Đồ án Ứng dụng xử lý ảnh trong nhận diện khuôn mặt (Phần 1)

pdf 22 trang phuongnguyen 280
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án Ứng dụng xử lý ảnh trong nhận diện khuôn mặt (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfdo_an_ung_dung_xu_ly_anh_trong_nhan_dien_khuon_mat_phan_1.pdf

Nội dung text: Đồ án Ứng dụng xử lý ảnh trong nhận diện khuôn mặt (Phần 1)

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA ĐÀO TẠO CHẤT LƯỢNG CAO ĐỒ ÁN TỐT NGHIỆP NGÀNH CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ TRUYỀN THÔNG ỨNG DỤNG XỬ LÝ ẢNH TRONG NHẬN DIỆN KHUÔN MẶT GVHD: TS. NGUYỄN MẠNH HÙNG SVTH: BÙI THỊ THANH TUYỀN MSSV: 13141613 S K L 0 0 5 0 0 9 Tp. Hồ Chí Minh, tháng 07/2017
  2. TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH KHOA ĐÀO TẠO CHẤT LƯỢNG CAO ĐỒ ÁN TỐT NGHIỆP ỨNG DỤNG XỬ LÝ ẢNH TRONG NHẬN DIỆN KHUÔN MẶT SVTH : BÙI THỊ THANH TUYỀN MSSV : 13141613 Khoá : 2013 Ngành : ĐIỆN TỬ CÔNG NGHIỆP GVHD: TS. NGUYỄN MẠNH HÙNG Tp. Hồ Chí Minh, tháng 7 năm 2017 i
  3. CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc Tp. Hồ Chí Minh, ngày 21 tháng 7 năm 2017 NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Họ và tên sinh viên: Bùi Thị Thanh Tuyền MSSV: 13141613 Ngành: Điện tử Công nghiệp Lớp: 13141CLĐT2 Giảng viên hướng dẫn:TS. Nguyễn Mạnh Hùng ĐT: 0978478096 Ngày nhận đề tài: 12/4/2017 Ngày nộp đề tài: 11/7/2017 1. Tên đề tài: Ứng dụng xử lý ảnh trong nhận diện khuôn mặt 2. Các số liệu, tài liệu ban đầu: 3. Nội dung thực hiện đề tài: 4. Sản phẩm: TRƯỞNG NGÀNH GIẢNG VIÊN HƯỚNG DẪN ii
  4. CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh Phúc PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ và tên Sinh viên: .Bùi Thị Thanh Tuyền .MSSV: 13141613 Ngành: Điện tử Công nghiệp Tên đề tài: Ứng dụng xử lý ảnh trong nhận diện khuôn mặt Họ và tên Giáo viên hướng dẫn: TS. Nguyễn Mạnh Hùng NHẬN XÉT 1. Về nội dung đề tài & khối lượng thực hiện: 2. Ưu điểm: 3. Khuyết điểm: 4. Đề nghị cho bảo vệ hay không? 5. Đánh giá loại: 6. Điểm: .(Bằng chữ: ) Tp. Hồ Chí Minh, ngày tháng năm 2017 Giáo viên hướng dẫn (Ký & ghi rõ họ tên) iii
  5. CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh Phúc PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ và tên Sinh viên: .Bùi Thị Thanh Tuyền .MSSV: 13141613 Ngành: Điện tử Công nghiệp Tên đề tài: Ứng dụng xử lý ảnh trong nhận diện khuôn mặt Họ và tên Giáo viên phản biện: NHẬN XÉT 1. Về nội dung đề tài & khối lượng thực hiện: 2. Ưu điểm: 3. Khuyết điểm: 4. Đề nghị cho bảo vệ hay không? 5. Đánh giá loại: 6. Điểm: .(Bằng chữ: ) Tp. Hồ Chí Minh, ngày tháng năm 2017 Giáo viên phản biện (Ký & ghi rõ họ tên) iv
  6. LỜI CẢM ƠN Trên thực tế không có sự thành công nào mà không gắn liền với sự hỗ trợ, giúp đỡ dù ít hay nhiều, dù trực tiếp hay gián tiếp của người khác. Trong suốt thời gian thực hiện đồ án , người thực hiện đã nhận được rất nhiều sự quan tâm, giúp đỡ của quý Thầy Cô, gia đình và bạn bè. Với lòng biết ơn sâu sắc nhất, người thực hiện xin gửi lời cảm ơn đến Thầy Nguyễn Mạnh Hùng_Giảng viên hướng dẫn cùng với tri thức và tâm huyết của mình, thầy đã trực tiếp hướng dẫn, chỉ bảo tận tình người thực hiện trong suốt quá trình làm đồ án. Người thực hiện cũng xin chân thành cảm ơn các thầy cô trong trường ĐH Sư Phạm Kỹ Thuật Tp HCM nói chung , các thầy cô trong Bộ môn Điện Tử Công nghiệp nói riêng đã dạy dỗ cho người thực hiện những kiến thức về các môn đại cương cũng như các môn chuyên ngành , giúp người thực hiện có được cơ sở lý thuyết vững vàng và tạo điều kiện giúp đỡ người thực hiện trong suốt quá trình học tập . Cuối cùng người thực hiện xin chân thành cảm ơn gia đình và bạn bè, đã luôn tạo điều kiện thuận lợi, quan tâm, giúp đỡ, động viên người thực hiện trong suốt quá trình học tập và hoàn thành đồ án tốt nghiệp. Người thực hiện đề tài v
  7. TÓM TẮT Với đề tài “Ứng dụng xử lý ảnh trong nhận diện diện khuôn mặt”. Mục tiêu nghiên cứu của em là xây dựng một hệ thống nhận dạng khuôn mặt với dữ liệu đầu vào là các ảnh mặt người, phát hiện khuôn mặt với phương pháp sử dụng hàm có sẵn trong matlab dùng thuật toán Viola-Jones. So sánh hình ảnh, phân loại và nhận dạng khuôn mặt giữa nhiều mô hình hồi quy tuyến tính với lý thuyết từ các tín hiệu thưa thớt. Cho ra kết quả nhận diện mang tính công nghệ cao trong cuộc sống. Kết quả đạt được từ nghiên cứu đã xây dựng được chương trình nhận dạng khuôn mặt có thể chụp hình tại chỗ và nhận dạng xuất ra kết quả như mong muốn. Nhờ có ứng dụng này sẽ phát triển các ứng dụng nhận dạng khác nhau mang tính đột biến trong cuộc sống. vi
  8. MỤC LỤC Trang phụ bìa i NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP ii PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN iii PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN iv LỜI CẢM ƠN v TÓM TẮT vi DANH MỤC CÁC CHỮ VIẾT TẮT ix DANH MỤC CÁC HÌNH ẢNH x TÀI LIỆU THAM KHẢO xii Chương 1 1 TỔNG QUAN 1 1.1 Tình hình nghiên cứu trong và ngoài nước 1 1.1.1 Đặt vấn đề 1 1.1.2 Tính cấp thiết và phổ biến của đề tài 1 1.2 Mục tiêu đề tài 2 1.3 Giới hạn đề tài 2 Chương 2 4 CƠ SỞ LÝ THUYẾT LIÊN QUAN 4 2.1 Lý thuyết cơ bản về nhận dạng mặt người 4 2.1.1 Giới thiệu 4 2.1.2 Thách thức trong nhận dạng mặt người 5 2.2 Các hướng tiếp cận cho bài toán nhận dạng khuôn mặt 6 2.2.1 Hướng tiếp cận dựa trên tri thức 6 2.2.2 Hướng tiếp cận dựa trên đặc trưng không đổi 7 2.2.3 Hướng tiếp cận dựa trên so khớp mẫu 7 2.2.4 Hướng tiếp cận dựa trên diện mạo 8 2.3 Giới thiệu chung về xử lý ảnh 9 2.3.1 Xử lý ảnh là gì? 9 2.3.2 Một số vấn đề cơ bản trong xử lý ảnh 9 vii
  9. 2.3.3 Biểu diễn ảnh 12 2.3.4 Không gian màu gray 15 2.3.5 Ngưỡng ảnh 15 Chương 3 17 PHƯƠNG PHÁP ĐỀ NGHỊ 17 3.1 Phát hiện khuôn mặt 17 3.1.1 Giới thiệu về bài toán phát hiện khuôn mặt 17 3.1.2 Phát hiện khuôn mặt là gì? 17 3.1.4 Phương pháp phát hiện khuôn mặt bằng thuật toán Viola - Jones 17 3.1 Nhận dạng khuôn mặt dựa trên sự biểu diễn thưa thớt 22 3.1.1 Giới thiệu 22 3.2.2 Phân loại các kỹ thuật biểu diễn thưa thớt 25 3.3.3 Thuật toán nhận dạng 26 Chương 4 28 THIẾT KẾ HỆ THỐNG 28 4.1 Sơ đồ khối 28 4.2 Chức năng từng khối 28 Chương 5 32 KẾT QUẢ THỰC HIỆN 32 5.1 Xây dựng ảnh 32 5.2 Nhận dạng ảnh 34 Chương 6 35 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 35 6.1 Kết quả đạt được 35 6.2 Hạn chế 35 6.3 Hướng phát triển 35 viii
  10. DANH MỤC CÁC CHỮ VIẾT TẮT LRBM: Phương pháp biểu diễn toán học tuyến tính. CS: Lấy mẫu tập trung SRC: Phương pháp phân loại dựa trên phân lớp. SST: Định lý lấy mẫu của Shannon. NSL: Lấy mẫu Nyquist. TPTSR: Phương pháp thử nghiệm mẫu hai pha thưa thớt. ix
  11. DANH MỤC CÁC HÌNH ẢNH Hình 2.1 Các thông tin có trong ảnh mặt người. Hình 2.2 Hướng tiếp cận dựa trên tri thức. Hình 2.3 Một loại tri thức của người nghiên cứu phân tích trên khuôn mặt Hình 2.4 Hướng tiếp cận dựa trên phương thức so sánh mẫu. Hình 2.5 Tập ảnh huấn luyện mặt người. Hình 2.6 Ảnh đơn Hình 2.7 Chuỗi ảnh Hình 2.8 Ma trận ảnh số Hình 2.9 Sơ đồ hệ thống xử lý ảnh Hình 2.10 Biểu diễn màu Hình 2.11 Không gian biểu diễn màu Hình 2.12 Ma trận số liệu ảnh số Hình 2.13 Chiều biễu diễn tọa độ điểm Hình 2.14 Quan hệ lân cận các điểm ảnh số Hình 3.1 Chuyển đổi ảnh tích phân Hình 3.2 Cách tính tổng các giá trị trong hình chữ nhật Hình 3.3 Đặc trưng Haarlike của Viola-Jones Hình 3.4 Đặc trưng cạnh Hình 3.5 Đặc trưng đường Hình 3.6 Đặc trưng xung quanh tâm Hình 3.7 Mô hình phân tầng kết hợp các bộ phân loại yếu để xác định khuôn mặt. Hình 3.8 Kết hợp các bộ phân loại yếu thành bộ phân loại mạnh Hình 3.9 Kết quả ảnh được cắt và được xử lý khi qua các bộ lọc Hình 3.10 Tổng quan thuật toán nhận dạng khuôn mặt Hình 4.1 Sơ đồ khối nhận dạng khuôn mặt Hình 4.2 Sơ đồ thuật toán của nhận dạng khuôn mặt Hình 4.3 Giao diện Hình 4.4 Giao diện sau khi được thiết kế Hình 5.1 Giao diện khi chạy chương trình Hình 5.2 Ảnh được chụp sau khi chọn chế độ chụp ảnh Hình 5.3 Ảnh cuối cùng sau khi đã chụp 1 và cắt loạt ảnh. x
  12. Hình 5.4 Loạt ảnh chụp được được lưu trong thư mục Hình 5.5 Ảnh sau khi được nhận dạng xi
  13. TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Thanh Hải (2014), “Giáo trình Xử lý ảnh”, Nhà xuất bản ĐHQG, Tp. HCM, Việt Nam. [2] Phạm Thế Bảo, Nguyễn Thành Nhựt, Cao Minh Thịnh, Trần Anh Tuấn, Phan Phúc Doãn. “Tổng quan các phương pháp xác định khuôn mặt người” Tiếng Anh [3] John Wright, Student Member, IEEE, Allen Y. Yang, Member, IEEE, Arvind Ganesh, Student Member, IEEE, S. Shankar Sastry, Fellow, IEEE, and Yi Ma, Senior Member, IEEE, (2009). “Robust Face Recognition via Sparse Representation”. 2009 [4] Zheng Zhang, Student Member, IEEE, Yong Xu, Senior Member, IEEE, Jian Yang, Member, IEEE, Xuelong Li, Fellow, IEEE, and David Zhang, Fellow, IEEE, A (2009). “A survey of sparse representation: algorithms and applications”. [5] Peter N. Belhumeur, “Ongoing Challenges in Face Recognition”, Frontiers of Engineering: Reports on Leading-Edge Engineering from the 2005, Symposium (2006). [6] Paul Viola, Michael J. Jones, “Robust Real-Time Face Detection”, International Journal of Cumputer Vision 57(2), 2004. [7] Ole Helvig Jensen, “Implementing the Viola-Jones Face Detection Algorithm”, Kongens Lyngby (2008) IMM-M.Sc.-2008-93 Tài liệu Internet [8] Bioz, “Adaboost - Haar Features - Face detection,” [9] Comvisap, “Phát hiện mặt người dựa trên các đặc trưng Haar-like,” [10] Viola–Jones object detection framework xii
  14. ĐỒ ÁN TỐT NGHIỆP Chương 1 TỔNG QUAN 1.1 Tình hình nghiên cứu trong và ngoài nước 1.1.1 Đặt vấn đề Ngày nay với sự phát triển vượt bậc của khoa học công nghệ cùng với đó là sự ra đời và phát triển của các phương pháp xử lý ảnh và thị giác máy tính đã giúp tạo ra các ứng dụng phong phú trong nhiều lĩnh vực: y khoa, quân sự, giám sát, khoa học cơ bản. Cùng với đó là các công nghệ kèm theo phục vụ trong việc xử lý ảnh như công nghệ camera đang được cải thiện. Từ xưa, việc nhận dạng khuôn mặt người đã được ứng dụng trong việc truy nã tội phạm, giám sát, an ninh. Việc nhận dạng khuôn mặt chủ yếu dựa vào đánh giá của con người. Với sự phát triển của thị giác máy tính việc nhận dạng khuôn mặt đã được xử lý trên máy tính một cách tự động hóa giúp gia tăng độ tin cậy, giảm sai sót do lỗi chủ quan của con người. Từ ý tưởng của một ứng dụng trong ngôi nhà thông minh: người thực hiện đã quyết định nghiên cứu và thực hiện đề tài: “Ứng dụng xử lý ảnh trong nhận dạng khuôn mặt”. Với mục đích tự động phát hiện và nhận dạng khuôn mặt. 1.1.2 Tính cấp thiết và phổ biến của đề tài Trong thời gian gần đây ứng dụng nhận diện khuôn mặt có nhiều thành tựu vượt bậc. Có rất nhiều ứng dụng mang tính công nghệ cao đã được và đang thiết kế: - Hệ thống tương tác giữa người và máy: giúp những người bị tật hoặc khiếm khuyết có thể trao đổi. Những người dùng ngôn ngữ tay có thể giao tiếp với những người bình thường. Những người bị bại liệt thông qua một số ký hiệu nháy mắt có thể biểu lộ những gì họ muốn, . Đó là các bài toán điệu bộ của bàn tay (hand gesture), điệu bộ khuôn mặt, - Nhận dạng người có phải là tội phạm truy nã hay không? Giúp cơ quan an ninh quản lý tốt con người. Công việc nhận dạng có thể ở trong môi trường bình thường cũng như trong bóng tối (sử dụng camera hồng ngoại). - Hệ thống quan sát, theo dõi và bảo vệ. Các hệ thống camera sẽ xác định đâu là con người và theo dõi con người đó xem họ có vi phạm gì không, ví dụ xâm phạm khu vực không được vào, . - Lưu trữ (rút tiền ATM, để biết ai rút tiền vào thời điểm đó), hiện nay có tình trạng những người bị người khác lấy mất thẻ ATM hay mất mã số PIN và những 1
  15. ĐỒ ÁN TỐT NGHIỆP người ăn cắp này đi rút tiền, hoặc những người chủ thẻ đi rút tiền nhưng lại báo cho ngân hàng là mất thẻ và mất tiền. Các ngân hàng có nhu cầu khi có giao dịch tiền sẽ kiểm tra hay lưu trữ khuôn mặt người rút tiền để sau đó đối chứng và xử lý. - Điều khiển vào ra: văn phòng, công ty, trụ sở, máy tính, Palm, . Kết hợp thêm vân tay và mống mắt. Cho phép nhân viên được ra vào nơi cần thiết, hay mỗi người sẽ đăng nhập máy tính cá nhân của mình mà không cần nhớ tên đăng nhập cũng như mật khẩu mà chỉ cần xác định thông qua khuôn mặt. - Tìm kiếm và tổ chức dữ liệu liên quan đến con người thông qua khuôn mặt người trên nhiều hệ cơ sở dữ liệu lưu trữ thật lớn, như internet, các hãng truyền hình, . Ví dụ: Tìm các đoạn video có tổng thống Bush phát biểu, tìm các phim có diễn viên Lý Liên Kiệt đóng, tìm các trận đá banh có Ronaldo đá, Nhận dạng khuôn mặt là bài toán có rất nhiều ứng dụng trong thực tế và nhận được sự quan tâm lớn từ cộng đồng các nhà khoa học nghiên cứu về thị giác máy tính. Một hệ thống nhận dạng mặt có nhiều bước và mỗi bước lại là một lĩnh vực nghiên cứu với các cách tiếp cận khác nhau cho từng khâu của một hệ thống hoàn chỉnh. Các thử nghiệm về tỉ lệ nhận dạng của các cách phương pháp đề xuất thường được tiến hành trên các tập dữ liệu được thu nhận trong điều kiện hạn chế về ánh sáng, hướng, , do đó khi áp dụng vào thực tế thì kết quả thu được thường kém xa so với môi trường thử nghiệm. Chính vì vậy, trong đề tài này, người thực hiện tập trung vào việc xây dựng một hệ thống nhận dạng và thử nghiệm với các điều kiện ảnh thu nhận được trong các điều kiện thực tế. 1.2 Mục tiêu đề tài Mục tiêu của đề tài là xây dựng một hệ thống nhận dạng khuôn mặt với dữ liệu đầu vào là các ảnh mặt người, phát hiện khuôn mặt với phương pháp sử dụng hàm có sẵn trong matlab dùng thuật toán Viola-Jones. So sánh hình ảnh, phân loại và nhận dạng khuôn mặt giữa nhiều mô hình hồi quy tuyến tính với lý thuyết từ các tín hiệu thưa thớt. Cho ra kết quả nhận diện mang tính công nghệ cao trong cuộc sống. 1.3 Giới hạn đề tài Với thời gian có hạn nên người thực hiện chỉ thực hiện nghiên cứu những vấn đề cơ bản sau: 2
  16. ĐỒ ÁN TỐT NGHIỆP • Nghiên cứu và thực hiện các thuật toán phát hiện và nhận dạng trên chương trình Matlab. • Nghiên cứu cấu trúc ảnh màu, các lệnh xử lý ảnh màu và chuyển sang ảnh xám với chương trình Matlab. • Nghiên cứu giải thuật và thực hiện phần mềm nhận dạng trên Matlab. 3
  17. ĐỒ ÁN TỐT NGHIỆP Chương 2 CƠ SỞ LÝ THUYẾT LIÊN QUAN 2.1 Lý thuyết cơ bản về nhận dạng mặt người 2.1.1 Giới thiệu Nhận dạng mặt người (Face recognition) là một chủ đề nghiên cứu thuộc lĩnh vực thị giác máy tính (Computer Vision) đã được phát triển từ đầu những năm 90 của thế kỷ trước. Cho tới hiện nay, đây vẫn là một chủ đề nghiên cứu mở nhận được sự quan tâm của nhiều nhà nghiên cứu từ nhiều lĩnh vực nghiên cứu khác nhau như nhận dạng mẫu (Pattern Recognition), học máy (Machine Learning), thống kê (Statistics), sinh trắc học (Biometrics). Điều này là do có rất nhiều ứng dụng thực tế cần tới một hệ thống nhận dạng mặt, từ các hệ thống quản lý đăng nhập đơn giản cho tới các ứng dụng giám sát tại các địa điểm công cộng (public areas surveillance) hoặc quản lý dân số (population management) và pháp lý (forsensics). Bên cạnh đó, so với các hệ thống nhận dạng dựa trên các đặc điểm sinh trắc học khác của con người, như nhận dạng mống mắt và vân tay (fingerprint and iris recoginitions), dáng đi (gait recognition), nhận dạng mặt có nhiều ưu điểm: - Một hệ thống nhận dạng mặt không đòi hỏi có sự tương tác trực tiếp giữa đối tượng được nhận dạng và hệ thống. - Việc thu nhận dữ liệu (ảnh mặt) cho quá trình nhận dạng một con người dễ thực hiện hơn so với thu nhận các đặc đặc điểm sinh trắc học khác (như thu nhận dấu vân tay và mống mắt). - Dữ liệu về mặt người phổ biến hơn so với các đặc trưng khác do sự bùng nổ các mạng xã hội (facebook, twitter ), các dịch vụ chia sẻ dữ liệu đa phương tiện (youtube, vimeo ) và sự phát triển mạnh mẽ của các thiết bị thu nhận hình ảnh. - Từ ảnh khuôn mặt của một người ta có thể khai thác nhiều thông tin liên quan chứ không chỉ là danh tính, chẳng hạn như giới tính (gender), màu da (skin color), hướng nhìn (gaze direction), chủng tộc, hành vi, sức khỏe, độ tuổi, cảm xúc và mức độ thông minh, 4
  18. ĐỒ ÁN TỐT NGHIỆP Hình 2.1 Các thông tin có trong ảnh mặt người. 2.1.2 Thách thức trong nhận dạng mặt người Việc xây dựng một hệ thốngnhận dạng mặt hoàn toàn tự động với khả năng nhận dạng chính xác cao thực sự là một thách thức đối với các nhà nghiên cứu. Điều này là do các yếu tố (chủ quan và khách quan) ảnh hưởng tới quá trình thu nhận ảnh và tạo ra các bức ảnh có độ khác biệt rất lớn của cùng một khuôn mặt. Có thể liệt kê ra đây các yếu chủ yếu ảnh hưởng tới độ chính xác của một hệ thống nhận dạng mặt: - Ánh sáng (light conditions). Các bức ảnh mặt thu nhận ở các điều kiện sáng khác nhau sẽ rất khác nhau và làm giảm sự chính xác trong quá trình nhận dạng. - Thay đổi về tuổi (aging changes). Khuôn mặt người có các thay đổi lớn khi tuổi thay đổi và khó nhận dạng hơn ngay cả đối với hệ thống thị giác của con người. - Các vấn đề về hướng (pose variations). Việc nhận dạng với các ảnh có góc chụp thẳng (frontal) có kết quả tốt hơn rất nhiều so với các ảnh được chụp ở góc nghiêng lớn hơn 45o. Giải pháp thường thấy đối với các ảnh có hướng chụp lớn là sử dụng các thuật toán nội suy để cố gắng bù đắp phần khuôn mặt bị che khuất. - Cảm xúc (facial expresion variations). Ở các trạng thái cảm xúc khác nhau, các đặc điểm quan trọng cho nhận dạng mặt (như mắt, mũi, mồm) có thể bị biến dạng (deformed) và dẫn tới các kết quả nhận dạng sai. - Che khuất (occlusions). Các ảnh mặt có thể bị che khuất bởi các yếu tố khách quan như vật chắn ở trước mặt hoặc chủ quan như các phụ kiện trên khuôn mặt (khăn, kính mắt) và làm cho quá trình nhận dạng bị sai. Các hệ thống nhận dạng mặt được chia thành hai loại: xác định danh tính (face identification) và xác thực (face verification). Bài toán xác định danh tính là bài toán dạng 1-N trong đó hệ thống sẽ đưa ra kết quả là danh tính của ảnh được nhận dạng 5
  19. ĐỒ ÁN TỐT NGHIỆP dựa trên sự tương đồng của ảnh input với một danh sách N ảnh đã biết danh tính chính xác. Trong khi đó, ở bài toán xác thực danh tính, hệ thống sẽ đưa ra câu trả lời đúng hoặc sai dựa vào việc xác định xem 2 bức ảnh có thuộc về cùng một người hay không. 2.2 Các hướng tiếp cận cho bài toán nhận dạng khuôn mặt 2.2.1 Hướng tiếp cận dựa trên tri thức Trong hướng tiếp cận này, các luật sẽ phụ thuộc rất lớn vào tri thức của những tác giả nghiên cứu về bài toán xác định khuôn mặt người. Đây là hướng tiếp cận dạng top-down. Dễ dàng xây dựng các luật cơ bản để mô tả các đặc trưng của khuôn mặt và các quan hệ tương ứng. Ví dụ, một khuôn mặt thường có hai mắt đối xứng nhau qua trục thẳng đứng ở giữa khuôn mặt và có một mũi, một miệng. Một vấn đề khá phức tạp khi dùng hướng tiếp cận này là làm sao chuyển từ tri thức con người sang các luật một cách hiệu quả. Nếu các luật này quá chi tiết thì khi xác định có thể xác định thiếu các khuôn mặt có trong ảnh, vì những khuôn mặt này không thể thỏa mãn tất cả các luật đưa ra. Nhưng các luật tổng quát quá thì có thể chúng ta sẽ xác định lầm một vùng nào đó không phải là khuôn mặt mà lại xác định là khuôn mặt. Và cũng khó khăn mở rộng yêu cầu từ bài toán để xác định các khuôn mặt có nhiều tư thế khác nhau. Hình 2.2 Hướng tiếp cận dựa trên tri thức 6
  20. ĐỒ ÁN TỐT NGHIỆP Hình 2.3 Một loại tri thức của người nghiên cứu phân tích trên khuôn mặt 2.2.2 Hướng tiếp cận dựa trên đặc trưng không đổi Đây là hướng tiếp cận theo kiểu bottom-up. Các tác giả cố gắng tìm các đặc trưng không thay đổi của khuôn mặt người để xác định khuôn mặt người. Dựa trên nhận xét thực tế, con người dễ dàng nhận biết các khuôn mặt và các đối tượng trong các tư thế khác nhau và điều kiện ánh sáng khác nhau, thì phải tồn tại các thuộc tính hay đặc trưng không thay đổi. Có nhiều nghiên cứu đầu tiên xác định các đặc trưng khuôn mặt rồi chỉ ra có khuôn mặt trong ảnh hay không. Các đặc trưng như: lông mày, mắt, mũi, miệng, và đường viền của tóc được trích bằng phương pháp xác định cạnh. Trên cơ sở các đặc trưng này, xây dựng một mô hình thống kê để mô tả quan hệ của các đặc trưng này và xác định sự tồn tại của khuôn mặt trong ảnh. Một vấn đề của các thuật toán theo hướng tiếp cận đặc trưng cần phải điều chỉnh cho phù hợp điều kiện ánh sáng, nhiễu, và bị che khuất. Đôi khi bóng của khuôn mặt sẽ tạo thêm cạnh mới, mà cạnh này lại rõ hơn cạnh thật sự của khuôn mặt, vì thế nếu dùng cạnh để xác định sẽ gặp khó khăn. Hướng tiếp cận này dựa trên các đặc trưng: đặc trưng về khuôn mặt, kết cáu khuôn mặt, sắc màu của da và đa đặc trưng. 2.2.3 Hướng tiếp cận dựa trên so khớp mẫu Trong so khớp mẫu, các mẫu chuẩn của khuôn mặt (thường là khuôn mặt được chụp thẳng) sẽ được xác định trước hoặc xác định các tham số thông qua một hàm. Từ một ảnh đưa vào, tính các giá trị tương quan so với các mẫu chuẩn về đường viền khuôn mặt, mắt, mũi và miệng. Thông qua các giá trị tương quan này mà các tác giả quyết định 7
  21. ĐỒ ÁN TỐT NGHIỆP có hay không có tồn tại khuôn mặt trong ảnh. Hướng tiếp cận này có lợi thế là rất dễ cài đặt, nhưng không hiệu quả khi tỷ lệ, tư thế, và hình dáng thay đổi. Nhiều độ phân giải, đa tỷ lệ, các mẫu con, và các mẫu biến dạng được xem xét thành bất biến về tỷ lệ và hình dáng. Hình 2.4 Hướng tiếp cận dựa trên phương thức so sánh mẫu 2.2.4 Hướng tiếp cận dựa trên diện mạo Trái ngược hẳn với so khớp mẫu, các mô hình (hay các mẫu) được học từ một tập ảnh huấn luyện trước đó. Sau đó hệ thống (mô hình) sẽ xác định khuôn mặt người. Hay một số tác giả còn gọi hướng tiếp cận này là hướng tiếp cận theo phương pháp học. Sau đó hệ thống sẽ tổng hợp tất cả các đặc tính của khuôn mặt con người như: mắt, mũi, miệng, thành một vector riêng. Hình 2.5 Tập ảnh huấn luyện mặt người 8