Luận văn Giám sát an ninh dùng kỹ thuật xử lý hình ảnh (Phần 1)

pdf 22 trang phuongnguyen 140
Bạn đang xem 20 trang mẫu của tài liệu "Luận văn Giám sát an ninh dùng kỹ thuật xử lý hình ảnh (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfluan_van_giam_sat_an_ninh_dung_ky_thuat_xu_ly_hinh_anh_phan.pdf

Nội dung text: Luận văn Giám sát an ninh dùng kỹ thuật xử lý hình ảnh (Phần 1)

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ HỒ QUỐC THIỀN GIÁM SÁT AN NINH DÙNG KỸ THUẬT XỬ LÝ HÌNH ẢNH NGÀNH: KỸ THUẬT ĐIỆN TỬ- 60520203 S K C0 0 4 9 1 7 Tp. Hồ Chí Minh, năm 2016
  2. LÝ LỊCH KHOA HỌC I. LÝ LỊCH SƠ LƢỢC: Họ & tên: Hồ Quốc Thiền Giới tính: Nam Ngày, tháng, năm sinh: 25/08/1990 Nơi sinh: Đà Lạt Quê quán: Quảng Nam Dân tộc: Kinh Chỗ ở riêng hoặc địa chỉ liên lạc: Căn hộ H812 - Chung cƣ CBD đƣờng Đồng Văn Cống – Phƣờng Thạnh Mỹ Lợi – Quận 2 – Tp.Hồ Chí Minh Điện Thoại: 0949009666 E-mail: hoquocthiendl@gmail.com II. QUÁ TRÌNH ĐÀO TẠO: 1. Đại học: Hệ đào tạo: chính quy - Thời gian đào tạo từ 2008 đến 2014. Nơi học (trƣờng, thành phố): Đại học sƣ phạm kĩ thuật Tp.HCM Ngành học: Công nghệ điện tử viễn thông Tên đồ án, luận án hoặc môn thi tốt nghiệp: ―Xử lý và nhận dạng tiếng nói‖. Ngày & nơi bảo vệ đồ án, luận án hoặc thi tốt nghiệp: 2/2014 tại trƣờng Đại học sƣ phạm kĩ thuật Tp.HCM Ngƣời hƣớng dẫn: Th.S Nguyễn Ngô Lâm i
  3. 2. Thạc sĩ: Hệ đào tạo: chính quy - Thời gian đào tạo từ 05/2015 đến 10/2016. Nơi học (trƣờng, thành phố):Đại học sƣ phạm kĩ thuật Tp.HCM Ngành học: kĩ thuật điện tử Tên luận văn: ―Giám sát an ninh dùng kĩ thuật xử lý hình ảnh‖ Ngày & nơi bảo vệ luận văn: 22/10/2016 tại trƣờng Đại học sƣ phạm kĩ thuật Tp.HCM Ngƣời hƣớng dẫn: TS. Lê Mỹ Hà ii
  4. LỜI CAM ĐOAN Tôi cam đoan đây là công trình nghiên cứu của tôi. Các số liệu, kết quả nêu trong luận văn là trung thực và chƣa từng đƣợc ai công bố trong bất kỳ công trình nào khác Tp. Hồ Chí Minh, ngày 01 tháng 10 năm 2016 Hồ Quốc Thiền iii
  5. LỜI CẢM ƠN Em xin chân thành cám ơn các Thầy, Cô trong khoa Điện – Điện Tử đã trang bị cho em một kiến thức nền tảng giúp em có thể hoàn thành tốt luận văn này. Cám ơn các bạn trong lớp đã chia sẻ các kinh nghiệm và đã hỗ trợ trong lúc làm luận văn. Đặc biệt em xin chân thành cảm ơn Thầy hƣớng dẫn, T.SLê Mỹ Hàđã hƣớng dẫn và hỗ trợ em trong lúc thực hiện luận văn này. Học viên Hồ Quốc Thiền iv
  6. TÓM TẮT Khoa học kĩ thuật ngày càng phát triển dẫn đến nhu cầu về các thiết bị thông minh có thể thay con ngƣời đƣa ra các quyết định cũng nhƣ phân loại đối tƣợng. Xử lý ảnh – thị giác máy tính giúp giải quyết một phần nhu cầu đó. Nhận dạng hành động ngƣời cũng là một đề tài thu hút sự chú ý nghiên cứu với các ứng dụng của nó trong tƣơng tác giữa ngƣời và máy cũng nhƣ các ứng dụng về giám sát anh ninh trong khu vực đặt các camera cố định. Luận văn này xây dụng ứng dụng xử lý ảnh –thị giác máy tính vào việc phát hiện và nhận dạng hành động của đối tƣợng qua video. Đầu tiên là phân hiện ngƣời trong khung ảnh dùng ACF và Adaboost để trƣợt các khung cửa sổ phân loại. Sau khi đã phát hiện đƣợc ngƣời có trong khung ảnh thì bám theo khu vực ngƣời đó (tracking)video. Khi đã bám mục tiêu (tracking) thành công,chƣơng trình sẽ trích các đặc trƣng HOG (Histogram of Oriented Gradients) trong nhiều frame ảnh liên tiếp của những ngƣời trong khung ảnh và sắp xếp chúng trên miền thời gian để biểu thị cho hành động của con ngƣời –sau cùng là phân loại các hành động thông qua vector hỗ trợ máy học (SVM: Support Vector Machines). Luận văn có bố cục gồm những phần nhƣ sau: I. Tổng Quan đề tài. II. Cơ sở lý thuyết. III. Xây dựng chƣơng trình. IV. Kết luận và hƣớng nghiên cứu. v
  7. MỤC LỤC Trang tựa TRANG LÝ LỊCH KHOA HỌC i LỜI CAM ĐOAN iii LỜI CẢM ƠN iv TÓM TẮT v MỤC LỤC vi DANH SÁCH HÌNH viii Chƣơng 1: TỔNG QUAN 1 1.1 Tổng Quan Về Lĩnh Vực Nghiên Cứu 1 1.2 Mục đích của đề tài 2 1.3 Nhiệm Vụ Và Giới Hạn Của Đề Tài 2 1.3.1 Nhiệm Vụ của đề tài 2 1.3.2 Giới Hạn của đề tài 3 1.3.3 Phƣơng Pháp Nghiên Cứu 3 1.4 Kế hoạch thực hiện 3 Chƣơng 2: CƠ SỞ LÝ THUYẾT 4 2.1. Xử lý ảnh số 4 2.1.1. Các thuật toán xử lý hình thái học 4 2.1.1.1 . Phần tửcấu trúc 4 2.1.1.2. Phép co ảnh – Erosion 6 2.1.1.3. Phép giãn ảnh – Dialtion 7 2.1.1.4. Phép mở ảnh– Openning 8 2.1.2. Các ứng dụng của các thuật toán xử lý hình thái học 10 2.1.2.1. Trích lọc biên ảnh –Boundaryextraction 10 2.1.2.2. Tô đầy vùng – Region fill 11 vi
  8. 2.1.2.3. Trích lọc thành phần liên thông - Extracting connected components 12 2.1.2.4. Làmmỏngđốitƣợngtrongảnh–Thinning 13 2.1.2.5. Làm dày đối tƣợng trong ảnh – Thickening 13 2.1.2.6. Thuật toán tìm xƣơng đối tƣợng trong ảnh- Skeletons 14 2.2. Đặc trƣng ACF và Adaboost 15 2.2.1. Đặc trƣng ACF (Aggregated Channel Features ) 15 2.2.1.1. Kênh đặc trƣng tỉ lệ 16 2.2.1.2 . Đặc trƣng nhanh hình tháp 16 2.2.1.3. Đặc trƣng kênh tổng hợp (ACF) 18 2.2.2. Phƣơng pháp AdaBoost 18 2.3. Bộ lọc Kalman 19 2.3.1. Bộ lọc Kalman tuyến tính 19 2.3.2. Bộ lọc Kalman mở rộng. 24 2.4. Histogram of gradient (HOG) 27 2.4.1. Giới thiệu HOG 27 2.4.2. Rút trích đặc trƣng HOG trong ảnh 27 2.4.3. Đặc trƣng hành động n-hog: 31 2.5. Support Vector Machines (SVM) 32 2.5.1. Giới thiệu 32 2.5.2. Các khái niệm cơ bản 32 2.5.3. Phân lớp dữ liệu 40 Chƣơng 3: Xây dựng chƣơng trình trên MATLAB 43 3.1. Thiết kế: 43 3.2. Kết quả: 46 3.3. Nhận xét: 48 Chƣơng 4: Kết luận và hƣớng phát triển 49 TÀI LIỆU THAM KHẢO 53 vii
  9. DANH SÁCH HÌNH HÌNH TRANG Hình 2.1: Mộtsố hình dáng của phần tử cấu trúc phẳng. 5 Hình 2.2: Mộtmặt nạ xác định lân cận của phần tử cấu trúc không phẳng. 5 Hình 2.3: Ma trận giá trị thực tƣơng ứng với lân cận trong phần tử cấu trúc không phẳng. 5 Hình 2.4: Ví dụ về phép toán co ảnh nhị phân vớiphần tử cấutrúc phẳng. 6 Hình 2.5. Ví dụ về phép toán co ảnh trên ảnh xám với phần tử cấu trúc không phẳng. 6 Hình 2.6: Ví dụ về phép giãn nhị phân trên ảnh vớiphần tử cấutrúc phẳng 7 Hình 2.7:. Phép toán giãn ảnh trên ảnh xám với phần tử cấu trúc không phẳng. 8 Hình 2.8: Phần tử cấu trúc phẳng 9 Hình 2.10: Kết quả của một số phép biến đổi trên ảnh nhị phân và ảnh xám 9 Hình 2.11: Trích lọc biên của đối tƣợng: 10 Hình 2.12: Kết quả của việc thực hiện lấp đầy vùng ảnh 11 Hình 2.13: Hình dáng 4 lân cận (N4)và 8 lân cận (N8) 12 Hình 2.15: Kết quả của thực hiện tríchlọc thành phần liên thông trong ảnh 13 Hình 2.14: Kết quả làm mỏng đối tƣợng 13 Hình 2.16: Kết quả làm dày đối tƣợng 14 Hình 2.18: Ảnh 15 Hình 2.19: các kênh đặc trƣng trong ACF 15 Hình 2.20: Kênh đặc trƣng tỉ lệ 16 Hình 2.21: Đặc trƣng nhanh hình tháp. [10] 17 Hình 2.22: Tổng quan về bộ phát hiện ACF. 18 Hình 2.23: Thuật toán Kalman cổ điển. 23 viii
  10. Hình 2.24: thuật toán Kalman mở rộng. 26 Hình 2.25: Mỗi khối (block) gồm nhiều ô (cell). 28 Hình 2.26: Các khối (block) đƣợc xếp chồng lên nhau 28 Hình 2.27: Tính góc và biên độ theo X-gradient và Y-gradient 29 Hình 2.28: Các bƣớc rút trích đặc trƣng HOG [2] 31 Hình 2.29: Đối tƣợng sau khi đƣợc phát hiện và trích đặc trƣng HOG trong 5-frames ảnh liên tiếp. 32 Hình 2.30: Đƣờng màu vàng trên hình là đƣờng phân chia đối với tập dữ liệu gồm hai thuộc tính 34 Hình 2.31: Một bộ dữ liệu hai chiều đƣợc phân chia tuyến tính.35Hình 2.32: Ví dụ về siêu phẳng phân chia tuyến tính cùng với biên độ của nó. 36 Hình 2.33: Đƣờng biểu diễn H1 và H2 38 Hình 2.34: Các support vector trong SVM. 39 Hình 2.35: Một trƣờng hợp không khả phân tuyến tính. 41 Hình 3.1: Tiến trình của hệ thống 43 Hình 3.2: Đối tƣợng sau khi đƣợc phát hiện và trích đặc trƣng HOG trong 5-frames ảnh liên tiếp. 44 Hình 3.3: Ảnh kết quả sau khi phát hiện và tracking ngƣời test trên tập dữ liệu PETS09 [13] với độ phân giải 768*576. 46 Hình 4.1: Lỗi sai do đặc trƣng HOG thể hiện 49 Hình 4.2: Sơ đồ khối của phƣơng pháp [5] để nâng cao chất lƣợng DPM. 50 Hình 4.3: Kết quả thời gian thực thi của phƣơng pháp trên trình bày [5]. 51 Hình 4.4: Kết quả thực thi của phƣơng pháp trên trình bày [5]. 51 ix
  11. Chƣơng 1. Tổng quan Chƣơng 1: TỔNG QUAN 1.1 Tổng Quan Về Lĩnh Vực Nghiên Cứu Trong cuộc sống hàng ngày, con ngƣời luôn không ngừng vận động và phát triển. Mọi thứ xung quanh chúng ta ngày một hiện đại hơn, phát triển hơn. Do đó việc có những thiết bị thông minh hiểu đƣợc hành động ngƣời trong video có thể tạo thuận lợi hơn trong việc tƣơng tác giữa ngƣời và máy, và ngoài ra có thể dựa vào những hành động mà máy tính hiểu ứng dụng cho các camera giám sát trong các khu vực bất kì.Để các thiết bị có thể nhận dạng đƣợc hành động của ngƣời gồm 3 phần: . Phát hiện đối tượng (người): trong thị giác máy tính là công việc tìm kiếm các vật thể trong ảnh hoặc trong video. Đây là hƣớng nghiên cứu đƣợc quan tâm nhiều hiện nay với nhiều ứng dụng. Phát hiện ngƣời trong ảnh hoặc video là một nhánh của phát hiện đối tƣợng. Chúng ta (con ngƣời)có thể nhận biết các đối tƣợng là ngƣời một cách dễ dàng trong các ảnh hoặc video dù hình dạng trong các trƣờng hợp là rất khác nhau vả cả với nền ảnh biến đổi đa dạng. Nhƣng đối với hệ thống thị giác máy tính thì công việc này vẫn còn là thách thc lớn. Nguyên nhân chủ yếu là do diện mạo và tƣ thế của mỗi ngƣời là hết sức đa dạng, ảnh hƣởng về điều kiện ánh sáng, sự che lấp lẫn nhau của những ngƣời trong đám đông, chất lƣợng video Phát hiện ngƣời là hƣớng nghiên cứu dành đƣợc rất nhiều sự quan tâm vì khả năng ứng dụng của nó. Manoranjan Paul, [1] đã trình bày tổng quan (review) về hầu hết các phƣơng pháp phát hiện ngƣời cũng nhƣ các ứng dụng của nó trong thực tế. Ngoài ra, N.Dalal; B.Triggs[2]đề xuất đặc trƣng HOG và phân loại SVM dùng cửa sổ trƣợt để phân loại ngƣời và nền (background) trong khung ảnh, là một phƣơng pháp nền tảng và đƣợc đƣợc biết đến rộng rãi trong lĩnh vực phát hiện ngƣời.Viola-Jone[3] đề xuất mô hình phân tầng để nhận dạng đối tƣợng. . Bám mục tiêu (tracking): Sau khi phát hiện đƣợc ngƣời trong ảnh, việc bám mục tiêu (tracking) để theo dõi các đối tƣợng cũng là yếu tố cần thiết để có thể xác định đƣợc hành động của ngƣời đó trong nhiều khung ảnh liên tiếp hoặc video. Việc bám mục tiêu (tracking) giúp liên kết các đối tƣợng mục tiêu trong khung hình video liên tục. Một vài kĩ thuật bám mục tiêu (tracking) đã đƣợc nghiên cứu nhƣ CAMshift[4], bộ bám mục 1
  12. Chƣơng 1. Tổng quan tiêu (tracker) KLT[5], dùng superpixel để bám mục tiêu (tracking)[6] kết hợp với KNN tđể phân loại màu cho kết quả tốt nhƣng chi phí tính toán cao. Kết quả của việc phát hiện và bám mục tiêu (tracking)liên tiếp trong nhiều khung ảnh là cơ sở để các thiết bị có thể dựa vào đó nhận dạng hành động của ngƣời. .Nhận dạng hành động người: cũng là một đề tài thu hút đƣợc nghiên cứu của nhiều tác giả trong và ngoài nƣớc. Một vài đặc trƣng để phân loại hành động đƣợc đề xuất bởi các tác giả: Laptev và các đồng nghiệp đã giới thiệu bộ miêu tả mà khi sắp xếpcác đặc trƣng HoG (Histogram of Oriented Gradients)– HoF (Histogram of Optical Flow) trên miền thời gian có thể rút trích thông tin về dáng vóc và chuyển động, tác giả còn giới thiệu một đặc trƣng STIP (Space-Time Interest Points) để miêu tả hành động trong không gian cục bộ [7]. Nazli Ikizler-Cinbis và Stan Sclaroff[8] đề xuất phƣơng pháp cho nhận diện hành động ngƣời mà kết hợp nhiều đặc trƣng của các thực thể nhƣ: Đối tƣợng, khung cảnh và con ngƣời. Lê Viết Tuấn[9] phân tích tổng hợp về các phƣơng thức nhận diện hành động trong video bằng cách kết hợp các phƣơng pháp. 1.2 Mục đích của đề tài Xây dựng chƣơng trình trên nền tảng MATLAB để nhận dạng hành động của con ngƣời qua các bƣớc phát hiện ngƣời, bám mục tiêu (tracking) và phân loại hành động từ camera hoặc video. 1.3 Nhiệm Vụ Và Giới Hạn Của Đề Tài 1.3.1 Nhiệm Vụ của đề tài Phát hiện ngƣời trong video. Bám theo mục tiêu (tracking) đối tƣợng. Phân loại một số hành động của đối tƣợng trong khung ảnh. 2
  13. Chƣơng 1. Tổng quan 1.3.2 Giới Hạn của đề tài - Độ chinh xác ở mức tƣơng đối do kết quả cuối cùng là sự tổng hợp của nhiều khâu xử lý nhƣ phát hiện con ngƣời, bám mục tiêu (tracking) theo ngƣời và phân loại các hành động đã qua huấn luyện. - Xử lý trong những khung ảnh vừa có độ phân giải vừa phải để có thể thực thi đƣợc đáp ứng đủ khung hình video khi mà yêu cầu thông tin tính toán vừa phải. 1.3.3 Phƣơng Pháp Nghiên Cứu - Từ ảnh đầu vào, tiến hành phát hiện trong ảnh có đối tƣợng là ngƣời hay không bằng đặc trƣng ACF kết hợp với thuật toán máy học Adaboost. - Nếu xuất hiện ngƣời trong ảnh thì bắt đầu tiến hành bám mục tiêu( tracking) đối tƣợng ngƣời quan tâm để tiến hành khảo sát hành động. - Từ dữ liệu bám mục tiêu (tracking) thu đƣợc trƣớc đó, áp dụng phƣơng pháp trích đặc trƣng HOG đối với các khung ảnh liên tiếp và tổ hợp nó lại với nhau biểu thị cho một đặc trƣng về hành động của ngƣời đang trong tình trạng bám mục tiêu (tracking) đó.Sau đó thông qua vector hỗ trợ máy học (SVM – Support Vector machine) để phân loại các loại hành động. 1.4 Kế hoạch thực hiện Tháng 2 đến tháng 4 Tìm hiểu các phƣơng pháp phát hiện ngƣời trong ảnh. Tháng 4 đến tháng 6 Nghiên cứu các phƣơng pháp bám theo (tracking) đối tƣợng. Tìm hiểu về các đặc trƣng hành động. Tháng 6 đến tháng 7 Xây dựng chƣơng trình Matlab. Tháng 7 đến tháng 9 Lập trình để phát hiện hành động ngƣời qua ba giai đoạn phát hiện – bám theo (tracking) – phân loại. Tháng 9 đến tháng 10 Viết luận văn tốt nghiệp. Chuẩn bị báo cáo. 3
  14. Chƣơng 2. Cơ sở lý thuyết Chƣơng 2: CƠ SỞ LÝ THUYẾT Với sự gia tăng không ngừng về số lƣợng cũng nhƣ chất lƣợng của các thiết bị ghi hình kỹ thuật số mà giá cả ngày càng giảm, việc sở hữu một chiếc máy ảnh hay máy quay không còn xa vời đối với mỗi ngƣời, dẫn đến sự bùng nổ các dữ liệu ảnh, video, do đó chúng ta cần các ứng dụng thông minh hơn, mạnh mẽ hơn giúp ta tổ chức, quản lý dữ liệu một cách hiệu quả. 2.1. Xử lý ảnh số 2.1.1. Các thuật toán xử lý hình thái học Với sự gia tăng không ngừng về số lƣợng cũng nhƣ chất lƣợng của các thiết bị ghi hình kỹ thuật số mà giá cả ngày càng giảm, việc sở hữu một chiếc máy ảnh hay máy quay không còn xa vời đối với mỗi ngƣời, dẫn đến sự bùng nổ các dữ liệu ảnh, video, do đó chúng ta cần các ứng dụng thông minh hơn, mạnh mẽ hơn giúp ta tổ chức, quản lý dữ liệu một cách hiệu quả. Phầnlớncácphéptoánhìnhtháihọcđƣợcđịnhnghĩatừhaiphéptoáncơbảnlà phéptoáncoảnh(Erosion)vàgiãnảnh(Dilation).Yếutốquantrọngtrongcácphép toán này làlựa chọn mộtphần tửcấu trúc cóhình dáng phùhợp. 2.1.1.1 . Phần tửcấu trúc Đốivớiảnhnhịphân,phầntửcấutrúclàmộtảnhcókíchthƣớcnhỏgồmcóhai giátrị0và1,cácgiátrịbằng0đƣợcbỏquatrongquátrìnhtínhtoán,gọiH(i,j)là phần tử cấutrúc của ảnh nhị phânvà đƣợc thểhiện nhƣ sau : H(i,j) 0,1          Mộtsốhìnhdángcủaphầntửcấutrúcthƣờngđƣợcsửdụngtrênảnhnhịphân: dạng đƣờng theo chiều ngangvà dọc,hình vuông, hìnhellip, 4
  15. Chƣơng 2. Cơ sở lý thuyết Hình 2.1: Mộtsố hình dáng của phần tử cấu trúc phẳng. Đốivớiảnhxám,phầntửcấutrúclàkhôngphẳng,tứclàcácphầntửcấutrúcsử dụngcácgiátrị0và1đểxácđịnhphạmvicủaphầntửcấutrúctrongmặtphẳngxvà mặtphẳngyvàthêmgiátrịđộcaođểxácđịnhchiềuthứba. Cấutrúcphầntửkhông phẳng gồm có hai phần : Phầnthứnhất:Mộtmảnghaichiềugồmcócácgiátrị0và1,trongđógiá trị bằng 1xác định lân cậncủa phần tử cấu trúc. Hình 2.2: Mộtmặt nạ xác định lâncận của phần tử cấu trúc không phẳng. Phầnthứhai:Mộtmảnghaichiềucókíchthƣớcbằngvớikíchthƣớccủamảng hai chiều ởphần thứ nhất nhƣngchứa cácgiátrị thực của phần tử cấu trúc. Hình 2.3: Ma trận giá trị thực tương ứng với lân cận trong phần tử cấu trúc không phẳng. 5
  16. Chƣơng 2. Cơ sở lý thuyết 2.1.1.2. Phép co ảnh – Erosion XéttậphợpAvàtậphợpB(Phầntửcấutrúc),phépcoảnhnhịphâncủatậphợp A bởiphầntử cấu trúc B đƣợc kíhiệu:A B và viếtdƣ ới dạng công thứcnhƣ sau: z|(B) A         A B= Z  PhépcoảnhnhịphâncủatậphợpAbởiphầnt ửcấutrúcBlàtậphợpcácđiểmz(znằmở tâmđiểmcủa phần tử cấu trúc B) sao cho Bzlàtập con củaA. Hình 2.4: Ví dụ về phép toán co ảnh nhị phân vớiphần tử cấutrúc phẳng. PhéptoáncoảnhcủaảnhxámIvớicấutrúcphầntửkhôngphẳngHtạivịtrí (x, y) củaảnhIđƣợc xácđịnhnhƣsau: (IH)(x,y)=max(I(x+i,y+j)+H(i,j)|(i,j) DH)   Hình 2.5. Ví dụ về phép toán co ảnh trên ảnh xám với phần tử cấu trúc không phẳng. Trong đó, DHlà không gian ảnh củaphần tửcấu trúc khôngphẳngH. 6
  17. Chƣơng 2. Cơ sở lý thuyết 2.1.1.3. Phép giãn ảnh – Dialtion Gọi A là ảnh gốc, B là một phần tử cấu trúc. Phép giãn nhị phân của ảnh A với phần tử cấu trúc B đƣợc kí hiệu là AB và chúng ta có thể biểu diễn phép toán giãn ảnh dƣới dạng phép toán tổ hợp sau:  PhépgiãnảnhnhịphâncủatậpAbởiphầntửcấutrúcBlàtậphợpcủacácđiểmz (zlàtâmcủa phần tử cấu trúc B trên tập A) sao chophản xạ của Bzgiao với tập A tạiít nhấtmột điểm. Hình 2.6: Ví dụ về phép giãn nhị phân trên ảnh vớiphần tử cấutrúc phẳng Phép toángiãn ảnh củaảnh xámI với cấutrúc phần tử không phẳngH tạivị trí (x, y) củaảnhIđƣợc xácđịnhnhƣsau: (IH)(x,y)=max(I(x+i,y+j)+H(i,j)|(i,j) DH)    (2.5) 7
  18. Chƣơng 2. Cơ sở lý thuyết Hình 2.7:. Phép toán giãn ảnh trên ảnh xám với phần tử cấu trúc không phẳng. Trong đó, DH là không gian ảnh của phần tử cấu trúc không phẳng H. 2.1.1.4. Phép mở ảnh– Openning GọiAlàhìnhảnhgốcvàBlàphầntửcấutrúc,()làkýhiệucủaphépmởảnh giữa tậphợp Avà phần tử cấu trúcB, phépmở ảnh đƣợc xácđịnhbởi côngthức: AB = (A⊖B)⊕B (2.6) 2.1.1.5. Phép đóng ảnh VớitậphợpAlàảnhgốc,Blàphầntửcấutrúc. làkýhiệuphépđóngảnh. KhiđóphépđóngảnhcủatậphợpAbởiphầntửcấutrúcB,kíhiệulà(A B)xácđịnh bởi: (A B)=(AB) B. (2.7) Hìnhdƣớiđâylàmộtvídụvề cácphéptoánxửlýhìnhhọctrênảnh. Trongđó,ápdụngcácphéptoánxửlýảnhnhịphânvớiphầntửcấutrúccóhìnhdáng ởhình2.8;vớiảnhxámsửdụngcấutrúcphầntửkhôngphẳngcóhìnhdánglân cận và giá trịnhƣ2.9. 8
  19. Chƣơng 2. Cơ sở lý thuyết Hình 2.8: Phần tử cấu trúc phẳng Hình 2.9: Hình dáng lân cận và ma trận giá trị tương ứng của phần tử cấu trúc không phẳng Hình 2.10: Kết quả của một số phép biến đổi trên ảnh nhị phân và ảnh xám 9
  20. Chƣơng 2. Cơ sở lý thuyết 2.1.2. Các ứng dụng của các thuật toán xử lý hình thái học 2.1.2.1.Trích lọc biên ảnh –Boundaryextraction Để trích lọc biên củaảnhnhị phân A,chúng tathực hiệnhai bƣớc sau: . Đầu tiên, thực hiệnphép ăn mòn/phép co ảnh với phần tử cấu trúc B. . Sauđó,thựchiệnkhửnềncủaảnhAbằngcáchlấyảnhgốcAtrừchoảnhđã thực hiện ởbƣớc 1. Nhƣvậy,chúngtacóthểtríchlọcbiêncủaảnhA,kýhiệulàApvớimộtphầntử cấu trúc Bbằng công thức sau: Ap= A– (A B)   Yếu tốquantrọngtrongviệctríchlọc biêncủaảnhnhị phânlàđƣa rađƣợc phầntử cấu trúc khôngphẳnghợp lý. (a) (b) (c) (d) Hình 2.1: Trích lọc biên của đối tượng: (a) ảnh gốc, (b) hình dáng của phần tử cấu trúc, (c) ảnh sau khi thực hiện phép co ảnh với phần tử cấu trúc, (d) ảnh kết quả theo công thức trích lọc biên 10
  21. Chƣơng 2. Cơ sở lý thuyết 2.1.2.2.Tô đầy vùng – Region fill Ảnhnhịphânthƣờnglàkếtquảcủacácphépthựchiệnphânngƣỡnghoặcphân đoạnảnhxámhoặcảnhmàuđầuvào.Nhữngphépbiếnđổinàyrấthiểmkhi―hoàn hảo‖ donhữngnhân tố bênngoàimàtrong quátrìnhlấymẫuảnhchúngtakhôngkiểm soátđƣợcnhƣcƣờngđộsánghayđộchóixuấthiệntrongảnhvànócóthểđểlại những―lỗhổng‖saukhithựchiệnlấyngƣỡnghoặcphânđoạnảnh.Sửdụngcácphép xử lý hìnhthái họcđể lấp đầy cáclỗ hổng thực sự rấthiệuquả. ChomộtảnhnhịphânAgồmcó:cácđiểmảnhlàbiêncủađốitƣợngđƣợcgán nhãnbằng1vàcácđiểmảnhkhôngphảilàbiênđƣợcgánnhãnbằng0.ĐặtBlàcấu trúcphầntửvà x0làmộtđiểm ảnhbất kìnằm tronglỗhổng đƣợc bao bọcbởi biêncủa đốitƣợng(điểmxuấtphát).Việclàmđầyđốitƣợngđƣợcthựchiệnbằngcáchlặpđi lặp lạibiểu thức sau: x0 = 1; do =( −1⨁ )∩ , với k = 1,2,3, (2.9) until xk = xk-1. Kết quả vùng đối tƣợng đƣợc lấp đầy cuối cùng chúng ta có đƣợc là H=A ∪ (a) (b) Hình 2.2: Kết quả của việc thực hiện lấp đầy vùng ảnh: (a) ảnh nhị phân với các “lỗ hổng”, (b) ảnh sau khi được lấp đầy. 11
  22. Chƣơng 2. Cơ sở lý thuyết 2.1.2.3. Trích lọc thành phần liên thông - Extracting connected components Tậphợptấtcảcácđiểmảnhkếtnốitớimộtđiểmảnhnàođógọilàcácthành phầnkếtnốicủađiểmảnhđó[25].Mộtnhómcácgiátrịđiểmảnhđƣợckếtnốivới nhauphânbiệtvớicácnhómđiểmảnhkhácthôngquaviệcgánnhãnkhácnhaucho cácnhóm.Cácnhãnnàylàcácsốnguyên,trongđónềncógiátrịbằng0,cácvùng ảnh/nhóm cácđiểmảnh liên thông với nhauđƣợc gán nhãn từ1 trởđi. Hình 2.3: Hình dáng 4 lân cận(N4)và 8 lân cận(N8) Thuậttoángánnhãncácthànhphầnliênthôngvớisốlân cậnlà8(N8)thực hiện nhƣ sau: - Quét ảnh đầu vào tuần tự theohàng từ trên xuống cho đến khi gặp một điểmp bất kì (p=1,nếu là ảnhnhịphần) trong ảnh. - Kiểmtra cáclân cậnp. Dựa trên những thôngtin đó,việcđánh nhãnsẽđƣợc thực hiện nhƣ sau: - Nếu tất cả4 lân cận của p đềubằng 0, thì gán một nhãn mới chop, ngƣợc lại. - Nếu chỉ một lân cận của p cógiá trịbằng1, gán nhãn chop, ngƣợc lại. - Nếu cónhiều hơn mộtlân cận của p cógiá trịbằng1, gán một nhãn trong các nhãn cho pvà ghichú thích tƣơngtự. Saukhihoàn tấtquá trìnhquét, cáccặp nhãntƣơngứngđã đƣợc sắp xếp vào các nhóm tƣơng ứng vàmỗi nhómsẽchỉcó một nhãn duy nhấtđƣợc gán. 12