Báo cáo Ứng dụng giải thuật fastica trong tách nguồn mù và trích đặc trưng (Phần 1)

pdf 22 trang phuongnguyen 90
Bạn đang xem 20 trang mẫu của tài liệu "Báo cáo Ứng dụng giải thuật fastica trong tách nguồn mù và trích đặc trưng (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbao_cao_ung_dung_giai_thuat_fastica_trong_tach_nguon_mu_va_t.pdf

Nội dung text: Báo cáo Ứng dụng giải thuật fastica trong tách nguồn mù và trích đặc trưng (Phần 1)

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH CÔNG TRÌNH NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG ỨNG DỤNG GIẢI THUẬT FASTICA TRONG TÁCH NGUỒN MÙ VÀ TRÍCHS K C 0 0 3 9 5 9 ÐẶC TRƯNG MÃ SỐ: T2013-13 S KC 0 0 5 3 8 4 Tp. Hồ Chí Minh, 2013
  2. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC SƢ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH BÁO CÁO TỔNG KẾT ĐỀ TÀI KH&CN CẤP TRƢỜNG ỨNG DỤNG GIẢI THUẬT fastICA TRONG TÁCH NGUỒN MÙ VÀ TRÍCH ĐẶC TRƢNG Mã số: T2013-13 Chủ nhiệm đề tài: ThS. Ngô Quốc Cƣờng TP. HCM, 11/2013
  3. TRƢỜNG ĐẠI HỌC SƢ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH KHOA ĐIỆN – ĐIỆN TỬ BÁO CÁO TỔNG KẾT ĐỀ TÀI KH&CN CẤP TRƢỜNG ỨNG DỤNG GIẢI THUẬT fastICA TRONG TÁCH NGUỒN MÙ VÀ TRÍCH ĐẶC TRƢNG Mã số: T2013-13 Chủ nhiệm đề tài: ThS. Ngô Quốc Cƣờng Thành viên đề tài: ThS. Nguyễn Ngô Lâm TP. HCM, 11/2013
  4. DANH SÁCH CÁN BỘ THAM GIA THỰC HIỆN ĐỀ TÀI STT MSCB Họ và tên Đơn vị công tác Nội dung công việc ĐT-Viễn thông-khoa ThS. Ngô 1. 0390 Điện-Điện tử- Xây dựng thuật Quốc Cƣờng ĐHSPKT Tp.HCM toán ĐT-Viễn thông-khoa ThS. Nguyễn Triển khai ứng dụng 2. 2204 Điện-Điện tử- Ngô Lâm ĐHSPKT Tp.HCM
  5. MỤC LỤC MỤC LỤC i DANH SÁCH HÌNH iii DANH SÁCH TỪ VIẾT TẮT v THÔNG TIN KẾT QUẢ NGHIÊN CỨU vi INFORMATION ON RESEARCH RESULTS vii MỞ ĐẦU 1 Chƣơng 1 3 CƠ SỞ LÝ THUYẾT 3 1.1 Lý Thuyết Chung Về ICA 3 1.1.1 Mô Hình ICA Cơ Bản 3 1.1.2 Giả thiết trong ICA 3 1.2 Ƣớc lƣợng Trong ICA 4 1.2.1 Đo Tính Phi Gauss Bằng Kurtosis 4 1.2.2 Đo Tính Phi Gauss Bằng Negentropy 4 1.3 Tiền Xử Lý trong ICA 5 1.3.1 Qui Tâm Tín Hiệu 5 1.3.2 Trắng Hoá 5 1.4 ICA dùng phƣơng pháp cực đại tính phi Gauss 6 1.5 Phƣơng Pháp Tái Hiện Hình Ảnh Và Tín Hiệu Não Ngƣời 7 1.5.1 Phƣơng pháp EEG 7 1.5.2 Phƣơng Pháp MRI 8 1.5.3 Phƣơng Pháp Quang Phổ Cận Hồng Ngoại fNIRS 10 Chƣơng 2 13 ỨNG DỤNG fast-ICA TRONG TÁCH NGUỒN MÙ 13 2.1 Nguồn Tín Hiệu Sin và Răng Cƣa 13 2.2 Nguồn Tín Hiệu Âm Thanh 22 Chƣơng 3 22 ỨNG DỤNG fastICA Trong Trích Đặc Trƣng Tín Hiệu NIRS 22 3.1 Các Vùng Chức Năng Não Ngƣời 22 3.2 Thiết Bị và Tín Hiệu fNIRS 24 3.2.1 Thiết Bị 24 3.2.2 Tín Hiệu fNIRS 26 3.3 Thiết Lập Thí Nghiệm Thu Dữ Liệu Cho Hoạt Động Gõ Tay 28 3.4 Tiền xử lý dữ liệu 31 3.5 Mô hình trích đặc trƣng áp dụng fastICA 33 i
  6. Chƣơng 4 38 4.1 Kết luận 38 4.2 Hƣớng phát triển 38 ii
  7. DANH SÁCH HÌNH Hình 1. 1. Bố trí điện cực trong phép đo EEG 7 Hình 1. 2. Bốn loại sóng cơ bản trong phép đo EEG : sóng delta, theta, alpha, beta . 8 Hình 1. 3. Quá trình tác động lên nguyên tử hydro trong phƣơng pháp MRI 9 Hình 1. 4. Ảnh MRI có đƣợc theo phƣơng pháp T1 và T2 (từ trái sang) 10 Hình 1. 5. Dải bƣớc sóng từ tia Gamma đến vô tuyến 10 Hình 1. 6. Tác động tia cận hồng ngoại vào vỏ não 11 Hình 1. 7. Phổ hấp thụ hemoglobin đối với các bƣớc sóng khác nhau 11 Hình 2. 1. Sơ đồ tổng quát giải bài toán tách nguồn mù. Các nguồn ở đây là các nguồn âm thanh khác nhau. Trong bài toán này tác giả sử dụng hai nguồn âm thanh gốc. 13 Hình 2. 2. Tín hiệu gốc sin: biên độ 2 (V), tần số 300 Hz. Tín hiệu gốc răng cƣa: biên độ 3 (V), tần số 100 Hz, hệ số công tác 70%. 14 Hình 2. 3. Hai tín hiệu trộn từ thành phần sin 300 Hz và răng cƣa 100 Hz. 14 Hình 2. 4. Hai tín hiệu gốc đƣợc ƣớc lƣợng 15 Hình 2. 5. Tín hiệu tách đƣợc xét trên mặt tần số của thành phần sin 300 Hz và răng cƣa 100 Hz. 16 Hình 2. 6. Tín hiệu tổng hợp từ tín hiệu sin tần số 3000 Hz, tín hiệu răng cƣa tần số 1000 Hz 17 Hình 2. 7. Tín hiệu ƣớc lƣợng trong trong trƣờng hợp sin 3000 Hz và răng cƣa 1000 Hz. 17 Hình 2. 8. Quan sát trên miền tần số của tín hiệu ƣớc lƣợng trong trƣờng hợp sin 3000 Hz và răng cƣa 1000 Hz 18 Hình 2. 9. Tín hiệu sin có tần số f1=500Hz và tín hiệu vuông có tần số f2=200Hz, hệ số công tác 50%. 19 Hình 2. 10. Tín hiệu ƣớc lƣợng trong trong trƣờng hợp sin 500 Hz và vuông 200 Hz. 19 Hình 2. 11. Tín hiệu ƣớc lƣợng trong trong trƣờng hợp sin 500 Hz và vuông 200 Hz quan sát trên miền tần số 20 Hình 2. 12. Mô hình tín hiệu trộn thu đƣợc trong trƣờng hợp có nhiễu 20 Hình 2. 13. Tín hiệu trộn dƣới tác động của nhiễu 21 Hình 2. 14. Tín hiệu ƣớc lƣợng đƣợc dƣới tác động của nhiễu trong trƣờng hợp tín hiệu gốc là tín hiệu sin tần số 800 Hz, tín hiệu vuông tần số 1200 Hz 21 Hình 2. 15. Quan sát trên miền tần số tín hiệu ƣớc lƣợng sin tần số 800 Hz, vuông tần số 1200 Hz 22 Hình 3. 1. Phân chia các thùy trên vỏ não 22 Hình 3. 2. Vị trí vùng điều khuyển chuyển động motor control 23 Hình 3. 3. Các chức năng liên quan trong vùng motor control 23 iii
  8. Hình 3. 4. Máy fNIRS : FOIRE-3000 24 Hình 3. 5. Các kiểu bố trí Holder khác nhau 24 Hình 3. 6. Các thành phần của Holder khi tháo rời 25 Hình 3. 7. Bố trí Holder và các đầu đo (a)) cho thí nghiệm trên máy FOIRE-3000 cùng phần mềm fNIRS (b)). 25 Hình 3. 8. Thiết lập các thông số trên máy fNIRS dùng phần mềm fNIRS 26 Hình 3. 9. Tín hiệu OxyHb, DeOxyHb, và TotalHb của kênh 1 trong 1,4 giây đầu tiên 28 Hình 3. 10. Bố trí các đầu đo trên hai bán cầu não của chủ thể tham gia thí nghiệm 28 Hình 3. 11. Hoạt động gõ tay trong thí nghiệm 29 Hình 3. 12. Giao thức thời gian cho một lần gõ tay 29 Hình 3. 13. Vị trí các đầu đo (đầu phát – đỏ, đầu thu - xanh ), kênh đo trên khu vực motor control của bán cầu não trái 30 Hình 3. 14. Vị trí các đầu đo, kênh đo (màu vàng) trên khu vực motor control của bán cầu não phải 30 Hình 3. 15. Các kênh 2, 5, 6, 9 trên bán cầu não trái và 12, 15, 16, 19 trên bán cầu não phải đƣợc chọn để lấy dữ liệu 30 Hình 3. 16. Tín hiệu thu đƣợc từ các kênh 2, 5, 6, 9 trên bán cầu não trái 31 Hình 3. 17. Tín hiệu thu đƣợc từ các kênh 12, 15, 16, 19 trên bán cầu não phải 31 Hình 3. 18. Áp dụng đối với tín hiệu trên các kênh ở não trái. Tín hiệu gốc – Origin signal, tín hiệu đƣợc làm phẳng Smooth signal 32 Hình 3. 19. Áp dụng đối với tín hiệu trên các kênh ở não phải 33 Hình 3. 20. Bố trí đầu phát (đỏ), đầu thu (xanh dƣơng) và các kênh đo giữa các đầu đo. 33 Hình 3. 21. Sơ đồ tƣơng đƣơng nhằm áp dụng trên thuật toán fastICA 33 Hình 3. 22. Tín hiệu ƣớc lƣợng từ đầu phát 2, 3 sử dụng fastICA trong một lần gõ tay trái 34 Hình 3. 23. Tín hiệu ƣớc lƣợng từ đầu phát 2, 3 sử dụng fastICA trong một lần gõ tay phải 34 Hình 3. 24. Phân tích phổ của tín hiệu ƣớc lƣợng trong một lần gõ tay trái (1) 35 Hình 3. 25. Phân tích phổ của tín hiệu ƣớc lƣợng trong một lần gõ tay phải (1) 35 Hình 3. 26. Phân tích phổ của tín hiệu ƣớc lƣợng trong một lần gõ tay trái (2) 36 Hình 3. 27. Phân tích phổ của tín hiệu ƣớc lƣợng trong một lần gõ tay phải (2) 36 iv
  9. DANH SÁCH TỪ VIẾT TẮT BSS Blind Source Saperation fastICA fast Independent Component Analysis fNIRS functional Near Infra-Red Spectroscopy MRI Magnetic Resonance Imaging EEG ElectroEncephaloGraphy v
  10. TRƢỜNG ĐẠI HỌC SƢ PHẠM KỸ THUẬT CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM THÀNH PHỐ HỒ CHÍ MINH Độc lập - Tự do - Hạnh phúc ĐƠN VỊ: ĐIỆN- ĐIỆN TỬ Tp. HCM, Ngày 22 tháng 11 năm 2013 THÔNG TIN KẾT QUẢ NGHIÊN CỨU 1. Thông tin chung: - Tên đề tài: ỨNG DỤNG GIẢI THUẬT fastICA TRONG TÁCH NGUỒN MÙ VÀ TRÍCH ĐẶC TRƢNG - Mã số: T2013-13 - Chủ nhiệm: Ngô Quốc Cƣờng - Cơ quan chủ trì: Đại Học Sƣ Phạm Kỹ Thuật TP. HCM - Thời gian thực hiện: 3/2013 đến 12/2013 2. Mục tiêu: Tách nguồn mù từ các tín hiệu trộn. Trích đặc trƣng của đối tƣợng. 3. Tính mới và sáng tạo: Áp dụng giải thuật fastICA để trích đặc trƣng trong tín hiệu NIRS. 4. Kết quả nghiên cứu: Tách đƣợc nguồn tín hiệu gốc từ tín hiệu trộn lẫn. Trích đƣợc đặc trƣng tín hiệu NIRS dùng giải thuật fastICA. 5. Sản phẩm: Tài liệu cơ bản về phép phân tích thành phần độc lập Bài báo đăng trên website Khoa Điện- Điện tử 6. Hiệu quả, phƣơng thức chuyển giao kết quả nghiên cứu và khả năng áp dụng: Tài liệu dùng trong giảng dạy Thực tập mô phỏng, Xử lý tín hiệu số Trƣởng Đơn vị Chủ nhiệm đề tài (ký, họ và tên) (ký, họ và tên) vi
  11. INFORMATION ON RESEARCH RESULTS 1. General information: Project title: Applying fastICA Algorithm for Blind Source Saperation and NIRS Features Extraction Code number: T2013-13 Coordinator: Cuong Ngo Implementing institution: Univerisy of Technical Education HCMC Duration: from March/2013 to December/2013 2. Objective(s): Extract the original signals from the mixed signals. Feature extraction for NIRS 3. Creativeness and innovativeness: Applying fastICA on NIRS signal 4. Research results: Verify the original signals from the mixed signals Figure out the NIRS feature for future work 5. Products: Basic material of ICA Paper proposed on FEEE website 6. Effects, transfer alternatives of research results and applicability: Reference material for Lab experiments. vii
  12. 1. Mở Đầu MỞ ĐẦU Bài toán phân tách nguồn mù (Blind Source Separation - BSS) đƣợc đƣa ra từ những năm 1980 trong vấn đề "cocktail-party" : phân tách âm thanh của nhiều ngƣời trong một phòng từ các tín hiệu thu đƣợc bởi các micro. Cho đến nay đã có nhiều phƣơng pháp giải quyết bài toán BSS dựa vào các đặc tính thống kê của tín hiệu nhƣ Hidden Markov, PCA, Natural Gradient, ICA Phƣơng pháp ICA (Independent Component Analysis) đƣợc xem là phƣơng pháp phổ biến nhất thực hiện phân tách các tín hiệu dựa vào tính thống kế của tín hiệu. Đây là phƣơng pháp đƣợc quan tâm nhiều trong những năm qua và đƣợc ứng dụng trong nhiều lĩnh vực khác nhau. Tách âm dùng phƣơng pháp phân tích thành phần độc lập đã đƣợc nghiên cứu để tách các nguồn âm thanh trộn lẫn nhau [7]. Việc tách âm nhằm lấy ra âm thanh mà tai chủ định muốn nghe một cách dễ dàng hơn. Phép phân tích thành phần độc lập cũng đƣợc áp dụng trong tách nguồn trong ảnh [1]. Chất lƣợng ảnh đƣợc cải thiện nhờ ứng dụng fast-ICA kết hợp với việc điều chỉnh hàm phân bố Gauss. Việc trích thông tin hữu ích và giảm nhiễu trên tín hiệu y sinh đƣợc thực hiện nhờ vào phép phân tích tích thành phần độc lập không-thời gian [4]. Các thông tin về thời gian và không gian từ hệ thống đa kênh đƣợc kết hợp để trích thông tin. Rất nhiều nhà nghiên cứu về khoa học thần kinh trên thế giới đã bị cuốn hút bởi kỹ thuật fNIRS, nhƣng ở Việt Nam, đây vẫn là một vấn đề khá mới. Nhiều công trình đã đƣợc công bố trên các tạp chí, hội nghị về các khía cạnh khác nhau dựa trên kỹ thuật quang phổ cận hồng ngoại. Tín hiệu fNIRS phản ánh hoạt động của não và chức năng liên quan trong khi gõ ngón tay [8]. Mô hình mạng nơ-ron Bayessian dự đoán hành vi từ thông tin não đo đƣợc bởi máy fNIRS [9]. Nhận dạng chức năng não thông qua phân tích wavelet tín hiệu fNIRS và mạng nơ-ron [6]. Nhận biết hoạt động não còn đƣợc thực hiện thông qua quỹ đạo nồng độ oxy [11]. Dựa trên hệ số góc của đƣờng thẳng thu đƣợc từ hồi quy tuyến tính, ta có thể phân biệt đƣợc là tay trái hay tay phải đang đƣợc gõ [2]. Oxy-Hb và deOxy-Hb còn có thể đƣợc dùng trực tiếp với giải thuật SVM để nhận dạng hoạt động gõ tay [10]. Phân tích các sự kiện, kiểm tra việc nói dối áp dụng trên tín hiệu quang phổ cận hồng ngoại (NIRS) cùng với giải thuật ICA cũng đã đƣợc đề xuất [5]. Tín hiệu Oxy- Hb có thể đƣợc phân giải và từ đó tìm vùng tích cực tƣơng ứng với biểu lộ cảm xúc. Tính cấp thiết Hiện nay, lĩnh vực xử lý tín hiệu, xử lý ảnh hay nhận dạng ngày càng phát triển mạnh. Đặc biệt với các giải thuật trích đặc trƣng mới cho độ tin cậy cao. Đề tài xây dựng và ứng dụng giải thuật fastICA trong tách nguồn mù và trích đặc trƣng. 1
  13. 1. Mở Đầu Kết quả của đề tài có thể đƣợc sử dụng vào việc nghiên cứu việc giảng dạy cho sinh viên chuyên ngành điện tử viễn thông. Mục tiêu đề tài Tách nguồn mù từ các tín hiệu trộn. Trích đặc trƣng của đối tƣợng. Cách tiếp cận, phương pháp nghiên cứu, phạm vi nghiên cứu Cách tiếp cận Lý thuyết đến thực nghiệm Phƣơng pháp nghiên cứu Nghiên cứu lý thuyết Mô phỏng Thực nghiệm Phạm vi nghiên cứu Ứng dụng giải thuật fastICA trong tách nguồn mù (nguồn tín hiệu mô phỏng) và trích đặc trƣng của đối tƣợng (tín hiệu NIRS). Nội dung nghiên cứu Cơ sở lý thuyết phân tích thành phần độc lập ICA Thuật toán fast ICA Ứng dụng thuật toán trong tách nguồn mù Ứng dụng thuật toán trong trích đặc trƣng trên tín hiệu NIRS 2
  14. 1. Cơ Sở Lý Thuyết Chƣơng 1 CƠ SỞ LÝ THUYẾT 1.1 Lý Thuyết Chung Về ICA 1.1.1 Mô Hình ICA Cơ Bản Để định nghĩa ICA [3], ta có thể sử dụng một mô hình thống kê „biến ẩn‟. Giả sử ta quan sát n biến ngẫu nhiên x1,x2, xn, các biến này đƣợc biểu diễn theo sự kết hợp tuyến tính với của n biến ngẫu nhiên s1,s2 sn: xi = ai1s1 + ai2s2 + + ainsn (1.1) Với aij, i,j =1, ,n là các hệ số thực. Theo định nghĩa, sj là độc lập thống kê với nhau. Đây là mô hình ICA cơ bản. Nó mô tả dữ liệu thu đƣợc bằng cách trộn các hành phần sj với nhau. Thành phần độc lập sj (viết tắt: ICs) là biến ẩn, không thể quan sát trực tiếp đƣợc. Ngoài ra các hệ số trộn aij cũng đƣợc giả sử là không biết. Tất cả những gì ta quan sát đƣợc là các biến ngẫu nhiên xi, và ta phải ƣớc lƣợng các hệ số trộn aij và các thành phần sj bằng cách sử dụng xi. Ở đây biến thời gian t đã đƣợc bỏ qua. Bởi vì trong mô hình ICA cơ bản này, ta giả định rằng xi cũng nhƣ mỗi thành phần độc lập sj là biến ngẫu nhiên, thay vì biểu diễn theo thời gian. Nhƣ vậy, ta có thể bỏ qua thời gian trễ trong quá trình kết hợp các thành phần độc lập chƣa biết. ICA có thể đƣợc miêu tả nhƣ bài toán tách nguồn mù. Nguồn ở đây chính là các tín hiệu gốc – thành phần độc lập chƣa biết. Do thông tin về sự kết hợp này cũng chƣa biết trƣớc nên ta có thể so sánh mô hình trong công thức (1.1) tƣơng ứng với bài toán tách nguồn mù và đƣợc sử dụng làm cơ sở cho các ứng dụng về sau. Sử dụng biểu diễn theo dạng ma trận cho công thức (1.1), ta có: x = As (1.2) Trong đó, x đại diện cho x1,x2, xn. và s là các thành phần s1 sn, ma trận A với các phần tử aij. 1.1.2 Giả thiết trong ICA Mô hình ICA cơ bản đặt ra các giả thiết sau cho việc phân ly (ƣớc lƣợng) các thành phần độc lập: Các nguồn s độc lập thống kê nhau, nghĩa là biết đƣợc một nguồn không thể suy ra các nguồn còn lại. Các hàm phân bố xác suất của các nguồn có trị trung bình bằng không. Không có nguồn (thành phần độc lập) nào có phân bố Gauss. Ma trận trộn A là ma trận vuông tức số lƣợng nguồn và số lƣợng trộn bằng nhau. 3
  15. 1. Cơ Sở Lý Thuyết 1.2 Ƣớc lƣợng Trong ICA Mô hình ICA đặt ra một hạn chế là các thành phần độc lập phải có tính phi Gauss (non-gaussianity), tức không có phân bố (hàm mật độ xác suất) là Gauss. Lý do tính phi Gauss nằm ở chỗ là các biến ngẫu nhiên Gauss đƣợc xác định hoàn toàn bởi các thống kê bậc một (trị trung bình) và bậc hai (phƣơng sai), các thống kê bậc cao hơn bằng không. Trong lúc đó, mô hình ICA cần các thống kê bậc cao hơn của các thành phần độc lập để thực hiện sự phân ly (ƣớc lƣợng các thành phần độc lập). Nhƣ vậy, sự phi tuyến, tính phi Gauss dẫn đến sự độc lập thống kê. Nhiều giải thuật khác nhau đã đƣợc đề xuất để giải quyết bài toán ƣớc lƣợng các thành phần độc lập trong ICA: Cực đại hóa tính phi Gauss (non-gaussianity) Ƣớc lƣợng khả năng cực đại (maximum likelihood) Cực tiểu hoá thông tin tƣơng hỗ (mutual information) 1.2.1 Đo Tính Phi Gauss Bằng Kurtosis Đầu tiên là phép đo dựa trên kurtosis của một biến ngẫu nhiên y có trung bình bằng không là cumulant bậc bốn: 4 2 2 kurt( y) = E{y } - 3 (E{y }) (1.3) Thật ra vì ta giả sử y có phƣơng sai đơn vị, nên kurtosis là kurt(y)=E{y4}–3, tức kurtosis là phiên bản chuẩn hóa của momen thứ tƣ E{y4}. Khi y có phân bố Gauss momen thứ tƣ bằng 3(E{y2})2 nên kurtosis bằng không đối với các biến ngẫu nhiên Gauss. Hầu hết các biến ngẫu nhiên không phải Gauss thì kurtosis khác không. Nếu kurtosis là dƣơng thì biến ngẫu nhiên có phân bố siêu Gauss (supergaussian), còn nếu kurotsis là âm thì biến ngẫu nhiên có phân bố dƣới Gauss (subgaussian). Phân bố siêu Gauss không còn dạng hình chuông nhƣ Gauss mà tăng nhanh ở trung tâm tƣơng tự nhƣ phân bố Laplace, còn phân bố dƣới Gauss không nhô lên ở phần giữa nhƣ Gauss mà tiến đến phân bố đều với biên độ rất nhỏ ở xa trung tâm. 1.2.2 Đo Tính Phi Gauss Bằng Negentropy Một phép đo tính phi Gauss khác là negentropy. Negentropy là đại lƣợng dựa trên lý thuyết thông tin gọi là entropy vi sai. Entropy của một biến ngẫu nhiên là số đo lƣợng thông tin trung bình của nó. Entropy (vi sai) H của vectơ ngẫu nhiên y có hàm phân bố f(y) định nghĩa nhƣ sau: H(y) = - f (y)logf (y) f (y)dy (1.4) Đặc tính quan trọng của entropy là biến ngẫu nhiên Gauss có entropy lớn nhất trong các biến ngẫu nhiên có cùng phƣơng sai. Nhƣ vậy entropy, và negentropy định nghĩa theo entropy, có thể dùng để đo tính phi Gauss của một biến ngẫu nhiên. Để có đƣợc một số đo tính phi Gauss sao cho bằng không đối với biến Gauss và luôn không âm, ta định nghĩa negentropy của vectơ ngẫu nhiên y: 4
  16. 1. Cơ Sở Lý Thuyết J(y) = H(yGauss ) - H(y) (1.5) Trong đó yGauss là một vectơ ngẫu nhiên Gauss cùng ma trận hiệp phƣơng sai (hay ma trận tƣơng quan vì các dữ liệu đƣợc giả sử có trung bình là không). Tuy nhiên tính toán negentropy lại khó khăn. Một số tính toán xấp xỉ đã đƣợc phát triển. 1.3 Tiền Xử Lý trong ICA Tiền xử lý là quá trình xử lý tín hiệu thu đƣợc x trƣớc khi thực hiện ƣớc lƣợng tín hiệu gốc. Tiền xử lý đƣợc sử dụng để việc giải bài toán ICA trở nên đơn giản hơn, gồm có quy tâm và trắng hóa tín hiệu. 1.3.1 Qui Tâm Tín Hiệu Nhƣ đã nêu ở trƣớc, các tín hiệu trộn quan sát đƣợc x phải có trị trung bình m=E[x] bằng không, điều này cũng có nghĩa là các tín hiệu nguồn s cũng có trị trung bình là không. Nếu các tín hiệu chƣa có trị trung bình là không ta thực hiện phép qui tâm tức trừ phân bố của các biến ngẫu nhiên với các trị trung bình của chúng: x = x - E{x } (1.6) Trong đó, x′ là vectơ ngẫu nhiên chƣa có trung bình là không. Sau khi đã ƣớc lƣợng ma trận A và các thành phần s ta có thể thêm trở lại các trị trung bình của chúng. Khi vectơ ngẫu nhiên x (hoặc s) có trị trung bình là không thì hiệp phƣơng sai và tƣơng quan của nó giống nhau. 1.3.2 Trắng Hoá Sau khi đã quy tâm, ta thực hiện một biến đổi trên x để đƣợc một vector mới gọi là vector trắng. Mục đích của việc làm trắng này là làm cho dữ liệu không tƣơng quan. x đƣợc gọi là trắng khi T E{xx } I (1.7) Việc làm trắng là một biến đổi tuyến tính thông qua ma trận V z = Vx (1.8) Trong đó x là dữ liệu cần làm trắng và V là ma trận làm trắng, z là dữ liệu đã trắng hóa. Một trong những phƣơng pháp phổ biến để trắng hóa là sử dụng phƣơng pháp phân giải trị riêng (EVD) của ma trận hiệp phƣơng sai. T T E{xx } EDE (1.9) Với E là ma trận trực giao của các vectơ riêng của E{xxT} và D là đƣờng chéo ma trận của các giá trị riêng của nó, D = diag(d1, ,d2). Ma trận làm trắng đƣợc tính: 1/2 T V ED E (1.10) 5
  17. 1. Cơ Sở Lý Thuyết -1/2 1/ 2 1/2 1/2 Ma trận D đƣợc tính bằng một thao tác đơn giản D diag(d1 , ,dn ) . T -1/2 -1/2 Ma trận trắng hóa tính toán theo cách này đƣợc ký hiệu là E{xx } hoặc C . Trắng hóa biến đổi ma trận trộn thành ma trận mới. Ta có ~ z VAs As (1.11) ~ Sau khi đã ƣớc lƣợng đƣợc ma trận trắng hóa A , các thành phần độc lập đƣợc tính s Wz (1.12) ~ Trong đó, W A 1 . Từ đây, ma trận A đƣợc ƣớc lƣợng ~ A VA D 1/ 2ET A (1.13) ~ A ED1/ 2A ED1/ 2W 1 ED1/ 2WT (1.14) Vì W trực giao nên W 1 WT . 1.4 ICA dùng phƣơng pháp cực đại tính phi Gauss Để thực hiện ƣớc lƣợng tính phi Gauss trong ICA, kurtosis đƣợc sử dụng. Nhƣ đã đề cập, kurtosis thể hiện cumulant bậc 4 của một biến ngẫu nhiên. Kurtosis của y, kurt(y) đƣợc định nghĩa kurt(y) E{y4} 3(E{y2})2 (1.15) Trong thực tế, để cực đại trị tuyệt đối của kurtosis, ta sẽ bắt đầu từ vector w, tính toán hƣớng mà trị tuyệt đối kurtosis của y wT z tăng nhanh trên các mẫu z(1), , z(T), và sau đó chuyển vector w theo hƣớng đó. Ý tƣởng này đƣợc thực thi theo phƣơng pháp gradient. Gradient của trị tuyệt đối kurtosis của wT z có thể đƣợc tính  kurt(wT z) 4sign(kurt(wT z))[E{z(wT z)3} 3w w 2 ] (1.16) w Ta có đƣợc giải thuật gradient w  sign(kurt(wT z))[E{z(wT z)3} (1.17) w  w/ w (1.18) Để tăng tốc độ hội tụ, giải thuật lặp điểm cố định có thể đƣợc sử dụng trong việc tìm w. Sử dụng các nhân tử Lagrange, từ (1.16) ta có w  [E{z(wT z)3} 3 w 2 w] (1.19) Từ đây, ta tính giá trị mới cho w w  E{z(wT z)3} 3w (1.20) Sau mỗi vòng lặp, w đƣợc chuẩn hóa bằng cách chia cho độ lớn của nó (vì vậy w 1 và có thể bỏ qua trong công thức 1.20) 6
  18. 1. Cơ Sở Lý Thuyết Sự hội tụ của giải thuật lặp điểm cố định đó là giá trị w cũ và mới đều có cùng hƣớng, tức là nhân chấm của chúng bằng 1. Giải thuật này đƣợc chứng minh là hội tụ nhanh và đáng tin cậy nên đƣợc gọi là FastICA. 1.5 Phƣơng Pháp Tái Hiện Hình Ảnh Và Tín Hiệu Não Ngƣời 1.5.1 Phƣơng pháp EEG EEG (Electroencephalography) – điện não đồ là một phƣơng pháp ghi lại các hoạt động về điện trên da đầu của ngƣời. Phƣơng pháp này đo sự thay đổi điện áp do việc di chuyển của các hạt điện tích bên trong các nơ- ron của não. Tín hiệu EEG trên ngƣời đã đƣợc tìm ra bởi Hans Berger (1873- 1941). Bài báo đầu tiên vào năm 1929 của Berger cho thấy sự tồn tại của sóng alpha nhƣ là một thành phần chủ yếu trong tín hiệu EEG. Việc nạp điện áp trên não đƣợc duy trì bởi hàng tỷ nơ-ron. Các nơ-ron nạp điện bởi các màng vận chuyển protein bằng cách bơm ion vào màng của chúng. Các nơ- ron thƣờng xuyên trao đổi ion với ngoại bào, tạo nên một quá trình liên tục bằng cách đẩy ion từ nơ-ron này đến nơ-ron khác nhƣ một sóng điện. Khi các sóng ion này tiến đến các điện cực trên da đầu, chúng có thể đẩy và kéo electron trên kim loại của điện cực. Vì kim loại có thể đẩy và kéo electron một cách dễ dàng nên sự khác nhau giữa điện áp kéo và đẩy của bất kỳ cặp cực nào cũng sẽ đƣợc ghi nhận. Các giá trị điện áp đƣợc ghi nhận theo thời gian này chính là tín hiệu EEG. Tùy theo các ứng dụng khác nhau mà ta có thể bố trí các điện cực ở các vị trí tƣơng ứng. Hình 1.1 là một ví dụ về bố trí các điện cực trong phép đo EEG. Hình 1. 1. Bố trí điện cực trong phép đo EEG Trên cơ thể ngƣời khỏe mạnh, biên độ và tần số của các tín hiệu thay đổi từ trạng thái này đến trạng thái khác, chẳng hạn nhƣ lúc thức và ngủ. Đặc tính của các sóng đo đƣợc cũng thay đổi theo độ tuổi. Có 5 loại sóng não cơ bản đƣợc phân biệt theo các vùng tần số khác nhau. Dựa vào dải tần số tƣơng ứng mà các sóng đƣợc chia thành: alpha( ), theta ( ), beta (β), delta ( ), và gamma ( ). 7
  19. 1. Cơ Sở Lý Thuyết Sóng delta nằm trong vùng từ 0,5 – 4 Hz. Các sóng này có trong giấc ngủ sâu và sẽ hiện diện ở trạng thái tỉnh giấc. Tuy nhiên loại sóng này dễ bị ảnh hƣởng bởi các nhiễu nhân tạo do các khối cơ lớn ở cổ, hàm. Sóng theta nằm trong vùng từ 4 – 8 Hz. Sóng này thƣờng thấy ở tuổi vị thành niên, xuất hiện khi chuyển từ trạng thái hiểu biết sang thờ thẫn, khi con ngƣời căng thẳng hay xuất hiện các bệnh lý khác nhau. Sóng alpha có tần số từ 8 – 13 Hz. Sóng này xuất hiện nhiều khi nhắm mắt và thƣ giãn, xuất hiện trên vùng đầu phía sau hay trƣớc trán. Sóng beta có tần số từ 13 – 30 Hz. Sóng beta này thƣờng liên quan đến hành vi điều khiển hoạt động. Với biên độ thấp và tần số thay đổi trong phạm vi đã nói, sóng này cũng liên quan đến vấn đề khi suy nghĩ hay tập trung cao. Sóng gamma có tần số từ 30 – 100 Hz. Nó thể hiện sự ràng buộc của một số lƣợng lớn các nơ- ron lại với nhau cho mục đích thực thi một hoạt động nhận thức ngẫu nhiên hoặc chức năng vận động. Hình ảnh của các sóng vừa trình bày đƣợc tóm tắt trong hình 1.2. Khi thực hiện các hành vi khác nhau thì trên não xuất hiện các loại sóng với các tần số khác nhau. Đây chính là điều mà EEG mang lại. Hình 1. 2. Bốn loại sóng cơ bản trong phép đo EEG : sóng delta, theta, alpha, beta 1.5.2 Phƣơng Pháp MRI Magnetic Resonance Imaging (MRI) – ảnh cộng hƣởng từ là một kỹ thuật quan trọng trong chẩn đoán lâm sàng dựa trên độ tƣơng phản giữa các mô mềm khác nhau. MRI đã đƣợc phát minh từ đầu những năm 1970. 8
  20. 1. Cơ Sở Lý Thuyết Để tạo ra ảnh cộng hƣởng từ, bệnh nhân đƣợc đặt trong một từ trƣờng mạnh. Từ trƣờng này sẽ canh chỉnh các nguyên tử hidro – hay proton trong ngƣời bệnh theo hƣớng của trƣờng. Sau đó, các nguyên tử bị xáo trộn từ việc định hƣớng này bằng cách sử dụng sóng có tần số vô tuyến (RF) từ bên ngoài. Sóng RF này tạo ra một trƣờng điện từ biến thiên. Trƣờng điện từ biến thiên này có một tần số gọi là tần số cộng hƣởng, nó bị hấp thụ và lật momen của proton trong trƣờng từ. Tiếp theo là sóng RF bị tắt đi, các nguyên tử hydro bị canh chỉnh lại bởi trƣờng từ tĩnh và tạo ra ra tín hiệu RF. Hình 1.3 miêu tả quá trình tác động lên nguyên tử hydro. Hình 1. 3. Quá trình tác động lên nguyên tử hydro trong phƣơng pháp MRI Tín hiệu RF phát ra từ các nguyên tử hydro khi chúng quay về hƣớng ban đầu phụ thuộc vào độ mạnh của trƣờng từ. Mỗi tín hiệu RF sẽ đƣợc phân tích bởi máy tính dựa trên cƣờng độ của chúng hay các tiêu chuẩn khác. Các tín hiệu này sau đó đƣợc chuyển qua ảnh xám. Có 2 phƣơng pháp cơ bản trong MRI. Chúng đƣợc gọi là trọng số T1 và trọng số T2. Ảnh trọng số T1 miêu tả nƣớc ứng với màu tối và mỡ ứng với màu sáng. Trong khi đó ảnh trọng số T2 thì ngƣợc lại. Một ví dụ về ảnh T1 và T2 đƣợc trình bày trong hình 1.4. Ngoài ra cũng có nhiều phƣơng pháp khác phát triển từ 2 phƣơng pháp trọng số cơ bản này nhƣ : Gradient Echo, FLAIR, . 9
  21. 1. Cơ Sở Lý Thuyết Hình 1. 4. Ảnh MRI có đƣợc theo phƣơng pháp T1 và T2 (từ trái sang) 1.5.3 Phƣơng Pháp Quang Phổ Cận Hồng Ngoại fNIRS Nếu nhƣ phƣơng pháp MRI sử dụng sóng nằm trong vùng tần số vô tuyến thì kỹ thuật fNIRS (functional Near Infra-Red Spectroscopy) sử dụng sóng ánh sáng trong vùng cận hồng ngoại. Dải bƣớc sóng đƣợc trình bày trong hình 1.5 Hình 1. 5. Dải bƣớc sóng từ tia Gamma đến vô tuyến Ánh sáng cận hồng ngoại (650 – 950 nm) có thể di chuyển qua sọ và tiến đến vỏ não với độ sâu lên đến 3cm nhƣ trong hình 1.6. Các sóng ánh sáng này bị hấp thụ bởi mô ở các mức độ khác nhau. Dựa trên phổ hấp thụ của HbR và HbO2 nhƣ trong hình 1.7, ta có thể tính đƣợc sự thay đổi mức độ tập trung bằng cách dựa vào cƣờng độ trên đầu thu. 10
  22. S K L 0 0 2 1 5 4