Luận văn Tách âm dùng phương pháp phân tích thành phần độc lập (Thuật toán Fastica) (Phần 1)

pdf 22 trang phuongnguyen 200
Bạn đang xem 20 trang mẫu của tài liệu "Luận văn Tách âm dùng phương pháp phân tích thành phần độc lập (Thuật toán Fastica) (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfluan_van_tach_am_dung_phuong_phap_phan_tich_thanh_phan_doc_l.pdf

Nội dung text: Luận văn Tách âm dùng phương pháp phân tích thành phần độc lập (Thuật toán Fastica) (Phần 1)

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ QUÁCH NGUYỄN LỆ HIỀN TÁCH ÂM DÙNG PHƯƠNG PHÁP PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP (THUẬT TOÁN FASTICA) NGÀNH: KỸ THUẬT ĐIỆN TỬ - 60520203 S K C0 0 4 6 6 0 Tp. Hồ Chí Minh, tháng 10/2015
  2. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC SƢ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ QUÁCH NGUYỄN LỆ HIỀN TÁCH ÂM DÙNG PHƢƠNG PHÁP PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP (THUẬT TOÁN FASTICA) NGÀNH: KỸ THUẬT ĐIỆN TỬ - 60520203 Hướng dẫn khoa học: PGS.TS. Dương Hoài Nghĩa TP.Hồ Chí Minh - Tháng 10/ 2015
  3. LÝ LỊCH KHOA HỌC I. LÝ LỊCH SƠ LƢỢC: Họ& tên: Quách Nguyễn Lệ Hiền Giới tính: Nữ Ngày, tháng, năm sinh: 15/12/1988 Nơi sinh: Bình Dương Quê quán: Tân Uyên - Bình Dương Dân tộc: Kinh Địa chỉ liên lạc: Tổ 1-Khu phố 4-P.Uyên Hưng - Tx.Tân Uyên - Bình Dương Điện thoại cơ quan: Điện thoại nhà riêng: Fax: E-mail: II. QUÁ TRÌNH ĐÀO TẠO: 1. Trung học chuyên nghiệp: Hệ đào tạo: Thời gian đào tạo từ / đến / Nơi học (trường, thành phố): Ngành học: 2. Đại học: Hệ đào tạo: Đại học Thời gian đào tạo từ 09/2007 đến 02/2012 Nơi học (trường, thành phố): Đại Học Sư Phạm Kỹ Thuật TPHCM. Ngành học: Công Nghệ Điện Tử Viễn Thông. Tên đồ án, luận án hoặc môn thi tốt nghiệp: Nhận dạng tiếng nói. Ngày & nơi bảo vệ đồ án, luận án hoặc thi tốt nghiệp: 21/02/2012 - Đại Học Sư Phạm Kỹ Thuật TPHCM. Người hướng dẫn: TS. Trần Tiến Đức. III. QUÁ TRÌNH CÔNG TÁC CHUYÊN MÔN KỂ TỪ KHI TỐT NGHIỆP ĐẠI HỌC: Thời gian Nơi công tác Công việc đảm nhiệm i
  4. LỜI CAM ĐOAN Tôi cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Tp. Hồ Chí Minh, ngày 23 tháng 8 năm 2015 (Ký tên và ghi rõ họ tên) Quách Nguyễn Lệ Hiền ii
  5. LỜI CẢM TẠ Trong suốt quá trình học tập, nghiên cứu và hoàn thành luận văn này, tôi đã nhận được sự hướng dẫn, giúp đỡ quý báu của các thầy cô giáo, các anh chị và các bạn. Với lòng biết ơn sâu sắc, tôi xin được bày tỏ lời cám ơn chân thành tới tất cả cá nhân và tập thể đã tận tình giúp đỡ, đóng góp ý kiến, khích lệ tinh thần để tôi có điều kiện tốt nhất để hoàn thành luận văn của mình. Đầu tiên, tôi xin bày tỏ sự biết ơn sâu sắc đến Thầy PGS. TS Dương Hoài Nghĩa đã tận tình, tận tâm chỉ bảo, hướng dẫn và định hướng cho tôi trong suốt quá trình nghiên cứu và hoàn thành luận văn. Tôi cũng xin bày tỏ lòng biết ơn của mình đến Ban giám hiệu, phòng đạo tạo sau đại học trường Đại học sư phạm kỹ thuật TP. HCM đã tạo mọi điều kiện thuận lợi để tôi hoàn thành tốt khóa học và tốt nghiệp. Cuối cùng, tôi muốn gửi lời cám ơn đến gia đình, người thân và bạn bè đã quan tâm, động viên và giúp đỡ tôi về mọi mặt trong suốt quá trình nghiên cứu, hoàn thành luận văn này. Tp. Hồ Chí Minh, ngày 10 tháng 8 năm 2015 Quách Nguyễn Lệ Hiền iii
  6. MỞ ĐẦU Mọi sự vật, hiện tượng trong tự nhiên đều không xuất hiện hoặc biến đổi đơn độc mà xuất hiện đồng thời với sự xuất hiện và biến đổi của các sự kiện khác trong mối quan hệ tương tác, phụ thuộc và ảnh hưởng lẫn nhau vừa mang tính quy luật vừa mang tính ngẫu nhiên. Trong âm thanh thường ít khi xảy ra sự cô lập. Khi có nhiều tín hiệu ở các khoảng tần số khác nhau được trộn lại, ta có thể lọc ra từng tín hiệu riêng biệt như lúc ban đầu. Còn nếu các tín hiệu nằm trong cùng khoảng tần số (ví dụ nhiều người cùng nói, tiếng hát trên nền nhạc, nhiều bản nhạc cùng chơi ), ta không thể dùng phương pháp lọc hay phân tích phổ thông thường để tách. Quá trình này được gọi là tách nguồn. Bài toán được đặt ra là, từ nhiều tín hiệu đã được trộn lẫn, làm thế nào để khôi phục lại từng tín hiệu nguồn riêng lẻ? Bản thân tai người cùng một thời điểm luôn tiếp nhận nhiều nguồn âm nhưng chúng ta luôn lắng nghe và nhận rõ nguồn âm có chủ định. Một hệ thống xử lý, nhận dạng tiếng hay điều khiển cần đạt mục tiêu như vậy. Kết quả của bài toán tách tín hiệu tiếng nói là cơ sở cho rất nhiều những ứng dụng trong thực tiễn liên quan tới xử lý tiếng nói. Kết quả của quá trình tách có tốt thì kết quả của nhận dạng mới chính xác được. Trong hơn chục năm qua, người ta đã phát triển một phương pháp mới giúp giải bài toán tách nguồn mù (Blind Source Separation – BSS) nêu trên rất hiệu quả, đó là phân tích thành phần độc lập (Independent Component Analysis – ICA). Trong luận văn này, người nghiên cứu thực hiện tách âm dùng phương pháp phân tích thành phần độc lập ( thuật toán flastICA). Trong đó đề cập đến lý thuyết, ứng dụng tách âm với nhiều hỗn hợp, chủ yếu tập trung vào các vấn đề tách nguồn xác định nơi số nguồn bằng số lượng các kênh trong hỗn hợp quan sát (số trộn). iv
  7. Abstract All subjects and natural phenomena very rarely appear or transform individually but concurrently with emergence and transformation of others in the interactive relationships, dependencies and influence to each other. It might be methodical or random. In acoustics, isolation rarely happens. When multiple signals in different frequency ranges are mixed together, we can filter out individual signal as in the beginning. If the signals are in the same frequency range (for example: people are talking or singing , many songs are being played ), we can’t use filtering methods or conventional spectrum analyzer to separate them. This process is called source separation.The problem here is how to separate them from each other? Human ear at the same time always received many sound sources, but we always listen and recognize the sound source intentional. A processing system, recognition or control should achieve such goal. Results of the problem separating voice signal is the basis for many practical applications related to speech processing. The results of the process with good separation, the result of new speech processing is accurate. Over the last decade, people have been developing a new method to solve blind source separation (Blind Source Separation - BSS) very efficiently, which is independent component analysis (Independent Component Analysis-ICA). In this thesis, acoustical source separation method will be performed using independentcomponent analysis(flastICAalgorithm).Themethodologyandapplication of the proposed method to mixed sounds, mainly focused on the source separation from a mixture of observations (the mixture), will be presented here. v
  8. MỤC LỤC Trang tựa TRANG Lý lịch khoa học i Lời cam đoan ii Lời cảm tạ iii Mở đầu iv Abstract v Mục lục vi Danh sách các hình x Danh sách các bảng xii Chƣơng 1. TỔNG QUAN 1 1.1. Lý do chọn đề tài 2 1.3 Mục tiêu nghiên cứu 2 1.4 Nhiệm vụ nghiên cứu 2 1.5 Khách thể và đối tƣợng nghiên cứu 2 1.6 Giả thuyết nghiên cứu 2 1.7 Phạm vi nghiên cứu 2 1.8 Phƣơng pháp nghiên cứu 2 1.9 Kế hoạch thực hiện 3 Chƣơng 2. KỸ THUẬT PHÒNG ẢO 4 2.1 Kỹ thuật âm học phòng 4 2.2 Mô hình âm học phòng 5 2.3 Phƣơng pháp theo sóng 6 2.4 Phƣơng pháp theo tia 7 2.4.1 Phƣơng pháp vạch tia 8 2.4.2 Phƣơng pháp nguồn ảnh 9 2.5 Minh họa giải thuật 10 vi
  9. 2.6 Kết luận 11 Chƣơng 3.GIỚI THIỆU TỔNG QUAN VỀBÀI TOÁN XỬ LÝ MÙ 13 3.1 Giới thiệu bài toán phân tách nguồn mù Blind Signal Processing (BSP) 21 3.2 Các mô hình đặc trƣng 23 3.3 Ứng dụng của bài toán BSS 13 3.3.1 Xử lý văn bản 14 3.3.2 Xử lý tín hiệu y sinh 15 3.3.3 Dự báo tài chính 17 3.3.4 Hệ thống viễn thông 19 3.3.5 Xử lý âm thanh 21 Chƣơng 4. PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP 26 4.1 Đặt vấn đề - bài toán cooktail-party 27 4.2 Mô hình ICA cơ bản 30 4.3 Các điểm không xác định trong ICA 31 4.4 Sự độc lập thống kê 32 4.4.1 Bất tƣơng quan 32 4.4.2 Độc lập thống kê 33 4.4.3 Tính phi Gauss 33 4.4.4 Hạn chế của ICA 34 4.5 Ƣớc lƣợng ICA 34 4.5.1 Phƣơng pháp ICA sử dụng tính phi Gauss 35 4.5.2 Phƣơng pháp ICA sử dụng thông tin hỗ tƣơng 43 4.5.3 Phƣơng pháp ICA sử dụng tính phi tƣơng quan phi tuyến 44 4.6 PCA và ICA 45 4.7 Kết luận 48 Chƣơng 5. THUẬT TOÁN FASTICA 49 5.1 Tiền xử lý ở ICA 49 5.1.1 Qui tâm 49 5.1.2 Trắng hóa 50 vii
  10. 5.2 Xấp xỉ hóa negentropy 53 5.3 Thuật toán FastICA 54 Chƣơng 6. THỰC NGHIỆM TÁCH ÂM 58 6.1 Mô hình thực hiện 58 6.2 Chuẩn đánh giá 59 6.3 Thực nghiệm và kết quả 60 6.4 Kết luận 77 Chƣơng 7. KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 78 TÀI LIỆU THAM KHẢO 82 PHỤ LỤC 84 Thuật toán FastICA 84 viii
  11. DANH MỤC TỪ VIẾT TẮT/ KÍ HIỆU KHOA HỌC Ký tự viết tắt Tiếng Anh Tiếng Việt BEM Boundary Element Method phương pháp phần tử biên BSP Blind Signal Processing Xử lý tín hiệu mù BSS Blind Sources Separation Phân tách nguồn mù BEM Boundary Element Method phương pháp phần tử biên FDTD Finite Difference Time Domain phương pháp miền thời gian vi sai hữu hạn FEM Finite Element Method phương pháp phần tử hữu hạn ICA Independent Component Phân tích các thành phần độc Analysis lập IC Independent Component Thành phần độc lập PCA Principal Component Analysis Phân tích các thành phần chính PDF probability density function Hàm mật độ xác suất STFT Short Time Fourier Transform Biến đổi Fourier thời gian ngắn ix
  12. DANH SÁCH CÁC HÌNH HÌNH TRANG Hình 2.1: Cấu trúc hình học một phòng đơn giản 4 Hình 2.2: Minh họa đáp ứng xung và trường âm của khán phòng thu được 5 Hình 2.3: Các mô hình chính thống mô tả âm học phòng 6 Hình 2.4: Các tuyến âm trực tiếp và phản xạbậc một và hai 8 Hình 2.5: Theo phương pháp nguồn ảnh, nguồn âm phản xạ tại mỗi bề mặt 9 Hình 2.6: Các nguồn ảnh tìm được trong một khán phòng 10 Hình 2.7: Chia đáp ứng xung phòng thành âm trực tiếp 11 Hình 3.1 : Tách mù văn bản từ một tín hiệu bị trùng lặp 14 Hình 3.2 : Ứng dụng trong y tế của bài toán xử lý tín hiệu mù 15 Hình 3.3 : Thu nhiều tín hiệu tác động vào não bộ dùng EEG và MEG 16 Hình 3.4 : Năm mẫu của dòng tiền mặt theo trình tự thời gian 17 Hình 3.5 : Bốn thành phần độc lập được tìm thấy từ các dữ liệu dòng tiền mặt 18 Hình 3.6 : Môi trường truyền thông không dây 19 Hình 3.7: Bài toán xử lý tín hiệu mù trong quân sự 20 Hình 3.8 : Ứng dụng BSS trong xử lý âm thanh 21 Hình 4.1: Các tín hiệu âm gốc s12 t , s t và st3 28 Hình 4.2: Hỗn hợp lai ghép của các tín hiệu âm trong hình 4.1 29 Hình 4.3: Các ước lượng của tín hiệu gốc 29 Hình 4.4 : Mục đích của phân tách nguồn mù 30 Hình 4.5 : Hàm mật độ xác suất của phân bố Gauss 36 Hình 4.6 : Hàm mật độ xác suất của phân bố Laplace 36 Hình 4.7 : Phân bố đều 37 Hình 4.8 : Minh họa định lý giới hạn trung tâm 37 Hình 4.9 : Sự phân bố chung của các thành phần độc lập 38 Hình 4.10 :Mật độ của một thành phần độc lập phân bố đều 39 x
  13. Hình 4.11 : Phân bố chung của hai thành phần độc lập 39 Hình 4.12 :Mật độ phân bố của các tín hiệu trộn xti 40 Hình 4.12: PCA của đám mây dữ liệu hai chiều 46 Hình 4.13: PCA tìm kiếm trục trực giao theo hướng cực đại phương sai 47 Hình 3.14: Hình chiếu hai cụm dữ liệu vào một trục sử dụng PCA và ICA 47 Hình 6.1: Minh họa quá trình tạo tín hiệu lai ghép với kỹ thuật phòng ảo 58 Hình 6.2: Sơ đồ hệ thống tách âm 59 Hình 6.3 : Trộn âm 61 Hình 6.4 : Tách âm 61 Hình 6.5 :Tín hiệu nguồn ban đầu 63 Hình 6.6 : Tín hiệu trộn 64 Hình 6.7 : Tín hiệu được ước lượng theo phương pháp ICA 65 Hình 6.8 :Biểu diễn các tín hiệu trong thực nghiệm 2 66 Hình 6.9 :Biểu diễn các tín hiệu trong thực nghiệm 3 69 Hình 6.10 : Tín hiệu nguồn s1, s 2, s 3, s 4, s 5 71 Hình 6.11: Tín hiệutrộn x1, x 2, x 3, x 4, x 5 71 Hình 6.12:Tín hiệu ước lượng y1, y 2, y 3, y 4, y 5 72 Hình 6.13:Tín hiệu nguồn s1, s 2, , s 10 73 Hình 6.14 : Tín hiệu trộn x1, x 2, , x 10 74 Hình 6.15 : Tín hiệu ước lượng y1, y 2, , y 10 75 xi
  14. DANH SÁCH CÁC BẢNG BẢNG TRANG Bảng 6.1: Danh sách các nguồn âm thực nghiệm 62 Bảng 6.2: Kết quả đánh giá thực nghiệm 2 67 Bảng 6.3: Kết quả đánh giá thực nghiệm 3 68 Bảng 6.4: Kết quả đánh giá thực nghiệm 4 70 Bảng 6.5: Kết quả đánh giá thực nghiệm 5 76 xii
  15. Chƣơng 1 TỔNG QUAN 1.1. Lý do chọn đề tài Gần đây, công nghệ xử lý tiếng nói, xử lý ảnh, truyền thông không dây, mạng và các thiết bị thông tin cá nhân đã và đang đuợc phát triển rất mạnh mẽ. Bắt đầu từ những năm 90 những nghiên cứu và thành công trong công nghệ mang lại tính năng hỗ trợ đa phương tiện, dễ sử dụng, nhỏ gọn và linh động. Một trong những công nghệ tham gia và phát triển hỗ trợ như vậy chính là xử lý tiếng nói. Mặc dù, nghiên cứu trong lĩnh vực đã tiến hành từ vài thập kỷ qua, nhưng nó vẫn còn là vấn đề cần quan tâm và làm sáng tỏ hơn. Xử lý tiếng nói được tóm gọn phát triển trong năm hướng [1] thì ba trong số đó là có liên quan đến nhận dạng tiếng nói. Công việc nghiên cứu này thực ra không còn gì mới mẻ với nhiều nghiên cứu trên thế giới và cảở Việt Nam. Tuy nhiên để đạt đến sự hoàn thiện theo tham vọng của chúng ta thì vẫn còn những bước rất dài phía trước. Kết quả của bài toán tách tín hiệu tiếng nói là cơ sở cho rất nhiều những ứng dụng trong thực tiễn liên quan tới xử lý tiếng nói. Kết quả của quá trình tách có tốt thì kết quả của nhận dạng mới chính xác được.Ví dụ như trong mô hình nhận dạng tiếng nói, tức là chuyển từ tiếng nói sang dạng text, tín hiệu đưa vào để nhận dạng được lấy từ dữ liệu ở các micro thu. Do đó, để có dữ liệu tiếng nói cho quá trình nhận dạng, trước hết cần tách ra được tín hiệu mong muốn từ dữ liệu bị trộn lẫn và chịu ảnh hưởng của môi trường từ các micro thu để không chỉ lấy được tín hiệu tiếng nói nào đó cần xử lý mà còn làm "sạch" nó khỏi nhiễu. Vậy suy nghĩ tự nhiên sẽ là: từ nhiều tín hiệu âm đã đƣợc trôn lẫn, làm thế nào để khôi phục lại từng tín hiệu nguồn riêng lẻ? 1
  16. Giải pháp như vậy sẽ được đề cập và giải quyết trong luận văn này, mà phương pháp chính có tên là: phân tích thành phần độc lập (Independent Component Analysis_ICA) [2],[3],[4],[5]. 1.2 Mục tiêu nghiên cứu Luận văn này góp phần trình bày kiến thức tổng quan về bài toán phân tách nguồn mù âm thanh, kỹ thuật ICA. Trên cơ sở đó lựa chọn một thuật toán ICA hiệu quả đểứng dụng tách các nguồn âm mù độc lập. 1.3 Nhiệm vụ nghiên cứu Trong luận văn này, trình bày tổng quan về bài toán phân tách nguồn mù âm thanh, kỹ thuật ICA và ứng dụng vào việc tách âm, thuật toán fastICA. Người thực nghiên cứu tập trung vào các vấn đề tách nguồn xác định nơi số nguồn bằng số lượng các kênh trong hỗn hợp quan sát (số trộn). 1.4 Khách thể và đối tƣợng nghiên cứu Luận văn thực hiện tách âm. Mỗi nguồn phát được tạo từ các mẫu âm chuẩn và thu mẫu từ máy tính với tốc độ lấy mẫu là 8KH mã hoá PCM 16 bit. Chiều dài mỗi đoạn dữ liệu mẫu là 10 giây. Do không có điều kiện thu trực tiếp nên ở đây các thực nghiệm tiến hành trên tín hiệu thu ảo, tức là mô tả ma trận lai ghép qua đặc trưng phòng âm hoặc là một ma trận hệ số bất kỳ. 1.5 Giả thuyết nghiên cứu Người nghiên cứu thực hiện tất cả thực nghiệm dựa trên mô hình ICA cơ sở tuân theo giả thuyết về đặc trưng nguồn phát: độc lập và phi Gauss; tuân theo giả thuyết là quá trình lai ghép xảy ra tức thì, không nhiễu, số đầu thu bằng số tín hiệu. 1.6 Phạm vi nghiên cứu Phạm vi nghiên cứu trong luận văn này là người thực nghiên cứu tập trung vào các vấn đề tách nguồn âm xác định nơi số nguồn bằng số lượng các kênh trong hỗn hợp quan sát (số trộn). 1.7 Phƣơng pháp nghiên cứu Luận văn nghiên cứu lý thuyết kết hợp với thực nghiệm để kiểm chứng, cụ thể tiến hành theo các bước như sau: 2
  17. - Tìm hiểu các vấn đề lý thuyết cụ thể gồm: tổng quan về bài toán xử lý mù, phương pháp phân tích thành phần độc lập, lý thuyết và mô hình toán của thuật toán fastICA Sau đó áp dụng tách nguồn mù âm thanh bằng thuật toán FastICA. - Thực hiện mô phỏng trên phần mềm mô phỏng Matlab 2013a. 1.8Kế hoạch thực hiện Thời gian thực hiện Nội dung thực hiện 23/2/2015 – 20/3/2015 Nghiên cứu thuật toán fastICA 20/3/2015 – 20/6/2015 Thực hiện tách âm bằng thuật toán fastICA 20/6/2015 – 20/7/2015 Đánh giá chất lượng của âm tách 20/7/2015 – 20/8/2015 Viết báo cáo luận văn tốt nghiệp 3
  18. Chƣơng 2 KỸ THUẬT PHÒNG ẢO Việc thử nghiệm mô hình ICA với nhiều nguồn tín hiệu và nhất là tín hiệu âm thanh đòi hỏi thực hiện với tín hiệu nhân tạo. Cụ thể là lấy tín hiệu âm thực chập với đáp ứng xung biết trước của một căn phòng. Lý do bởi số đầu thu giới hạn và khó mở rộng mạng thu âm. Ngoài ra có hai yếu tố quan trọng đối với thử nghiệm nhân tạo: một là giới hạn kích thước bộ lọc tách, hai là với các bộ lai biết trước, xác định ma trận giả lai trộn sẽ dễ dàng hơn trong phân tích định lượng, so sánh kết quả. Phần này sẽ trình bày các giải pháp xác định đáp ứng xung của một căn phòng từ các thông số đặc tả của chúng. Kết quả là cơ sở cho việc hình thành ma trận lai trong mô hình ICA cơ sở. 2.1Kỹ thuật âm học phòng Hình2.1 biểu diễn cấu trúc hình học đơn giản của một phòng và các tuyến truyền trực tiếp và phản xạ của âm. Trong hình này tất cả các hướng phản xạ được xem là khúc xạ luôn tồn tại thành phần khuyếch tán ( xem thêm [6] ). Hình 2.1: Cấu trúc hình học một phòng đơn giản, và biểu diễn của âm trực tiếp (đường liền) và các phản xạ bậc một (đường gạch) và bậc hai (đường chấm) 4
  19. Hình 2.2: (a) minh họa đáp ứng xung của một khán phòng. Trong một đáp ứng xung phòng gồm ba phần: âm trực tiếp, các phản xạ sớm và rung động trễ, trường âm được xem là khuyếch tán. (b) trường âm của khán phòng thu được. Đáp ứng xung của một phòng hòa nhạc có thể tách thành ba phần sau: âm trực tiếp, âm phản xạ sớm và âm vang trễ. Đáp ứng minh họa như trong hình 2.2(a) là một mạng đơn giản, trong đó không có các tuyến khuyếch tán hay nhiễu xạ. Trong đáp ứng thực tế sẽ có phần năng lượng khuyếch tán giữa các phản xạ sớm như trong hình 2.2(b). 2.2Mô hình âm học phòng Các tuyến truyền âm được mô tả toán học bởi phương trình sóng (phương trình Henholtz). Đáp ứng xung từ nguồn đến người nghe có thể nhận được bằng cách giải phương trình sóng, nhưng hiếm khi thực hiện theo phương pháp giải tích. Do đó nghiệm được xấp xỉ và có ba mô hình tính toán âm học phòng khác nhau được minh họa trong hình 2.3. 5
  20. Hình 2.3: Các mô hình chính thống mô tả âm học phòng dựa trên các tia âm hoặc trên giải phương trình sóng hoặc kỹ thuật thống kê. • Các phương pháp dựa theo sóng (wave-based methods). • Các phương pháp dựa theo tia (ray-based methods). • Các mô hình thống kê (statistical models) Các phương pháp theo tia, phương pháp ray-tracing [7] và phương pháp nguồn ảnh (image-source) [8], thường được sử dụng nhất. Gần đây các kỹ thuật dựa theo sóng đòi hỏi cao về tính toán như phương pháp phần tử hữu hạn (Finite Element Method - FEM), phương pháp phần tử biên (Boundary Element Method - BEM) và các phương pháp miền thời gian vi sai hữu hạn ( Finite Difference Time Domain - FDTD) cũng được quan tâm đáng kể [7], [9]. Các kỹ thuật này chỉ phù hợp mô phỏng âm tần số thấp. Các phương pháp mô hình thống kê như phân tích năng lượng thống kê (Statistical Energy Analysis - SEA) [7], được áp dụng chủ yếu trong dự đoán mức nhiễu ở các hệ ghép có cấu trúc truyền âm giữ vai trò quan trọng. 2.3 Phƣơng pháp theo sóng Phương pháp này cho kết quả chính xác nhất. Nghiệm giải tích của phương trình sóng chỉ có thể tìm được trong một số ít trường hợp như với một phòng hình chữ nhật có tường rắn. Do đó, cần sử dụng các phương pháp số toán với phương 6
  21. trình sóng. Các phương pháp phần tử như FEM và BEM chỉ thích hợp với không gian nhỏ và các tần số thấp do yêu cầu tính toán cao. Điểm khác biệt ở đây chính là cấu trúc phần tử, FEM rời rạc toàn bộ không gian, trong khi BEM chỉ thực hiện với các biên của không gian rời rạc. Thực tế điều đó có nghĩa là các ma trận FEM lớn và thưa còn các ma trận BEM nhỏ và dày hơn. Các phương pháp FDTD đưa ra các kỹ thuật khả thi khác cho việc mô phỏng âm học phòng [9]. Nguyên lý chính của phương pháp này chính là đạo hàm của phương trình sóng được thay bằng vi sai hữu hạn. Phương pháp FDDT cho đáp ứng xung thích hợp hơn FEM và BEM. Một lợi điểm của các phương pháp phần tử theo FDDT là tạo nên cấu trúc lưới chặt tại các vị trí cần thiết như các góc. Ngoài ra, các phương pháp này cho khả năng kết nối các mô hình dễ dàng. 2.4 Phƣơng pháp theo tia Phương pháp theo tia của hình 2.3 dựa trên các đặc trưng âm hình học của phòng, trong đó âm được xem như các tia. Giả thuyết này đúng khi bước sóng âm nhỏ so với diện tích bề mặt phòng và lớn so với mức độ gồ ghề bề mặt. Do đó tất cả các hiện tương tuân theo bản chất sóng, chẳng hạn nhiễu xạ và giao thoa có thể bỏ qua. Các kết quả của mô hình theo tia giống với đáp ứng trong hình 2.2(a) do âm thanh được xem là các tia với phản xạ hoàn toàn. Trong hầu hết các hệ thống kết quả là bình phương của đáp ứng xung. Phương pháp theo tia phổ biến nhất là phương pháp vạch tia (ray-tracing) [7] và phương pháp nguồn ảnh (image-source) [8]. Điểm phân biệt cơ sở của hai phương pháp này là cách tính toán các tuyến phản xạ. Để mô hình một đáp ứng xung lý tưởng cần đưa ra tất cả các tuyến phản xạ âm có thể. Phương pháp nguồn ảnh tìm tất cả các tuyến này, tuy nhiên vì thực tế khối lượng tính toán lớn nên chỉ một tập hợp các phản xạ sớm được tính. Bậc phản xạ cực đại có thể đạt được phụ thuộc vào cấu trúc hình học phòng và khả năng tính toán cho phép. Bên cạnh đó yếu tố đặc trưng hình học phải thiết lập trên các mặt phẳng. Phương pháp vạch tia 7
  22. S K L 0 0 2 1 5 4