Tài liệu tham khảo Đa truyền thông (Phần 4)

pdf 10 trang phuongnguyen 860
Bạn đang xem tài liệu "Tài liệu tham khảo Đa truyền thông (Phần 4)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdftai_lieu_tham_khao_da_truyen_thong_phan_4.pdf

Nội dung text: Tài liệu tham khảo Đa truyền thông (Phần 4)

  1. MÃHOMÃHO ÁÁ AUDIOCAUDIOC MQUANMQUAN • Cutrúcdngcâyđơnphângii 0 jω H02 (e ) ↓2 x(n) jω H01 (e ) ↓2 0 jω H12 (e ) ↓2 1 jω H02 (e ) ↓2 jω H11 (e ) ↓2 1 jω H12 (e ) ↓2 MÃHOMÃHO ÁÁ AUDIOCAUDIOC MQUANMQUAN • Cutrúcdngcâyđaphângii – Cutrúcnàychotalưngbitngõratiưuvà phù thuc vàos phânb ph catínhiu. 0 jω H02 (e ) ↓2 x(n) jω H01 (e ) ↓2 0 jω H12 (e ) ↓2 jω H11 (e ) ↓2
  2. MÃHOMÃHO ÁÁ AUDIOCAUDIOC MQUANMQUAN • Cácphươngphápmãhố chuynđi – FFT(FastFourierTransform) – DFT(DiscreteFourierTransform) – DCT(DiscreteCosineTransform) – MDCT(ModifiedDCT) – Wavelets. MÃHOMÃHO ÁÁ AUDIOCAUDIOC MQUANMQUAN • DCT (DiscreteCosineTransform) DCTlà phép bin đi trc giao,mt thut tốn hiu qu,cho các đc tính nén mnh và gim đ tương quan. N −1 π 2( n + )1 k Chuyn đi DCTthun: X (k) = ∑ (n)x(n)cos , k = 0, N −1 n=0 2N  1 ,n = ;0  N (n) =  2  0, < n ≤ N −1  Chuyn đi DCTngưc  N N −1 π 2( n + )1 k x(n) = ∑ (n)X (k)cos , n = 0, , N −1 k =0 2N  1 ,n = ;0  N (n) =  2  0, < n ≤ N −1  N
  3. MÃHOMÃHO ÁÁ AUDIOCAUDIOC MQUANMQUAN • MDCT (ModifiedDCT):DCTđưc hiu chnh. MDCTlà phép bin đi trc giao tuyn tính đưc hiu chnh t DCT. MDCTthun: N −1 π N  N Xk()=∑ pnxnc ()()os (2 n +++=−=− 1 )(2 k 1);  n 0, , Nk 1; 0, , 1. n=0 2N2  2 Và chuyn đi MDCTngưc (IMDCT): N −1 4 2  π N  N x(n) = ∑ p(n)X (k)cos 2( n +1+ )(2k + )1 , n = 0, , N − ;1 k = 0, , − .1 N k =0 2N 2  2 π x Vi p(x)là hàm ca s sinđưc xác đnh: p() x = sin( ) • Wavelets N Waveletscĩ th đưc xem như mt b phân tích băng con,vi cây khơng cân bng,nghĩa là các tn s đưc chia mt cách khơng đng nht.Vy,băng lc tương đng vi di ti hn. MÃHOMÃHO ÁÁ AUDIOCAUDIOC MQUANMQUAN • DWT(DiscreteWaveletTransform) M rng và dch chuyn “hàm m” h(t)bng cách đnh nghĩa mt cơ s trc giao,waveletcơ s: −m/ 2 − m htn. m ()2= h( 2 tn − ) Trong đĩ:nlà t l,m là đ di và tlà thi gian. H s t l nch th đ rng ca các waveletvà h s v trí mxác đnh v trí ca nĩ.Vi hàm m h(t),ta đưc mt tp hàm wavelettrc giao cơ s. Trc giao: f(t),g(t)là hai vectorthuc khơng gian L2(a,b).t ∈∈∈[a,b]. Hai vectorgi là trc giao khi tích vơ hưng ca chúng bng 0. b = f (t)g * (t)dt = 0 ∫a
  4. MÃHOMÃHO ÁÁ AUDIOCAUDIOC MQUANMQUAN • Cơ s trc giao: Tp các vector{vk}={v1,v2, ,vn}đưc gi là cơ s trc giao nu chúng trc giao tng đơi mt và cĩ đ dài bng 1. = δδδmn.Hay: b h (t)h * (t)dt = δ . ∫ k l kl a •Hàm delta:  ,1 k = l δ kl =   ,0 k ≠ l Chuyn đi Wavelet: * X ω (n,m) = cn,m = ∑ x(t)hn,m Chuyn đi waveletngưc: +∞ +∞ x(t) = ∑∑cn.mhn,m (t) −∞ −∞ PHÂNTPHÂNT ÍÍCHTÂMLÝÂMHCHTÂMLÝÂMH CC • H thng thính giác ca conngưi – ðưc chú trng khai thác trong mã hố audiocm quan. – Conngưi cĩ th nghe trong di 20Hzđn 20kHzvi kh năng nghe khơng đng nht vi các tn s trong di này.Vic cm nhn cịn ph thuc vào mc áp lc và tuỳ thuc vào tng ngưi. – Di 20Hz ÷20kHzđưc chia thành các di conkhơng đng nht và khơng tuyn tính.Cm nhn tt trong khong 2kHzđn 4kHzvà ngưng nghe đn ngưng đau khong 96dB. – Ph thuc vào mơi trưng nghe,vi mơi trưng nhiu ln thì hn ch kh năng nghe và kh năng phân bit các âm thanh khác nhau. – Vy,phân tích tâm lý nghe là xét các vn đ: • ð nhy ca tai,kh năng đáp ng ca các cưng đ khác nhau. • ðáp ng ca taivi các tn s khác nhau. • Nghe mt âmkhi cĩ mt mt âmkhác.
  5. PHÂNTPHÂNT ÍÍCHTÂMLÝÂMHCHTÂMLÝÂMH CC • Ngưng nghe tuyt đi ATH(AbsoluteTheshold of Hearing) – Thí nghim:ðt mt ngưi trong phịng kín,im lng,phát âm kim tra (test tone)vi tn s xác đnh (1kHz),tăng mc âm thanh cho đn khi cĩ th nghe đưc,ghi li các giá tr và lp li vi tn s khác. – V đ th,ta đưc ngưng nghe tuyt đi.Th vi ngưi khác,ghi kt qu. PHÂNTPHÂNT ÍÍCHTÂMLÝÂMHCHTÂMLÝÂMH CC • Di ti hn (criticalbankwidth) – Fletchertin hành các th nghim và cho thy vic nghe ca conngưi ging như s dng các b lc tâm sinh lý cĩ đ rng gn bng mt giá tr ti hn và Flecher gi đ rng ca b lc ti hn là di ti hn. – Di ti hn biu din cơng sut xác đnh ca taicho cho các tn s haydi tn s liên tc. – Các thí nghim cho thy rng: • Vi các tn s che nh hơn 500Hzthì di ti hn khơng đi vi đ rng khong 100Hz. • Vi các tn s che ln hơn 500Hzthì di ti hn cĩ đ rng tăng tương đi tuyn tính theo tn s. – Vy,thang tn s khơng tuyn tính  thang bark(Barkhausen)
  6. PHÂNTPHÂNT ÍÍCHTÂMLÝÂMHCHTÂMLÝÂMH CC • Di ti hn (criticalbankwidth) – Flecher chia băng thơng âm thanh thành 25di ti hn. Di Tns thp Ts trungtâm Tns cao Băngthơng 1 50 100 2 100 150 200 100 4 300 350 400 100 5 400 450 510 110 6 510 570 630 120 7 630 700 770 140 25 15500 18775 22050 6550 PHÂNTPHÂNT ÍÍCHTÂMLÝÂMHCHTÂMLÝÂMH CC • Di ti hn (criticalbankwidth) – Barklà đơn v đ biu din mt di ti hn,1bark=1đ rng di ti hn. – Cơng thc chuyn đi:  f  , f < 500 1bark = 100  f 9 + 4 log ( ), f ≥ 500  2 1000 – Cơng thc khác:1bark=13arctg(0.76f)+3.5arctg(f/7500)[bark] – Cơng thc khác na:1bark=13arctg(0.76f)+3.5arctg(f 2/65.25)[bark]
  7. PHÂNTPHÂNT ÍÍCHTÂMLÝÂMHCHTÂMLÝÂMH CC • K thut che (masking) Conngưi khi nghe mt âm vi s cĩ mt ca mt âm khác s cm nhn yu đi khi âmnày cĩ tn s gn vi âm cn nghe hoc biên đ ln. – Che tn s (frequencymasking) Thí nghim:ðt mt ngưi trong phịng kín,phát ra mt âm che (maskingtone)vi tn s xác đnh (1kHz) mt mc nào đĩ (60dB),sau đĩ,phát âm kim tra (testtone)(1,1kHz),tăng mc đn khi cĩ th nghe đưc.Thay đi âm kim tra,v ngưng nghe,lp li vi âm che khác. PHÂNTPHÂNT ÍÍCHTÂMLÝÂMHCHTÂMLÝÂMH CC – Che thi gian (temporalmasking) Thí nghim: Phát mt âm che tn s 1kHz,biên đ 55dB,thêm mt âm kim tra 1,1kHz,biên đ 20dB trưc và sau âm che.Âm kim tra khơng th nghe đưc (nĩ đang b che). Lp li các mc khác ca âm kim tra và v. Vi thí nghim trên,ta thy âm 1,1kHzvi 20dBb che trưc khong 15msvà che sau khong 50ms.
  8. KK THUTHU TNTN ÉÉNAUDIONAUDIO •Cơs Âm thanh trung thc và cht lưng dch v tho mãn thì tc đ dịng d liu phi ln. Ví d :H thng âm thanh đa kênh mã hố 16bits,tn s ly mu 48kHz(6kênh) s cĩ tc đ:48x16x6=4.5Mbps. Tc đ cao  Khĩ khăn lưu tr,truyn dn và giá thành thit b.  Nén. • Nén khơng tn hao Khơi phc đúng thơng tinbanđu sau khi gii nén. Cơs:Loi b dư tha thng kê,các thơng tinxut hin trong tín hiu mà cĩ th d báo trưc. T s nén thp,khong 2:1,ph thuc vào đ phc tp ca tín hiu ngun. Thưng s dng k thut mã hố d đốn trong min thi gian. KK THUTHU TNTN ÉÉNAUDIONAUDIO – Thut tốn visai: Tín hiu âm thanh cĩ đc tính lp đi lp li nên xut hin s dư tha s liu. Thơng tinlp s đưc loi b trong quá trình mã hố và đưc đưa vào li trong quá trình gii mã s dng k thut DPCM. Các tín hiu audiođu tiên đưc phân tích thành tp hp các di băng conbao gm mt s lưng âm thanh ri rc,sau đĩ,DPCMđưc s dng đ d báo các tín hiu lp li theo chu kỳ. Nu s dng ADPCMcịn cho kt qu tt hơn. – Mã hố Entropy: Tn dng đ dư tha trong cách miêu t các h s băng conđã lưng t hố nhm ci thin tính hiu qu ca quá trình mã hố.Các h s lưng t đưc gi đi theo s tăng dn ca tn s. Kt qu nhn đưc là bng mã ti ưu thng kê các giá tr min tn s thp và cao. S dng mã hố Hufman,LempelZipđ nén.
  9. KK THUTHU TNTN ÉÉNAUDIONAUDIO • Nén tn hao H thng thính giác ca conngưi khơng th phân bit các thành phn ph cĩ biên đ nh gia các thành phn ph cĩ biên đ ln. H s nén ln,khong 20:1ph thuc vào quá trình nén và gii nén và cht lưng audioyêu cu. – Các k thut đưc s dng: K thut che (masking)đi vi các thành phn tín hiu trong min thi gian và tn s. Che mc tp âm lưng t cho tng âm đ ca tín hiu âm thanh bng cách ch đnh s bitva đ đ chc chn rng mc nhiu lưng t luơn nm dưi mc giá tr cn che. Mã hố ghép:Khai thác đ dư tha trong h thng audiođa kênh vi các thành phn s liu trong các kênh ging nhau.Mã hố mt phn s liu chung trên mt kênh và ch đnh cho b gii mã lp li tín hiu đĩ trên các kênh cịn li. MPEGMPEG 11 • Gii thiu MPEG1 Mono và Stereo 32,44.1,48kHz Lp I Lp II Lp III ðưc phát trin trên cơ s phi hp chun ISO/IEC11172. S dng tn s ly mu ca CDDA,vi fs=32;44.1;48kHz,mã hố 16bits/mutín hiu. Tc đ bít:32 768kbps/channel. Các kiu:Mono,dualmono,dualstereo,jointstereo. Xác đnh các tham s khác nhau v tc đ,dịng s sau khi nén,s mu trong headercho mt kênh,cu trúc thi gian khung,phương pháp mã hố d đốn và các ch đ làm vic.
  10. MPEGMPEG 11 • ðc tính Lp I Lp II Lp III Dùngchothitb dândng Dùng cho thit b chuyên Dùng cho thit b chuyên dng,đamơitrưng dng,đamơitrưng Tc đ dịng s liu t 32 Tcđ dịngs liut 32 Tcđ dịngs liut 32 448kbps 384kbps 320kbps 384mu/khung/kênh 1152mu/khung/kênh 1152mu/khung/kênh 32 băng con đu nhau, mi 32băng conđunhau, mi 32 băng con ti hnthành băng con gm block12 mu băng con gm block36 mu 18MDCT Chu kỳ mt khung 8ms cho Chu kỳ mt khung 24ms Chu kỳ mt khung 24ms kênhcĩ fs=48kHz chokênhcĩ fs=48kHz chokênhcĩ fs=48kHz H s t l 6bits/băng, phân H s t l 6 bits/băng, H s t l 6 bits/băng, phi bittheophươngthcng phân phi bit theo phương phân phi bit theo phương trưc. thcngtrưc. thcngtrưc. MPEGMPEG 11 12mu12mu12mu Lcbăngcon0 Cácmu 12mu12mu12mu Audio Lcbăngcon1 ngõvào 12mu12mu12mu Lcbăngcon2 12mu12mu12mu Lcbăngcon31 • Khung lp I:12x32=384. Khung KhunglpII • Khung lp II,III:12x32x3=1152. lpI và lpIII