Bài giảng Lý thuyết thông tin - Chương 1: Những khái niệm cơ bản - Bùi Văn Thành
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết thông tin - Chương 1: Những khái niệm cơ bản - Bùi Văn Thành", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_ly_thuyet_thong_tin_chuong_1_nhung_khai_niem_co_ba.pdf
Nội dung text: Bài giảng Lý thuyết thông tin - Chương 1: Những khái niệm cơ bản - Bùi Văn Thành
- Trường Đại Học Công Nghệ Thông Tin KHOA MẠNG & TRUYỀN THÔNG LÝ THUYẾT THÔNG TIN Bùi Văn Thành thanhbv@uit.edu.vn 1 Tháng 7 năm 2013
- THÔNG TIN CHUNG Về MÔN HọC Tên môn học: LÝ THUYẾT THÔNG TIN (Fundamental of information theory) Số đvht: 4 đvht Loại môn học: bắt buộc Các môn học tiên quyết: Lý thuyết xác suất, Kỹ thuật số, Kỹ thuật truyền số liệu, Hệ điều hành, Mạng máy tính. Phân bổ giờ: Lý thuyết + bài tập : 45 tiết (Hệ Chính quy) 24 tiết (Hệ TXQM) 2
- MụC TIÊU CủA MÔN HọC Hiểu các khái niệm về về thông tin, Entropy, Entropy có điều kiện, Độ đo lượng tin. Vận dụng giải quyết các bài toán về xác định lượng tin. Biết khái niệm về mã tách được, mã không tách được, mã hóa tối ưu Huffman. Hiểu định lý mã hóa Shannon (1948). Vận dụng lý thuyết mã hóa để hiểu thiết bị mã hóa và giải mã. Từ đây, các sinh viên có thể tự nghiên cứu các mã khác để vận dụng cho việc mã hóa và bảo mật thông tin một cách hiệu quả. Lý thuyết thông tin cũng là một trong các môn học khó vì nó đòi hỏi người học phải có kiến thức cơ bản về toán và xác suất thống kê. Do đó, đòi hỏi người học phải tham gia lớp học đầy đủ và3 làm các bài tập theo yêu cầu của môn học thì mới tiếp thu kiến thức môn học một cách hiệu quả.
- NỘI DUNG MÔN HỌC Chương 1: Những khái niệm cơ bản Chương 2: Tín hiệu Chương 3: Lượng tin, Entropi nguồn rời rạc Chương 4: Lý thuyết mã – Mã hóa nguồn Chương 5: Mã hóa kênh truyền Chương 6: Mã vòng 4
- TÀI LIỆU THAM KHẢO [1] Adamek, J.Foundations of Coding: Theory and Application of Error–Correcting Codes with an Introduction to Cryptography and Information Theory, John Wiley and Sons, New York 1991. [2] Nguyễn Bình, Lý thuyết thông tin, NXB Bưu điện , năm 2007. [3] Nguyễn Thúy Vân, Lý thuyết mã, NXB KHKT, 5 năm 2006.
- TÀI LIỆU THAM KHẢO [4] Vũ Ngọc Phàn, Lý thuyết thông tin và mã hóa, NXB Bưu điện, năm 2006. [5] Đặng Văn Chuyết, Cơ sở lý thuyết tryền tin, NXB Giáo dục, năm 2001. [6] Trần Trung Dũng, Lý thyết truyền tin, NXB KH & KT, năm 2007. 6
- CHƯƠNG 1 NHỮNG KHÁI NIỆM CƠ BẢN 1.1 Giới thiệu về Lý thuyết thông tin (Information theory) Thông tin? ◦ Hai người nói chuyện với nhau. Cái mà trao đổi giữa họ gọi là thông tin. ◦ Một người đang xem tivi/nghe đài/đọc báo, người đó đang nhận thông tin từ đài phát/báo. ◦ Các máy tính nối mạng và trao đổi dữ liệu với nhau. ◦ Máy tính nạp chương trình, dữ liệu từ đĩa cứng vào RAM để thực thi. 7
- THÔNG TIN Nhận xét ◦ Thông tin là cái được truyền từ đối tượng này đến đối tượng khác để báo một “điều” gì đó. ◦ Thông tin chỉ có ý nghĩa khi “điều” đó bên nhận chưa biết. ◦ Thông tin xuất hiện dưới nhiều dạng âm thanh, hình ảnh, ◦ Ngữ nghĩa của thông tin chỉ có thể hiểu được khi bên nhận hiểu được cách biểu diễn ngữ nghĩa của bên phát. ◦ Có hai trạng thái của thông tin: truyền và lưu trữ. Môi trường truyền/lưu trữ được gọi chung là môi trường chứa tin hay kênh tin. 8
- CÁC LOạI THÔNG TIN Thông tin có thể thuộc nhiều loại như: 1. Một dãy kí tự như trong điện tín (telegraph) của các hệ thống gởi điện tín (teletype system); 2. Một hàm theo chỉ một biến thời gian f(t) như trong radio và điện thoại; 3. Một hàm của thời gian và các biến khác như trong tivi trắng đen – ở đây thông tin có thể được nghĩ như là một hàm f(x, y, t) của toạ độ hai chiều và thời gian biểu diễn cường độ ánh sáng tại điểm (x, y) trên màn hình và thời gian t; 4. Một vài hàm của một vài biến như trong trường hợp tivi màu – ở đây thông tin bao gồm ba hàm f(x, y, t), g(x, y, t), h(x, y, t) biểu diễn cường độ ánh sáng của các ba thành phần màu cơ bản (xanh lá cây, đỏ, xanh dương). 9
- LịCH Sử HÌNH THÀNH Cuộc cách mạng lớn nhất về cách nhìn thế giới khoa học là chuyển hướng từ thuyết quyết định Laplacian đến bức tranh xác suất của tự nhiên. Thế giới chúng ta đang sống trong đó chủ yếu là xác suất. Kiến thức của chúng ta cũng là một dạng xác suất. LTTT nổi lên sau khi cơ học thống kê và lượng tử đã phát triển, và nó chia xẻ với vật lý thống kê các khái niệm cơ bản về entropy. Theo lịch sử, các khái niệm cơ bản của LTTT như entropy, thông tin tương hỗ được hình thành từ việc nghiên cứu các hệ thống mật mã hơn là từ việc nghiên cứu các kênh truyền thông. Về mặt toán học, LTTT là một nhánh của lý thuyết xác suất và các quá trình ngẫu nhiên (stochastical process).
- LịCH Sử HÌNH THÀNH (TT) Quan trọng và có ý nghĩa nhất là quan hệ liên kết giữa LTTT và vật lý thống kê. Trong một thời gian dài trước khi LTTT được hình thành, L. Boltzman và sau đó là L.Szilard đã đánh đồng ý nghĩa của thông tin với khái niệm nhiệt động học của entropy. Một mặt khác, D. Gabor chỉ ra rằng “lý thuyết truyền thông phải được xem như một nhánh của vật lý”. C. E. Shannon là cha đẻ của LTTT.
- VAI TRÒ CỦA LÝ THUYẾT THÔNG TIN Thông tin là một nhu cầu cơ bản, một điều kiện cần cho sự tồn tại và phát triển. Trong khoa học kỹ thuật, LTTT nghiên cứu nhằm tạo ra một “cơ sở hạ tầng” tốt cho việc truyền thông tin chính xác, nhanh chóng và an toàn; lưu trữ thông tin một cách hiệu quả. Ở các góc độ nghiên cứu khác, LTTT nghiên cứu các vấn đề về cách tổ chức, biểu diễn, truyền đạt thông 12 tin, và tổng quát là các vấn đề về xử lý thông tin.
- ỨNG DỤNG CỦA LÝ THUYẾT THÔNG TIN LTTT ứng dụng trong truyền thông và xử lý thông tin: truyền thông, nén, bảo mật, lưu trữ, LTTT đã được áp dụng trong nhiều lĩnh vực khác: vật lý, ngôn ngữ học, Kinh tế, khoa học máy tính, tâm lý học, hóa học, Mối quan hệ giữa LTTT và thống kê đã được tìm thấy, các phương pháp mới về phân tích thống kê dựa trên LTTT đã được đề nghị. Ứng dụng vào quản lý kinh tế. Ví dụ, lý thuyết đầu tư tối ưu xuất hiện đồng thời với lý thuyết mã hóa nguồn tối ưu. 13 Ứng dụng vào ngôn ngữ học.
- CÁC LĨNH VựC NGHIÊN CứU CƠ BảN Ba lĩnh vực nghiên cứu cơ bản của môn học: Mã hoá chống nhiễu. Mã hoá tối ưu (hay nén dữ liệu). Mật mã hoá. 14
- CÁC VẤN ĐỀ NGHIÊN CỨU CỦA LTTT 1. Bản chất thông tin. 2. Bản chất của quá trình truyền tin theo quan điểm toán học. 3. Cấu trúc vật lý của môi trường truyền tin. 4. Các vấn đề liên quan đến tính chất bảo mật, tối ưu hóa quá trình. 5. Các vấn đề đó thường được gọi là các lý thuyết thông tin, lý thuyết năng lượng. 15
- CÁC VẤN ĐỀ NGHIÊN CỨU CỦA LTTT Lý thuyết về năng lượng: Giải quyết vấn đề xây dựng mạch, tín hiệu. Tuy nhiên chưa giải quyết được vấn đề: tốc độ, hiện tượng nhiễu, mối liên hệ giữa các dạng năng lượng khác nhau của thông tin . => Lý thuyết thông tin nhằm giải quyết vấn đề: Rời rạc hóa nguồn, mô hình phân phối xác suất của nguồn và đích, các vấn đề về mã hóa và giải mã, khả năng chống nhiễu của hệ thống 16
- CÁC ĐỊNH NGHĨA Thông tin: là tập hợp các tri thức mà con người thu được qua các con đường tiếp nhận khác nhau. Thông tin được mang dưới dạng năng lượng khác nhau gọi là vật mang: điện, điện từ, sóng âm, sóng ánh sáng . Vật mang có chứa thông tin gọi là tín hiệu. Tin là dạng vật chất cụ thể biểu diễn hoặc thể hiện thông tin: bản nhạc, bảng số liệu, bài nói 17
- 1.2 HỆ THỐNG TRUYỀN TIN 1.2.1 Phân loại hệ thống truyền tin Theo quan điểm năng lượng : Năng lượng một chiều (điện tín) Vô tuyến điện (sóng điện từ) Quang năng (cáp quang) Sóng siêu âm (la-de) 18
- 1.2.1 PHÂN LOẠI HỆ THỐNG TRUYỀN TIN Theo biểu hiện bên ngoài: Hệ thống truyền số liệu Hệ thống truyền hình phát thanh Hệ thống thông tin thoại Theo dạng tín hiệu: Hệ thống truyền tin rời rạc Hệ thống truyền tin liên tục 19
- TRUYỀN TIN (TRANSMISSION) Định nghĩa: Là quá trình dịch chuyển thông tin từ điểm này sang điểm khác trong một môi trường xác định. Hai điểm này sẽ được gọi là điểm nguồn tin (information source) và điểm nhận tin (information destination). Môi trường truyền tin còn được gọi là kênh tin (chanel). 20
- SƠ ĐỒ KHỐI CHỨC NĂNG CỦA HỆ THỐNG TRUYỀN TIN Nhiễu Nguồn phát Kênh truyền Nguồn nhận 21
- NGUỒN TIN là nơi sản sinh ra hay chứa các tin, là tập hợp các tin mà hệ thống truyền tin dùng để lập các bảng tin hay thông báo (message) khác nhau để truyền tin. Bảng tin chính là dãy tin được bên phát truyền đi. 25
- KÊNH TIN là môi trường lan truyền thông tin, là nơi hình thành và truyền tín hiệu mang tin đồng thời ở đấy sinh ra các tạp nhiễu phá huỷ thông tin. Để có thể lan truyền được thông tin trong một môi trường vật lý xác định, thông tin phải được chuyển thành tín hiệu thích hợp với môi trường truyền lan. 26
- PHÂN LOẠI MÔI TRƯỜNG TRUYỀN TIN Truyền tin theo các dây song hành, cáp đồng trục, ống dẫn sóng. Tín hiệu truyền lan qua các tầng điện ly. Tín hiệu truyền lan qua các tầng đối lưu. Tín hiệu truyền lan trên mặt đất, trong đất. Tín hiệu truyền lan trong nước. 27
- NHẬN TIN Nhận tin: Là cơ cấu khôi phục thông tin ban đầu từ tín hiệu lấy được từ đầu ra của kênh. Tin đến được nơi nhận có sự tác động của nhiễu. Vì vậy nơi nhận phải thực hiện việc phát hiện sai và sửa sai. Nơi nhận còn có thể phải thực hiện việc giải nén hay giải mã thông tin đã được mã hoá bảo mật nếu như bên phát đã thực hiện việc nén hay bảo mật thông tin trước khi truyền. 28
- NGUỒN TIN NGUYÊN THUỶ Các nguồn tin thường thấy trong tự nhiên được gọi là các nguồn tin nguyên thuỷ (nguồn tin chưa qua bất kỳ một phép biến đổi nhân tạo nào). Các tín hiệu âm thanh, hình ảnh được phát ra từ các nguồn tin nguyên thuỷ này thường là các hàm liên tục theo thời gian và theo mức, nghĩa là có thể biểu diễn một thông tin nào đó dưới dạng một hàm s(t) tồn tại trong một quãng thời gian T và lấy các trị bất kỳ trong một phạm vi (smin, smax) nào đó. 29
- NGUỒN TIN NGUYÊN THUỶ Các nguồn biểu diễn được bằng hàm s(t) được gọi là các nguồn liên tục (continuous source). Tin từ nguồn liên tục gọi là tin liên tục (continuous information) và kênh tin được gọi là kênh liên tục (continuous channel). 30
- NGUỒN TIN NGUYÊN THUỶ Tuy nhiên, vẫn có những nguồn nguyên thuỷ là rời rạc: Ví dụ: Bảng chữ cái của một ngôn ngữ, lệnh điều khiển, tin trong hệ thống điện tín, Trong trường hợp này các nguồn được gọi là nguồn rời rạc , các tin được gọi là tin rời rạc và kênh tin được gọi là kênh rời rạc . Sự phân biệt về bản chất của tính rời rạc và tính liên tục là số lượng tin của nguồn trong trường hợp rời rạc là hữu hạn, còn trong trường hợp liên tục là không đếm được. 31
- BẢN CHẤT CỦA THÔNG TIN THEO QUAN ĐIỂM TRUYỀN TIN Chỉ có quá trình ngẫu nhiên mới tạo ra thông tin. Hàm ngẫu nhiên là hàm nếu với một giá trị bất kì của đối số giá trị của một hàm là một đại lượng ngẫu nhiên. Việc đoán trước một giá trị ngẫu nhiên là khó khăn. Ta chỉ có thể tìm được quy luật phân bố của các thể hiện thông qua việc áp dụng các qui luật của toán thống kê để xử lý các giá trị của thể hiện mà ta thu được từ các tín hiệu. 32
- MÔ HÌNH HOÁ NGUỒN TIN Quá trình ngẫu nhiên liên tục: Liên tục theo thời gian và theo mức. Nguồn tiếng nói, âm nhạc, hình ảnh là tiêu biểu cho quá trình này. 33
- MÔ HÌNH HOÁ NGUỒN TIN Quá trình ngẫu nhiên rời rạc: là quá trình ngẫu nhiên liên tục sau khi được lượng tử hoá theo mức trở thành quá trình ngẫu nhiên rời rạc (ngôn ngữ, tín hiệu điện tín, lệnh điều khiển ). Liên tục theo thời gian và rời rạc theo mức. 34
- MÔ HÌNH HOÁ NGUỒN TIN Dãy ngẫu nhiên liên tục: Đây là trường hợp một nguồn liên tục đã được gián đoạn hóa theo thời gian (hệ thống xung điều biên, tần hay pha, không bị lượng tử hoá). Liên tục theo mức, rời rạc theo thời gian. 35
- MÔ HÌNH HOÁ NGUỒN TIN Dãy ngẫu nhiên rời rạc: Trong các hệ thống thông tin xung có lượng tử hoá như điều biên (tần, pha), điều xung mã, tín hiệu số. 36
- TRUYỀN TIN Vấn đề cơ bản của truyền thông là việc tái sinh tại một điểm hoặc chính xác hoặc gần đúng một thông báo được chọn tại một điểm khác. (Claude Shannon 1948) Bản chất của sự lan truyền thông tin. Vật chất chỉ có thể dịch chuyển từ điểm này đến một điểm khác trong một môi trường thích hợp và dưới tác động của một lực thích hợp. Trong quá trình dịch chuyển của một hạt vật chất, những thông tin về nó hay chứa trong nó sẽ được dịch chuyển theo. Truyền tin chính là sự dịch chuyển của dòng các hạt vật 37 chất mang tin (tín hiệu) trong môi trường truyền tin.
- TRUYỀN TIN Trong quá trình truyền tin dòng vật chất mang tin còn chịu tác động của các lực không mong muốn sẵn có trong cũng như ngoài môi trường gọi là nhiễu, nhiễu làm biến đổi thông tin. Kênh tin là môi trường hình thành và truyền lan tín hiệu mang tin, trong kênh diễn ra sự truyền lan của tín hiệu mang tin và chịu tác động của tạp nhiễu. 38
- PHÂN LOẠI MÔI TRƯỜNG TRUYỀN TIN Lấy nhiễu làm cơ sở phân loại Môi trường trong đó tác động nhiễu cộng là chủ yếu Nc(t): Nhiễu cộng là nhiễu sinh ra một tín hiệu ngẫu nhiên không mong muốn và tác động cộng thêm vào tín hiệu ở đầu ra. Nhiễu cộng là do các nguồn nhiễu công nghiệp, vũ trụ sinh ra, luôn luôn tồn tại trong các môi trường truyền lan tín hiệu. 39
- PHÂN LOẠI MÔI TRƯỜNG TRUYỀN TIN Môi trường trong đó tác động nhiễu nhân là chủ yếu Nn(t): Nhiễu nhân là nhiễu có tác động nhân vào tín hiệu, nhiễu này gây ra do phương thức truyền lan của tín hiệu, hay là sự thay đổi thông số vật lý của bộ phận môi trường truyền lan khi tín hiệu đi qua. Nó làm nhanh, chậm tín hiệu (thường ở sóng ngắn) làm tăng giảm biên độ tín hiệu (lúc to, lúc nhỏ, có lúc tắt hẳn). Môi trường gồm cả nhiễu cộng và nhiễu nhân. 40
- MÔ TẢ SỰ TRUYỀN TIN QUA KÊNH Biểu thức mô tả nhiễu: SR(t) = Sv(t) . Nn(t) + Nc(t) Thực tế còn hệ số đặc tính của xung nên: SR(t) = Sv(t). Nn(t). H(t) + Nc(t) H(t) là đặc tính xung của kênh. Đặc tính kênh không lý tưởng này sẽ gây ra một sự biến dạng của tín hiệu ra so với tín hiệu vào, gọi là méo tín hiệu và méo lại là một nguồn nhiễu trong quá trình truyền tin. 41
- MÔ TẢ SỰ TRUYỀN TIN QUA KÊNH Tín hiệu vào của kênh truyền hiện nay là những dao động cao tần với những thông số biến đổi theo quy luật của thông tin. Trong trường hợp dao động liên tục biểu thức tổng quát của tín hiệu có dạng sau: Sv(t) = a(t) cos((t) - (t)) a(t) là biên độ (t): tần số (t): góc pha 42
- ĐẶC TÍNH TRUYỀN TIN CỦA KÊNH Mô hình mạng 2 cửa của kênh tin: Với yêu cầu truyền tin chính xác, ta cần y(t) phải là đại diện cho x(t), hay xác suất nhận được y(t) là đại diện của x(t) khi truyền x(t) là p(y|x)=1(đạt được khi kênh không nhiễu). Khi kênh có nhiễu xác suất để nhận được y(t) là đại diện của x(t) là p(y|x) (0 < p(y|x) <1), nhiễu càng lớn, xác suất này càng nhỏ. Vậy sử dụng xác suất p(y|x) để đặc trưng cho đặc tính truyền tin của kênh. 43
- ĐầU CUốI CủA Hệ THốNG TRUYềN TIN Nhận tin là đầu cuối của hệ thống truyền tin. Nhiệm vụ chính cần thực hiện tại nhận tin là từ tín hiệu nhận được y(t) phải xác định được x(t) nào được đưa vào ở đầu vào của kênh. Bài toán này được gọi là bài toán thu hay phục hồi tín hiệu tại điểm thu. 44
- CÁC VẤN ĐỀ CƠ BẢN CỦA HỆ THỐNG TRUYỀN TIN Hiệu suất: (tốc độ truyền tin) Là lượng tin tức cho phép truyền đi trong một đơn vị thời gian với độ sai sót cho phép. Độ chính xác: (khả năng chống nhiễu) Là khả năng giảm tối đa sai nhầm thông tin trên đường truyền. Yêu cầu tối đa với bất kỳ một hệ thống truyền tin nào là thực hiện được sự truyền tin nhanh chóng và chính xác. 45
- 1.3 RỜI RẠC HÓA MỘT NGUỒN TIN LIÊN TỤC Nhận xét: Các thiết bị đầu cuối (máy tính số) hầu hết xử lý tín hiệu rời rạc. Nếu nguồn tin là liên tục cần phải rời rạc hoá nguồn tin đó. Các hệ thống liên tục có nhiều nhược điểm như cồng kềnh, không hiệu quả và chi phí cao. Các hệ thống truyền tin rời rạc có nhiều ưu điểm hơn, khắc phục được những nhược điểm trên của các hệ thống liên tục. 46
- RỜI RẠC HÓA MỘT NGUỒN TIN LIÊN TỤC Rời rạc hoá một nguồn tin liên tục gồm 2 khâu: Khâu rời rạc hóa theo thời gian hay là khâu lấy mẫu (sampling). Khâu rời rạc hoá theo biên độ hay là khâu lượng tử hóa (quantize). 47
- LẤY MẪU Lấy mẫu một hàm là trích ra từ hàm ban đầu các mẫu được lấy tại những thời điểm xác định. Nếu nguồn tin liên tục dạng tín hiệu được biểu diễn bằng hàm : S(t) = a(t)cos[(t) - (t)] Cần thay hàm tin liên tục bằng một hàm rời rạc là những mẫu của hàm trên lấy tại những thời điểm gián đoạn. Thay như thế nào để đảm bảo khôi phục thông tin? Định lý lấy mẫu Shannon. 48
- ĐỊNH LÝ LẤY MẪU SHANON Một hàm s(t) có phổ hữu hạn, không có thành phần tần số lớn hơn max (= 2 fmax) có thể được thay thế bằng các mẫu của nó được lấy tại những thời điểm cách nhau một khoảng t /max, hay nói cách khác tần số lấy mẫu f 2fmax. s(t) smax 49 smin t
- THỰC HIỆN LẤY MẪU Việc lấy mẫu có thể thực hiện bằng một rơle điện, điện tử bất kì đóng mở dưới tác động của điện áp u(t) nào đó. Thời gian đóng mạch của rơle là thời gian lấy mẫu Chu kỳ lấy mẫu là T Tần số lấy mẫu là f=1/T. Từ S(t) ta thu được S *(t). 50
- LƯỢNG TỬ HOÁ Giả thiết hàm tin S(t) biến thiên liên tục nên biên độ của nó thay đổi trong phạm vi S min S max. Chia phạm vi đó thành một số mức nhất định: Smin = S0 , S1 , S2 Sn = Smax. Việc gián đoạn hóa sự biến đổi biên độ của s(t) là cho mức si nhất định khi nó tăng hoặc giảm gần đến mức đó. Như vậy s(t) sẽ trở thành s’(t) có dạng biến đổi bậc thang gọi là hàm lượng tử hoá với mỗi mức lượng tử i. Sự lựa chọn các mức thích hợp sẽ giảm sự sai khác giữa S(t) và S’(t). 51
- s(t) smax smin t 52
- LƯỢNG TỬ HOÁ Phép biến đổi S(t) thành S '(t) gọi là phép lượng tử hoá. i gọi là mức lượng tử hoá. Nếu i bằng nhau ta có qui luật lượng tử hoá đều. i không bằng nhau ta có luật lượng tử hoá không đều. Do sự biến thiên S(t) thường là không đều nên thường dùng qui luật lượng tử không đều. Việc chia không đều này phụ thuộc vào mật độ xác suất các trị tức thời của S(t) . Chọn i sao cho các trị tức thời của S(t) trong phạm vi i là hằng số. 53
- KẾT LUẬN Việc biến một nguồn liên tục thành một nguồn rời rạc cần hai phép biến đổi: lấy mẫu và lượng tử hoá. Thứ tự thực hiện hai phép biến đổi này phụ thuộc vào điều kiện cụ thể của hệ thống: Lượng tử hoá sau đó lấy mẫu. Lấy mẫu sau đó lượng tử hoá. Thực hiện đồng thời hai phép trên. 54
- VÍ Dụ Rời rạc hóa tín hiệu tiếng nói với gt: Tần số tối đa fmax = 4000Hz Khả năng phân biệt của tai người là: ~1% Cần bao nhiêu bit để có thể truyền tín hiệu tiếng nói bằng tín hiệu số? Tần số lấy mẫu theo Shanon 8000Hz(lần /s) Khoảng cách giữa các mức: 1% biên độ tối đa Số mức: 100 để đảm bảo tái tạo lại cường độ tiếng nói. 100 mức mã hoá cần 7 bit. Vậy cần 8x7=56kbps truyền tín hiệu tiếng nói bằng tín 55 hiệu số.
- 1.4. ĐỘ ĐO THÔNG TIN Khái niệm độ đo: Độ đo của một đại lượng là cách ta xác định độ lớn của đại lượng đó. Mỗi độ đo phải thỏa mãn 3 tính chất sau: Độ đo phải cho phép ta xác định được độ lớn của đại lượng đó. Đại lượng càng lớn, giá trị đo được phải càng cao. Độ đo phải không âm. Độ đo phải tuyến tính. 56
- ĐỘ ĐO THÔNG TIN Nhận xét: Độ đo thông tin cũng phải thoả mãn 3 tính chất của độ đo. Thấy rằng thông tin càng có ý nghĩa khi nó càng ít gặp, nên độ lớn của nó phải tỷ lệ nghịch với xác suất xuất hiện của tin. Cho tin xi với xác suất xuất hiện p(xi) thì hàm độ đo thông tin là: f(1/p(xi)) Một tin xi không cho ta lượng tin nào khi ta đã biết trước về nó hay xác suất p(xi) =1. 57
- ĐỘ ĐO THÔNG TIN Xác định hàm f(1/p(xi)). Giả sử hai tin xi và xj là độc lập thống kê, xác suất xuất hiện tương ứng là p(xi) và p(xj), lượng tin của mỗi tin sẽ là f(1/p(xi)) và f(1/p(xj)). Giả sử hai tin này cùng đồng thời xuất hiện, ta có tin (xixj), lượng tin chung của chúng phải bằng tổng lượng tin của từng tin. Khi hai tin đồng thời xuất hiện (tính chất 3) xác suất xuất hiện đồng thời của chúng là p(xixj) và ta có: f(1/p(xixj)) = f(1/p(xi)) + f(1/p(xj)). 58
- ĐỘ ĐO THÔNG TIN Vì hai tin độc lập thống kê nên p(xixj) = p(xi) p(xj). Vậy f(1/p((xi)p(xj))) = f(1/p(xi)) + f(1/p(xj)). Hàm f phải là hàm dạng loga.Vậy log(1/p(xi)) là dạng hàm có thể chọn làm độ đo thông tin. Kiểm tra tính không âm: do p(xi) 1 => 1/p(xi) 1 => log(1/p(xi)) 0. Khi một tin luôn xuất hiện thì lượng tin nhận được khi này bằng không. 59
- ĐỘ ĐO THÔNG TIN Vậy hàm log(1/p(xi)) được chọn làm độ đo thông tin hay lượng đo thông tin của một tin của nguồn. Lượng đo thông tin của một tin xi của nguồn được ký hiệu là I(xi) = log(1/p(xi)). Cơ số và đơn vị đo Bit hay đơn vị nhị phân khi cơ số là 2. Nat hay đơn vị tự nhiên khi cơ số là e. Hartley hay đơn vị thập phân khi cơ số là 10. 60
- VÍ DỤ Nguồn A có m ký hiệu đẳng xác suất. Xét một tin có n ký hiệu. Lượng tin trong tin đó là bao nhiêu? Lượng tin của tưng ký hiệu: I(xi)=logm Lượng tin của n ký hiệu xuất hiện trong bản tin: I(x) = nlogm Nếu các ký hiệu không cùng xác suất thì lượng tin của mỗi ký hiệu là: I(xi)=log(1/p(xi). Lượng tin trong một tin còn phụ thuộc vào sự độc lập giữa các ký hiệu (xác suất có điều kiện). 61
- 1.5 MÃ HOÁ Khái niệm Mã hoá là một phép biến đổi tương đương về mặt tin tức cấu trúc thống kê của nguồn nhằm mục đích cải tiến các chỉ tiêu kĩ thuật của hệ thống thích hợp với kênh (về tốc độ, nhiễu). Phương pháp mã hoá (nguồn rời rạc) Nguồn A gồm m ký hiệu (cơ số m), các tin có độ dài n. Mã hoá thành nguồn B có m’ ký hiệu và độ dài các tin là n’. Mục đích: Tích m’ n’ đạt min. 62
- 1.5 MÃ HOÁ Chú ý: Sau mã hoá lượng tin không đổi. Số phân tử mạch mã hoá tối thiểu. Với yêu cầu lượng tin không đổi: I(A) = I(A’) Hay nlogm = n’logm’ Với yêu cầu số phần tử mạch tối thiểu, bằng thực nghiệm ta thấy nếu m = e (2,7) thì số phần tử mạch sẽ tối thiểu, thông thường chọn m = 2 ta được bộ mã nhị phân. 63
- VÍ DỤ Cho nguồn tin A có 4 ký tự a1 , a2 , a3 , a4 . Lượng tin của mỗi ký hiệu là: I (ai )=log2 ¼ =2 bit. Mã hoá nguồn A thành nguồn B như sau: a1= b1b1 , a2= b1b2 , a3= b2b1 , a4= b2b2 Nguồn B có m = 2 và n = 2 lượng tin I(B) = 2log22 = 2 (bit) Nhận xét: Nguồn A mạch cần 4 phần tử còn nguồn B cần 2 phần tử Lượng tin hai nguồn bằng nhau. 64 Mã hóa có lợi không?
- 1.6 ĐIỀU CHẾ Khái niệm điều chế : Trong các hệ thống truyền tin liên tục, các tin hình thành từ nguồn tin liên tục được biến đổi thành các đại lượng điện (áp, dòng) và chuyển vào kênh. Khi muốn chuyển các tin ấy qua một cự ly lớn, phải cho qua một phép biến đổi khác gọi là điều chế. Điều chế là chuyển thông tin ban đầu thành một dạng năng lượng thích hợp với môi trường truyền lan, sao cho năng lượng ít bị tổn hao, ít bị nhiễu trên đường truyền tin. 65
- 1.6 ĐIỀU CHẾ Các phương pháp điều chế Các phương pháp điều chế cao tần thường dùng với tín hiệu liên tục Điều chế biên độ AM (Amplitude Modulation) Điều chế Đơn biên SSB (Single Side Bande) Điều tần FM (Frequency Modulation) Điều pha PM (Phase Modulation) 66
- 1.6 ĐIỀU CHẾ Với tín hiệu rời rạc, các phương pháp điều chế cao tần cũng giống như trường hợp thông tin liên tục, nhưng làm việc gián đoạn theo thời gian, gọi là manip hay khóa dịch. Gồm các phương pháp sau: Manip biên độ ASK (Amplitude Shift Key) Manip tần số FSK (Frequency Shift Key) Manip pha PSK (Phase Shift Key) 67
- GIẢI ĐIỀU CHẾ Định nghĩa: Giải điều chế là nhiệm vụ thu nhận lọc tách thông tin nhận được dưới dạng một điện áp liên tục hay một dãy xung điện rời rạc giống như đầu vào, với một sai số cho phép. Các phương pháp giải điều chế: Tách sóng biên độ Tách sóng tần số Tách sóng pha 68