Giáo trình Lập trình truyền thông (Phần 1)
Bạn đang xem tài liệu "Giáo trình Lập trình truyền thông (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- giao_trinh_lap_trinh_truyen_thong_phan_1.pdf
Nội dung text: Giáo trình Lập trình truyền thông (Phần 1)
- Ngô Bá Hùng, Nguyễn Công Huy GIÁO TRÌNH Lập trình truyền thông Ebook.moet.gov.vn, 2008
- Khoa Công Nghệ Thông Tin - Đại Học Cần Thơ - Giáo Trình Lập Trình Truyền Thông CHƯƠNG 1 Tổng quan về lập trình truyền thông Mục đích Chương này nhằm cung cấp cho các bạn một cái nhìn tổng quan về các vấn đề có liên quan trong lập trình truyền thông Yêu cầu Sau khi hoàn tất chương này, bạn có thể: Giải thích được Cơ chế giao tiếp liên quá trình (Inter-Process Communication ) là gì. Mô tả chức năng, nhiệm vụ của các tầng trong mô hình OSI. Định nghĩa về giao thức và biện luận được sự cần thiết của giao thức trong truyền thông . Mô tả về bộ giao thức TCP/IP. Định nghĩa mô hình Client – Server. Phân biệt được 2 chế độ giao tiếp: Nghẽn và Không nghẽn. Phân biệt được các kiểu kiến trúc chương trình. Biên Soạn: Ngô Bá Hùng - Nguyễn Công Huy 1
- Khoa Công Nghệ Thông Tin - Đại Học Cần Thơ - Giáo Trình Lập Trình Truyền Thông 1.1. Cơ chế giao tiếp liên quá trình là gì ? Truyền thông là một khái niệm dùng để chỉ sự giao tiếp, trao đổi thông tin giữa hai hay nhiều thực thể trong một hệ thống nào đó. Nếu hệ thống mà chúng ta xem xét là xã hội loài người, thì truyền thông có thể là quá trình trao đổi thông tin giữa người với người trong cuộc sống thông qua các phương tiện truyền tải thông tin khác nhau như không khí (trong trò chuyện trực tiếp), hệ thống điện thoại, sách, báo, các phương tiện nghe nhìn, mạng máy tính Nếu hệ thống mà chúng ta xem xét là một hệ thống máy tính hay một hệ thống mạng thì truyền thông có thể được phân thành hai mức: Mức phần cứng: là sự giao tiếp, trao đổi thông tin giữa các bộ phận vật lý cấu thành nên hệ thống máy tính như CPU, bộ nhớ, thiết bị vào ra, card giao tiếp mạng, nhờ vào các phương tiện truyền thông như hệ thống BUS nội, hệ thống BUS vào ra hay các dây cáp mạng . . . Mức phần mềm: là sự giao tiếp, trao đổi thông tin giữa các thành phần bên trong của một chương trình hay giữa các chương trình với nhau thông qua các cơ chế truyền thông được hỗ trợ bởi các hệ điều hành, hệ điều hành mạng. Trong các hệ thống máy tính đơn nhiệm (monotasking) cổ điển, ví dụ MS-DOS, tại một thời điểm chỉ cho phép tồn tại một quá trình. Việc giao tiếp, trao đổi thông tin chỉ diễn ra trong phạm vi của một chương trình. Đó là sự giao tiếp giữa các thủ tục dưới hình thức chia sẻ các biến toàn cục, hay bằng cách truyền các tham số khi gọi hàm, thủ tục hay bằng giá trị trả về của một hàm . . . Ngược lại, trong các hệ thống đa nhiệm (multitasking) có nhiều quá trình tồn tại song song nhau, mỗi quá trình được thực hiện trong một không gian địa chỉ (Address space) riêng biệt. Việc giao tiếp giữa các quá trình muốn thực hiện được đòi hỏi phải có những tiện ích hỗ trợ bởi hệ điều hành, hệ điều hành mạng. Các tiện ích này thường được gọi với cái tên là Cơ chế giao tiếp liên quá trình (IPC - Inter-Process Communication). 1.2. Phân loại cơ chế giao tiếp liên quá trình Các cơ chế giao tiếp liên quá trình được hỗ trợ bởi các hệ điều hành đa nhiệm, hệ điều hành mạng được chia ra làm hai loại: Loại 1: Cơ chế giao tiếp liên quá trình hỗ trợ giao tiếp giữa các quá trình trên cùng một máy tính. (Hình H1.1) Hình 1.1 - Cơ chế giao tiếp liên quá trình loại 1 Biên Soạn: Ngô Bá Hùng - Nguyễn Công Huy 2
- Khoa Công Nghệ Thông Tin - Đại Học Cần Thơ - Giáo Trình Lập Trình Truyền Thông • Loại 2: Cơ chế giao tiếp liên quá trình hỗ trợ giao tiếp giữa các quá trình nằm trên các máy tính khác nhau (Hình H1.2). Hình 1.2 - Cơ chế giao tiếp liên quá trình loại 2 Trong cơ chế giao tiếp liên quá trình trên cùng một máy, dữ liệu trao đổi qua lại giữa các quá trình phải đi xuyên qua hạt nhân (kernel) của hệ điều hành. Đó có thể là một vùng nhớ dùng chung cho các quá trình đã được qui định trước bởi hệ điều hành, hay một tập tin trên đĩa được quản lý bởi hệ điều hành trong đó một quá trình sẽ ghi dữ liệu vào, quá trình khác đọc dữ liệu ra, . . . Trong cơ chế giao tiếp liên quá trình trên các máy tính khác nhau, dữ liệu trao đổi giữa các quá trình không những phải đi qua hạt nhân như cơ chế giao tiếp liên quá trình trên một máy tính mà hơn thế các hạt nhân của các máy có liên quan phải hiểu nhau. Nói cách khác các hạt nhân phải thoả thuận trước với nhau về các qui tắc trao đổi thông tin giữa chúng. Thông thường ta gọi các qui tắc này là các giao thức (Protocol). 1.3. Mô hình tham khảo OSI Để dễ dàng cho việc nối kết và trao đổi thông tin giữa các máy tính với nhau, vào năm 1983, Tổ chức tiêu chuẩn thế giới ISO đã phát triển một mô hình cho phép hai máy tính có thể gởi và nhận dữ liệu cho nhau. Mô hình này dựa trên tiếp cận phân tầng (lớp), với mỗi tầng đảm nhiệm một số các chức năng cơ bản nào đó và được gọi là mô hình OSI. Để hai máy tính có thể trao đổi thông tin được với nhau cần có rất nhiều vấn đề liên quan. Ví dụ như cần có Card mạng, dây cáp mạng, điện thế tín hiệu trên cáp mạng, cách thức đóng gói dữ liệu, điều khiển lỗi đường truyền Bằng cách phân chia các chức năng này vào những tầng riêng biệt nhau, việc viết các phần mềm để thực hiện chúng trở nên dễ dàng hơn. Mô hình OSI giúp đồng nhất các hệ thống máy tính khác biệt nhau khi chúng trao đổi thông tin. Mô hình này gồm có 7 tầng: 7. Tầng ứng dụng (Application Layer) Đây là tầng trên cùng, cung cấp các ứng dụng truy xuất đến các dịch vụ mạng. Nó bao gồm các ứng dụng của người dùng, ví dụ như các Web Browser (Netscape Navigator, Internet Explorer ), các Mail User Agent (Outlook Express, Netscape Messenger, ) hay các chương trình làm server cung cấp các dịch vụ mạng như các Web Server (Netscape Enterprise, Internet Information Service, Apache, ), Các FTP Server, các Mail server (Send mail, MDeamon). Người dùng mạng giao tiếp trực tiếp với tầng này. 6. Tầng trình bày (Presentation Layer) Biên Soạn: Ngô Bá Hùng - Nguyễn Công Huy 3
- Khoa Công Nghệ Thông Tin - Đại Học Cần Thơ - Giáo Trình Lập Trình Truyền Thông Tầng này đảm bảo các máy tính có kiểu định dạng dữ liệu khác nhau vẫn có thể trao đổi thông tin cho nhau. Thông thường các máy tính sẽ thống nhất với nhau về một kiểu định dạng dữ liệu trung gian để trao đổi thông tin giữa các máy tính. Một dữ liệu cần gởi đi sẽ được tầng trình bày chuyển sang định dạng trung gian trước khi nó được truyền lên mạng. Ngược lại, khi nhận dữ liệu từ mạng, tầng trình bày sẽ chuyển dữ liệu sang định dạng riêng của nó. 5. Tầng giao dịch (Session Layer) Tầng này cho phép các ứng dụng thiết lập, sử dụng và xóa các kênh giao tiếp giữa chúng (được gọi là giao dịch). Nó cung cấp cơ chế cho việc nhận biết tên và các chức năng về bảo mật thông tin khi truyền qua mạng. 4. Tầng vận chuyển (Transport Layer) Tầng này đảm bảo truyền tải dữ liệu giữa các quá trình. Dữ liệu gởi đi được đảm bảo không có lỗi, theo đúng trình tự, không bị mất mát, trùng lắp. Đối với các gói tin có kích thước lớn, tầng này sẽ phân chia chúng thành các phần nhỏ trước khi gởi đi, cũng như tập hợp lại chúng khi nhận được. 3. Tầng mạng (Network Layer) Tầng này đảm bảo các gói dữ liệu (Packet) có thể truyền từ máy tính này đến máy tính kia cho dù không có đường truyền vật lý trực tiếp giữa chúng. Nó nhận nhiệm vụ tìm đường đi cho dữ liệu đến các đích khác nhau trong hệ thống mạng. 2. Tầng liên kết dữ liệu (Data-Link Layer) Tầng này đảm bảo truyền tải các khung dữ liệu (Frame) giữa hai máy tính có đường truyền vật lý nối trực tiếp với nhau. Nó cài đặt cơ chế phát hiện và xử lý lỗi dữ liệu nhận. 1. Tầng vật ký (Physical Layer) Điều khiển việc truyền tải thật sự các bit trên đường truyền vật lý. Nó định nghĩa các tín hiệu điện, trạng thái đường truyền, phương pháp mã hóa dữ liệu, các loại đầu nối được sử dụng. Về nguyên tắc, tầng n của một hệ thống chỉ giao tiếp, trao đổi thông tin với tầng n của hệ thống khác. Mỗi tầng sẽ có các đơn vị truyền dữ liệu riêng: • Tầng vật lý: bit • Tầng liên kết dữ liệu: Frame • Tầng mạng: Packet • Tầng vận chuyển: Segment Trong thực tế, dữ liệu được gởi đi từ tầng trên xuống tầng dưới cho đến tầng thấp nhất của máy tính gởi. Ở đó, dữ liệu sẽ được truyền đi trên đường truyền vật lý. Mỗi khi Biên Soạn: Ngô Bá Hùng - Nguyễn Công Huy 4
- Khoa Công Nghệ Thông Tin - Đại Học Cần Thơ - Giáo Trình Lập Trình Truyền Thông dữ liệu được truyền xuống tầng phía dưới thì nó bị "gói" lại trong đơn vị dữ liệu của tầng dưới. Tại bên nhận, dữ liệu sẽ được truyền ngược lên các tầng cao dần. Mỗi lần qua một tầng, đơn vị dữ liệu tương ứng sẽ được “tháo” ra. Đơn vị dữ liệu của mỗi tầng sẽ có một tiêu đề (header) riêng, được mô tả trong hình 1.3. OSI chỉ là mô hình tham khảo, mỗi Hình 1.3 - Xử lý dữ liệu qua các tầng nhà sản xuất khi phát minh ra hệ thống mạng của mình sẽ thực hiện các chức năng ở từng tầng theo những cách thức riêng. Các cách thức này thường được mô tả dưới dạng các chuẩn mạng hay các giao thức mạng. Như vậy dẫn đến trường hợp cùng một chức năng nhưng hai hệ thống mạng khác nhau sẽ không tương tác được với nhau. Hình 1.4 sẽ so sánh kiến trúc của các hệ điều hành mạng thông dụng với mô hình OSI. Hình 1.4 - Kiến trúc của một số hệ điều hành mạng thông dụng Để thực hiện các chức năng ở tầng 3 và tầng 4 trong mô hình OSI, mỗi hệ thống mạng sẽ có các protocol riêng: UNIX: Tầng 3 dùng giao thức IP, tầng 4 giao thức TCP/UDP Netware: Tầng 3 dùng giao thức IPX, tầng 4 giao thức SPX Windows NT: chỉ dùng 1 giao thức NETBEUI Nếu chỉ dừng lại ở đây thì các máy tính UNIX, Netware, NT sẽ không trao đổi thông tin được với nhau. Với sự lớn mạnh của mạng Internet, các máy tính cài đặt các hệ điều hành khác nhau đòi hỏi phải giao tiếp được với nhau, tức phải sử dụng chung một giao thức. Đó chính là bộ giao thức TCP/IP, giao thức của mạng Internet. Biên Soạn: Ngô Bá Hùng - Nguyễn Công Huy 5
- Khoa Công Nghệ Thông Tin - Đại Học Cần Thơ - Giáo Trình Lập Trình Truyền Thông 1.4. Mạng TCP/IP Đây là kiến trúc của mạng Internet, chỉ gồm 5 tầng như hình vẽ dưới đây: Hình 1.5 - Kiến trúc mạng TCP/IP Người ta còn gọi mô hình này là mô hình OSI đơn giản. Các giao thức được sử dụng trên mỗi tầng được qui định như sau: Hình 1.6 – Bộ giao thức TCP/IP Tầng 3 sử dụng giao thức IP, tầng 4 có thể sử dụng giao thức TCP ở chế độ có nối kết hoặc UPD ở chế độ không nối kết. Tầng 5 là tầng của các ứng dụng. Mỗi loại ứng dụng phải định nghĩa một giao thức riêng để các thành phần trong ứng dụng trao đổi thông tin qua lại với nhau. Một số ứng dụng phổ biến đã trở thành chuẩn của mạng Internet như: • Ứng dụng Web: Sử dụng giao thức HTTP để tải các trang web từ Web Server về Web Browser. • Ứng dụng thư điện tử: Sử dụng giao thức SMTP để chuyển tiếp mail gởi đi đến Mail Server của người nhận và dùng giao thức POP3 hoặc IMAP để nhận mail về cho người đọc. • Ứng dụng truyền tải tập tin: Sử dụng giao thức FTP để tải (download) các tập tin từ các FTP Server ở xa về máy người dùng hay ngược lại. • . . . . . Biên Soạn: Ngô Bá Hùng - Nguyễn Công Huy 6
- Khoa Công Nghệ Thông Tin - Đại Học Cần Thơ - Giáo Trình Lập Trình Truyền Thông Thông thường các tầng 1,2,3 và 4 được phát triển bởi các nhà sản xuất hệ điều hành, nhà sản xuất các thiết bị phần cứng mạng. Chúng đảm nhận nhiệm vụ truyền tải thông tin cho các quá trình trên tầng ứng dụng. Chúng cài đặt các cơ chế giao tiếp liên quá trình để các quá trình trên tầng ứng dụng có thể truy xuất đến dịch vụ truyền tải thông tin do chúng cung cấp. Trong khi đó, tầng 5 là nơi các nhà sản xuất phần mềm khai thác để tạo ra các ứng dụng giải quyết các vấn đề khác nhau của cuộc sống. Nó được xem như là tầng xử lý thông tin. 1.5. Dịch vụ mạng Dịch vụ mạng (Net service) là một chương trình ứng dụng thực hiện một tác vụ nào đó trên hệ thống mạng. Ví dụ: • Dịch vụ in trên mạng cho phép nhiều máy tính cùng sử dụng một máy in. • Dịch vụ tập tin trên mạng cho phép chia sẻ chương trình, dữ liệu giữa các máy tính. • Dịch vụ web cung cấp các trang web cho các máy tính khác nhau Có nhiều mô hình khác nhau để xây dựng các dịch vụ mạng. Một trong những mô hình được sử dụng khá phổ biến là mô hình Client-Server. Đây là một mô hình cơ bản để xây dựng các dịch vụ mạng. 1.6. Mô hình Client – Server 1.6.1. Giới thiệu Trong mô hình này, chương trình ứng dụng được chia thành 2 thành phần: • Quá trình chuyên cung cấp một số phục vụ nào đó, chẳng hạn: phục vụ tập tin, phục vụ máy in, phục vụ thư điện tử, phục vụ Web Các quá trình này được gọi là các trình phục vụ hay Server. • Một số quá trình khác có yêu cầu sử dụng các dịch vụ do các server cung cấp được gọi là các quá trình khách hàng hay Client. Việc giao tiếp giữa client và server được thực hiện dưới hình thức trao đổi các thông điệp (Message). Để được phục vụ, client sẽ gởi một thông điệp yêu cầu (Request Message) mô tả về công việc muốn server thực hiện. Khi nhận được thông điệp yêu cầu, server tiến hành phân tích để xác định công việc cần phải thực thi. Nếu việc thực hiện yêu cầu này có sinh ra kết quả trả về, server sẽ gởi nó cho client trong một thông điệp trả lời (Reply Message). Dạng thức (format) và ý nghĩa của các thông điệp Hình 1.7 – Mô hình Client-Server Biên Soạn: Ngô Bá Hùng - Nguyễn Công Huy 7
- Khoa Công Nghệ Thông Tin - Đại Học Cần Thơ - Giáo Trình Lập Trình Truyền Thông trao đổi giữa client và server được qui định rõ bởi giao thức (protocol) của ứng dụng. 1.6.2. Ví dụ về dịch vụ Web. Dịch vụ web được tổ chức theo mô hình Client -Server, trong đó: • Web server sẵn sàng cung cấp các trang web đang được lưu trữ trên đĩa cứng cục bộ của mình. • Web Client, còn gọi là các Browser, có nhu cầu nhận các trang web từ các Web Server • HTTP là giao thức trao đổi thông tin qua lại giữa Web client và Web Server. • Thông điệp yêu cầu là một chuỗi có dạng sau: Command URL HTTP/Ver \n\n • Thông điệp trả lời có dạng sau: \n\n • Giả sử Client cần nhận trang Web ở địa chỉ nó sẽ gởi đến Web Server có tên www.cit.ctu.edu.vn thông điệp yêu cầu sau: GET www.cit.ctu.edu.vn HTTP/1.1\n\n • Server sẽ gởi về nội dung sau: HTTP/1.0 200 OK Date: Mon, 24 Nov 2003 02:43:46 GMT Server: Apache/1.3.23 (Unix) (Red-Hat/Linux) mod_ssl/2.8.7 OpenSSL/0.9.6b DAV/1 .0.3 PHP/4.1.2 mod_perl/1.26 Last-Modified: Tue, 01 Jul 2003 08:08:52 GMT ETag: "17f5d-2abb-3f014194" Accept-Ranges: bytes Content-Length: 10939 Content-Type: text/html X-Cache: HIT from proxy.cit.ctu.edu.vn Proxy-Connection: close Biên Soạn: Ngô Bá Hùng - Nguyễn Công Huy 8
- Khoa Công Nghệ Thông Tin - Đại Học Cần Thơ - Giáo Trình Lập Trình Truyền Thông 1.6.3. Các chế độ giao tiếp Quá trình giao tiếp giữa client và server có thể diễn ra theo hai chế độ là nghẽn (blocked) hay không nghẽn (Non blocked). 1.6.3.1. Chế độ nghẽn : Trong chế độ này, khi quá trình client hay server phát ra lệnh gởi dữ liệu, (thông thường bằng lệnh send) , sự thực thi của nó sẽ bị tạm dừng cho đến khi quá trình nhận phát ra lệnh nhận số dữ liệu đó (thường là lệnh receive). Tương tự cho trường hợp nhận dữ liệu, nếu quá trình nào đó, client hay server, phát ra lệnh nhận dữ liệu, mà ở thời điểm đó chưa có dữ liệu gởi đến, sự thực thi của nó cũng tạm dừng cho đến khi có dữ liệu gởi đến. Hình 1.8 - Chế độ giao tiếp nghẽn 1.6.3.2. Chế độ không nghẽn: Trong chế độ này, khi quá trình client hay server phát ra lệnh gởi dữ liệu, sự thực thi của nó vẫn được tiếp tục mà không quan tâm đến việc có quá trình nào phát ra lệnh nhận số dữ liệu đó hay không. Tượng tự cho trường hợp nhận dữ liệu, khi quá trình phát ra lệnh nhận dữ liệu, nó sẽ nhận được số lượng dữ liệu hiện có (bằng 0 nếu chưa có quá trình nào gởi dữ liệu đến). Sự thực thi của quá trình vẫn được tiếp tục. Trong thực tế cần chú ý đến chế độ giao tiếp nghẽn khi lập trình, vì nó có thể dẫn đến trường hợp chương trình bị "treo" do số lần gởi và nhận giữ liệu không bằng nhau giữa hai bên giao tiếp. Hình 1.9 - Chế độ giao tiếp không nghẽn 1.7. Các kiểu kiến trúc chương trình Ở mức luận lý, các chức năng mà một chương trình ứng dụng thực hiện có thể xếp thành một trong 3 loại sau: 1. Các chức năng thực hiện việc tương tác với người dùng như tạo các giao diện nhập liệu hay in các báo biểu, thông báo ra màn hình. Các chức năng này được gọi chung là Dịch vụ giao diện người dùng (User Interface Service). Biên Soạn: Ngô Bá Hùng - Nguyễn Công Huy 9