Giáo trình Hệ điều hành phân tán (Phần 2)

149 trang phuongnguyen 8230

Download

Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Hệ điều hành phân tán (Phần 2)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

giao_trinh_he_dieu_hanh_phan_tan_phan_2.pdf

Nội dung text: Giáo trình Hệ điều hành phân tán (Phần 2)

Lập trình phân tán và lập trình trên mạng Occam, RS và Linda được mô tả như những ngôn ngữ đồng thời hoặc những mô hình cho hệ thống chặt chẽ. Chúng không đáp ứng được cho hệ thống không chặt chẽ hoặc là mạng máy tính, nơi những vấn đề về khả năng trong suốt và khả năng tương tác các toán tử là cần được suy nghĩ. Trong hệ thống lỏng, sự thực hiện các hệ chương trình đồng thời cần được cung cấp sự truyền thông tin cậy, đối tượng riêng biệt, nhân bản dữ liệu và một hệ thống hỗn tạp. Hai ngôn ngữ lập trình ORCA và JAVA là ví dụ liên quan đến lập trình hệ phân tán và mạng. ORCA Orca là ngôn ngữ lập trình động thời dựa trên mô hình đối tượng chia sẻ logic cho hệ thống phân tán lỏng. Nó hỗ trợ việc thực hiện song song của QT trên các máy khác nhau nhờ truy nhập đồng thời đối tượng dữ liệu chia xẻ. Đối tượng dữ liệu chia xẻ là các thể hiện của kiểu dữ liệu trừu tượng được người dùng định nghĩa. Chúng có thể được phân tán vật lý hoặc được nhân bản để truy nhập cục bộ hiệu quả và thuận tiện nhưng chúng hoàn toàn “trong suốt“ đối với chương trình ứng dụng nhờ thi hành của Orca. QT Orca mỗi khi được khởi tạo, truyền thông xuyên qua các đối tượng chia xẻ khi dùng các phép toán người dùng định nghĩa trên các đối tượng đó. Ưu điểm của việc sử dụng biến chia xẻ cho TTLQT thì tương phản với CTĐ là hoàn toàn rành mạch. Truyền thông liên bộ xử lý là hoàn toàn “trong suốt” và các thông tin toàn cục có thể được chia xẻ trực tiếp. Viết một chương trình đồng thời là gần gũi với kiểu lập trình thông thường. Thêm nữa, nếu thể hiện cấu trúc dữ liệu phức tạp của đối tượng được phân tán vật lý, việc sử dụng CTĐ tường minh để truy cập vào từng phần của cấu trúc dữ liệu sẽ trở nên khó khăn nếu không quá dài dòng. Khái niệm cốt lõi được dùng trong hệ thống Orca là đối tượng chia xẻ lôgic và kiểu dữ liệu trừu tượng. Khái niệm đối tượng chia xẻ lôgic (hoặc cấu trúc dữ liệu) đã từng biết trong Linda còn khái niệm kiểu dữ liệu trừu tượng có trong SR. Trong Linda đối tượng chai xẻ (bao gồm dữ liệu và QT) là các bộ trong không gian bộ. Phương thức truy nhập là phù hợp (địa chỉ hóa nội dung) nhưng ở mức thấp (nguyên thủy in, out, rd). Mặc dù về ngữ nghĩa thì khá đơn giản và đẹp đẽ, nhưng viết một chương trình với cấu trúc dữ liệu phức tạp trong Linda là không trực giác (nhúng trong những ngôn ngữ lập trình). Dùng kiểu dữ liệu trừu tượng trong Orca thì cho phép sự chặt chẽ kiểm tra kiểu và độ mềm dẻo của các phép toán trên đối tượng. SR là ngôn ngữ định kiểu mạnh và có tính trừu tượng kiểu dữ liệu giống như Orca. Tuy nhiên, do không có khái niệm đối tượng chia xẻ logic nên SR phải dựa vào một tập hợp lớn nguyên thủy đồng bộ và truyền thông (cuộc hẹn, CALL, SEND, năng lực và những đồng bộ biến chia xẻ khác). Mặt dù ngôn ngữ 101/249
này khá dồi dào cho lập trình đồng thời, nhưng đồng bộ và truyền thông QT lại không trong suốt. Orca được xem như ngôn ngữ thoả hiệp tốt giữa Linda và RS. QT đồng thời trong Orca được kích hoạt bằng cách tạo ra một QT mới trên một máy hoàn toàn xác định bởi lệnh fork: fork Tên_QT ( các tham số) { on [ số Bộ XL]} Tham số được truyền từ QT cha xuống QT con có thể là giá trị, đối tượng thường hoặc đối tượng chia xẻ. Giá trị và đối tượng thường là những dữ liệu cục bộ của QT. Đối tượng chia xẻ là toàn cục. Chúng được nhân bản tại mỗi bộ xử lý và cần một giao thức cập nhật nguyên tử để duy trì nhất quán của các bản sao của đối tượng chia xẻ. Hai kiểu đồng bộ trên đối tượng được Orca cung cấp là loại trừ ràng buộc và cộng tác có điều kiện. Orca cho rằng tất cả các phép toán đều hoàn toàn cô lập trên đối tượng. Mỗi đối tượng được gắn một khóa để loại trừ ràng buộc. Khoá chỉ có hiệu lực tại mức đối tượng và được giới hạn với đối tượng đơn. Khoá chia xẻ được cung cấp để cho phép cùng một lúc có nhiều phép toán đọc đối tượng. Để cộng tác có điều kiện, Orca sử dụng lệnh an toàn (Guarded) tương tự như trong CSP: Operation Op(parameters) //operation Tên_toán_tử(các_tham_số) Guarded condition do statements; //Guarded điều_kiện do các_câu_lệnh; Guarded condition do statements; // Guarded điều_kiện do các_câu_lệnh; Lệnh trong toán tử chỉ được thực hiện khi điều_kiện trong Guarded là đúng. Nếu không thì QT đó bị chặn lại. Nếu có hơn một điều kiện đúng, thì chỉ một lệnh điều kiện được chọn động để cung cấp cách thức thực hiện không xác định. Một toán tử đối tượng trong một chương trình ứng dụng trên Orca được biên dịch thành nguyên thủy invoke (yêu cầu). invoke (object, operation, parameters) Các nguyên thủy invoke được bẫy tới hệ thống thời gian thực hiện Orca (Orca RTS: Orca Run Time System). RTS kiểm tra xem đối tượng có phải là chỉ đọc. Nếu đúng, RTS đặt khoá chia xẻ cho bản sao địa phương, thực hiện QT đọc, sau đó lại mở khóa đối tượng. Nếu không, RTS khởi tạo một TĐ quảng bá đến tất cả các vị trí của đối tượng chia xẻ, bao gồm chính nó, để cập nhật đối tượng và kết khối QT. Khi nhận TĐ quảng bá để ghi lên đối tượng, RTS đặt một khoá ghi lên đối tượng, thực hiện toán tử ghi và mở khoá đối tượng. Nếu thông điệp quảng bá hình thành cục bộ, nó sẽ kết khối QT. RTS giả thiết truyền thông là tin cậy. Nó hỗ trợ tầng quảng bá tin cậy ngay dưới hệ thống thời gian chạy. Tầng quảng bá tin cậy đó có thể thi hành nhiều giao thức quảng 102/249
bá theo những đòi hỏi ngữ nghĩa khác nhau. Giao thức quảng bá kỳ vọng đảm bảo rằng mọi phía đối tượng nhận được toàn bộ các TĐ quảng bá và tất cả các TĐ được phân phát theo đúng một thứ tự (tức là quảng bá được xem như là một nguyên tử). Thi hành giao thức quảng bá nguyên tử được trình bày ở chương sau, tuy vậy ở đây giới thiệu khái quát cách tiếp cận đơn giản trong Orca để thực hiện quảng bá nguyên tử. Khi quảng bá được RTS yêu cầu, nhân của RTS gửi một TĐ điểm-điểm đến lời gọi nhân đặc biệt sequencer. Sequencer gắn một số hiệu dãy tới yêu cầu và quảng bá TĐ bao gồm các số hiệu dãy tới mọi phía đối tượng nhân bản. Chi số dãy được mỗi nhân dùng để xác định thứ tự phân phát TĐ, kiểm tra TĐ bội, và yêu cầu sequencer chuyển lại một TĐ nếu như TĐ đó bị mất. Đối tượng là đơn vị dữ liệu nền tảng trong Orca. Đối tượng được trình bày bằng một cấu trúc dữ liệu chẳng hạn như danh sách, cây hoặc đồ thị, thường được dùng bằng con trỏ trong ngôn ngữ lập trình quy ước. Con trỏ (pointer) là một địa chỉ máy. Truyền địa chỉ máy là kém ngữ nghĩa và có thể dẫn đến xung đột an ninh CTĐ ở HPT. Cơ chế cho phép thi hành và truyền cấu trúc dữ liệu phức tạp có sẵn để tạo ra mô hình đối tượng chia xẻ hữu dụng. Orca giải quyết vấn đề này bằng cách thay thế con trỏ bởi tên. Với mỗi đối tượng được RTS quản lý, mảng logic các dữ liệu có cấu trúc sẽ được duy trì cho đối tượng. Ví dụ, một cây nhị phân đơn giản t với 3 nút {A, B, C} và các liên kết trái và phải, được trình bày như sau: t[1] = 6,A,8 t[6] = 0,B,0 t[8] = 0,C,0 Mỗi nút trong cấu trúc dữ liệu này được tạo động bởi nguyên thủy RTS addnode(t), trả lại tên n cho nút đó. Tên n được dùng như số hiệu của cấu trúc mảng để đặt tên cho nút cũng như để liên kết tới các nút khác. Tương tự cũng có một nguyên thuỷ xóa nút là deletenote(t,n). Chỉ dẫn tới nút đã bị xóa sẽ gặp lỗi thực hiện. Mảng đối tượng mang tính lôgic: định vị và giải phóng lưu giữ chúng được RTS quản lý động. Dùng nút đặt tên để thi hành cấu trúc dữ liệu đạt được hiệu lực tới con trỏ mà không cần địa chỉ máy. Truyền cấu trúc dữ liệu phức tạp trở thành chấp nhận được với việc trả thêm tổng phí trong hệ thống thời gian chạy. Java Mục tiêu nguyên thủy của Orca là hỗ trợ lập trình đồng thời trong hệ phân tán. Vấn đề thi hành chính yếu của nó là tính toán phân tán và tạo độ trong suốt truyền thông tới các QT cộng tác. Java được đưa ra theo một phối cảnh khác. Nó là ngôn ngữ lập trình và môi trường lập trình, nhằm đạt được khả năng cộng tác trong phát triển phần mềm mạng. Chúng ta có thể hình dung rằng ứng dụng mạng chứa một tập hợp các môdun phần mềm 103/249
được phân tán một cách vật lý trên một hệ mạng diện rộng hỗn tạp. Mỗi môdun phần mềm có thể được thi hành và duy trì bởi những cá thể khác nhau trên những nút mạng. Để thực hiện một ứng dụng mạng thì phải tập hợp một số modun trên tới một nút mạng đơn. Khả năng liên thao tác để mở một ứng dụng mạng cần sự hỗ trợ của ba hệ thông cơ sở: 1. Các giao diện chuẩn định nghĩa tốt để tích hợp các môđun phần mềm, 2. Năng lực thực hiện môđun phần mềm trên máy tính bất kỳ, 3. Hạ tầng cho cộng tác và vận chuyển modun phần mềm Để thuận tiện tích hợp phần mềm, Java thông qua mô hình hướng đối tượng, một kiểu lập trình đã được dùng rộng rãi khi phát triển những phần mềm lớn. Ngôn ngữ Java tương tự ngôn ngữ hướng đối tượng C++. Với sự chấp nhận với một ít kiểu dữ liệu, như số và logic, mọi thực thể phần mềm được mô hình hóa như một đối tượng Java. Một đối tượng là một tóm lược của dữ liệu và các thủ tục (hoặc phương pháp) liên quan trên đối tượng đó. Đối tượng được tạo ra bằng việc thuyết minh lớp qua ví dụ. Lớp là một mẫu xác định các biến cũng như những phương pháp chung cho tất cả các đối tượng cùng kiểu (lớp). Lớp này thường chứa đựng lớp khác (thừa kế). Chúng là cơ sở để xây dựng các khối trong chương trình Java. Các file lớp thường dùng phân loại và sắp xếp trong các thư viện lớp được gọi là gói. các gói có thể được nạp cục bộ hay từ xa để khởi tạo đối tượng. Phát triển phần mềm mạng trở thành dễ điều khiển hơn do các thư viện lớp được chia xẻ. Tiếp cận đặt ra với Java là cho phép chạy mọi modul phần mềm tại mọi nơi theo ngữ nghĩa của khái niệm máy ảo. Hệ thống Java với trình biên dịch và trình phiên dịch. Đầu tiên, chương trình Java được biên dịch thành file lớp chứa các mã trung gian được gọi là applet (tiểu dụng). Tiểu dụng là chương trình độc lập máy và có thể được thông dịch trên mọi máy tính có trình thông dịch Java. Thông dịch trên mã trung gian là kém hiệu quả hơn so với chạy mã máy biên dịch. Tuy nhiên, ưu điểm lớn của cách thức này là mã trung gian được chuyển đi như những TĐ tới bất cứ môi trường nào và chạy trực tiếp không cần dịch lại. Một ứng dụng mạng có thể mang bất cứ một file mã byte nào trên đường truyền để thực hiện. Do các bản sao của file mã không cần lưu cục bộ, bài toán duy trì tính nhất quán cập nhật phiên bản trong phát triển phần mềm cộng tác được loại bỏ. Java được ràng buộc cẩn thận nhằm đảm bảo tính độc lập máy. Một vài đặc trưng của ngôn ngữ thông dụng là nguyên nhân làm cho các vấn đề liên thao tác hoặc an toàn được loại bỏ khỏi ngôn ngữ. Ví dụ, Java không cung cấp con trỏ, kiểu cấu trúc, chuyển đổi kiểu ngầm định hoặc thừa kế bội. Khái niệm về file đầu (.h) trong C cũng bị loại trừ khỏi Java. Hơn nữa, mọi phương thức và biến trong file lớp Java là được chhỉ dẫn bằng tên và được giải quyết trước khi thực hiện. Việc làm chậm giải pháp tên đòi hỏi sự hỗ 104/249
trợ của dịch vụ tên. Nó cung cấp sự trong suốt truy nhập, trong suốt định vị và an toàn bổ sung. Hạ tầng để chuyển vận tiểu dụng Java được sáng tỏ tốt nhất nhờ việc tích hợp Java cùng với hệ thống duyệt WWW. Theo nhiều khía cạnh, triết lý của Java cũng rất giống với duyệt Web là sử dụng giao thức giao vận như giao thức chuyển siêu văn bản HTTP để chuyển các modun HTML dọc theo các nút mạng hỗn tạp. HTML là ngôn ngữ đánh dấu độc lập máy để mô tả dữ liệu siêu văn bản. Giống như file lớp trong Java, file HTML là đối tượng có thể chứa các file HTML khác và có thể định vị và liên kết khi dùng bộ định vị tài nguyên tổng thể toàn mạng URL. Tiểu dụng Java có thể hợp nhất trong một file HTML và được thông dịch bởi trình thông dịch Java đã được dựng nội trong trình duyệt. Theo cách đó, trình duyệt vừa có thể hiển thị nội dung dữ liệu siêu văn bản tĩnh vừa có thể chạy linh hoạt tiểu dụng Java. Trình ứng dụng là vô kể. Với trình duyệt đa luồng và Java đa luồng, thì trình duyệt có thể hiển thị đồng thời văn bản cũng như hình ảnh động và trở thành tương tác giữa khách và phục vụ của ứng dụng. Một cách hiệu quả, trang Web được trình bày dưới một file HTML trở thành lối vào của tiểu dụng Java. Khái niệm thực hiện thông dịch trực tuyến trong Java không phải là mới. Ví dụ, Postscript và dữ liệu đồ họa GIF cũng được thông dịch trong hệ thống trình duyệt. Tuy nhiên, Java là ngôn ngữ đa năng đã được suy nghĩ cẩn thận cho lập trình mạng. Lưu ý cuối cùng là vấn đề an toàn khi thiết kế Java. An toàn là vấn đề khó tính trong lập trình mạng hệ thống mở. Thêm nữa, để định nghĩa ngôn ngữ chặt chẽ nhằm đề phòng sự lạm dụng của ngôn ngữ, Java là ngôn ngữ định kiểu mạnh giống như Orca. Mọi đối tượng trong Java phải được định kiểu tường minh. Trình biên dịch làm hiệu lực những kiểm tra kiểu tĩnh. Do mỗi máy thấy được tiểu dụng từ bên ngoài theo mã trung gian, cần phải xác minh mã trung gian không phải bị làm giả hay biến dạng. Kiểu và những thông tin điều khiển khác được tích hợp với mọi tiểu dụng. Trước khi thực hiện một tiểu dụng, mã của nó buộc phải được kiểm tra chặt chẽ bộ kiểm tra Java (Java Virifier) xem sự vi phạm về truyền tham số, chuyển đổi kiểu bất hợp pháp, khả năng tràn (vượt trần) và hụt (xuống quá đáy) stack, vi phạm truy nhập và sinh mã trung gian giả bởi trình biên dịch đáng ngờ. Việc kiểm tra lỗi thời gian chạy ở mức tối thiểu nhất nhằm có được sự thực hiện hiệu quả. Một vần đề về an toàn khác đáng chú ý tới lập trình trên mạng là sự nhái lại đối tượng. Khi tiểu dụng thực hiện có thể gọi một đối tượng khác. File lớp đã được tải cho đối tượng có thể là tiểu dụng đích thực với cùng tên và xuất hiện nhưng có thể không phải từ địa hạt mong muốn. Ví dụ, đối tượng lớp đối với hệ thống file và vào ra I/O nên đến là địa phương. Mỗi lớp file lớp được tương ứng một địa hạt bảo vệ. Địa hạt được phân ra ít nhất là ba mức: máy tính cục bộ, mạng cục bộ và mạng toàn cục mà mức máy tính cục bộ có mức bảo vệ cao nhất. Khi tải một file lớp, các lớp với độ bảo vệ cao hơn được ưu tiên hơn các lớp độ bảo vệ thấp hơn. Hơn nữa, lớp trong một dịa hạt chỉ truy nhập được các phương pháp trong cùng địa hạt. Các phương pháp thuộc các lớp trong một địa 105/249
hạt khác được truy nhập chỉ khi chúng được khai báo là công cộng. Quy tắc tải các lớp tuân theo Bộ tải lớp Java (the Java Class Loader) do người lập trình Java định nghĩa. Câu hỏi và bài tập 3.1. Khái niệm QT và luồng, ý nghĩa của khái niệm luồng. Đặc điểm chính trong mô hình Client/Server trong hệ phân tán. 3.2. Vai trò của dịch vụ thời gian trong hệ phân tán. Giải pháp đồng hồ vật lý và đồng hồ lôgic trong hệ phân tán. 3.3. Đồng bộ hóa sử dụng biến chung 3.4. Đồng bộ hóa chuyển thông điệp 106/249
Truyền thông CTĐ Các QT cộng tác trong hệ thống máy tính tương tác lẫn nhau theo mô hình TTLQT nhằm phối hợp thực hiện. TTLQT và cộng tác QT phân tán là chủ đề chính của chương này. Chương ba đã nhấn mạnh tầm quan trọng của mô hình clien/server đối với truyền thông và quan hệ gắn kết giữa TTLQT và đồng bộ. TTLQT đóng vai trò đáng kể hơn trong hệ phân tán do chỉ có phương pháp trao đổi dữ liệu QT là CTĐ. Vì vậy mọi mô hình truyền thông liên QT mức cao đều được xây dựng trên nền CTĐ. Mọi cộng tác QT phân tán đều dựa vào truyền thông liên QT CTĐ. TTLQT phụ thuộc vào năng lực định vị thực thể truyền thông. Đây chính là vai trò của dịch vụ tên trong hệ phân tán. Chương này trình bày ba mô hình truyền thông CTĐ cơ sở và mô hình dịch vụ tên. Tiếp theo là một minh hoạ cộng tác QT phân tán sử dụng hai bài toán kinh điển của TTCTĐ: loại trừ ràng buộc phân tán và chọn thủ lĩnh. TTLQT có thể được xem xét tại các mức trừu tượng khác nhau. Bảng 4.1 cho năm mức từ mạng tới hệ giao vận và tới các QT ứng dụng. Theo phương diện HĐH phân tán, đầu tiên quan tâm tới ba mức trên chuyển vận TĐ trong các QT phân tán. Chúng là CTĐ, mô hình truyền thông định hướng dịch vụ mức cao sử dụng truyền thông hỏi/đáp và truyền thông giao dịch dựa trên mô hình hỏi/đáp và CTĐ. Bảng 4.1. cho thấy CTĐ là mức thấp nhất của TT giữa các QT TT. TT hỏi/đáp dựa trên khái niệm client/server. Khi được thi hành như lời gọi thủ tục trong chương trình phân tán, mô hình TT được quy tới lời gọi thủ tục từ xa (RPC). Một cách tự nhiên, hỏi/đáp hoặc RPC dựa trên phương tiện CTĐ cơ sở. Giao dịch là một dãy các TT hỏi/đáp đòi hỏi TT nguyên tử. Giao dịch biểu diễn đơn vị cơ sở của TT đối với các ứng dụng mức cao, chẳng hạn hệ CSDL. Thực hiện đồng thời các giao dịch cần được đồng bộ để duy trì tính nhất quán của hệ thống. Ngoài ra, khái niệm bộ nhớ chia xẻ lôgic hoặc đối tượng dữ liệu là phương pháp TT khác biệt đáng kể so với ba mô hình CTĐ. Trong hệ thống chỉ với bộ nhớ vật lý phân tán, bộ nhớ chia xẻ được mô phỏng bởi CTĐ. Lợi thế của bộ nhớ chia xẻ lôgic là dễ dàng lập trình, do TT là trong suốt. Giao dịch và bộ nhớ chia xẻ phân tán được trình bày trong các chương 6 và 7. Bảng 4.1. Các mức khác nhau của TT TTLQT Giao dịch Hỏi / Đáp (RPC) 107/249
CTĐ HĐH mạng Kết nối giao vận Mạng truyền thông Chuyển gói TĐ là một tập các đối tượng dữ liệu, mà cấu trúc và sự giải thich chúng được xác định bởi các QT ngang hàng với nó. Đối tượng dữ liệu trong TĐ thường được định kiểu nhằm dễ dàng chuyển đổi đối tượng dữ liệu trong hệ thống hỗn tạp. TĐ bao gồm đầu TĐ (chứa thông tin điều khiển phụ thuộc hệ thống) và thân TĐ với kích thước cố định hoặc biến thiên. Trong hệ thống CTĐ, QT TT chuyển các TĐ được đóng gói tới dịch vụ giao vận hệ thống cung cấp kết nối truyền TĐ trong mạng. Giao diện tới dịch vụ giao vận là dịch vụ nguyên thủy hiển, chẳng hạn gửi và nhận, hoặc biến thể nào đó của cả hai. Ngữ nghĩa của các dịch vụ nguyên thủy TT này cần xác định hoàn toàn. Các bài toán chính được đưa ra trong các đoạn sau đây bao gồm TT là trực tiếp hay gián tiếp, kết khối hay không kết khối, tin cậy hay không tin cậy, dùng vùng đệm hay không. Dịch vụ TT nguyên thủy cơ sở Hai dịch vụ TT nguyên thủy cơ sở dưới đây là ví dụ để gửi và nhận TĐ. Sẽ là hiệu quả đối với QT ứng dụng khi chỉ rõ thực thể TT và TĐ được truyền: send (đích, TĐ) receive (nguồn, TĐ) trong đó nguồn hoặc đích = (tên QT, liên kết, hộp thư hoặc cổng). Một câu hỏi nảy sinh trực tiếp từ dịch vụ nguyên thủy là làm thế nào để địa chỉ hóa thực thể TT, nguồn hoặc đích? Dưới đây bàn luận về bốn lựa chọn trên: tên QT, kết nối, hộp thư, cổng. Đầu tiên, giả sử địa chỉ hóa thực thể TT bằng tên QT (tức là định danh QT toàn cục). Khi thi hành thực sự, định danh QT toàn cục có thể được tạo duy nhất qua kết hợp địa chỉ máy chủ mạng với số hiệu QT cục bộ được sinh. Sơ đồ này ngầm định rằng chỉ có một đường TT lôgic trực tiếp tồn tại giữa cặp hai QT gửi và nhận như hình 4.1.a đã chỉ ra. Điều này tương tự TT input/output dùng trong CSP mà đoạn 3.5.3 đã chỉ ra hạn chế của cách tiếp cận này. Sơ đồ địa chỉ được chỉ dẫn là địa chỉ đối xứng do các QT gửi/ nhận tương ứng biết rõ nhau trong dịch vụ TT nguyên thủy. Trong một số trường hợp, thuận lợi hơn cho QT nhận là nhận được TĐ từ nguồn chưa biết. Trong trường hợp như thế, địa chỉ nguồn của DV nguyên thủy nhận là một biến vào mà được cho giá trị định danh QT gửi TĐ đó (nếu có một QT nhận). Địa chỉ gửi và nhận là bất đối xứng do chỉ QT gửi cần định vị người nhận. Hình 4.1.b. chỉ ra các trường hợp tổng quát hơn của DV nguyên thuỷ nhận. 108/249
Sơ đồ trên giả thiết tồn tại đường TT trực tiếp giữa cặp hai QT. Thực tế, đường TT là trong suốt hoàn toàn vì vậy đã không chú ý tới kết nối khi giao vận TĐ. Về quan niệm thì đơn giản nhưng để hợp lý chỉ có một đường TT định hướng kép giữa mỗi cặp hai QT TT. Để cho phép đường truyền dữ liệu phức giữa các QT và TT trực tiếp, bắt buộc định danh được mỗi đường đi trong dịch vụ TT nguyên thuỷ. Đòi hỏi này đưa đến khái niệm kết nối hayliên kết, tương tự với khái niệm chu trình ảo trong mạng TT. TĐ có thể được gửi theo các chu trình ảo khác nhau. Như vậy, điểm TT phức trong một QT cần phải đinh danh bằng việc sử dụng các kết nối khác nhau, mỗi kết nối đó ánh xạ tới một đường TT thực sự. Giống như chu trình ảo, kết nối được tạo và loại bỏ theo yêu cầu. Chúng được nhân hệ thống quản lý cục bộ và là những kênh TT không định hướng. TĐ được gửi qua một kết nối được hướng vào một đường TT mạng và được phân phối tới các máy chủ ở xa. Máy chủ từ xa ánh xạ TĐ tới kết nối đầu vào trong QT nhận. Hình 4.1.c chỉ ra tính hợp lý của việc duy trì hai kết nối giữa các QT khi dùng hai số hiệu kết nối khác nhau. QT đọc cần chú ý kết nối là tương tự với tên điểm vào thủ tục trong cuộc hẹn (đoạn 3.5.3) với lý do là chúng đều cung cấp điểm TT phức trong một QT. Tuy nhiên, giao vận dữ liệu bằng truyền tham số trong cuộc hẹn là định hướng kép. Dùng tên QT và số hiệu kết nối để định vị các điểm TT cung cấp cơ chế TT trực tiếp giữa các QT ngang hàng. Tuy nhiên, đôi khi TT gián tiếp cũng được ưa chuộng. QT gửi không quan tâm tới định danh riêng biệt của QT nhận cho đến khi có một QT nhận được TĐ. Tương tự, QT nhận chỉ quan tâm đến chính TĐ mà không cần biết QT gửi. Ví dụ, client phức có thể đòi hỏi dịch vụ từ một trong nhiều dịch vụ phức (định danh của khách có thể được chứa trong chính TĐ). Kịch bản TT này là cồng kềnh khi dùng TT trực tiếp thi hành. Đây là tình huống chung trong cuộc sống hàng ngày, và được giải quyết bằng hộp thư chung. CTĐ dùng hộp thư chung là sơ đồ TT gián tiếp cung cấp cả TT đa điểm và đa đường một cách hợp lý. Kịch bản này được minh hoạ trong hình 4.2. 109/249
Về quan niệm, hộp thư là cấu trúc dữ liệu toàn cục chia xẻ của QT sản xuất (gửi) và QT khách hàng (nhận). Dùng hộp thư đòi hỏi sự đồng bộ chính xác dọc theo mạng mà đây là một bài toán khó. Do hộp thư là dùng cho TT, có thể gắn với nó một cấu trúc chuyển vận yếu và thi hành chúng bằng cách dùng vùng đệm và liên kết TT. Cổng là một ví dụ tốt cho hộp thư. Cổng là một khái niệm trừu tượng về một dòng xếp hàng có kích thước cố định hoạt động theo FIFO được nhân duy trì. TĐ có thể gắn vào đuôi và loại bỏ từ dòng đợi bởi các thao tác gửi và nhận xuyên qua một đường TT. Như vậy, cổng tương tự như danh sách ngoại trừ chúng là định hướng kép và có vùng đệm. Các QT TT qua cổng là gián tiếp. Cổng được tạo bởi QT người dùng nhờ lời gọi hệ thống đặc biệt và có thể được phù hợp với QT chủ và đủ năng lực. Chúng được chỉ dẫn bằng số hiệu cổng, mà không thể bị nhầm lẫn với địa chỉ cổng giao vận trong giao vận gói (địa chỉ cổng giao vận là cổng mạng và trong suốt với QT người dùng). Khi thi hành, cổng QT được ánh xạ tới cổng giao vận và ngược lại. Cổng hoặc hộp thư được hình dung như là phục vụ TT và đồng bộ, đã được biện luận trong đoạn 3.6. Thuật ngữ cổng và hộp thư thường được tráo đổi (thay thế nhau) trong một vài tài liệu. Tương tự như socket và cổng trong HĐH UNIX. Socket là giao diện mức cao sử dụng khái niệm cổng. Cổng có chủ nhân là QT riêng biệt. Cổng cung cấp TT nhiều-một (n-1). Hộp thư là đối tượng chia xẻ và cho phép truyền thông nhiều-nhiều (n-n). Đồng bộ hóa TĐ và vùng đệm TT CTĐ phụ thuộc một số điểm đồng bộ. Khi gửi TĐ tới đích xa, TĐ đó được chuyển tới nhân hệ thống gửi để thực hiện chuyển giao TĐ cho mạng TT. Cuối cùng, TĐ đi tới được nhân hệ thống đích (ở xa) thực hiện việc trao trả TĐ cho QT đích. Đồng bộ hóa truyền TĐ xảy xa giữa QT người dùng và nhân hệ thống, nhân và nhân, và QT nguồn và QT đích. Hình 4.3. chỉ rõ các giai đọan khác nhau của CTĐ trong hệ thống. 110/249
Dịch vụ nguyên thủy gửi và nhận được coi là kết khối nếu QT gọi cần kết khối để phân phối hay nhận TĐ tương ứng. Hầu hết hệ thống cho phép chọn dịch vụ nguyên thủy gửi/ nhận kết khối hoặc không kết khối. Hầu hết ngầm định gửi không kết khối và nhận kết khối. Lý do là để thuận tiện, giả thiết rằng phân phối TĐ là đáng tin cậy và QT gửi có thể tiếp tục công việc một cách hiệu quả sau khi TĐ đã được dàn xếp và nhân bản tới nhân gửi. Mặt khác, QT nhận cần chờ cho đến khi TĐ xuất hiện để thực hiện công việc của mình. Tuy nhiên, không phải mọi trường đều như vậy. Chẳng hạn, QT gửi có thể mong muốn đồng bộ với QT nhận hoặc QT nhận mong muốn TĐ từ QT gửi phức và không thể không đủ chỗ cho thao tác nhận riêng biệt. Tại phía nhận, kết khối là hoàn toàn rõ ràng; nó cần được kết khối theo sự xuất hiện của TĐ. Về phía QT gửi, rắc rối hơn đôi chút. QT gửi nên chờ việc nhận được TĐ của nhân nguồn, nhân đích, hoặc QT đích hoặc thậm chí hoàn thiện một số thao tác của QT nhận? Danh sách dưới đây chỉ dẫn năm chức năng khác nhau của dịch vụ nguyên thủy gửi theo sơ đồ ở hình 4.3: 1. Gửi không kết khối, 1+8: QT gửi được loại bỏ sau khi TĐ đã được dàn xếp và sao tới nhân nguồn. 2. Gửi kết khối, 1+2+7+8: QT gửi được loại bỏ sau khi TĐ đã được truyền tới mạng 3. Gửi kết khối tin cậy, 1+2+3+6+7+8: QT gửi bị loại bỏ sau khi TĐ đã được nhân đích nhận xong. 4. Gửi kết khối tường minh, 1+2+3+4+5+6+7+8: QT gửi bị loại bỏ sau khi TĐ đã được QT nhận xong 5. Hỏi và đáp, 1-4, dịch vụ, 5-8: QT gửi bị loại bỏ sau khi TĐ đã được xử lý bởi QT nhận và lời đáp trở lại QT gửi. Phương án đầu tiên là gửi dị bộ còn những phương án khác đều là gửi đồng bộ. Phương án cuối cùng chính là TT clien/server. Trong gửi dị bộ, QT gửi bị kết khối nếu nhân tại nó chưa sẵn sàng tiếp nhận TĐ, có thể do thiếu không gian vùng đệm. Đây là đòi hỏi tối thiểu nhất vì rất nguy hiểm nếu QT gửi tiếp tục công việc (chẳng hạn, tạo ra một TĐ mới) trước khi nhân gửi nắm điều khiển TĐ. Khi giả thiết là gửi/nhận dị bộ, ta mong 111/249
muốn rằng dịch vụ nguyên thủy cần cho một mã quay về cho biết kết quả thành công hay thất bại của thao tác để qua phân tích mã quay về để hoặc gửi TĐ tiếp theo hoặc xử lý lỗi. Trong sơ đồ hình 4.3, ngầm định tồn tại vùng đệm trong nhân gửi, nhân nhận và mạng TT. Vùng đệm trong nhân hệ thống cho phép TĐ được gửi đến thậm chí khi TĐ trước nó chưa được phân phối. Do QT gửi và nhận chạy dị bộ, chúng tạo ra và xử lý các TĐ theo các mức độ (tốc độ) khác nhau. Do có vùng đệm, sự không đồng nhất này trở nên êm ả. Thêm nữa, khả năng QT gửi bị kết khối được rút gọn và thông lượng truyền tổng thể TĐ được tăng lên. Vùng đệm được dùng để điều khiển lưu lượng trong mạng TT. Trong HĐH, thông thường vùng đệm được chia xẻ bởi TT gửi và nhận đa thanh phần. Quản lý vùng đệm hiệu quả trở thành một bài toán quan trọng. Quản lý vùng đệm không chính quy có thể trở thành nguyên nhân bế tắc TT. Về lôgic, có thể kết hợp vùng đệm trong nhân gửi, nhân nhận, và mạng thành một vùng đệm lớn. QT gửi tạo ra TĐ và chèn chúng vào vùng đệm còn QT nhận xóa khỏi vùng đệm và sử dụng chúng. Nếu vùng đệm là không giới hạn, QT gửi dị bộ là không kết khối. Một trường hợp đặc biệt khác là mọi thành phần là vắng vùng đệm (zero-buffer). Trong trường hợp này, QT gửi và QT nhận bắt buộc phải đồng bộ (trách nhiệm đồng bộ hóa dành cho người viết chương trình các QT này) để đủ năng lực truyền TĐ (bất cứ TĐ nào xuất hiện thì trước hết phải đợi TĐ trước đó). Điều này tương tự như khái niệm cuộc hẹn và là một kiểu gửi/nhận kết khối tường minh. API ống dẫn và Socket Như đã nói ở trên, tồn tại lượng lớn và đa dạng các dịch vụ nguyên thủy TT CTĐ với các khái niệm và giả thiết khác nhau. Khi TT được thực hiện nhờ một tập hoàn toàn xác định các giao diện chương trình ứng dụng chuẩn (API) sẽ tạo thuận lợi cho người dùng và hiệu quả cho hệ thống. TT QT người dùng sử dụng một API độc lập với môi trường TT hạ tầng. ống dẫn (pipe) và socket là hai API TTLQT được sử dụng rộng rãi trong cả hai môi trường UNIX và Windows. Như trình bày trong đoạn 3.5.3 thì chia xẻ kênh TT về mặt lôgic là tương đương với chia xẻ biến. Cả hai đều là chia xẻ đối tượng. Trong thực tế, kênh TT được thi hành bởi chia xẻ lưu trữ, chẳng hạn không gian nhân, bộ nhớ, hoặc file. Trong hệ đơn xử lý hỗ trợ QT TT có thể mô phỏng kênh TT nhờ chia xẻ bộ nhớ trong không gian nhân. QT người dùng thấy được kênh TT theo trình diễn bởi API. Chi tiết nội tại và thi hành, chẳng hạn như dung tích của kênh và đồng bộ truy nhập bộ nhớ, được nhân quản lý và trong suốt với người dùng. ống dẫn được thi hành bằng một vùng đệm dòng byte FIFO kích thước cố định được nhân duy trì. Được hai QT TT sử dụng, phục vụ ống dẫn như một kết nối TT không định hướng mà một QT có thể ghi dữ liệu vào đuôi của ống dẫn và một QT khác có thể đọc từ đầu của nó. ống dẫn được khởi tạo bởi lời gọi hệ thống pipe cho hai đặc tả ống dẫn (tương tự như đặc tả file), một để đọc và một để ghi. Kịch bản điển hình 112/249
để ống dẫn giữa hai QT là vì một QT phải khởi tạo ống dẫn, fork QT khác, gắn QT cha vào đầu đọc ống dẫn và gắn đầu ghi ống dẫn tới QT con. Như vậy một dòng dữ liệu một chiều trở thành chuyển dịch giữa QT cha và con khi sử dụng các thao tác ghi và đọc bình thường. Đặc tả ống dẫn được các QT TT chia xẻ. Điều này ngụ ý rằng ống dẫn được sử dụng chỉ với các QT có quan hệ với nhau (tức là, QT được khởi tạo thông qua thao tác fork). Trong điều kiện thông thường, QT đọc và ghi được giả thiết là chạy đồng thời đối với mọi ống dẫn được tạo. ống dẫn chỉ tồn tại trong khoảng thời gian cả hai QT đọc và ghi hoạt động. Thao tác ghi ống dẫn không kèm thao tác đọc tương ứng là vô nghĩa do ống dẫn ngừng tồn tại khi QT ghi kết thúc. Dữ liệu trong ống dẫn mặc nhiên là dòng byte liên tục. Tiếp cận này được chọn nhằm khớp với giả thiết chung cấu trúc file hướng byte của UNIX. Đôi khi mong muốn rằng là dòng dữ liệu cấu trúc, chẳng hạn TĐ độ dài biến đổi trong kênh và khái niệm ống dẫn có thể được mở rộng để bao gói cả TĐ. Kiểu kênh TT này được hiểu là dòng xếp hàng TĐ. Dòng xếp hàng TĐ được thi hành trong không gian bộ nhớ của nhân. Nhiều hệ thống cung cấp dòng xếp hàng TĐ như là một IPC API. Với những QT không quan hệ (fork), cần định danh ống dẫn vì đặc tả ống dẫn không thể chia xẻ. Một giải pháp là thay cấu trúc dữ liệu ống dẫn nhân bằng một file FIFO đặc biệt. File FIFO đặc biệt được định danh duy nhất bằng tên đường tương tự như file thông thường. ống dẫn với tên đường được gọi là ống dẫn có tên. Với một tên duy nhất, ống dẫn có tên có thể được chia xẻ giữa các QT rời rạc xuyên qua các máy tính khác nhau với một hệ thống file chung. Do ống dẫn có tên là file thì các QT TT không cần đồng thời tồn tại. QT ghi có thể ghi xong dữ liệu tới một ống dẫn có tên và kết thúc trước khi một thao tác đọc file xuất hiện. ống dẫn có tên dùng ngữ nghĩa của một file thông thường. Chúng được khởi tạo bởi câu lệnh open trước khi tạo ra truy nhập tới file FIFO. ống dẫn và ống dẫn có tên thi hành bài toán IPC giữa nhà sản xuất và khách hàng. Trong bài toán nhà sản xuất và khách hàng, QT sản xuất (gửi) và QT khách (nhận) tương tác nhau thông qua một vùng đệm chung để hoàn thành TTLQT. Vấn đề đồng bộ là loại trừ ràng buộc đối với truy nhập vùng đệm và cộng tác có điều kiện khi vùng đệm là đầy hoặc rỗng. Truy nhập vùng đệm được chú ý như khoảng tới hạn mà cần được giám sát. Điều kiện tràn hoặc rỗng của vùng đệm là tương tự kết khối của gửi (sản xuất) và nhận (khách hàng) với một vùng đệm cố định. Thi hành ống dẫn và ống dẫn có tên đơn thuần bảo đảm tính nguyên tử của vùng đệm nhân chia xẻ và file FIFO đặc biệt và việc kết khối thao tác ghi và đọc khi vùng lưu trữ chia xẻ là đầy hoặc rỗng. Các byte được ghi từ QT phức tới ống dẫn được đảm bảo không khi nào là chen lẫn. Cẩn thận đặc biệt khi ghi dữ liệu riêng tới ống dẫn trước khi nó trở nên đầy. Hoặc toàn bộ các byte của TĐ được ghi vào ống dẫn hoặc không. Dùng ống dẫn định danh gặp một hạn chế từ tên miền đơn trong hệ thống file chung. Để đạt được TT QT liên miền mà không có cấu trúc dữ liệu hoặc file có tên duy nhất và 113/249
được chia xẻ, cần có một IPC API chạy trên đỉnh của dịch vụ giao vận. Hai API TT liên QT liên miền được dùng rộng rãi nhất là socket Berkeley và Giao diện mức giao vận hệ thống 5 (TLI). Socket Berkerley là ví dụ minh họa API TT. Việc đặt tên kênh TT qua một miền hỗn tạp là không khả thi. Tuy nhiên, kênh TT có thể được hình dung như một cặp gồm hai đầu mút TT. Socket là mút TT của kết nối TT được quản lý bởi dịch vụ giao vận. Tương tự việc sử dụng ống dẫn cho phép file I/O có ngữ nghĩa đối với việc đọc từ và ghi tới ống dẫn, mô hình I/O mạng socket dựa trên I/O File quy ước. Trừu tượng hóa I/O mạng như I/O file làm tăng tính trong suốt truy nhập trong hệ thống. Socket được tạo ra nhờ lời gọi hệ thống socket cho một đặc tả socket phục vụ các thao tác I/O mạng tiếp sau, bao gồm cả đọc/ghi hướng file và gửi/nhận đặc trưng TT. Lời gọi hệ thống socket cũng được sử dụng trong nhiều giao thức mạng như TCP, UDP và IP. TCP là giao thức giao vận dòng thực hiện hướng kết nối và UDP là giao thức giao vận sơ đồ không kết nối. Chúng là hai giao thức giao vận chính. IP được dùng để truyền dòng gói dữ liệu và là giao thức tầng mạng không kết nối trong bộ giao thức Internet. Đặc tả socket là nút TT logic (LCE: Logic Communication EndPoint) cục bộ đối với một QT; nó bắt buộc phải phù hợp với nút TT vật lý (PCE: Physic CE) để truyền dữ liệu. Nút TT vật lý được đặc tả bởi địa chỉ máy chủ mạng và cặp cổng giao vận. Địa chỉ máy chủ mạng là toàn cục, trong khi số hiệu của giao vận được sinh cục bộ bởi dịch vụ giao vận. Việc phù hợp một LCE với một PCE được thi hành bằng lời gọi hệ thống bind. Hình 4.4. chỉ ra một ví dụ TT ngang hàng không kết nối dùng các lời gọi hệ thống socket, bind và sendto/recvfrom. Do TT là không kết nối nên mỗi lời gọi sendto/ recvfrom bắt buộc chứa đặc tả socket cục bộ và PCE từ xa. Trong TT socket không kết nối mỗi QT ngang hàng bắt buộc phải biết PCE từ xa của nó. Có thể được loại bỏ việc gọi tên hiển của PCE từ xa trong lời gọi gửi/nhận nếu lời gọi socket kết nối ràng buộc một LCE cục bộ với PCE từ xa của nó trước khi bắt đầu truyền dữ liệu. Sau thao tác kết nối, truyền dữ liệu có thể đơn giản là send/recv hoặc write/read không có đặc tả của PCE từ xa. Lời gọi socket kết nối thông thường được dành riêng cho 114/249
TT Client/Server hướng kết nối. Đối với TT Client/Server, dịch vụ cần có được PCE rõ ràng. Một phục vụ sẽ cần TT với khách phức có PCE chưa biết. Khách đưa ra một lời gọi connect tới phục vụ để hẹn (cuộc hẹn), với yêu cầu khách nhờ một accept và thiết lập có kết quả một kết nối tới khách đó. Về khái niệm, điều này tương đương với thi hành cuộc hẹn Ada trong TT liên miền. Hình 4.5. minh họa TT socket Client/Server hướng kết nối. Trong thi hành UNIX, lời gọi socket listen được dùng để chỉ ra phục vụ sẽ chấp nhận một kết nối và đặc tả độ dài dòng xếp hàng (bao nhiêu lời hỏi xảy ra có thể xếp hàng). Lời gọi accept hẹn với lời gọi connect được tích lũy lại trong dòng xếp hàng listen. Một lời gọi accept sẽ kết khối nếu chưa có một connect giải quyết. Nếu có, nó xoá bỏ yêu cầu connect từ dòng đợi và đưa ra một đặc tả socket mới được dùng để TT với khách đã được kết nối. Đặc tả socket cũ còn lại trong dịch vụ cho các yêu cầu khách khác. Trong thi hành phục vụ đồng thời, QT (luồng) con là được phân nhánh đối với mỗi kết nối sử dụng đặc tả socket mới. Socket an toàn Socket đã trở thành API CTĐ phổ biến nhất trong cộng đồng Internet. Do việc sử dụng rộng rãi các ứng dụng Windows mà nhóm chuẩn WinSock, bao gồm hơn 30 hãng công nghiệp (kể cả MicroSoft) đã phát triển một socket Windows chuẩn (WinSock). WinSock bắt nguồn từ socket Berkeley. Nó gồm một tập công phu các API và được mở rộng nhằm 115/249
cung cấp tính trong suốt giao vận hoàn hảo khi sử dụng giao diện cung cấp dịch vụ (SPI: Service Provider Interface) trừu tượng làm dễ dàng tương thích plug-in cho hầu hết các giao thức giao vận. Phiên bản gần nhất cũng chứa tầng socket an toàn (SSL: Secure Socket Layer). Đòi hỏi an toàn TT trên Internet đã thúc đẩy IETF (Internet Engineering Task Force) phát triển SSL. Mục tiêu SSL là cung cấp: - Bảo mật trong TT socket khi dùng mã đối xứng để mã hoá dữ liệu - Toàn vẹn dữ liệu trong socket khi kiểm tra tính toàn vẹn TĐ - Xác thực phục vụ và khách khi dùng mã hóa khóa công khai bất đối xứng. Điểm chủ yếu của SSL chứa trong hai mức giao thức: một giao thức Handshake và một giao thức Record Layer. Giao thức Handshake tương ứng thiết lập các khóa ghi (khóa phiên TT để bí mật dữ liệu) và MAC (Message Authentication Check để toàn vẹn dữ liệu) bí mật và xác nhận tính xác thực của phục vụ và khách. Giao thức Record Layer thích hợp để phân đoạn, nén/giãn nén và mã hóa/giải mã các bản ghi của TĐ. Kết quả cuối cùng của giao thức Handshake là một cấu trúc dữ liệu chia xẻ (được gọi là mastersecret) chỉ khách và phục vụ biết được, mà có thể được biến đổi thành write key và một MACsecret để TT an toàn bằng Record Layer. Hình 4.6. trình bày một kịch bản đơn giản của giao thức Handshake SSL. Khách muốn liên lạc với phục vụ bằng cách gửi TĐ ClientHello tới phục vụ đó. Thành phần chính của TĐ chứa một số ngẫu nhiên (randomC) và một tập thuật toán mật mã (CipherSuites). Số ngẫu nhiên được dùng để tính toán mastersecret quyết định. CipherSuites là một danh sách lựa chọn mã hóa được phục vụ đàm phán và chọn. Phục vụ trả lại cho khách một TĐ phục vụHello chứa một số ngẫu nhiên randomS, một thuật toán mã hóa CipherSuite được chọn và một định danh phiên cho kết nối. Tại thời điểm này, phục vụ có thể xác nhận định danh của nó bằng việc gửi một giấy chứng nhận tới khách. Giấy chứng nhận được cho bằng giấy xác thực (CA) nhóm ba. Giấy chứng nhận được QT cấp giấy ký khi dùng khóa bí mật của nó và như vậy không thể dễ giả mạo. SSL dùng xác nhận X.509. Phục vụ có thể yêu cầu giấy chứng nhận của khách. Mỗi một chứng nhận mang thành phần khóa công khai trong cặp gồm khóa công khai và khóa bí mật của đối tượng được ghi nhận (khách hoặc phục vụ). Khách cần khóa công khai của phục vụ để biến đổi thông tin bí mật tới phục vụ. Mã hóa khóa công khai được trình bày trong chương sau. Phương pháp cặp khóa kép (công khai và bí mật) được coi là một thuật toán mã hóa. Với nó, một TĐ được mã hóa bởi một khóa công khai có thể được giải mã bằng khóa bí mật tương ứng và ngược lại. Khóa công khai được ghi nhận bằng thông tin công khai còn khóa bí mật chỉ có các đối tượng biết. Để đơn giản 116/249
hóa trong trình bày giao thức Handshake SSL ở hình 4.6 đã bỏ qua việc xác nhận tính hợp lệ của các giấy chứng nhận. Không cần giấy chứng nhận, một phục vụ nặc danh có thể gửi khoá công khai của nó trong TĐ phục vụKeyExchange tới Khách. Khóa công khai này không cần phải là khóa đã được ghi nhận. Phục vụ sinh tạm thời khóa công khai để sử dụng theo từng lần yêu cầu của khách. Khách đáp lại bằng một TĐ ClientKeyExchange mang một pre- mastersecret mã hóa theo khóa công khai tạm thời của phục vụ. Chỉ có phục vụ với khóa bí mật tương ứng mới giải mã được pre-mastersecret. Lúc đó, cả khách và phục vụ chia xẻ pre-mastersecret và hai số ngẫu nhiên. Cả hai QT độc lập áp dụng hàm băm một chiều tới thông tin chia xẻ để chuyển pre-mastersecret quyết định chứa khóa ghi (write key) và MAC bí mật. Các khóa và MAC bí mật này được dùng để liên kết với bộ mật mã vừa được đàm phán. Chúng được ChangeCipherSpec tạo hiệu quả nhằm thay thế bộ mật mã cũ bằng một bộ mới. Các TĐ finished chấm dứt việc bắt tay. Chúng cũng được dùng để xác minh việc trao đổi khóa và xác thực có thành công hay không. Việc kiểm tra thông qua xác nhận TĐ finished chứa kết quả băm của mastersecret được móc nối với mọi TĐ bắt tay. TT socket an toàn được bắt đầu sau khi TĐ finished đã được trao đổi và kiểm tra. Mọi TĐ socket tiếp sau được mã hóa theo thuật toán mã hóa và khóa ghi bí mật đã được thiết lập cho đến khi phiên được thương lượng lại. Mọi TĐ chứa một bộ kiểm tra xác thực TĐ là kết quả băm TĐ với MAC bí mật. Không có MAC bí mật, sản xuất MAC cho TĐ tạm thời trở nên bất hợp lý. TĐ socket được xử lý bởi Record Layer trở thành bí mật 117/249
và bền vững. Khái niệm giao thức socket an toàn vẫn đang được tiếp tục tiến hóa và cải tiến. Truyền thông nhóm và phân phát bội (multicast) Mô hình TT CTĐ được trình bày trên đây dùng cho TT điểm-điểm. Mục này mô tả nhu cầu và thi hành TT nhóm đa điểm. Cần lưu ý là nhóm là bản chất để phát triển phần mềm cộng tác trong hệ phân tán hay tự trị. Quản trị nhóm các QT hoặc đối tượng cần có cơ chế TT phân phát bội để gửi TĐ tới các thành viên trong nhóm. Tồn tại hai kịch bản ứng dụng TT phân phát bội. Đầu tiên là một khách mong muốn cố níu kéo một dịch vụ từ bất kỳ phục vụ nào miễn là có khả năng đáp ứng dịch vụ. Thứ hai là một khách đòi hỏi dịch vụ từ tất cả các thành viên trong nhóm phục vụ. Trong trường hợp đầu tiên, không cần phải tất cả phục vụ đáp ứng lại mà chỉ cần một phục vụ. Phân phát bội được thực hiện trên cơ sở cố gắng nhất (best-effort) và được lặp lại nếu cần thiết. Hệ thống chỉ cần đảm bảo phân phát bội TĐ tới các QT không bị mắc lỗi có thể đạt được. Cách như vậy gọi là phân phát bội cố gắng nhất. Trong trường hợp sau, cần đảm bảo là mọi phục vụ đều nhận được yêu cầu và tính bền vững trong các phục vụ có thể được duy trì. TĐ phân phát bội cần được đáp ứng cho tất cả các phục vụ nhận hoặc không một phục vụ nào (tức là toàn bộ hoặc không cái nào); cách này thường được gọi là phân phát bội tin cậy. Đòi hỏi toàn bộ hoặc không cái nào có nghĩa là TĐ phân phát bội nhận được cần được đưa vào vùng đệm trước khi phân phối cho QT ứng dụng. Chú ý trong phân phát bội tin cậy đồng bộ ảo, TĐ có thể được phân phối trước khi nhận được (Đồng bộ ảo được thảo luận ở phần sau). Ihi hành phân phát bội phức tạp hơn vì gặp nhiều thiếu thốn do chưa có phân phát bội nguyên tử. Lỗi của QT nhận hoặc kết nối truyền thông có thể được QT khởi tạo TĐ phát hiện khi sử dụng cơ chế quá hạn hoặc xác nhận. QT khởi tạo sau đó có thể thoát ra hoặc tiếp tục phân phát bội bằng cách loại bỏ thành viên lỗi trong nhóm. Lỗi của khởi tạo một chiều (haft-way) trong phân phát bội chỉ mới được giải quyết một cách giả định. Rất khó khăn để xác định khởi tạo là có lỗi hay không. Để xác định thoát từ lỗi hoặc toàn bộ các bộ phận của phân phát bội là hoàn thiện, một trong các QT nhận bắt buộc được chọn như một khởi tạo mới. Kỹ thuật thông thường còn đòi hỏi các QT nhận phải đưa vào bộ đệm phân phát bội cho tới khi TĐ đã trở nên an toàn cho phân phối. Lỗi được kiểm soát nhờ hệ thống ảo. Phân phát bội bỏ qua đồng bộ ảo là không thực sự tin cậy; chúng chỉ là cố-gắng-nhất. Quan hệ trực tiếp với bài toán phân phối tin cậy là bài toán về thứ tự phân phối các TĐ. Khi TĐ phức là phân phát bội tới cùng một nhóm, chúng xuất hiện tại các thành viên khác nhau trong nhóm theo các thứ tự khác nhau (do tính biến động của độ trễ trong mạng). 118/249
Hình 4.7 cho một số ví dụ TT nhóm yêu cầu thứ tự TĐ: G và s tương ứng biểu diễn nhóm và nguồn TĐ. QT s có thể đứng ngoài nhóm hoặc là một thành viên của nhóm. Giả thiết rằng TĐ phân phát bội cần được nhận và phân phối ngay lập lức theo thứ tự chúng được gửi. Nếu giả thiết này là đúng thì công việc lập trình nhóm đơn giản hơn rất nhiều. Tuy nhiên điều đáng tiếc là giả thiết này không có thực và thiếu ý nghĩa vì trong hệ phân tán không có được thời gian toàn cục và giao vận TĐ trong mạng gặp độ trễ TT đáng kể và không ổn định. Về ngữ nghĩa, phân phát bội có thể được xác định sao cho TĐ được nhận theo thứ tự khác nhau tại các nút khác nhau có thể được sắp xếp lại và phân phối tới QT ứng dụng theo quy tắc chặt chẽ nhỏ hơn. Thứ tự phân phát bội dưới đây được xếp theo độ tăng của tính chặt chẽ: + Thứ tự FIFO: TĐ phân phát bội từ nguồn đơn được phân phối theo thứ tự chúng được gửi. + Thứ tự nhân quả: TĐ quan hệ nhân quả từ nguồn phức được phân phối theo thứ tự nhân quả của chúng. + Thứ tự tổng: Mọi TĐ phân phát bội tới một nhóm được phân phối tới mọi thành viên của nhóm theo cùng thứ tự. Một thứ tự tin cậy và tổng được gọi là thứ tự nguyên tử. Tại mỗi nút, chương trình điều khiển TT chịu trách nhiệm nhận TĐ và sắp xếp lại theo thứ tự tới QT ứng dụng. Điều này tương tự như tính chất mô hình bất biến của hệ thống file phân tán và hệ thống bộ nhớ chia xẻ phân tán. Chúng là tương tự nhau trong bối cảnh phân tán. 119/249
Thi hành theo thứ tự FIFO (hình 4.7a) là dễ dàng. Do chỉ có các TĐ được gửi từ cùng một QT khởi tạo, các TĐ này được gán số hiệu TĐ tuần tự. Điều khiển TT có thể làm trễ TĐ hoặc loại bỏ các TĐ lặp khi sử dụng dãy số hiệu tuần tự này. Dãy số hiệu tuần tự TĐ là cục bộ đối với mỗi nguồn TĐ và vì vậy không thể kết hợp các TĐ từ các nguồn khác nhau (xem hình 4.7 b). Thứ tự nhân quả và thứ tự tổng của TĐ phân phát bội từ các nguồn khác nhau là công phu hơn. Hai TĐ được gọi là có quan hệ nhân quả với nhau nếu một TĐ được sinh ra sau khi đã tiếp nhận xong cái còn lại. Thứ tự TĐ nhân quả cần được trình bày tại mọi nút (phía) do nội dung của TĐ thứ hai có thể được tác động theo kết quả xử lý TĐ đầu tiên. Quan hệ nhân quả này có thể trải dọc qua một vài thành viên trong nhóm do tính bắc cầu của quan hệ nhân quả. Thi hành thứ tự nhân quả các TĐ bằng cách mở rộng số hiệu tuần tự thành vector số hiệu tuần tự, S=(S1, S2, , Sn) được mỗi thành viên duy trì. Mỗi Sk trình bày số hiệu TĐ sẽ nhận được từ thành viên k của nhóm. Khi thành viên i phân phát bội một TĐ mới m, nó làm tăng Si lên 1 (dấu hiệu cho biết số lượng TĐ mà i đã phân phát bội) và gắn vector S với m. Khi nhận được TĐ m có vector tuần tự T=(T1, T2, , 120/249
Tn) từ thành viên i, thành viên j hoặc tiếp nhận hoặc làm trễ phân phối m theo các luật dưới đây (Chú ý Si là thành phần vector số hiệu tại thành viên j): ? Tiếp nhận TĐ m nếu Ti=Si+1 và Tk ≤ Sk với mọi k≠i. Điều kiện đầu tiên (Ti=Si+1) chỉ ra rằng thành viên j mong chờ TĐ tiếp sau theo dãy từ thành viên i. Điều kiện thứ hai xác minh rằng thành viên j đã phân phát mọi TĐ phân phát bội mà thành viên i đã phân phát trước khi nó phân phát bội m (có thể một vài cái nữa). Như vậy, j đã thực sự phân phát mọi TĐ đứng trước (nhân quả) m. ? Làm trễ TĐ m nếu hoặc Ti>Si + 1 hoặc tồn tại một số k≠i mà Tk > Sk. Trường hợp đầu tiên, một vài TĐ phân phát bội trước đây từ thành viện i đã bị thất lạc mà thành viên j đã không nhận được. Trường hợp thứ 2, khi thành viên i phân phát bộ m thì nó đã nhận được nhiều TĐ phân phát bội từ các thành viên khác trong nhóm hơn so với thành viên j. Trong cả hai trường hợp, TĐ bắt buộc phải bị làm chậm để đảm bảo tính nhân quả. ? Loại bỏ TĐ nếu Ti ≤ Si. Việc sao lặp TĐ từ thành viên i đã được bỏ qua hoặc loại bỏ bởi thành viên j. Giao thức thứ tự nhân quả này giả thiết rằng phân phát bội trong một nhóm đóng (tức là nguồn của phân phát bội cũng là một thành viên của nhóm) và phân phát bội không thể mở rộng dọc theo nhóm (mục sau sẽ bàn luận về việc này). Khi thi hành, phân phát bội đòi hỏi công phu hơn. Theo trực giác, đòi hỏi rằng một phân phát bội buộc phải hoàn thiện và TĐ phân phát bội buộc phải được sắp xếp theo thời gian hoàn thiện phân phát bội trước khi phân phát tới QT ứng dụng. Điều đó tạo nên lý do kết hợp quảng bá nguyên tử với quảng bá thứ tự tổng thành một giao thức. Điều này đưa đến khái niệm phân phát bội thứ tự tổng hai pha. Trong pha đầu tiên của giao thức phân phát bội, QT khởi tạo quảng bá TĐ và thu thập xác nhận với tem thời gian lôgic từ tất cả các thành viên trong nhóm. Suốt thời gian pha 2, sau khi đã thu thập xong mọi xác nhận với tem thời gian lôgic, QT khởi tạo gửi một TĐ cam kết mang tem thời gian xác nhận cao nhất như là thời gian logic đối với việc cam kết. Thành viên trong nhóm sau đó quyết định hoặc TĐ cam kết được đưa vào vùng đệm hoặc phân phát dựa trên thời gian cam kết lôgic toàn cục của TĐ phân phát bội. Giao thức phân phát bội 2 pha được biểu diễn trong hình 4.8. Trong hình vẽ, hai TĐ, m1 và m2 từ hai nguồn khác nhau được quảng bá tới một nhóm. Để rõ ràng, ở đây có hai nguồn (s1, s2) và hai thành viên trong nhóm (g1, g2). Thời gian đồng hồ lôgic khởi tạo của chúng cho trong vòng tròn. Các đường liền nét và rời nét tương ứng trình bày TĐ và TĐ xác nhận. Mỗi một cung được gán nhãn bởi một cặp hai số. Số đầu tiên (từ 1 đến 8) chỉ bước theo thứ tự bộ phận của xuất hiện và số thứ hai là tem thời gian của TĐ. Ví dụ, QT 1 phân phát bội s1. Khi mọi xác nhận (bước 2 và 8) đã được s1 nhận, bộ xử lý tính toán tem thời gian cam kết (9, là lớn nhất của 6 và 9) và trả lại TĐ cam kết cho toàn nhóm. TĐ cam kết mang thời gian hoàn thiện cuối cùng của quảng bá TĐ không 121/249
được chỉ trong hình. Tương tự, s2 tính toán tem thời gian cam kết là 8 đối với phân phát bội m2 của nó. Bảng chỉ dẫn vùng đệm được quản lý bởi CT điều khiển TT của thành viên nhóm g1. Bộ xử lý đã xác nhận 2 TĐ với tem thời gian là 6 và 8. TĐ cam kết với tem thời gian 8 và 9 có thể tới với thứ tự bất kỳ nhưng CT điều khiển bắt buộc phải chờ cả hai trước khi phân phát được thực hiện. TĐ m2 được hoàn thiện trước m1 bởi vì tem cam kết của nó nhỏ hơn. TĐ m3 (phân phát bội bởi một nguồn khác) không được chú ý tại đây vì TĐ cam kết của nó có tem thời gian cao hơn 10 và như vậy bắt buộc được phân phát sau m1 và m2. Mọi TĐ sau này cũng có tem thời gian lớn hơn và không cần chú ý. Bộ đếm TĐ tổng trong giao thức phân phát bội thứ tự tổng hai pha là cao. Nhiều hệ thống (chẳng hạn, ISIS) đơn giản giải pháp thứ tự TĐ tổng bởi giả thiết tồn tại một dịch vụ đánh số dãy toàn cục. Mọi TĐ phân phát bội nhận một số tuần tự toàn cục từ bộ sắp xếp dãy, một bộ xử lý là một thành viên của nhóm. Khi bộ xử lý nhận một TĐ thứ tự tổng, sự phân phát TĐ được làm trễ tới khi số hiệu dãy toàn cục đã được nhận. Bộ sắp xếp dãy đặt vào vùng đệm thứ tự tổng phân phát bội mà nó nhận, gán cho chúng số dãy toàn cục và sau đó phân phát bội số dãy này tới các thành viên khác của nhóm (cần chứng tỏ năng lực gán nhiều số hiệu dãy trong một TĐ đơn là tối ưu). Mỗi khi nhận được số hiệu dãy của phân phát bội toàn cục, bộ xử lý phân phát bội theo thứ tự cho bởi số hiệu dãy toàn cục. Nếu bộ xử lý dãy bị lỗi, một bộ xử lý dãy khác được chọn từ các thành viên trong nhóm. Trong nhiều ứng dụng phân tán, một QT có thể thuộc vào nhiều nhóm. Hình 4.7.c chỉ ra hai ví dụ tương đương của phân phát bội tới các nhóm giao nhau. Trên đây cho giao thức đánh thứ tự TĐ trong một nhóm đơn. Tuy nhiên, thứ tự có thể khác nhau khi các nhóm rời rạc thậm chí với cùng một TĐ phân phối bội. Với nhóm giao nhau, thì cần phải có sự cộng tác trong nhóm để duy trì thứ tự tường minh của TĐ đối với các thành viên thuộc vùng giao. Một ví dụ về nhóm giao nhau hữu dụng là thi hành các phục vụ được nhân bản khi dùng phân phát bội nguyên tử. Một nhóm chứa chỉ các phục vụ. Với 122/249
mỗi khách, tồn tại một nhóm khách gồm khách đó và tất cả các phục vụ. Khách có thể thuộc vào một nhóm khác mà chứa các khách khác. Một giải pháp cho bài toán nhóm giao nhau là đặt cấu trúc được công nhận trên đây đối với nhóm và phân phát bội TĐ sử dụng các cấu trúc này. Ví dụ, các thành viên của nhóm có thể được cấu trúc như là một cây thác triển (cây thác triển là một biểu diễn hợp lý của quan hệ thành viên nhóm trong mạng máy tính không có hỗ trợ quảng bá về phần cứng). Gốc cây đóng vai trò đứng đầu nhóm. Cung của cây trình bày kênh TT FIFO. Một TĐ phân phối bội trước hét gửi tới đỉnh đứng đầu (gốc) và sau đó gửi tới mọi thành viên trong nhóm theo lộ trình TĐ dọc theo các cung của cây. Thành viên trong phần giao phải được cấu hình thành một cây con chung giữa hai nhóm giao nhau. Trong ví dụ hình 4.9. chỉ ra hai nhóm: nhóm 1 gồm các thành viên A, B, C, D và nhóm 2 gồm các thành viên C, D, F và G. Tập giao {C, D} được cấu trúc như một cây con chung giữa hai nhóm. Đạt được sự mềm dẻo hơn nếu như phân phát bội tới nhiều hơn một nhóm (hình 4.7.d). Để đạt được tính nhất quán giữa các nhóm, cần phải xác định một nhóm mới là hợp nhất của hai nhóm. Hình 4.7 b và 4.7.c đã rút gọn vấn đề này. 123/249
Mô hình đối tượng các phục vụ tài nguyên và ngôn ngữ lập trình đồng thời Mô hình đối tượng các phục vụ tài nguyên Nhu cầu đồng bộ xuất hiện từ việc chia xẻ tài nguyên. Để làm tăng hiệu quả việc sử dụng tài nguyên cần giao trách nhiệm cho phục vụ quản lý tài nguyên. Sử dụng khái niệm hướng đối tượng đối với tài nguyên sẽ cung cấp sự trong suốt tài nguyên tới các khách. Một tài nguyên được coi là một đối tượng ảo và được trình bày dưới dạng một tập các thao tác chính xác được khách gọi. Đồng bộ và điều khiển đồng thời giữa các đối tượng phục vụ là hoàn toàn trong suốt với các khách. Hơn nữa truyền thông giữa các khách và phục vụ đối tượng có thể trong suốt bằng cách dùng các lời gọi thủ tục từ xa. Sự đồng thời trong phục vụ có thể được thực hiện tốt bằng cách dùng đa luồng cho phép đáp ứng đồng thời các yêu cầu của nhiều khách. Do các luồng chia xẻ vùng địa chỉ chung, phương pháp đồng bộ biến chia xẻ được sử dụng để phối hợp các luồng. Trong RPC và cuộc hẹn đã thảo luận nhiều về việc đồng bộ CTĐ. Trong một vài ứng dụng, các khách có thể ưa thích gửi các yêu cầu dị bộ cho phục vụ. Một yêu cầu không cần sự đáp lại nên là dị bộ. Điều này cũng có thể xảy ra khi cần lời dáp cho một câu hỏi song để hiệu quả hơn, QT khách thực hiện một công việc khác thay vì bị kết khối. Có hai phương pháp thi hành việc CTĐ không đồng bộ với phục vụ: một là định nghĩa RPC dị bộ mới, hai là ứng với mỗi RPC tạo một luồng của QT khách. Cả hai phương pháp đều cần tới cơ chế ngôn ngữ, với cơ chế đó QT có thể biết được việc hoàn thành và lấy được kết quả của các RPC. Ngôn ngữ lập trình đồng thời Ngôn ngữ lập trình đồng thời là một hệ chương trình hỗ trợ việc đặc tả tính đồng thời, sự đồng bộ, việc truyền thông trong tương tác giữa các QT đồng thời. Sự thi hành của ngôn ngữ lập trình đồng thời được dành cho HĐH phân tán hơn là chương trình dịch như kiểu các ngôn ngữ tuần tự. Điều đó do tính đồng thời, đồng bộ và truyền thông QT là một vần đề thời gian chạy. Ngôn ngữ lập trình đồng thời có thể được xem như là sự mở rộng từ ngôn ngữ tuần tự đã tồn tại. Chúng ta xem xét cơ chế đồng bộ theo minh họa trong hình 3.22. Cơ chế đồng bộ được phân thành hai loại: Biến chia xẻ hoặc CTĐ. Monitor là một ví dụ thông dụng nhất cho khái niệm đồng bộ biến chia xẻ cho những ngôn ngữ đồng thời. Sự thể hiện trừu tượng nhờ khái niệm monitor làm cho nó trở thành mô hình thích hợp đối với đối tượng dữ liệu và phục vụ tài nguyên. Những ngôn ngữ cổ điển sử dụng monitor là Concurent Pascal, Modula và Turing Plus. Concurent Pascal là ngôn ngữ đầu tiên hỗ 124/249
trợ monitor. Modula là một ngôn ngữ được phát triển với mục đích nhấn mạnh tầm quan trọng của modun chương trình. Nhờ bổ sung môdun giao tiếp hỗ trợ monitor, Modula sử dụng môđun thiết bị nhằm thi hành các I/O trừu tượng cho phép mềm dẻo hơn khi giao tiếp với nhân. Turing là một ngôn ngữ tuần tự được thiết kế phục vụ chỉ dẫn tới các công thức toán học mạnh. Turing Plus là một mở rộng của Turing nhằm hỗ trợ monitor cho lập trình đồng thời. Tồn tại nhiều ngôn ngữ đồng thời dựa trên monitor và việc định nghĩa monitor cũng rất đa dạng. Điều khác nhau chính của chúng là ngữ nghĩa là toán tử signal cùng lời gọi monitor lồng nhau và quy định phạm vi của các biến. Một ngôn ngữ đồng thời danh tiếng khác sử dụng biến chung đồng bộ đồng thời là Path Pascal, một biến thể của khoảng tới hạn điều kiện - CCR trong QT phân tán - DP (Distributed Processes) và Argus. Biểu thức Path là cách đặc tả ngữ nghĩa cho một tính toán đồng thời. Tuy nhiên, biểu thức Path đơn giản không hiệu quả trong các mô hình cộng tác QT trong đó đòi hỏi thông tin trạng thái về tài nguyên chia xẻ. Biểu thức Path mở rộng được đề xuất để thể hiện việc mở rộng mô hình kiểu đó nhưng khi mở rộng như vậy thì sự đẹp đẽ ban đầu lại bị mất đi. Khoảng tới hạn điều kiện CCR dễ dàng được thi hành. Đánh giá các điều kiện nhằm tách khối các QT là rất đáng giá. Điều này 125/249
có thể được giải quyết bằng wait và signal hiển theo điều kiện tương tự như biến điều kiện trong tiếp cận monitor. Hai phương pháp đồng bộ CTĐ đồng bộ và dị bộ được sử dụng trong nhiều ngôn ngữ đồng thời. Việc nhận hoặc gửi TĐ có thể được xác định bằng cách chỉ trực tiếp tên nguồn và tên đích của TĐ. Tuy nhiên, như đã được diễn giải ở trên, cách chỉ tên như vậy là không thực tế. Mềm dẻo hơn, QT TT là không trực tiếp mà được thực hiện bằng cách qua kênh định danh. Cổng (Port) và hộp thư (Mailbox) là hai kênh chuyển định danh. Cổng cho phép truyền thông nhiều-một. Hộp thư cho phép truyền thông nhiều- nhiều. Sử dụng cổng hoặc hộp thư không giới hạn việc cung cấp gửi TĐ dị bộ. GYPSY là ngôn ngữ bậc cao đầu tiên sử dụng hộp thư để gửi các TĐ dị bộ. PLITS là ngôn ngữ sử dụng việc CTĐ dị bộ nhưng định danh trực tiếp các môđun QT. Vấn đề định tên trực tiếp trong PLITS được làm nhẹ bớt bằng việc bổ sung khóa TĐ và những phép toán cho phép loại bỏ những thông tin được bổ sung từ bên gửi. Một QT nhận có thể nhận mọi TĐ từ bất cứ nơi gửi nào hay bất cứ TĐ nào với cùng một khoá thẻ (tagged key) thực sự. Hợp lý hơn nếu QT nhận trở thành một phục vụ dành cho khách phức mà không cần biết tên của các khách. Nói thêm là kênh TT phức giữa khách và phục vụ được thiết lập khi dùng các khóa khác nhau đối với TĐ. Chính vì vậy, bên nhận có thể được coi như là một phục vụ dành cho nhiều khách mà không cần biết tên của các khách. Sử dụng khoá thẻ khác nhau có thể tạo nên những kênh truyền khác nhau giữa phục vụ và khách. Thiên hướng trên được sử dụng trong ngôn ngữ C đồng thời để chuyển đồng bộ những TĐ dị bộ. Có thể đặt tên cho kênh bằng cách sử dụng những cấu trúc ngôn ngữ bậc cao qua các lời gọi thủ tục và được gọi là RPC dị bộ. CTĐ đồng bộ có thể đối xứng hoặc không đối xứng, phụ thuộc vào kịch bản truyền thông. CTĐ đồng bộ không đối xứng giả thiết hai chủ thể truyền thông có quan hệ chủ/ tớ - master/slave (chính-phụ - primary/secondary). Đối tượng chính phát yêu cầu và đối tượng phụ đáp ứng câu trả lời cho yêu cầu đó. Khi thi hành trong mô hình phục vụ/client thì phục vụ đóng vai trò như là đối tượng nhận yêu cầu phục vụ. CTĐ đồng bộ đối xứng là khái niệm cuộc hẹn khi các QT truyền thông đang cố gắng tích cực đồng bộ với một QT khác. Tương tự, cả đồng bộ hỏi/đáp và cuộc hẹn đều yêu cầu thiết lập kênh truyền thông bằng tên QT hoặc lời gọi thủ tục. Cổng và hộp thư không thể áp dụng ở đây vì chúng được dùng cho gửi dị bộ. RPC quy ước dùng CTĐ đồng bộ không đối xứng và các lời gọi thủ tục được hợp thể hoá trong một số ngôn ngữ đồng thời như DP, Argus và Mesa. Các ngôn ngữ này cũng bổ sung đồng bộ CCR hoặc monitor biến chia xẻ. Do RPC là phương pháp truyền thông quan trọng trong hệ phân tán nên nó được tích hợp như một gói phần mêm trong hầu hết HĐH hiện nay. CTĐ đồng bộ đối xứng dùng cuộc hẹn. CSP dùng cách đánh tên QT cho cuộc hẹn. DP mở rộng thêm tên thủ tục trong QT, nơi cuộc hẹn có thể xẩy ra tại các điểm khác 126/249
nhau. Hiệu quả sử dụng cuộc hẹn theo kiểu RPC tìm thấy trong Ada. Thi hành Ada cho cuộc hẹn RPC là đúng hoàn toàn. Lệnh seclect hỗ trợ lời gọi cuộc hẹn không định trước (truyền thông chọn lọc). Bổ sung thêm những chức năng về quá hạn (time-out) và điểm vào thủ tục cho vector ngắt trong những lệnh accept. Ada trở thành thích hợp cho lập trình hệ thống và lập trình thời gian thực. Hình 3.20 trình bày sự phân loại các mô tả trên đây về đồng bộ và truyền thông ngôn ngữ đồng thời. Nhiều ngôn ngữ đồng thời dùng cách tổ hợp các cơ chế. ví dụ, ngôn ngữ SR (Synchronizing Resources) có hâu hết các cấu trúc cần thiết cho lập trình đồng thời. SR dùng sự trừu tượng tài nguyên, PRC dị bộ và RPC cuộc hẹn, truyền thông chọn lọc, mô đun hóa phần cứng và mô đun hóa ngắt. Đi tới các tiệm cận ngôn ngữ đồng thời khác ngoài hướng mở rộng đơn giản các ngôn ngữ tuần tự cũng rất có giá trị. Bàn luận trên đây chỉ ra rằng quản lý QT đồng thời, đồng bộ cũng như truyền thông thực ra là những vấn đề trực giao với khía cạnh tính toán của ngôn ngữ tuần tự. Thực ra cần tìm một ngôn ngữ phối hợp theo phương thức đơn giản và hiệu quả để xây dựng chương trình đồng thời bằng cách kết nối một vài thực thể truyền thông cơ sở lại và cung cấp ý nghĩa truyền thông và đồng bộ nhau cho chúng. Các thực thể truyền thông là QT, tài nguyên, hoặc cả hai hoặc là đối tượng trừu tượng. Với giá thiết CTĐ cho truyền thông và đồng bộ QT, thì các vấn đề mấu chốt chỉ là thực thể được mô hình hóa như thế nào, các chương trình đồng thời được giải quyết ra sao và các kênh truyền thông giữa các thực thể sẽ được đặt tên lôgic và quản lý như thế nào ? Một ngôn ngữ đồng thời mới (chi tiết hơn, hệ lập trình đồng thời) có thể được xây dựng dựa trên những mô hình tính toán và truyền thông. Đoạn dưới đây giới thiệu và so sánh ba hệ thống, được thiết kế theo dòng tiếp cận này: Occam, SR và Linda. Occam tiến hóa từ nhiều ý tưởng trong CSP. Nó được dùng rộng rãi để lập trình đồng thời trong các hệ thống Transputer và xử lý tín hiệu số DSP (Digital Signal Processing). Transputer và DSP là các máy tính đơn chíp với bộ nhớ trong cục bộ và tuyến truyền thông nhanh. Nó có thể cấu hình để ánh xạ các QT đồng thời tới xử lý song song hiệu quả với việc truyền thông dữ liệu thường xuyên giữa các bộ xử lý nhờ tuyến tốc độ cao. Do các bộ xử lý đơn chíp này có bộ nhớ cục bộ hạn chế nên OCCAM giả thiết hạt QT nhỏ. Mỗi lệnh sai khiến (gán, vào và ra) được coi như những QT nguyên thủy. Lệnh được nhóm với nhau nhờ lệnh contructors thành lệnh hợp thành theo một trong ba kiểu thực hiện: thực hiện tuần tự các lệnh (cấu trúc SEQ), thực hiện song song các lệnh (cấu trúc PAR), thực hiện dị bộ và không định trước cấu trúc ALT tương tự như lệnh alternative trong CSP. Hai cấu trúc bổ sung, IF và WHILE cần đến để điều chỉnh dòng tuần tự thực hiện cấu trúc. Cấu trúc có thể cộng tác với các biến cục bộ và có thể gộp trong cấu trúc khác. Mặc dù lệnh là QT nguyên thủy thực hiện được, cấu trúc là đơn vị QT lập lịch chuẩn. Không có sự chia sẽ biến toàn cục giữa các cấu trúc khác nhau. Đồng bộ được thực hiện bằng cách sử dụng khái niệm cuộc hẹn của lệnh input/output trong CSP, ngoại trừ tên các kênh truyền thông dùng các tên kênh toàn cục khai báo tường minh. Sử dụng cấu trúc để dàn xếp các chương trình đồng thời và kênh toàn cục để truyền thông giữa các cấu trúc làm cho trình biên dịch dễ tạo ra mã xếp lịch các QT tới bộ xử lý. 127/249
Trong SR, chương trình đồng thời là một tập các tài nguyên, khác với cách nhìn QT của Occam. Tài nguyên được trừu tượng như một môđun gồm khai báo và thân. Khai báo đặc tả những thực thể nhập đối với các tài nguyên khác và thực thể xuất đối với các phép toán trên chính tài nguyên này. Thân chứa một phần khởi tạo, một hoặc nhiều QT và một mã kết thúc. Các QT trong một tài nguyên có thể đồng thời hoặc tương tác nhau nhờ biến chia sẻ trong nguốn đó. Các tài nguyên khác nhau tương tác nhờ các operations tương tự như thực thể thủ tục trong Ada. Thực thể operations hoặc là QT hoặc là thủ tục. Minh họa cho một tài nguyên được dẫn ra qua việc thực hiện lệnh CREATE tên_tài_nguyên trả lại năng lực để truyền thông sau này với các phép toán tài nguyên. Phép toán tài nguyên được dẫn ra lênh CALL đồng bộ hoặc lệnh SEND không đồng bộ tới tài nguyên khi dùng năng lực tài nguyên. Trong Occam, năng lực là mềm dẻo hơn so với kênh toàn cục. Chúng được tạo ra một cách động và có thể được truyền như một biến. Thêm vào nữa, năng lực có thể trình bày đa thể hiện của một tài nguyên và đạt được cả khái niệm đặt tên kênh và điều khiển truy nhập. Cuộc hẹn được đặc tả bằng lệnh nhập (in) với điểm vào phép toán có lựa chọn (ana) để hỗ trợ truyền thông chọn lọc và lựa chọn (by) để lập lịch các yêu cầu sắp giải quyết. SR dùng trừu tượng dữ liệu và hỗ trợ hầu hết mọi kiểu đồng bộ CTĐ và chia sẻ biến. Linda khác biệt với Occam hoặc SR. Nó không là một ngôn ngữ lập trình nhưng một mô hình dữ liệu chia xẻ duy nhất có thể được tích hợp với bất kỳ ngôn ngữ lập trình nào để hỗ trợ cộng tác QT trong lập trình song song. QT và dữ liệu chia xẻ trong mô hình Linda được trình bày đồng nhất như một tập không sắp xếp của các bộ (tuple) mà mỗi bộ có dạng t = (“tag”, value), trong đó tag là tên kí hiệu của bộ dữ liệu còn value là danh sách giá trị có kiểu phù hợp với bộ đó. QT là bộ hoạt động (active tuple) còn bộ dữ liệu là bộ thụ động (pass tuple). Các bộ thuộc lớp không gian bộ (TS), một vùng bộ nhớ lôgic địa chỉ hóa được nội dung chia xẻ, có thể phân tán một cách vật lý để trình bày cấu trúc dữ liệu phân tán trong không gian bài toán. Linda cung cấp ba nguyên thủy cơ sở để truy nhập bộ. Hai nguyên thủy in(s) và out(s) là nhận kết khối từ TS và gửi không kết khối tới TS, ở đây, s là một mẫu hoặc một anti-tuple có dạng s = (“tag”, Actual, formats). in(s) làm phù hợp với mẫu s dựa vào bộ t với thẻ tag và thực tế Actual. Nếu phù hợp, nghi thức trong s được gán bằng các giá trị tương ứng trong t và QT gọi được tiếp tục. Sau đó, bộ này bị xoá khỏi TS. Trong trường hợp phù hợp bội (có nhiều hơn một bộ phù hợp) thì chỉ có duy nhất một bộ được chọn một cách tuỳ biến. Phép toán in bị kết khối theo nghĩa QT gọi bị ngừng lại cho đến khi có được sự phù hợp. Phép toán out đơn giản tính giá trị của biểu thức trong s và đưa vào trong TS. Cập nhật bộ được thực hiện này sau khi có sự phù hợp in ngay sau một nguyên thủy out. Nguyên thủy thứ ba là rd được dùng để đánh giá bộ. Nguyên thủy này tương tự như in, ngoại trừ còn phải làm phù hợp với các bộ còn lại trong TS. Các phiên bản in và rd không kết khối cũng được Linda hỗ trợ. 128/249
Linda có một nguyên thủy bổ sung eval(s) tạo ra QT. Phép toán eval khởi tạo (fork) một QT mới nhằm đánh giá tất cả các biểu thức trong s. Các biểu thức này thường chứa các thủ tục. eval tương tự như out, ngoại trừ việc s được đưa vào TS trước khi đánh giá nó. Khi QT được hoàn thành (tức mọi biểu thức đã được tính), s cùng các giá trị kết quả thành một bộ dữ liệu thụ động. Linda là cách trừu tượng nhất để mô hình hóa cộng tác quá trình. Do chỉ có một số rất ít các phép toán nguyên thủy, Linda có thể được gắn vào ngôn ngữ cơ sở, chẳng hạn C. C-Lind là thi hành của mô hình Linda trong C. Hình 3.23 mô tả những nét khác nhau cơ sở giữa Occam, SR và Linda theo các phương diện là khái niệm hệ thống cơ sở, mô hình dữ liệu căn bản, cách thức đặt tên cho kênh truyền thông. Hệ thống Mô hình đối tượng Đặt tên kênh Occam Ngôn ngữ lập trình đồng thời Quá trình Kênh toàn cục tĩnh SR Ngôn ngữ lập trình đồng thời Tài nguyên Năng lực động Linda Ngôn ngữ lập trình đồng thời Cấu trúc dữ liệu phân tán Thẻ kết hợp Hình 3.23 So sánh Occam, SR và Linda 129/249
Truyền thông hỏi-đáp Mức TT ngay trên TT CTĐ cơ sở là TT hỏi/đáp định hướng dịch vụ. Mô hình TT hỏi/ đáp được dùng rộng rãi nhất là Lời gọi thủ tục từ xa RPC. RPC là việc trừu tượng ngôn ngữ cơ chế TT hỏi/đáp dựa trên CTĐ. Mục trước đã khẳng định vai trò của RPC trong việc ĐB và TT trong hệ phân tán, còn ở mục này là vấn đề thi hành lời gọi thủ tục từ xa. Các thao tác RPC Như thông thường, thao tác gọi thủ tục và chờ kết quả là tương tự cặp TT hỏi/đáp đồng bộ. Điều tương tự giữa lời gọi thủ tục và TT là động lực thúc đẩy nguyên thủy khi dùng lời gọi thủ tục như trừu tượng mức cao cho TT. Một RPC có dạng một lời gọi thủ tục thông thường với các tham số input và output phù hợp của nó. Do không có phân biệt về cú pháp giữa lời gọi thủ tục từ xa và một lời gọi thủ tục cục bộ nên RPC cung cấp sự truy cập trong suốt tới các thao tác từ xa. Tuy nhiên, ngữ nghĩa của chúng là khác nhau do thực hiện thủ tục từ xa bao hàm độ trễ và lượng lỗi có thể trong thao tác mạng. ứng dụng người dùng cần biết về sự khác biệt này và mối liên quan của chúng. Tuy vậy nhưng RPC là cách đơn giản và trong sáng hoàn thành được tính trong suốt TT bằng cách che dấu lời gọi hệ thống mức thấp, sự biến đổi dữ liệu và TT mạng từ ứng dụng người dùng. Như đã biết (chương II) RPC hỗ trợ một dịch vụ trình diễn giữa tầng giao vận và tầng ứng dụng. RPC có thể được chú ý như một API đối với dịch vụ giao vận. Thao tác RPC cơ sở trong mô hình Client/Server được chỉ ra trong hình 4.10. Mô tả ngắn gọn về thi hành lời gọi thủ tục từ xa. Giả thiết rằng thông tin cần thiết cho kết nối RPC đã được khởi tạo giữa khách và phục vụ như trong hình 4.10. Lời gọi thủ tục từ xa được khởi tạo từ khách thông qua một lời gọi request, được kết nối với thủ tục nền khách tại nền khách. Thủ tục nền khách chịu trách nhiệm đóng gói lời gọi và tham số của nó thành một TĐ để truyền (điển hình sử dụng API socket) dọc theo mạng nhờ dịch vụ giao vận. TĐ này được dịch vụ giao vận phục vụ tiếp nhận và dịch vụ này chuyển nó tới nền phục vụ. Nền phục vụ là điểm vào chính của phục vụ. Nó tách TĐ thành một lời gọi hỏi với các tham số tương ứng và kích hoạt thủ tục tại phục vụ. Khi hoàn thiện dịch vụ, thủ tục phục vụ đưa lời đáp tới nền phục vụ để đóng gói các tham số thành một TĐ và gửi nó tới dịch vụ giao vận. Quá trình nhận được thực hiện tại phía khách, và được kết thúc bằng việc nhận được trả lời và loại bỏ việc thực hiện lời gọi. Thao tác RPC cơ sở nảy sinh một số vấn đề đáng chú ý sau đây: 130/249
-Truyền tham số và biến đổi dữ liệu: Kiểu dữ liệu được truyền và dữ liệu được trình bày trong TĐ theo cách nào ? -Liên kết: Làm thế nào khách có thể định vị được phục vụ và bằng cách nào phục vụ ghi nhận được dịch vụ của nó (tạo ra dịch vụ có thể nhìn được từ xa) ? -Biên dịch: Thủ tục nền đến từ đâu và làm cách nào chúng liên kết tới QT khách và QT phục vụ? -Loại bỏ và kiểm soát lỗi: Làm cách nào để kết xuất lỗi và giả thiết nào cần có về lỗi trong hệ thống ? - An toàn: RPC an toàn ? Ba vấn đề đầu tiên được trình bày như dưới đây. Truyền tham số và biến đổi dữ liệu Quy tắc truyền tham số và biến đổi dữ liệu/TĐ RPC được coi là việc sắp xếp lại tham số. Sắp xếp tham số là trách nhiệm nguyên thủy của thủ tục nền. Tồn tại nhiều ngữ nghĩa cho việc truyền tham số đối với lời gọi thủ tục trong ngôn ngữ lập trình bậc cao hiện hành. Đó là các cách thức gọi theo giá trị, gọi theo tên, gọi theo chỉ dẫn, và gọi qua sao chép/khôi phục. Phương pháp gọi theo giá trị trong RPC là trực tiếp. Một giá trị được 131/249
truyền cho thủ tục được sao vào một biến cục bộ tại điểm vào của thủ tục. Sự thay đổi của biến cục bộ trong lời gọi thủ tục không ảnh hưởng đến lời gọi thủ tục. Gọi theo tên đòi hỏi việc đánh giá biểu thức ký hiệu trong khi thực hiện động là không thực sự dễ dàng trong môi trường biên dịch. Truyền tham số theo chỉ dẫn chuyển con trỏ địa chỉ sẽ gây nên sự lúng túng nếu không giảm ngữ nghĩa trong hệ phân tán với hoàn cảnh là không có bộ nhớ trong chia xẻ. Bởi vậy, gọi theo chỉ dẫn không phải là phương pháp truyền tham số thích hợp đối với RPC. Gọi theo sao chép/khôi phục kết hợp của gọi theo giá trị và gọi theo chỉ dẫn. Nó là gọi theo giá trị tại điểm vào của lời gọi thủ tục và gọi theo chỉ dẫn có hạn chế tại điểm ra của RPC. Kết quả được sao lại trở lại cho thủ tục gọi; khi hoàn thành thủ tục gọi không tạo ra bất kỳ chỉ dẫn bộ nhớ nào trong quá trình thực hiện thủ tục. Cách thức này có thể được dùng để nắm giữ các con trỏ nhằm đơn giản hóa các cấu trúc dữ liệu kiểu mảng. Cấu trúc con trỏ phức tạp, chẳng hạn như cây và đồ thị, sẽ khó thi hành RPC với mục tiêu nắm giữ mà không cần công sức và phí tổn nào đó. Đa số các thi hành RPC giả thiết tham số được truyền là gọi theo giá trị và gọi theo sao chép/khôi phục. Dữ liệu trong ngôn ngữ bậc cao thường được định kiểu theo cấu trúc xác định-tốt. Kiểm tra kiểu tĩnh được trình biên dịch thực hiện khi đối sánh phù hợp hóa kiểu giữa thủ tục nền với khách hoặc phục vụ. Kiểm tra kiểu xuyên qua các máy là khó khăn hơn vì dữ liệu được chuyển thông qua TĐ liên chương trình. Vì vậy, một câu hỏi được nảy sinh là có cần hay không dữ liệu mang kèm theo thông tin kiểu để kiểm tra kiểu động? Hơn nữa, mỗi máy tính lại có cách trình bày dữ liệu riêng của mình. Ví dụ, kiểu integer có thể được trình bày dạng phần bù 2 trong một máy 32 bit song lại có thể là dạng có dấu với lượng 16 bit trong một máy khác. Đối với văn bản, một số máy dùng mã ASCII trong khi một số máy khác dùng EBCDIC. Sự khác nhau này do tính hỗn tạp các thành phần trong hệ thống tạo ra tính cần thiết phải biến đổi dữ liệu trong truyền thông ngang hàng. Tình huống rắc rối hơn khi xem xét việc trình bày chuỗi bit và byte trong kênh truyền thông. Nói riêng, các máy khác nhau có chuẩn khác nhau để các bit hoặc byte trong TĐ được truyền ít nhất hoặc hầu hết chữ số có dấu được truyền trước. Quy tắc liên quan tới giao vận TĐ trong mạng được gọi là cú pháp giao vận. Một số chuẩn biến đổi dữ liệu tường minh bắt buộc được công nhận trong mọi hệ thống khi trình bày dữ liệu (hoặc CSDL) hỗn tạp. Nếu như n cách trình bày dữ liệu thì phải có n*(n-1)/2 cách biến đổi dữ liệu. Giải pháp tốt hơn là tạo ra một ngôn ngữ vạn năng hoặc bộ biểu diễn dữ liệu hợp chuẩn mà mỗi QT TT cần dịch đối với ngôn ngữ hoặc biểu diễn dữ liệu riêng của nó. Rút gọn này cho phép chỉ cần 2*n phép biến đổi đối với hệ thống n cách trình bày. Đáng tiếc là việc sử dụng một ngôn ngữ vạn năng đòi hỏi phải tăng thêm nhiều chi phí về đóng gói và tách gói. Vì vậy, một số nhà sản xuất đề xuất là ngôn ngữ vạn năng được định danh bằng ngôn ngữ bản địa của máy tính do hãng chế tạo. Điểm tối ưu ở chỗ ngăn ngừa được việc dịch nếu các QT TT có thể ngầm định rằng chúng chia xẻ cùng một dạng tự nhiên. Ba vấn đề đáng chú ý trong chuyển đổi dữ liệu tới TĐ và từ TĐ tới dữ liệu như bàn luận trên đây là định kiểu dữ liệu, biểu diễn dữ liệu và cú pháp giao vận dữ liệu. 132/249
Một trong những phát triển quan trọng nhất nhằm chuẩn hóa việc định kiểu và biểu diễn dữ liệu là Bộ chú giải cú pháp trừu tượng 1 (ASN.1). ASN.1 là một ngôn ngữ định nghĩa cấu trúc dữ liệu và được sử dụng rộng rãi để đặc tả khuôn dạng các giao thức chỉnh thể dữ liệu trong TT mạng. Cú pháp giao vận và ASN.1 là điều kiện chính để xây dựng dịch vụ trình diễn mạng. ASN.1 có thể được dùng trực tiếp trong trình diễn dữ liệu để thi hành RPC. Các thi hành RPC hiện tại thường dùng một tập con của ASN.1. Nếu RPC được hỗ trợ trong một miền đơn thì nền khách và nền phục vụ là cộng tác mật thiết. Kiểu dữ liệu được kiểm tra khi sinh và dịch các thủ tục nền. Khi đó không cần cung cấp thông tin kiểu trong TĐ (tức là kiểu đã tường minh trong ASN.1). Trong hệ hỗn tạp, vấn đề liên quan đến cú pháp giao vận được bỏ qua. Các ví dụ kinh điển về ngôn ngữ mô tả và trình diễn dữ liệu đối với RPC là XDR (eXternal Data Representation) của Sun và IDL (Interface Definition Language) của DCE. Cả hai tương tự với ASN.1 song định nghĩa cấu trúc dữ liệu và giao diện thủ tục là đơn giản hơn. Liên kết Phục vụ buộc phải tồn tại trước khi khách tạo ra một lời gọi thủ tục tới nó. Dịch vụ này được đặc tả bằng một giao diện phục vụ khi dùng một ngôn ngữ định nghĩa giao diện, chẳng hạn XDR. Một đặc tả giao diện phục vụ điển hình có khuôn dạng được trình bày như hình 4.11. Ví dụ này mô tả hai thủ tục và được định danh duy nhất qua chương trình và số hiệu phiên bản của nó. Khách có thể định vị phục vụ bằng việc quảng bá yêu cầu đối với dịch vụ. Tuy nhiên, giải pháp hiệu quả hơn là đi tới tên riêng phục vụ mà địa chỉ của nó đã được định vị tốt, nếu điều đó là cho phép. program PROGRAMME { version VERSIONNAME { long PROCEDUREA (parameters) = 1; /* procedure number = 1 */ string PROCEDUREB (parameters) = 2; /* procedure number = 2 */ } = 1 ; /* version number = 1 */ } = 12345 ; /* program number = 12345 */ Hình 4.11. Một đặc tả giao thức phục vụ Hình 4.12 minh họa việc liên kết giữa khách và phục vụ. Liên kết đó được giải thích qua các bước sau đây: 1. Khi phục vụ được khởi động, nó ghi nhận nút TT của mình bằng việc gửi một yêu cầu tới bộ ánh xạ cổng. Yêu cầu này bao gồm chương trình của phục vụ, số hiệu phiên bản cùng với số hiệu cổng mà phục vụ dùng để nghe (listen). Bộ ánh xạ cổng quản lý việc 133/249
ánh xạ giữa số hiệu chương trình và số hiệu cổng. Giả thiết rằng ánh xạ cổng là một QT phục vụ chạy ngầm (daemon) với địa chỉ cổng đã được biết tốt. 2. Trước khi tạo một lời gọi thủ tục từ xa, QT khách bắt buộc tiếp xúc với bộ ánh xạ cổng của hệ thống từ xa để thu được một thẻ (handing) truy nhập tới phục vụ với chương trình riêng và số hiệu phiên bản. Điều này đạt được nhờ việc gọi một chương trình con (routine) creat của thư viện thời gian chạy RPC và creat gửi một TĐ chứa tên máy phục vụ, chương trình và số hiệu phiên bản, cùng giao thức giao vận (UDP hoặc TCP) tới bộ ánh xạ cổng từ xa. 3. Bộ ánh xạ cổng qua kiểm tra chương trình và số hiệu phiên bản trong bảng của nó để cung cấp (trả lại) số hiệu cổng của phục vụ tới hệ thống khách. 4. Hệ thống khách xây dựng một thẻ khách cho QT khách để sử dụng sau này trong lời gọi thủ tục từ xa. Quá trình liên kết thiết lập các kết nối socket giữa khách và phục vụ. Trong trường hợp tổng quát hơn khi chưa biết được máy phục vụ, khách cần định vị máy phục vụ bằng cách tiếp xúc với một phục vụ thư viện (đôi lúc được gọi là bộ liên kết, bộ giao dịch) để định vị địa chỉ của hệ thống phục vụ. Các đường nét rời trong hình 4.12 trình bày thao tác bổ sung này. Biên dịch RPC Biên dịch các RPC đòi hỏi ba thành phần chính trong bó RPC: 134/249
- Một file đặc tả giao diện; - Một bộ sinh RPC có chức năng nhận input là file đặc tả giao diện và sản xuất ra output là mã nguồn các thủ tục nền khách và phục vụ; - Một thư viện thời gian chạy để hỗ trợ việc thực hiện RPC bao gồm cả hỗ trợ việc liên kết, biến đổi dữ liệu và truyền thông. Hình 4.13 trình bày công việc sinh các thủ tục nền và biên dịch chương trình RPC. Bộ sinh RPC khởi tạo các thủ tục nền và một thẻ file vì tính biên dịch độc lập của các chương trình khách và phục vụ. Do cả thủ tục nền phục vụ và thủ tục nền khách được sinh ra bởi cùng một file giao diện cho nên chúng phù hợp cú pháp với nhau. Mã ghi nhận một phục vụ được chứa trong nền phục vụ như là phần khởi động của QT phục vụ. Lời gọi hệ thống liên kết một khách tới phục vụ này được cho trong QT khách. Lời gọi hệ thống được thực hiện trong lần đầu tiên khi khách có lời gọi RPC tới phục vụ. Kiểm soát loại bỏ và lỗi RPC Dù tương tự về khái niệm và cú pháp, RPC vẫn khác với lời gọi thủ tục cục bộ do hạn chế mạng và lỗi. Hai vấn đề cơ bản, loại bỏ và lỗi, cần được định vị đối với thi hành RPC. Loại bỏ là các trạng thái khác thường xảy ra khi thực hiện các thủ tục nền và thủ tục phục vụ. Lỗi là vấn đề gây ra bởi sự đổ vỡ của khách, phục vụ hoặc mạng TT. Kiểm soát loại bỏ 135/249
Loại bỏ trong thủ tục phục vụ, chẳng hạn như overflow/underflow hoặc vi phạm bảo vệ trong khi thực hiện thủ tục bắt buộc phải được kết xuất tới khách. Theo một nghĩa khác, một khách hoặc một thủ tục nền của nó có thể dừng việc thực hiện một thủ tục phục vụ. Những câu hỏi cơ bản là: -Bằng cách nào phục vụ kết xuất thông tin trạng thái tới khách ? -Bằng cách nào khách gửi thông tin điều khiển tới phục vụ ? Các bài toán này được giải quyết dễ dàng theo quy ước trong lời gọi thủ tục cục bộ nhờ sử dụng biến toàn cục chia xẻ và tín hiệu. Ví dụ, trong UNIX biến toàn cục errno được dùng để kết xuất trạng thái sai sót, và các tín hiệu (hoặc ngắt) có thể được dùng để thực hiện điều khiển đối với các QT khác. Trên mạng máy tính, không thể sử dụng cả biến chia xẻ lẫn ngắt trực tiếp. Trao đổi điều khiển và trạng thái bắt buộc phải nhờ cậy vào kênh dữ liệu. Tình huống này tương tự vấn đề trong TT dữ liệu khi kênh tín hiệu buộc phải hoặc tìm vị trí của mình trong kênh dữ liệu chuẩn (băng tín hiệu-lõm) hoặc sử dụng một kênh riêng (băng tín hiệu-lồi). Nhiều dịch vụ giao vận cung cấp lựa chọn dữ liệu cờ như điểm lồi của băng thông tin trong dịch vụ nguyên thủy gửi. Cũng có thể dùng kênh riêng (kết nối socket) để khử bỏ đòi hỏi nhận biết tín hiệu từ dữ liệu chuẩn. Tiếp cận như vậy là mềm dẻo hơn đối với RPC do đa số thi hành hệ thống sẵn có giả thiết cổng bội đối với mỗi QT (với mục đích tương tự, chẳng hạn như TT tới nhân). Trong những trường hợp khác, việc gửi và nhận thông tin điều khiển và trạng thái được thi hành như một phần của hỗ trợ thư viện nền và cần phải trong suốt tới QT khách. Kiểm soát lỗi Khả năng lỗi xảy ra từ lời gọi thủ tục từ xa là khác với lời gọi thủ tục cục bộ. Việc kiểm soát lỗi để che dấu và trong suốt cho người dùng RPC là một công việc nặng nề. Lỗi xảy ra khi khách không thể định vị được phục vụ tại thời điểm khởi tạo lời gọi RPC. Điều đó xảy ra do phục vụ không tồn tại hoặc phục vụ bị đổ vỡ. Lỗi cũng xảy ra khi khách đang dùng một chương trình hoặc số hiệu phiên bản lỗi thời. Vấn đề này tương tự với loại bỏ hơn là lỗi và có thể được kết xuất như loại bỏ. Mỗi khi phục vụ được định vị và TĐ hỏi đã được gửi tới phục vụ, TĐ có thể bị trễ hoặc mất. Tương tự, TĐ đáp có thể bị trễ hoặc mất. Việc mất TĐ được phát hiện do thời gian quá hạn hoặc không có lời đáp từ phục vụ. TĐ bị trễ hoặc mất có thể được truyền lại. -Sự truyền lại câu hỏi (từ khách) lại là nguyên nhân của kiểu bài toán khác. Nếu câu hỏi không mất mà đơn thuần chỉ là bị làm chậm, thì phục vụ nhận được hai câu hỏi từ phía khách trong khi mong đợi chỉ một câu hỏi đến đó. Một giải pháp cho vấn đề này là tạo ra tính bất biến của câu hỏi theo nghĩa câu hỏi được thực hiện với số lần bất kỳ đều nhận cùng một hiệu quả. Ví dụ hệ thống file NFS cung cấp chỉ một dịch vụ bất biến (ví 136/249
dụ, đọc khối, ghi giá trị vào khối, song không gắn một khối vào một file). Không phải mọi dịch vụ đều có tính bất biến (chẳng hạn như phục vụ khóa). Trong trường hợp này, khách gắn một số hiệu dãy vào mỗi câu hỏi để cho phục vụ có thể phát hiện ra sự đúp hoặc lỗi thời của TĐ hỏi. Nếu phục vụ nhận được sự đúp, nó truyền lại kết quả được kết xuất từ yêu cầu đầu tiên. Chú ý rằng, phục vụ cần giữ lại vết của số hiệu dãy của yêu cầu cuối cùng của mỗi khách và kết quả sinh ra đối với yêu cầu đó. Số hiệu dãy đối với lời gọi RPC khách là không thật sự cần thiết nếu RPC được chạy theo dịch vụ giao vận TCP hướng kết nối tin cậy do dịch vụ đã sắp xếp TĐ và loại trừ sự đúp. Thi hành điển hình một RPC không dùng đến số hiệu dãy. Phục vụ không chú ý đến khách là ai, có bao nhiêu khách tạo ra câu hỏi như thể là nó đã có cách phát hiện sự đúp. Ví dụ, một giao thức UDP thi hành RPC trên máy Sun dùng một số ngẫu nhiên duy nhất xid, được gọi là số hiệu giao dịch hoặc nonce (số được dùng chỉ một lần) cho mỗi TĐ hỏi (giao dịch). xid được dùng nhằm liên kết hỏi và đáp. Phục vụ RPC duy trì một bảng cache được chỉ số hóa theo chương trình và số hiệu phiên bản, số hiệu thủ tục, địa chỉ UDP khách và xid cho mỗi giao dịch hoàn thiện. Kết quả của lần gọi trước đây được trả cho người gọi nếu câu hỏi mới đã có sẵn trên cache. Nếu TĐ đáp là đúp trong bất kỳ lý do nào thì xid được khách dùng để loại bỏ sự đúp hoặc thậm chí cả lời đáp sai sót. -Đỗ vỡ phục vụ là bài toán nguy kịch hơn. Ngay cả khi kết nối TCP tin cậy, thì câu hỏi đúp cũng có thể được phân phát tới phục vụ. Vấn đề này có thể xuất hiện nếu khách đã chờ lời đáp cho câu hỏi của nó đã quá hạn (chẳng hạn, vượt quá hạn TCP). Khách cố gắng thiết lập lại kết nối. Khi kết nối được thiết lập lại (có thể sau khi phục vụ khôi phục lại từ lỗi), khách truyền lại lời hỏi của mình. Chú ý rằng, lỗi của kết nối TCP không có nghĩa là phục vụ bị đỗ vỡ vì rằng trong vài trường hợp kết nối TCP bị đứt do vấn đề mạng, tràn vùng đệm Có chăng khi phục vụ bị lỗi, dịch vụ có thể được thực hiện hoặc không. Nếu kết nối TCP bị đứt nhưng phục vụ không bị đổ vỡ, bảng cache được kiểm tra để xác định yêu cầu có đúp hay không. Nếu phục vụ bị đổ vỡ, bảng cache bị mất. Trong trường hợp này, phục vụ có thể chọn đề xuất một loại bỏ tại QT khách và QT khách hoặc chờ cho phục vụ khôi phục lại hoăc từ bỏ ngay lập tức. Từ đó dẫn đến ba giả thiết khả năng cho ngữ nghĩa lời gọi RPC khi hiện diện lỗi: -phục vụ đề xuất một loại bỏ và khách thử lại thao tác khi phục vụ hồi phục. Do thao tác sẽ được thi hành ít nhất một lần thì ít nhất phải có một lần ngữ nghĩa. Ngữ nghĩa này được thừa nhận cho thao tác bất biến. -phục vụ đề xuất một loại bỏ và khách từ bỏ ngay lập tức. Do thao tác yêu cầu có thể đã được thực hiện bởi phục vụ trước khi bị đổ vỡ, tồn tại ít nhất một ngữ nghĩa. -phục vụ không kết xuất lỗi nào cả, và khách gửi lại yêu cầu của nó cho đến khi nó được đáp hoặc từ bỏ. Điều này cũng có thể ngữ nghĩa do thao tác có thể đã được thực hiện số lượng lần bất kỳ (bao gồm cả không lần nào). 137/249
Đương nhiên, ngữ nghĩa RPC mong muốn nhất là một lần chính xác. Khó khăn khi hoàn thành một lần chính xác mà không cần đòi hỏi sự cố gắng. Do vấn đề ở chỗ bị mất bảng cache, giải pháp là ngữ nghĩa ít nhất một lần và chặt đoạn bảng cache lên bộ nhớ ngoài. Khi phục vụ được hồi phục, nó tải lại bảng cache từ các đoạn của nó. Tuy nhiên, thao tác thích hợp mỗi dịch vụ bắt buộc được thực hiện như một giao dịch tại phục vụ. Điều này đòi hỏi quá nhiều chi phí đối với nhiều ứng dụng. -Cuối cùng, nếu QT khách đỗ vỡ (hoặc kết thúc vội vã) trước khi phục vụ hoàn thiện yêu cầu của khách, phục vụ có một tính toán orphan (đơn độc) và đáp của nó là không được phân phát. Không có cách dễ dàng để phục vụ kiểm tra sự biến mất của khách ngoại trừ việc dùng quá hạn hoặc chờ khách lỗi để reboot và loan báo sự hiện diện mới của nó. Tính toán đơn độc tiêu thụ các tài nguyên phục vụ (không gian bộ nhớ, khoá) và cũng có thể làm lộn xộn khách với câu đáp không có giá trị trong kết nối trước. Tính toán đơn độc có thể bị loại trừ theo các cách sau đây: -Bằng khách: Nhờ vào việc reboot khách lỗi, khách đó làm sạch một cách rõ ràng các tính toán đơn độc trước đây. Đòi hỏi khách nhận thức được hoạt động của lời gọi thủ tục chưa kết thúc trước đây của nó và năng lực định vị các lời gọi đó. -Bằng phục vụ: phục vụ thỉnh thoảng thử định vị chủ nhân của các thao tác từ xa của nó và bỏ đi những thao tác không tìm thấy chủ nhân. Giải pháp này đòi hỏi sự hoán vị vai trò của khách và phục vụ, phức tạp hóa một thiết kế đơn giản khác. -Bằng sự kết thúc: Mỗi thao tác được tương ứng với một thời gian sống cực đại. Một thao tác bị loại bỏ khi nó đạt tới thời gian kết thúc của nó (ngoài trừ khách yêu cầu thêm thời gian một cách rõ ràng). Bảo mật RPC Bảo mật là vô cùng quan trọng đối với RPC bởi hai lý do: -RPC là hình thức thực hiện từ xa cho phép chương trình hoặc lệnh được thực hiện tại một hệ thống khác. Nó là phương tiện đầy sức mạnh thi hành hệ thống và các ứng dụng phân tán. Tuy nhiên, RPC lại là một nguồn gốc làm cho hệ thống dễ bị xâm phạm khi người dùng không thân thiện sử dụng RPC để tấn công từ xa. -RPC đã trở thành nền tảng của tính toán Client/Server. Tất cả các đặc điểm an toàn của hệ thống máy tính sẽ được xây dựng dựa trên an toàn RPC. RPC dựa trên trao đổi TĐ hỏi/đáp giữa khách và phục vụ. Các vấn đề an toàn nguyên thủy là tính xác thực của QT khách và QT phục vụ, tính xác thực và bí mật của TĐ, và tính xác thực điều khiển truy nhập từ khách tới phục vụ. Vấn đề an toàn máy tính phân tán tổng thể được trình bày ở chương sau. Tại đây trình bày các khái niệm thích hợp về 138/249
tính xác thực lưu tâm tới RPC. Một giao thức xác thực cho RPC cần được thiết lập như sau: -Xác thực lẫn nhau: Định danh của khách và phục vụ cần được kiểm tra. TĐ hỏi thực sự được sinh ra từ khách và được mong đợi tại phục vụ. TĐ đáp thực sự sinh ra bởi phục vụ và được mong đợi tại khách. Tính xác thực bắt buộc phải được đảm bảo đối với TĐ và đối với các QT TT. -Tính toàn vẹn, tính tin cậy và tính nguyên bản của TĐ: TĐ hỏi/đáp không bị xáo trộn (tính toàn vẹn), nội dung của nó không bị lộ (tính tin cậy) và một TĐ không xuất hiện quá một lần (tính nguyên bản). Thiết kế giao thức xác thực là nội dung rất phức tạp. Tính phức tạp của giao thức phụ thuộc vào mục tiêu an toàn cao đến đâu, những tấn công thích hợp nào được đoán nhận, và một số hạn chế cố hữu của hệ thống. Hệ thống an toàn cao đòi hỏi nhiều biến đổi cơ sở trong HĐH. Giải pháp thích hợp hơn mong muốn có được những đặc điểm an toàn dễ dàng bổ sung vào HĐH đang tồn tại. Nội dung dưới đây về RPC an toàn của Sun là ví dụ về tính an toàn có thể kết hợp chặt chẽ dễ dàng vào một HĐH đang tồn tại. RPC an toàn Sun được xây dựng trong hệ thống RPC cơ sở của Sun. Giả thiết tồn tại dịch vụ thông tin mạng (NIS) tin cậy được đặt tại một phục vụ xác thực được chia xẻ trong hầu hết các giao thức xác thực. Tuy nhiên, NIS trong RPC xác thực Sun không thực hiện chức năng xác thực. Nó đơn giản được đặt ra để giữ một CSDL chứa các bản ghi về tên mạng của người dùng và khóa công khai và khóa bí mật. Các khóa này không phải là mã hóa/giải mã như chúng thông thường được dùng trong mật mã. Thay vào đó, chúng được dùng để sinh ra một khóa phiên mật mã đúng cho TT. Khóa công khai là thông tin công khai, còn khóa bí mật được tạo bởi mã hóa chúng khi dùng thuật toán mã hóa DES (Data Encryption System) với mật khẩu người dùng như một khóa mật mã. Khi người dùng login máy trạm, RPC an toàn chạy, chương trình login tiếp xúc với NIS để nhận bản ghi khóa của người dùng. Sau đó chương trình login nhắc người dùng nhập mật khẩu, sử dụng mật khẩu để giải mã khóa bí mật đã được mã hóa, và loại bỏ mật khẩu ngay lập tức sau đấy. Pha login người dùng được chỉ ra trong hình 4.14. Chú ý rằng mật khẩu người dùng không truyền trên mạng. 139/249
Sau khi login thành công, QT khách, làm việc nhân danh người dùng, thiết lập một phiên TT với QT phục vụ như sau. Chương trình login đặt khóa bí mật của khách vào vùng nhớ phục vụ khóa. Thủ tục giống như ở phía khách cũng diễn ra ở phía phục vụ. QT phục vụ khóa tại khách và phục vụ chịu trách nhiệm sinh ra khóa phiên chung giữa khách và phục vụ. Điều đó được thực hiện bằng việc trao đổi khóa đã mũ hóa. Đầu tiên, một cặp khóa riêng và khóa công khai được gán (hoặc ghi nhận) đối với mọi khách {C1, C2, , Cp}và mọi phục vụ {S1, S2, , Sp} trong hệ thống. Các khóa này được sinh theo con đường sau đây: ? Cs và Ss là các số ngẫu nhiên 128 bit, ? Cp = αCs mod M và Sp = αSs mod M , trong đó α và M là hai hằng số đã biết. Mặc dù khóa công khai thu được từ khoá bí mật song thao tác tìm ngược theo logarith rời rạc được đánh giá là tính toán rất tốn kém. Người dùng không thể dễ dàng suy luận được khóa bí mật từ khóa công khai tương ứng của nó, thậm chí trong trường hợp khi đã biết thuật toán. Tại phía khách, khóa phiên SKCS đươc tính qua khóa bí mật khách Cs và khóa công khai phục vụ Sp như sau: SKCS = SpCs = (αSp)Cs = αSp°Cs Hoàn toàn đối xứng và độc lập, phục vụ khóa tính khóa phiên SKSC nhờ khóa bí mật phục vụ Ss và khóa công khai khách Cp như sau: SKSC = CpSp = (αCs)Sp = αCs°Sp 140/249
Có thể thấy rằng, SKCS = SKSC = SK. Khoá phiên được tính toán theo MOD M (để rõ ràng bỏ qua toán tử mod). Mỗi khi khóa phiên được sinh, khóa bí mật được xoá khỏi vùng nhớ của dịch vụ khóa. Khóa phiên theo thỏa thuận thiết lập xác thực lẫn nhau của khách và phục vụ do nó chỉ nhận được từ khóa bí mật trình diễn định danh thực sự của bộ đôi TT. Mỗi TĐ RPC được xác thực bởi khóa kết hợp CK là một số ngẫu nhiên 56-bit được khách sinh ra và được truyền tới phục vụ nhờ khóa phiên. Khóa kết hợp được giữ trong phục vụ khóa và được dùng trong toàn bộ phiên giữa khách và phục vụ. Khóa phiên được dùng sơ bộ trong mạng còn khoá kết hợp là được chuyển giao. Khả năng bị làm hại là tối thiểu. Lý do sử dụng khóa kết hợp đối với TĐ RPC kế tiếp là nó không bắt nguồn từ khóa bí mật và bởi vậy, được lưu lại để dùng cho giai đoạn dài. Nó khác nhau trong mỗi phiên. TĐ RPC có thể chứa thêm nhiều thông tin, bao gồm tem-thời gian, (số hiệu) lượt và một tóm tắt TĐ. Tem-thời gian được dùng để kiểm tra kết thúc TĐ. Lượt được dùng để đảm bảo không xảy ra việc lặp TĐ. Tóm tắt TĐ là một giá trị băm của dữ liệu TĐ được dùng để phát hiện bất kỳ can thiệp nào vào TĐ. Mã hóa thông tin này bằng khóa kết hợp cung cấp cả tính xác thực lẫn tính an toàn của TĐ. Thi hành RPC của Sun là rất đơn giản. Nó dùng NIS tồn tại thay cho một phục vụ xác thực riêng biệt. Thông tin bí mật được chuyển tới mạng hoặc bảo quản tại máy khách và máy phục vụ được giữ ở mức độ tối thiểu. 141/249
Truyền thông giao dịch TT hỏi/đáp định hướng dịch vụ và đa phân phát được trình bày trên đây có thể kết hợp lại thành một mức TT mới cao hơn được gọi là TT giao dịch. Phổ biến hơn, giao dịch được biết như một đơn vị chuẩn của liên-hành động giữa QT khách và phục vụ trong hệ CSDL. Giao dịch CSDL được biểu diễn như một dãy thao tác hỏi/đáp đồng bộ đảm bảo tính nguyên tử (không chia cắt được), tính nhất quán, tính cô lập (riêng biệt) và tính bền vững (ACID) như trình bày dưới đây. Giao thức trong TT tương tự như giao thức trong CSDL ngoại trừ chúng được định nghĩa như một tập TT hỏi/đáp dị bộ có các tính chất ACID nhưng không ép buộc tính tuần tự thao tác như giao dịch CSDL. Một giao dịch TT có thể bao gồm đa phân phát cùng một TĐ tới các phục vụ nhân bản và yêu cầu khác nhau tới phục vụ được phân chia. Dịch vụ giao dịch và kiểm tra đồng thời đối với giao dịch CSDL sẽ được nói sau. Trình bày dưới đây giới hạn trong khuôn khổ TT giao dịch. Các tính chất ACID Các tính chất ACID liên quan trước hết tới mục tiêu trong suốt đồng thời của hệ phân tán. Đoạn 2.2 đã giới thiệu trong suốt đồng thời là tính chất cho phép chia xẻ các đối tượng mà không gặp trở ngại. Về cảm giác, thực hiện giao dịch có vị trí như khoảng tới hạn. Tuy nhiên, các thao tác từ các giao dịch khác nhau là được xen kẽ (theo một cách đảm bảo) nhằm tăng tính đồng thời. Nói thêm, giao dịch có các tính chất bổ sung: -Tính nguyên tử (A: Atom): Hoặc tất cả thao tác được thực hiện hoặc không một thao tác nào trong giao dịch được thực hiện bất chấp lỗi. -Tính nhất quán (C: Consistency): Thực hiện trộn xen kẽ các giao dịch tương đương với thực hiện tuần tự các giao dịch đó theo thứ tự nào đó. -Tính cô lập (I: Isolation): Kết quả thực hiện bộ phận giao dịch chưa hoàn thiện được che dấu đối với các giao dịch khác trước khi giao dịch được cam kết thành công. -Tính bền vững (D: Durability): Hệ thống đảm bảo rằng kết quả thực hiện giao dịch đã cam kết được lưu giữ lâu dài, ngay cả khi xuất hiện lỗi sau cam kết. Do cả bốn tính chất này quan hệ với tính nhất quán nên trong nhiều trường hợp, thường gọi tính chất thứ hai là tính thi hành dãy để phân biệt với các tính chất khác. Tính nguyên tử cho tính nhất quán của đối tượng khi nhân bản hay phân hoạch. Vi phạm sự cô lập thì thấy được cái không bao giờ xẩy ra, còn vi phạm tính bền vững thì lại không thấy được cái thực tế xảy ra. Cả hai điều này là không nhất quán về trạng thái hệ thống. 142/249
Bảo đảm các tính chất ACID đòi hỏi các QT thành phần cộng tác thực hiện giao dịch. Gọi QT khởi tạo giao dịch là bộ phối hợp và các QT còn lại là thành viên. Bộ phối hợp bắt đầu giao dịch bằng một đa phân phát yêu cầu tới các thành viên. Giao dịch kết thúc bằng cam kết hoặc hủy bỏ giao dịch tùy thuộc vào các tính chất ACID có được đảm bảo hay không. Mọi thành viên phải tán thành quyết định cuối cùng. Một giải pháp cho đòi hỏi tính nguyên tử của giao dịch là cần thường xuyên ngăn cản thao tác của mỗi thành viên cho đến khi đã chắc chắn hoặc được thông báo là mọi thành viên khác đã sẵn sàng làm thao tác đó. Kỹ thuật này tương tự như hai giai đoạn (nhận và phân phát TĐ) trong giao thức hai pha đối với đa phân phát thứ tự toàn bộ trong đoạn 4.1.5. Giao thức cam kết hai pha đối với giao dịch nguyên tử cho cách thức để đạt được tính nguyên tử, tính cô lập và tính bền vững. Giao thức cam kết hai pha Giao thức cam kết 2 pha (2PC) tương tự như sơ đồ bỏ phiếu nhất trí trong cuộc sống đời thường. Bỏ phiếu được bộ phối hợp của giao dịch khởi động. Tất cả các thành viên phải đi tới nhất trí về việc cam kết hoặc hủy bỏ giao dịch và buộc phải đợi thông báo về quyết định. Trước khi thành viên bỏ phiếu cam kết giao dịch, nó cần phải chuẩn bị thực hiện cam kết. Giao dịch được cam kết chỉ khi mọi thành viên đồng ý và sẵn sàng cam kết. Mỗi thành viên (bao gồm cả bộ phối hợp) duy trì một không gian làm việc riêng để giữ vết cập nhật đối tượng dữ liệu. Mỗi cập nhật gồm giá trị cũ và giá trị mới của đối tượng dữ liệu. Cập nhật là không thực sự (lâu dài) cho đến khi giao dịch được cam kết cuối cùng nhằm đảm bảo ngữ nghĩa cô lập của giao dịch. Cần đưa các cập nhật lên bộ nhớ lâu dài để đối phó với lỗi. Cập nhật được ghi nhận trong bộ nhớ lâu dài vào sổ lộ trình hoạt động của giao dịch. Mỗi thành viên có một sổ lộ trình. Sổ lộ trình được duyệt lại trong khi sửa lỗi nhằm làm dễ dàng hơn công việc hoặc tu sửa lại giao dịch đã cam kết hoặc tháo bỏ giao dịch không cam kết. Sổ lộ trình hoạt động nhất quán là cần thiết cho tính nhất quán hoặc tính bền vững của giao dịch đã cam kết. Hình 4.15. minh họa dòng thực hiện giao dịch nguyên tử cam kết 2-pha. Tại đây có hai điẻm đồng bộ là tiền cam kết và cam kết đối với mỗi thành viên. Bộ phối hợp bắt đầu giao dịch bằng việc ghi nhận bản ghi tiền cam kết vào sổ lộ trình hoạt động của nó. Bộ phối hợp phải chuẩn bị cam kết giao dịch (tức là, cập nhật được hướng tới sổ lộ trình ổn định, các tài nguyên dành để thực hiện lời cam kết ) trước khi ghi bản ghi tiền cam kết. Ghi bản ghi tiền cam kết vào sổ lộ trình hoạt động cho phép bộ phối hợp biết trạng thái của giao dịch nếu một lỗi xuất hiện; giao dịch kết thúc thực hiện mà nó không cam kết. Sau đó, bộ phối hợp đa phân phát yêu cầu bỏ phiếu tới mọi thành viên. Khi nhận được yêu cầu bỏ phiếu, mỗi thành viên kiểm tra xem có cam kết được giao dịch hay không (các cập nhật đã được hướng tới sổ lộ trình hoạt động, phát hành đã được tin tưởng, tài nguyên đã sẵn sàng ). Nếu kiểm tra thấy hợp lý thì thành viên ghi một tiền cam kết 143/249
vào sổ lộ trình và gửi TĐ YES tới bộ phối hợp. Ngược lại thành viên bỏ giao dịch và gửi TĐ NO tới bộ phối hợp. Bộ phối hợp Thành viên quyết địnhKết quảyêu cầuTrả lời- Tiền cam kết giao dịch - Gửi yêu cầu tới mọi thành viên - Nhận TĐ yêu cầu - Nếu sẵn sàng thì tiền cam kết và gửi YES - Kết nối mọi trả lời ngược lại bỏ giao dịch và gửi NO - Nếu mọi bỏ phiếu là nhất trí YES thì cam kết và gửi COMMIT ngược lại bỏ và gửi ABORT - nhận quyết định - Nếu COMMIT thì cam kết - Nếu ABORT thì bỏ giao dịch - Nhận trả lời - Gửi trả lời Hình 4.15. Giao thức giao dịch nguyên tử cam kết hai pha Nếu trong khoảng thời gian quy định, bộ phối hợp kết nối được tất cả các trả lời YES thì nó cam kết giao dịch bằng việc ghi bản ghi cam kết tới sổ lộ trình của nó và đa phân phát TĐ COMMIT tới mọi thành viên. Ngược lại, bộ phối hợp hủy bỏ giao dịch và đa phân phát TĐ ABORT. Khi nhận được TĐ COMMIT, mỗi thành viên cam kết giao dịch bằng việc ghi bản ghi cam kết vào sổ lộ trình hoạt động và tiếp nhận tài nguyên dành cho giao dịch. Cuối cùng gửi một trả lời cho bộ phối hợp. Nếu TĐ nhận được là ABORT thì thành viên ghi bản ghi hủy bỏ vào sổ lộ trình, hủy bỏ giao dịch và giải phóng tài nguyên dành cho giao dịch. Dùng sổ lộ trình hoạt động, giao thức cam kết 2-pha mạnh mẽ đối với các lỗi QT. Hình 4.16 chỉ dẫn mạch thời gian của giao thức đối với bộ phối hợp và một thành viên. Do việc ghi tiền cam kết và cam kết tới sổ lộ trình hoạt động làm sạch mọi cập nhật trước điểm đồng bộ này, thao tác thích hợp trong khôi phục lỗi tin cậy được là làm lại thao tác theo sổ lộ trình ít nhất từ một điểm đồng bộ. Như vậy, thao tác khôi phục được phân thành ba kiểu: lỗi trước tiền cam kết, lỗi sau tiền cam kết song trước cam kết, lỗi sau 144/249
cam kết. QT (hoặc bộ phối hợp hoặc thành viên) một cách đơn giản bỏ giao dịch nếu từ sổ lộ trình phát hiện lỗi xuất hiện trước tiền cam kết. Điều đó tương đương với phiếu NO đối với giao dịch. Bộ phối hợp cũng bỏ giao dịch nếu nó sụp đổ giữa tiền cam kết và cam kết, nhưng hiệu quả hơn thì nên cố gắng tiếp tục cam kết giao dịch bằng cách đa phân phát lại TĐ yêu cầu (nhân bản có thể được các thành viên phát hiện ra). Tương tự, thận trọng gửi lại TĐ cam kết nếu bộ phối hợp sụp đổ sau khi ghi bản ghi cam kết vào sổ lộ trình của nó. Thao tác khôi phục sẽ phức tạp hơn chút ít nếu một thành viên sụp đổ giữa tiền cam kết và cam kết. Việc phục hồi thành viên bắt buộc phải xác định được giao dịch là cam kết hay bỏ qua hợp đồng thao tác với bộ phối hợp hoặc các thành viên khác. Cuối cùng nếu thành viên khôi phục do lỗi sau khi bản ghi cam kết đã được ghi vào sổ lộ trình thì thành viên đó đơn giản chỉ tạo ra các cập nhật giao dịch lâu dài. Với bộ nhớ cố định, cơ chế khôi phục tin cậy cho tính bền vững của cam kết. Chương tiếp theo trình bày hình thức hơn giao thức cam kết hai pha và nâng cấp của nó: giao thức cam kết 3-pha. Chương sau đó được dành cho lỗi và phục hồi. Thao tác khôi phục lỗi của Bộ phối hợp Thao tác khôi phục lỗi của thành viên 145/249
Dịch vụ tên và thư mục Khi đề cập tới truyền thông, vấn đề tên và địa chỉ là rất cần thiết. Khi tạo yêu cầu một dịch vụ hoặc truy cập tới một đối tượng theo nghĩa TTLQT đòi hỏi bắt buộc đầu tiên là phải định vị được dịch vụ hoặc đối tượng. Dịch vụ là đối tượng được trừu tượng hóa. Chúng thường được QT trình bày bằng một điểm truy cập dịch vụ. Đối tượng có thể là người dùng, máy tính, đường TT hoặc các tài nguyên khác, chẳng hạn file. Dịch vụ và đối tượng thường được định danh bằng tên kết cấu. Như là một chọn lựa, nếu tên là chưa biết, điểm vào dịch vụ hoặc đối tượng được mô tả thông qua sử dụng thuộc tính phù hợp với chúng. Do dịch vụ hoặc đối tượng có nghĩa rất rõ ràng, vấn đề tên của chúng là tương tự nhau. Khi nghiên cứu về dịch vụ tên và thư mục, dùng thuật ngữ mục đối tượng để chỉ cả dịch vụ lẫn đối tượng. Giải pháp tên và địa chỉ Dịch vụ tên và thư mục, theo nghĩa hẹp là các toán tử tra cứu (look-up). Khi cho một tên hoặc một vài thuộc tính của một mục đối tượng thì thu được thêm nhiều thông tin thuộc tính. Thuật ngữ dịch vụ tên và dịch vụ thư mục thường được sử dụng hoán đổi nhau. Dịch vụ tên là cách tổng quát mô tả một đối tượng được địa chỉ hoá và do đó có thể xác định được đối tượng thông qua địa chỉ. Khái niệm dịch vụ thư mục trong nhiều trường hợp, được dùng để chỉ dịch vụ tên đặc biệt như dịch vụ thư mục của hệ thống file. Trong các trường hợp khác, nó không bị hạn chế bởi thông tin địa chỉ mà còn được dùng để trình bày một dịch vụ đặt tên chung nhất đối với tất cả các kiểu tra cứu thuộc tính trên những loại đối tượng khác nhau. X500 được CCITT định nghĩa là ví dụ cho dịch vụ kiểu này. Những dịch vụ tên mức cao được xây dựng dựa trên dịch vụ thư mục chuẩn. Mục đối tượng bất kỳ trong hệ thống phải được đặt tên (hoặc định danh) và được định vị trước khi sử dụng. Hoạt động định vị đối tượng được gọi là QT giải pháp (resolution), cần đến một loạt các thao tác tra cứu (hoặc ánh xạ). Mỗi mục đối tượng có một địa chỉ logic trong HĐH và một địa chỉ vật lý trong mạng. QT giải pháp gồm hai phần: Giải pháp tên ánh xạ tên tới địa chỉ logic và Giải pháp địa chỉ ánh xạ địa chỉ logic tới đường truyền vật lý trong mạng. Giải pháp tên Tên là dấu hiệu định hướng ứng dụng của đối tượng. Địa chỉ đại diện cho đối tượng, mang thông tin cấu trúc nào đó thích hợp để HĐH quản lý và định vị đối tượng. QT giải pháp tên ánh xạ tên tới địa chỉ. Đối tượng được xác định bằng tên, và đối tượng được định vị thông qua địa chỉ. Tên thường là duy nhất nhưng cùng một tên có thể có nhiều địa chỉ. ánh xạ tên một phục vụ tới các địa chỉ cổng của nó được coi là ví dụ về giải pháp tên. 146/249