Giáo trình Hệ điều hành phân tán (Phần 1)

pdf 102 trang phuongnguyen 3780
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Hệ điều hành phân tán (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_he_dieu_hanh_phan_tan_phan_1.pdf

Nội dung text: Giáo trình Hệ điều hành phân tán (Phần 1)

  1. Giáo trình hệ điều hành phân tán Biên tập bởi: Hà Quang Thụy
  2. Giáo trình hệ điều hành phân tán Biên tập bởi: Hà Quang Thụy Các tác giả: Hà Quang Thụy Phiên bản trực tuyến:
  3. MỤC LỤC 1. Sự tiến hoá của hệ điều hành hiện đại 2. Tổng quan về hệ điều hành truyền thống 3. Cấu trúc hệ điều hành truyền thống 4. Sơ lược về hệ điều hành mạng 5. Sơ lược về hệ điều hành phân tán và hệ tự trị cộng tác 6. Khái niệm và kiến trúc hệ phân tán 7. Tính trong suốt trong hệ phân tán và các dịch vụ 8. Mô hình kiến trúc hệ điều hành phân tán 9. Các giao thức mạng truyền thông 10. Kết quả thiết kế chủ yếu 11. Môi trường tính toán phân tán 12. Khái niệm quá trình và luồng 13. Mô hình đồ thị thể hiện các quá trình và các dịch vụ thời gian 14. Cơ cấu ngôn ngữ cho đồng bộ 15. Lập trình phân tán và lập trình trên mạng 16. Truyền thông CTĐ 17. Mô hình đối tượng các phục vụ tài nguyên và ngôn ngữ lập trình đồng thời 18. Truyền thông hỏi-đáp 19. Truyền thông giao dịch 20. Dịch vụ tên và thư mục 21. Loại trừ ràng buộc phân tán 22. Bầu thủ lĩnh 23. Mô hình hiệu năng hệ thống 24. Lập lịch quá trình tĩnh 25. Chia sẻ và cân bằng động 26. Thi hành quá trình phân tán 27. Lập lịch thời gian thực 28. Đặc trưng của DFS 29. Thiết kế và thi hành DFS 30. Điều khiển đồng bộ và giao dịch 31. Nhân bản dữ liệu và file Tham gia đóng góp 1/249
  4. Sự tiến hoá của hệ điều hành hiện đại Khái niệm hệ điều hành Hệ điều hành (Operating System - OS, dưới đây viết tắt tiếng Việt là HĐH) là một hệ thống các chương trình (và dữ liệu - tham số hệ thống) được cài đặt sẵn (dưới dạng các file trên đĩa từ - băng từ) thực hiện hai chức năng cơ bản: - Chức năng của một hệ thống quản trị tài nguyên: Quản trị, phân phối công việc cho hệ thống thiết bị để hệ thống thiết bị hoạt động hiệu quả nhất, - Chức năng của một máy tính mở rộng (máy tính ảo): Phục vụ nhu cầu đa dạng của người dùng một cách tốt nhất. Theo cách nói cụ thể hơn, HĐH là một bộ các môđun phần mềm hệ thống đóng vai trò giao diện giữa chương trình ứng dụng với phần cứng hệ thống, với mục tiêu đạt tới một hệ thống máy tính hiệu quả, tin cậy và dễ sử dụng. Một cách đại thể, tồn tại các chức năng riêng biệt của HĐH như lập lịch làm việc của bộ xử lý (hoặc các bộ xử lý), phối hợp thực hiện các quá trình (QT: process) tương tác nhau, quản lý các tài nguyên hệ thống (chẳng hạn như các thiết bị vào/ra, bộ nhớ trong, File ) nhằm nâng cao năng lực điều khiển và bảo vệ, duy trì tính toàn vẹn hệ thống, thi hành khôi phục lỗi và cung cấp một giao diện người dùng. HĐH thường cấu trúc hai yêu cầu này thành hai lớp: dịch vụ hệ thống và nhân của HĐH. Dịch vụ hệ thống là những chức năng mức cao được chương trình ứng dụng nhận biết còn nhân (thường trực trong bộ nhớ trong) chỉ đảm bảo những chức năng mang tính cơ bản nhất và phụ thuộc vào kiến trúc hạ tầng.Hình 1.1. mô tả khung nhìn đơn giản về hệ thống máy tính theo cấu trúc lớp. Vị trí của dịch vụ hệ thống trong hình cho thấy vai trò quan trọng của lớp này. Cấu trúc lớp của hệ thống máy tính 2/249
  5. * Với ý nghĩa đóng vai trò như một máy tính ảo, theo cách nhìn của người dùng (từ lớp chương trình ứng dụng), HĐH là sự trừu tượng hóa của hệ thống máy tính được trình diễn bằng các dịch vụ hệ thống: HĐH được chỉ dẫn như là một máy mở rộng (máy tính ảo). Mục đích của lớp dịch vụ hệ thống là nhằm che đậy đi những chi tiết của hệ thống (phần cứng và phần mềm) đối với người dùng. * Theo cách nhìn của người quản trị hệ thống, dịch vụ hệ thống và nhân được coi là người quản lý tài nguyên. Quản lý hệ thống tài nguyên (CPU, bộ nhớ, hệ thống vào ra, file) không chỉ kiểm soát được tình trạng của các tài nguyên mà còn nhằm khai thác hiệu quả nhất. Một số bài toán điển hình như điều khiển bộ nhớ, lập lịch QT, điều khiển liên QT, điều khiển file, điều khiển vào ra Máy tính mở rộng và quản lý tài nguyên là hai thuật ngữ chung nhất được dùng để xác định một HĐH. Máy tính mở rộng (trừu tượng máy) là mục tiêu thiết kế nguyên thủy đối với HĐH và quản lý tài nguyên giải nghĩa cho việc thực hiện mục tiêu đó. Thiết kế HĐH truyền thống thường bắt đầu từ yếu tố quan trọng hơn là quản lý tài nguyên, trong khi đó thiết kế HĐH hiện đại lại tập trung nhiều hơn vào yếu tố trừu tượng máy. Và một lẽ tất nhiên là yếu tố nào là quan trọng hơn lại phụ thuộc vào sự quan tâm từ phía người dùng. Sơ bộ về sự tién hóa của hệ điều hành Trong máy tính thuộc các thế hệ đầu tiên không có HĐH. Các thao tác chọn công việc, phân công công việc đều do thao tác viên (và thậm chí ngay chính người lập trình) thực hiện. Theo thời gian, năng lực của máy tính được nâng cao: về tốc độ xử lý của CPU, về dung lượng bộ nhớ, về hệ thống thiết bị ngoại vi, về phần mềm hệ thống cũng như số lượng và năng lực người sử dụng tăng trưởng và vì vậy cần có một hệ thống chương trình điều khiển tự động hệ thống máy tính. Những yếu tố thực tế như vậy làm nảy sinh những điều kiện cần thiết cho việc xuất hiện các HĐH đơn giản. Lịch sử tiến hóa của HĐH trình diễn một quá trình chuyển hóa từng bước trong việc thiết kế, từ nhấn mạnh chức năng quản trị tài nguyên sang nhấn mạnh chức năng máy tính mở rộng. Theo mô hình trong hình 1.1. thì điều đó được thể hiện việc chuyển hóa từ nhấn mạnh nhân sang nhấn mạnh các dịch vụ hệ thống. Theo lịch sử tiến hóa, HĐH hiện đại được phân ra thành 4 thế hệ: HĐH truyền thống (tập trung), hệ điều mạng, HĐH phân tán và hệ tự trị cộng tác. Thế hệ gần đây nhất (hệ tự trị cộng tác) chú trọng thiết kế các ứng dụng phân tán trong môi trường hệ thống mở (bao gồm các thành phần hệ thống hỗn tạp được tích hợp mềm dẻo và có tính khả chuyển nhằm hỗ trợ việc cộng tác thực hiện theo quy mô lớn ở mức ứng dụng).Dưới đây mô tả sơ bộ về cách thức phân biệt các HĐH này theo (1) độ kết dính phần cứng-phần mềm và (2) tổ hợp mục tiêu-đặc trưng 3/249
  6. . Phân bố của các thế hệ điều hành theo độ kết dính * Độ kết dính phần cứng-phần mềm cho biết hệ thống là "tập trung đến mức độ nào", được đo bằng tổ hợp kết dính phần cứng và kết dính phần mềm. Theo đó, phân bố các thế hệ HĐH được sắp xếp như hình 1.2. Tỷ số giữa tổng phí truyền thông liên bộ xử lý so với thời gian truyền thông nột tại bộ xử lý càng thấp thì kết dính phần cứng càng chặt. Kết dính phần mềm chặt nếu phần mềm điều khiển tập trung và sử dụng thông tin toàn cục. - HĐH tập trung kết dính phần cứng - phần mềm chặt. - HĐH phân tán (DOS): phần mềm kết dính chặt trên nền phần cứng kết dính lỏng, - HĐH mạng (NOS): cả phần mềm lẫn phần cứng đều kết dính lỏng, - Hệ tự trị cộng tác (CAS) làm giảm kết dính chặt phần mềm (cách nhìn lôgic tập trung của DOS). CAS nằm giữa NOS và DOS. *Phân biệt HĐH theo tổ hợp mục tiêu-đặc trưng Bảng 1.1 trình bày sự phân biệt các thế hệ HĐH theo tổ hợp mục tiêu-đặc trưng. Thế Hệ Đặc trưng Mục tiêu hệ thống HĐH Quản trị quá trìnhQuản trị bộ Quản trị tài nguyênMáy tính mở 1 tập nhớQuản trị vào-raQuản trị file rộng (ảo) trung HĐH Truy nhập từ xaTrao đổi thông 2 Chia xẻ tài nguyên(liên thao tác) mạng tinDuyệt mạng HĐH Khung cảnh toàn cục của: Hệ Cách nhìn của một máy tính duy 3 phân thống file,Không gian tên,Thời nhất của một hệ thống phức hợp tán gian, an toàn,Năng lực tính toán các máy tính (tính trong suốt) 4/249
  7. Hệ tự trị Các ứng dụng phân tán là mở và 4 Làm việc cộng tác (tự trị) cộng cộng tác tác Mục tiêu nguyên thủy của HĐH là máy tính ảo (virtual computer). Ba mục tiêu bổ sung là liên thao tác, trong suốt và tự trị hiện vẫn đang là những nội dung nghiên cứu, phát triển. - Mục tiêu liên thao tác hướng tới năng lực tạo ra điều kiện thuận tiện cho việc trao đổi thông tin giữa các thành phần hỗn tạp trong hệ thống. Đây là mục tiêu gợi mở nguyên thuỷ dẫn tới việc thiết kế HĐH mạng trong một môi trường hỗn tạp. - Khái niệm trong suốt (transparency) và khái niệm ảo tương tự nhau ở chỗ cung cấp tính trừu tượng cao cho hệ thống. Điều khác biệt giữa hai khái niệm này là theo tính ảo, người dùng có thể nhìn thấy cái họ muốn, trong khi đó tính trong suốt đảm bảo rằng người dùng không nhìn thấy những cái họ không muốn. ảo là mục tiêu quan trọng của HĐH tập trung còn trong suốt là mục tiêu quan trọng của DOS. Khái niệm trong suốt cho phép mô tả DOS như một hệ thống cung cấp một khung cảnh lôgic của hệ thống cho người dùng, độc lập với hạ tầng vật lý. Người dùng có được cách nhìn của máy tính đơn cho một hệ thống máy tính phức hợp: sự tồn tại của hạ tầng mạng và hoạt động của hệ thống là trong suốt với người dùng. Từ "trong suốt" ở đây được hiểu theo nghĩa 'thuần khiết" của một môi trường thuần nhất. - Trong suốt là một mục tiêu quá cao. Hơn nữa, không bắt buộc phải luôn cố đạt tới tính trong suốt vì nó bao gói một độ tập trung nào đó. Điều chắc chắn phù hợp với người dùng là họ thích có được cái nhìn riêng về hệ thống. Người dùng cần một môi trường mở không đòi hỏi nhất thiết về tính trong suốt mà chỉ cần hệ thống cung cấp tính mở để người dùng biến đổi, chuyển, di trú, mở rộng phần mềm ứng dụng của họ một cách độc lập đối với sự hỗn tạp của hệ thống. Lý do là, như lẽ rất tự nhiên, người dùng biết được sự tồn tại của tài nguyên phức và sự hiện diện của các người dùng khác, và người dùng trở thành cộng tác hoàn toàn với hệ thống. Từ đó, hệ thống phần mềm được xây dựng nhờ việc tích hợp các dịch vụ cộng tác, được cung cấp từ các đơn vị tự trị. Kiểu hoạt động như vậy của hệ tự trị cộng tác rất giống xã hội loài người. Hiện tại một số hệ thống phần mềm lớp giữa (middleware) được xây dựng như những phiên bản (version) ban đầu của hệ tự trị cộng tác. Liên thao tác, trong suốt, và tự trị là những tính chất rất đáng mong muốn. Người dùng không phải (thường là không cần thiết) biết HĐH hiện tại có phải là mạng, DOS, CAS hay không. Hầu hết các HĐH hiện đại là một hệ thống tích hợp. Nó là việc tiến hóa từ HĐH tập trung tới HĐH mạng, HĐH phân tán và sau đó là hệ tự trị cộng tác, trong đó 5/249
  8. người dùng tiếp xúc với việc xây dựng các ứng dụng cộng tác lớn dựa trên các khối đã được cấu trúc hoàn hảo. 6/249
  9. Tổng quan về hệ điều hành truyền thống Như đó biết, HĐH truyền thống (cũn được gọi là HĐH tập trung với đơn/đa bộ xử lý) chạy trờn một mỏy tớnh là thế hệ HĐH đầu tiên, với độ kết dính chặt chẽ phần mềm - phần cứng trong đó mọi tài nguyên được chia xẻ một cách nội tại và truyền thông liên xử lý/liên QT được thực hiện qua hoặc chia xẻ bộ nhớ hoặc ngắt QT trực tiếp. Trong HĐH tập trung, hệ thống máy tính là tập trung: CPU (một hoặc nhiều) và bộ nhớ trong thỏa món một số tớnh chất nguyờn thủy của chỳng (vớ dụ, tốc độ truy nhập của một CPU bất kỳ tới một địa chỉ bộ nhớ trong bất kỳ là đồng nhất ). Coi rằng chỉ có duy nhất "một bộ CPU" cùng duy nhất "một bộ nhớ trong" và không hề quan tâm đến sự khác biệt thời gian truyền thông giữa các CPU hay giữa các bộ phận của bộ nhớ trong. Trong các HĐH truyền thống, chức năng hệ quản trị tài nguyên được nhấn mạnh hơn cho nên việc thiết kế chúng định hướng vào khai thác hiệu quả các tài nguyên phần cứng của hệ thống. Các bài toán điều khiển CPU (lập lịch), điều khiển bộ nhớ trong, điều khiển dữ liệu được đặc biệt chú ý. HĐH truyền thống được tiến hóa từ một chương trỡnh đơn giản (cung cấp một giao diện người dùng và điều khiển vào - ra) tới một hệ đa người dùng/đa bài toán hoàn hảo với các yêu cầu về quản trị rất phức tạp đối với QT, bộ nhớ, file và thiết bị. Sự tiến hóa này được thể hiện trong bảng 1.2 mà các chức năng quản lý được đặt ra nhằm đáp ứng mỗi yêu cầu bổ sung. Bảng 1.2. Chức năng chính của hệ điều hành tập trung Thế Hệ Đặc trưng Mục tiêu hệ thống HĐH Quản trị quá trìnhQuản trị bộ Quản trị tài nguyênMáy tính mở 1 tập nhớQuản trị vào-raQuản trị file rộng (ảo) trung HĐH Truy nhập từ xaTrao đổi thông 2 Chia xẻ tài nguyên(liên thao tác) mạng tinDuyệt mạng HĐH Khung cảnh toàn cục của: Hệ Cách nhìn của một máy tính duy 3 phân thống file,Không gian tên,Thời nhất của một hệ thống phức hợp tán gian, an toàn,Năng lực tính toán các máy tính (tính trong suốt) Hệ tự trị Các ứng dụng phân tán là mở và 4 Làm việc cộng tác (tự trị) cộng cộng tác tác Có một lưu ý nhỏ về chớnh khỏi niệm hệ điều hành trong thời kỳ đánh dấu sự phát triển mạnh của HĐH truyền thống (vào khoảng những năm 1980). Trong nhiều tài liệu, đặc 7/249
  10. biệt là tài liệu về thiết kế HĐH, "hệ điều hành" được hiểu theo những nội dung đó được trỡnh bày trờn đây. Nhưng trong không ít các tài liệu khác, "hệ điều hành" được hiểu như bộ các chương trỡnh hệ thống (xem hỡnh 1.3) được cung cấp cho người sử dụng và ngoài những thành tố đó núi - tương ứng với thành phần điều kiển, HĐH cũn cú thành phần ứng dụng và thành phần tiện ớch. Lý do chính của việc mở rộng nội dung khái niệm về HĐH như vậy liên quan đến sản phẩm kết quả cung cấp cho người sử dụng là một "bộ phần mềm hệ điều hành". Tuy nhiên, khi trỡnh bày bản chất của HĐH, cách quan niệm này cũng nhất quán với cách quan niệm đó núi và nội dung trong giỏo trỡnh này nhất quỏn theo cỏch quan niệm như vậy. Một cách nhân khác về kiến trúc mức hệ thống máy tính Tiếp theo trong mục dưới đây, chúng ta mô tả sơ lược quá trỡnh tiến húa của HĐH truyền thống. Tiến hóa hệ điều hành truyền thống Hệ điều hành đơn chương trình HĐH đơn chương trỡnh (HĐH dóy: serial OS) xuất hiện đầu tiên: chương trỡnh của người dùng được xếp hàng để lần lượt được đưa vào bộ nhớ trong và chạy (thực hiện). Một chương trỡnh sau khi được nạp từ dũng xếp hàng vào bộ nhớ trong được hệ thống (cùng toàn bộ tài nguyên) phục vụ từ khi chương trỡnh bắt đầu chạy cho đến lúc chương trỡnh kết thỳc. Một chương trỡnh được nạp vào bộ nhớ như vậy có thể được thực hiện với nhiều bộ dữ liệu. Chỉ khi chương trỡnh này kết thỳc thỡ mới nạp tiếp chương trỡnh khỏc trong dũng đợi vào bộ nhớ trong. Trong hệ thống đơn chương trỡnh thực chất khụng cần giải quyết bài toỏn điều khiển CPU (lập lich) vỡ CPU đó được dành riêng cho chương trỡnh hiện tại. Tuy nhiên, việc nạp chương trỡnh và dữ liệu vào bộ nhớ trong làm việc lại liờn quan đến thiết bị vào-ra đa dạng mà trong giai đoạn ban đầu phổ biến là vào bỡa đục lỗ (thiết 8/249
  11. bị vào chuẩn) và ra máy in (thiết bị ra chuẩn). Và tới một thời điểm, ra đời CPU tốc độ cao, tốc độ nạp bỡa cũng như tốc độ in ra không theo kịp với tốc độ của CPU, vỡ thế làm tăng thời gian nghỉ vô ích của CPU mà gây ra lóng phớ. Đũi hỏi cần cải tiến nhằm tăng hiệu quả hoạt động. Một trong những cải tiến đối với HĐH đơn chương trỡnh là hoạt động theo chế độ SPOOLING (Simultaneous Peripheral Operation OnLine), mà theo đó tất cả việc vào - ra đối với HĐH là làm việc với đĩa cứng cũn vào - ra từ đĩa cứng với các vật mang tin khác được đảm bảo bằng những cơ chế riêng. Tốc độ của toàn bộ hệ thống được tăng lên đáng kể. Chế độ SPOOLING cũn được sử dụng trong những HĐH đa chương trỡnh xuất hiện sau này. Hệ điều hành đa chương trình Sự tiến bộ nhanh chóng của công nghệ máy tính dẫn tới dung lượng bộ nhớ tăng lên đáng kể (vượt xa dung lượng trung bỡnh của cỏc chương trỡnh người dùng) và tốc độ CPU cũng tăng nhanh, chế độ hoạt động đa chương trỡnh xuất hiện. Chế độ đa chương trỡnh (multiprogramming) được phân loại theo hướng độc lập người dùng (chế độ mẻ) và hướng thân thiện người dùng (chế độ đa người dùng). Đối với HĐH đa chương trỡnh, tại mỗi thời điểm có thể có nhiều chương trỡnh đồng thời có mặt ở bộ nhớ trong. Các chương trỡnh này đều có nhu cầu được phân phối bộ nhớ và CPU để thực hiện. Như vậy, bộ nhớ, CPU, các thiết bị ngoại vi v.v. là các tài nguyên của hệ thống được chia xẻ cho các chương trỡnh. Đặc điểm quan trọng cần lưu ý là các chương trỡnh này phải được “bỡnh đẳng” khi giải quyết các yêu cầu tài nguyên. Khái niệm chương trỡnh nói trong chế độ đa chương trỡnh được dùng để chỉ cả chương trỡnh người dùng lẫn chương trỡnh HĐH. Khi so sánh với HĐH đơn chương trỡnh, cú thể nhận thấy ngay một điều là đối với một chương trỡnh cụ thể thỡ trong chế độ đơn chương trỡnh, chương trỡnh đó sẽ kết thúc nhanh hơn (thời gian chạy ngắn hơn) so với khi nó chạy trong chế độ đa chương trỡnh; nhưng bù lại, trong một khoảng thời gian xác định thỡ chế độ đa chương trỡnh sẽ hoàn thiện được nhiều chương trỡnh (giải được nhiều bài toán) hơn, do đó hiệu quả sử dụng máy tính cao hơn. Một trong những tài nguyên quan trọng nhất của hệ thống máy tính là CPU. Việc chia xẻ CPU là một trong những dạng điển hỡnh của việc chia xẻ tài nguyên. Tính chất chia xẻ CPU lại phân lớp các HĐH đa chương trỡnh thành cỏc lớp con: HĐH hoạt động theo chế độ mẻ (batch) và HĐH hoạt động theo chế độ phân chia thời gian (time shared). -Hệ điều hành hoạt động theo chế độ mẻ Đây là loại HĐH định hướng tới mục tiêu làm cực đại số lượng các bài toán được giải quyết trong một khoảng đơn vị thời gian (có nghĩa là trong một khoảng đơn vị thời gian thỡ hướng mục tiêu vào việc hoàn thiện được càng nhiều chương trỡnh càng tốt). ở nước 9/249
  12. ta những năm trước đây, các máy tính EC-1022, EC-1035 (HĐH OS), IBM 360/40-50 (HĐH DOS) phổ biến hoạt động theo chế độ mẻ. Trong HĐH chế độ mẻ, cách thức điều khiển CPU điển hỡnh là một chương trỡnh ở trạng thỏi sẵn sàng sẽ được chọn thực hiện (được phân phối CPU) khi chương trỡnh đang chạy phải ngừng vỡ nú cần đến một tài nguyên khác CPU. Các HĐH theo chế độ mẻ lại có thể phân biệt thành hai loại điển hỡnh là MFT và MVT: sự phõn biệt chỳng theo cỏch điều khiển bộ nhớ trong. MFT: Multiprogramming with Fixed number of Tasks Khi hệ thống làm việc, đó quy định sẵn một số lượng cố định các bài toán đồng thời ở bộ nhớ trong: Bộ nhớ trong được chia thành một số vùng nhớ cố định, các vùng này có biên cố định mà mỗi vùng được dùng để chứa một chương trỡnh tại một thời điểm. Mỗi chương trỡnh người dùng chỉ được đưa vào một vùng nhớ xác định tương ứng với chương trỡnh đó. Một chương trỡnh chỉ cú thể làm việc trong giới hạn của vựng bộ nhớ trong đang chứa nó: chương trỡnh đó tồn tại trong vùng bộ nhớ tương ứng trong suốt thời gian nó được thực hiện trong máy tính, kể từ lúc bắt đầu cho tới lúc kết thúc. MVT: Multiprogramming with Variable number of Tasks Khác với chế độ MFT, trong chế độ MVT, bộ nhớ trong không bị chia sẵn thành các vùng, việc nạp chương trỡnh mới vào bộ nhớ trong cũn được tiếp diễn khi mà bộ nhớ trong cũn đủ để chứa thêm chương trỡnh. Có thể quan niệm rằng trong chế độ MFT bộ nhớ trong được phân thành các vùng có vách ngăn cố định, cũn trong chế độ MVT, không có vách ngăn sẵn, mỗi khi chương trỡnh được nạp vào mới hỡnh thành một vỏch ngăn tạm thời. Nếu chỉ gặp các chương trỡnh đũi hỏi ớt bộ nhớ thỡ theo chế độ MVT, số lượng chương trỡnh đồng thời có mặt trong bộ nhớ nhiều lên. -Chế độ phân chia thời gian (Time Shared System: TSS) Chế độ phân chia thời gian là chế độ hoạt động điển hỡnh của cỏc HĐH đa người dùng (multi-users). HĐH hoạt động theo chế độ này định hướng phục vụ trực tiếp người dùng khi chương trỡnh của người dùng đó đang thực hiện, làm cho giao tiếp của người dùng với máy tính là hết sức thân thiện. Liên quan đến HĐH hoạt động theo chế độ này là các khái niệm lượng tử thời gian, bộ nhớ ảo v.v. Trong hệ TSS, tại cùng thời điểm có nhiều người dùng đồng thời làm việc với máy tính: Mỗi người làm việc với máy tính thông qua một trạm cuối (terminal) và vỡ vậy, hệ thống đó cho phộp mỏy tớnh thõn thiện với người dùng. 10/249
  13. Khác với cách thức điều khiển CPU trong chế độ mẻ, HĐH phân phối CPU lần lượt cho từng chương trỡnh người dùng, mỗi chương trỡnh được chiếm giữ CPU trong một khoảng thời gian như nhau (khoảng thời gian đó được gọi là lượng tử thời gian: time quantum): có thể thấy phổ biến về lượng tử thời gian điển hỡnh là khoảng 0,05s. Mỏy tớnh làm việc với tốc độ cao, chu kỳ quay lại phục vụ cho từng chương trỡnh người dùng là rất nhanh so với giác quan của người dựng, và vỡ vậy, mỗi người dùng đều có cảm giác rằng mỡnh đang chiếm hữu toàn bộ tài nguyên hệ thống. Điều khiển bộ nhớ trong của chế độ đa người dùng có nhiều khác biệt bản chất so với chế độ mẻ. Bộ nhớ trong luôn chứa chương trỡnh của mọi người dùng, vỡ vậy xảy ra tỡnh huống toàn bộ bộ nhớ trong khụng đủ để chứa tất cả chương trỡnh người dùng hiện đang thực hiện; vỡ vậy, đối với HĐH TSS nảy sinh giải pháp sử dụng bộ nhớ ảo: sử dụng đĩa từ như vùng mở rộng không gian nhớ của bộ nhớ trong. HĐH UNIX (và Linux) là HĐH đa người dùng điển hỡnh. Cú thể nhận xột rằng, tính quản trị tài nguyờn được nhấn mạnh trong HĐH mẻ và tớnh chất máy tính ảo đó được quan tâm hơn trong HĐH đa người dùng. Hệ điều hành thời gian thực Nhiều bài toán trong lĩnh vực điều khiển cần được giải quyết không muộn hơn một thời điểm nhất định, và vỡ vậy, đối với các máy tính trong lĩnh vực đó cần HĐH thời gian thực (RT: Real Time). Trong hệ thời gian thực, mỗi bài toán được gắn với một thời điểm tới hạn (tiếng Anh là deadtime) và bài toỏn phải được giải quyết không muộn hơn thời điểm đó cho đó: Nếu bài toán hoàn thiện muộn hơn thời điểm đó thỡ việc giải quyết nú trở nờn khụng cũn ý nghĩa nữa. Hệ thời gian thực cú thể được coi như một trường hợp của hệ đa chương trỡnh hoạt động theo chế độ mẻ có gắn thêm thời điểm kết thúc cho mỗi bài toán. Hệ điều hành kết hợp Các nhà thiết kế HĐH hiện đại cũng chọn lựa việc thiết kế HĐH có khả năng khởi tạo hoạt động được theo một trong một số chế độ hoạt động của HĐH đó núi trờn đây. Chẳng hạn, HĐH OS cho hệ thống máy EC hoặc IBM có thể hoạt động hoặc theo chế độ mẻ (MFT, MVT) hoặc theo chế độ phân chia thời gian (SYS); hoặc HĐH LINUX hoạt động theo chế độ đơn người dùng (với superuser) hoặc chế độ đa người dùng (với các người dùng khác). Kiểu hệ điều hành như vậy được quan niệm là kết hợp nội dung của nhiều loại hệ điều hành (Combination Operating System). Hệ thống đa xử lý Hệ thống nhiều CPU 11/249
  14. Hiện nay, từ tốc độ phát triển nhanh của công nghệ, máy tính ngày càng được phổ dụng trong xó hội. Mức độ thâm nhập của mỏy tớnh vào cuộc sống càng cao thỡ yờu cầu nõng cao năng lực của máy tính lại ngày càng trở nên cấp thiết. Bộ nhớ chính ngày càng rộng lớn; đĩa từ có dung lượng càng rộng, tốc độ truy nhập ngày càng cao; hệ thống thiết bị ngoại vi càng phong phú, hỡnh thức giao tiếp người-máy ngày càng đa dạng. Như đó núi, CPU là một tài nguyờn thể hiện chủ yếu nhất năng lực của hệ thống máy tính, vỡ vậy một trong những vấn đề trọng tâm nhất để tăng cường năng lực của hệ thống là tăng cường năng lực của CPU. Đối với vấn đề này, nảy sinh các giải pháp theo hai hướng: Giải phỏp tăng cường năng lực của một CPU riêng cho từng mỏy tớnh: cụng nghệ vi mạch ngày càng phỏt triển vỡ vậy năng lực của từng CPU cũng ngày nâng cao, các dự án vi mạch VLSI với hàng triệu, hàng chục tiệu transitor được triển khai. Tuy nhiên giải pháp này cũng nảy sinh những hạn chế về kỹ thuật: tốc độ truyền thông tin không vượt qua tốc độ ánh sáng; khoảng cách gần nhất giữa hai thành phần không thể giảm thiểu quá nhỏ v.v. Song song với giải pháp tăng cường năng lực từng CPU là giải pháp liờn kết nhiều CPU để tạo ra một hệ thống chung có năng lực đáng kể: việc xử lý song song tạo ra nhiều lợi điểm. Thứ nhất, chia các phần nhỏ công việc cho mỗi CPU đảm nhận, năng suất tăng không chỉ theo tỷ lệ thuận với một hệ số nhõn mà cũn cao hơn do không mất thời gian phải thực hiện những công việc trung gian. Thứ hai, giải phỏp này cũn cú lợi điểm tích hợp các hệ thống máy đó cú để tạo ra một hệ thống mới với sức mạnh tăng gấp bội. Chỳng ta khảo sỏt một số nội dung chọn giải pháp đa xử lý theo nghĩa một hệ thống tính toán được tổ hợp không chỉ một CPU mà nhiều CPU trong một máy tính (hệ đa xử lý tập trung) hoặc nhiều máy tính trong một hệ thống thống nhất. Gọi chung các hệ có nhiều CPU như vậy là hệ đa xử lý. Phõn loại các hệ đa xử lý Có một số cách phân loại các hệ đa xử lý: -Phõn loại theo vị trí đặt các CPU: tập trung hoặc phõn tỏn. Các siêu máy tính (supercomputer) là các ví dụ về hệ đa xử lý tập trung. Đặc trưng của hệ thống này là các CPU được liên kết với nhau trong một máy tính duy nhất đảm bảo độ kết dính phần cứng chặt. Ví dụ về hệ đa xử lý phân tán là các hệ thống tính toán phân tán dựa trên mạng máy tính với độ kết dính phần cứng lỏng. -Phõn loại theo đặc tính của các CPU thành phần: hệ đa xử lý thuần nhất hoặc hệ đa xử lý không thuần nhất v.v. Một ví dụ quen thuộc về hệ không thuần nhất là thiết bị xử lý 12/249
  15. trong mỏy vi tớnh gồm CPU xử lý chung và CPU xử lý dấu phảy động. Siêu máy tính ILLIAC-IV gồm nhiều CPU có đặc trưng giống nhau là một ví dụ về hệ thuần nhất. - Cách phân loại điển hỡnh là dựa theo kiểu cỏc CPU thành phần tiếp nhận và xử lý dữ liệu trong một nhịp làm việc. Cách phân loại này bao gồm cả máy tính đơn xử lý thụng thường: - Đơn chỉ thị, đơn dữ liệu (SISD: Single Data Single Instruction) được thể hiện trong máy tính thông thường; Mỗi lần làm việc, CPU chỉ xử lý “một dữ liệu” và chỉ cú một chỉ thị (instruction, câu lệnh) được thực hiện. Đây là máy tính đơn xử lý. - Đơn chỉ thị, đa dữ liệu (SIMD: Single Instruction Multiple Data): Cỏc bộ xử lý trong cựng một nhịp làm việc thực hiện chỉ cựng một chỉ thị. Ví dụ như phép cộng hai vector cho trước: Các CPU thành phần đều thực hiện các phép cộng theo đối số tương ứng tại mỗi CPU; sau đó, chọn tiếp chỉ thị mới để tiếp tục công việc. Thông thường, hệ thống có bộ phận điều khiển riêng cho việc chọn chỉ thị và mọi CPU thành phần cùng thực hiện chỉ thị đó (bộ xử lý ma trận). - Đa chỉ thị, đơn dữ liệu (MISD: Multiple Instruction Single Data): Trong cỏc mỏy tớnh thuộc loại này, hệ thống gồm nhiều CPU, cỏc CPU liờn kết nhau tuần tự: output của CPU này là input của CPU tiếp theo (Bộ xử lý vector). Cỏc CPU kết nối theo kiểu này được gọi là kết nối “dây chuyền”. - Đa chỉ thị, đa câu lệnh (MIMD): Mỗi CPU có bộ phân tích chương trỡnh riờng; chỉ thị và dữ liệu gắn với mỗi CPU: nhịp hoạt động của các CPU này hoàn toàn “độc lập nhau”. 13/249
  16. Cấu trúc hệ điều hành truyền thống HĐH là bộ phần mềm lớn có kích thước từ hàng nghỡn tới hàng triệu dũng mó lệnh, cho nờn khi thi hành cần thiết phải kiến trỳc phần mềm HĐH từ các môđun dễ dàng quản lý (phự hợp với phương pháp chung phát triển phần mềm). Kỳ vọng một kết quả thiết kế là cung cấp các giao diện được xác định tường minh giữa các môđun và cách đặt các ràng buộc cho tương tác môđun. Hai cách tiếp cận truyền thống thông dụng phân hoạch các môđun là phân hoạch ngang và phân hoạch dọc. Phân hoạch dọc dựa trên khái niệm mức, theo đó phân chia các môđun thành nhóm theo các mức khác nhau với ràng buộc là chỉ cho phép tương tác giữa các môđun thuộc hai mức liền kề. Đây là giao diện một vào - một ra giữa các mức. Các môđun trong từng mức (phân hoạch ngang) lại được tổ chức thành các thành phần lớn rời rạc nhau, mỗi thành phần như thế lại có thể được tinh chế tiếp theo tổ hợp phân hoạch ngang hoặc dọc (hỡnh 1.4). Kiểu điển hỡnh của mụđun là tập dũng lệnh thi hành một dịch vụ hệ thống riờng biệt. Trong một hệ thống hướng đối tượng, các môđun cần được thi hành như một đối tượng với các thao tác (hoàn toàn xác định) trên mỗi đối tượng dịch vụ thành phần. Môđun hóa dựa trên đối tượng là tốt hơn so với mó húa. Mọi tài nguyờn, bao gồm cả file và QT, cần được tiếp cận như đối tượng dữ liệu mà thể hiện vật lý của chúng phải được che giấu bằng các cấu trúc dữ liệu trừu tượng. Hoạt động (thực hiện) của môđun được giới hạn bằng một tập các thao tác và luật hỡnh thức gỏn cho đối tượng. Môđun hướng đối tượng cung cấp hàng loạt lợi thế, trong đó có tính đồng nhất truy nhập và bảo vệ. Vỡ đồng nhất, chúng dễ dàng biến đổi và do đó làm tăng tính khả chuyển của hệ thống. Tính khả chuyển của HĐH cũn tăng lên khi tách các mó phụ thuộc-mỏy từ hệ thống. Đa phần các phần mềm HĐH (các dịch vụ hệ thống) là độc lập phần cứng. Từ đó, hệ thống cần được cấu trúc theo cách mà phần phụ thuộc-máy được giữ ở mức tối thiểu nhất và tỏch rời khỏi cỏc dịch vụ hệ thống. Cách tiếp cận nhân tối thiểu này làm giảm bớt độ phức tạp về tính khả chuyển hệ thống từ kiểu kiến trúc máy tính này sang kiểu kiến trúc máy tính khác vỡ chỉ cú nhõn mới phải viết lại. Cỏc chức năng điển hỡnh được thi hành trong nhân tối thiểu bao gồm: tính đa thành phần của các bộ xử lý với hỗ trợ đa chương trỡnh, kiểm soỏt ngắt, điều khiển thiết bị, (dịch vụ) nguyên thuỷ đồng bộ QT (ĐBQT), các phương tiện truyền thông liên QT (TTLQT, tiếng Anh Interprocess Communication, IPC). Cấu trúc nhân thường nguyờn khối theo nghĩa khụng cũn phõn hoạch ngang hoặc dọc được nữa mà chỉ là môđun hóa theo mó. Cấu trỳc này đạt được do nhân đó được tối thiểu nhất. Triết lý thiết kế này là hiệu quả cho phộp chỳ ý tới cỏch liờn kết nhõn hơn là cấu trỳc nhõn. Hỡnh 1.4 thể hiện cỏc khỏi niệm mụđun hóa và cấu trúc hóa với một số thành phần trong mỗi mức của phần mềm hệ thống. Cấu trúc HĐH được nâng cao theo mô hỡnh Client/Server. Mụ hỡnh Client/Server là một mụ hỡnh lập trỡnh khuụn mẫu. Theo mụ hỡnh này, lời gọi hệ thống từ các chương trỡnh ứng dụng yờu cầu cỏc dịch vụ HĐH giống như yêu cầu QT khách trực tiếp tới QT 14/249
  17. phục vụ. Chúng được thi hành gián tiếp thông qua nhân HĐH. Lời gọi hệ thống chia xẻ một lối vào nhất quán tới hệ thống. Cơ chế này làm đơn giản hóa tương tác tới HĐH và cho phép người thiết kế hệ thống chuyển thêm nhiều dịch vụ hệ thống tới mức cao hơn (trong nhiều trường hợp tới không gian QT người dùng) và kết quả được nhân nhỏ hơn và dễ quản lý hơn. Mô hỡnh Client/Server là cỏch tự nhiờn mô tả các tương tác giữa các QT trong hệ phân tán trong khi chuyển thông điệp (một khái niệm quan trọng) chỉ có nghĩa chuyển vận dữ liệu trong các thực thể truyền thông. Sự phân biệt giữa chương trỡnh ứng dụng với chương trỡnh hệ thống thường mơ hồ. Chương trỡnh trong nhõn và dịch vụ hệ thống là phần mềm hệ thống (xem hỡnh 1.4). Tuy nhiờn, theo một quan niệm khỏc (như đó được trỡnh bày trong hỡnh 1.3), chương trỡnh hệ thống cũn bao gồm cả trỡnh biờn dịch, trỡnh soạn thảo hệ thống, trỡnh thụng dịch [3]. Chớnh bởi lý do đó mà người viết trỡnh biờn dịch cũng tự coi họ là những người lập trỡnh hệ thống. Tuy nhiờn, trỡnh biờn dịch theo quan điểm của HĐH được xem là một ứng dụng. Mặt khác, phần mềm cơ sở dữ liệu là một ứng dụng đối với trỡnh biờn dịch hoặc một ngụn ngữ, đến lượt mỡnh nú lại là chương trỡnh hệ thống đối với người dùng. Kiến trúc này có thể phát triển thêm một vài mức. Người dùng nhỡn hệ thống qua một hệ thống con được đặc trưng bằng các dịch vụ cung cấp cho họ. Mối quan hệ giữa chương trỡnh hệ thống và chương trỡnh ứng dụng là gần gũi. Hệ thống con và vi nhân Nhân tối thiểu vạn năng mà dựa trên nó, các dịch vụ HĐH chuẩn được thi hành nhằm hỗ trợ các hệ thống con hướng ứng dụng được gọi là vi nhân. Kiến trúc vi nhân bao gồm một nhân tối thiểu phụ thuộc nền phần cứng và một tập các thi hành độc lập phần cứng (dịch vụ hệ thống) bằng Bộ giao diện trỡnh ứng dụng (API: Application Program Interface) hoàn toàn xỏc định. Điều ý nghĩa của khái niệm vi nhân ở chỗ nó cung cấp một môi trường chứa các điều kiện cần và đủ để cấu trúc HĐH hoặc hệ thống con đáp ứng nhu cầu bất kỳ với ít công sức nhất. Nhân, mặc dù phụ thuộc phần cứng, nhưng được cấu trúc với độ trừu tượng phần cứng để dễ dàng được ghi lại mó mỏy khi được mang chuyển tới một nền khác. Cấu trúc bổ sung này được gọi là Mức trừu tượng phần cứng (HAL: Hardware Abstraction Layer) hoặc Giao diện cung cấp dịch vụ (SPI: Service Provider Interface) khi được sử dụng trong mô đun phần mềm mức trên. Như trỡnh bày tại hỡnh 1.5 thỡ API cung cấp tớnh mở rộng cho cỏc ứng dụng mức cao cũn SPI (hoặc HAL) đề cao tính khả chuyển cho nền tảng mức thấp. 15/249
  18. Các mức API và SPI Kiến trúc hệ thống Windows NT Các dịch vụ hệ thống là đồng hạng môđun và đầy đủ vỡ vậy chỳng được dùng như một cơ chế để hỗ trợ lớp rộng lớn các ứng dụng. Người thiết kế phần mềm chỉ cần biết các giao diện chuẩn tới các môđun dịch vụ thi hành và có thể chọn một tập con của chúng theo đũi hỏi. Kiến trỳc như vậy rất thuyết phục vỡ tớnh mụđun hóa, dễ mang chuyển và khả năng tiếp thị (môđun thi hành có thể thuộc bản quyền của nhà cung cấp hệ thống khác). Ngành công nghiệp đó cú một vài cố gắng hướng tới một kiến trúc vi nhân chung, đáng kể nhất là Microkernel của IBM và Windows NT của Microsoft. Windows NT được trỡnh bày trong hỡnh 1.6 như một ví dụ của kiến trúc vi nhân, trong kiến trúc này mỗi khách thấy máy tính theo một môi trường tính toán khác nhau (OS/2, Win32, POSIX) được biểu diễn bởi API trong hệ thống con. Mỗi hệ thống con có không gian địa chỉ lôgic riêng của mỡnh, cú thể được cô lập và bảo vệ đối với các hệ thống con 16/249
  19. khác. Lời gọi hệ thống con dựa trên API dịch vụ hệ thống và như vậy được thi hành một cách độc lập với việc thực hiện tại mức nhân và mức phần cứng. Như một chọn lựa, hệ thống con có thể tương tác gián tiếp với dịch vụ hệ thống qua hệ thống con Win32, hệ này hỗ trợ phương tiện lập trỡnh window. Kiến trỳc tại hỡnh vẽ đạt được mọi khái niệm kiến trúc hệ thống như đó thảo luận: mụđun hóa, phân mức, mô hỡnh Client/Server, mụ hỡnh đối tượng, và nhân tối thiểu. Hầu hết các HĐH hện đại theo đuổi triết lý thiết kế như vậy với một vài khác biệt nhỏ khi thi hành. Các chức năng quản trị HĐH có chức năng quản trị tài nguyên. Mỗi tài nguyên trong hệ thống máy tính nói chung thuộc vào một trong bốn lớp: Bộ xử lý/quỏ trỡnh, bộ nhớ, I/O và dữ liệu/file. Mô tả một cách tóm tắt các vấn đề cơ sở của HĐH truyền thống. Tóm tắt này như là những thông tin nền tảng cho thảo luận HĐH mạng, HĐH phân tán và hệ tự trị cộng tác. -? Quản trị Bộ xử lý/Quỏ trỡnh ở mức hệ thống thấp nhất là cung cấp ỏnh xạ (lập lịch: scheduling) cỏc bộ xử lý tới cỏc QT, hoặc ngược lại. Để thuận tiện cho việc mở rộng đa người dùng và đa bài toán (đa nhiệm), cần tới tính đa thành phần-không gian bộ nhớ (nơi đặt QT) và tính đa thành phần-thời gian các bộ xử lý (nơi QT thực hiện). Thi hành tính đa thành phần như vậy thông qua tính đa chương trỡnh và phõn chia thời gian được cơ chế kiểm soát ngắt đầy đủ hỗ trợ. Tại mức cao, việc thi hành là trong suốt tới các QT thực hiện đồng thời. Người dùng chỉ quan tâm tới việc phối hợp tương tác các QT đồng thời. Các tương tác đũi hỏi ĐBQT và TTLQT. Trong hơn hai chục năm trở lại đây, hàng loạt phương pháp ĐBQT được đề xuất nhằm giải quyết bài toán đồng bộ nhờ loại trừ ràng buộc và kết hợp trạng thái. Hầu hết các tiếp cận cơ sở dùng lời gọi hệ thống đặc biệt thao tác trên các biến kiểu dữ liệu semaphore. Do được hệ thống hỗ trợ khả năng kết khối QT, các thao tác nguyên tử trên semaphore (yêu cầu tài nguyên P(s) / giải phóng tài nguyên V(s)) cho phép phối hợp các QT tương tác. Các tiếp cận khác (không dùng semaphore) gắn năng lực đồng bộ vào ngôn ngữ lập trỡnh nhờ hoặc là biến dạng cấu trỳc điều khiển (chẳng hạn, khoảng tới hạn có điều kiện - Condition Critical Region, ghi tắt CCR. Khái niệm cơ sở là khoảng tới hạn - Critical Region, ghi tắt là CR) hoặc là bổ sung kiểu dữ liệu trừu tượng mới (chẳng hạn, bộ giỏm sỏt - monitor). Ngoài ra, một cách thức ĐBQT khác dựa theo cách lệnh vào-ra, chẳng hạn Bộ cỏc quỏ trỡnh tuần tự truyền thụng (Communicating Sequential Processes: CSP). Đây là cách tiếp cận tổng quát hơn theo kiểu lời gọi thủ tục và dẫn dắt điểm hẹn (rendezvous) trong ngụn ngữ lập trỡnh Ada. Tiến thờm một bước mới, cho phép đặc tả dóy cỏc điều khiển thực hiện đồng thời trong một chương trỡnh mà khụng cần dựng cỏc nguyờn thủy đồng bộ một cách tường minh, như được thi hành trong biểu thức đường đi (Path Expression: PE). Người ta chỉ ra rằng, mọi tiếp cận được đề xuất cho bài toán đồng bộ có thể được thi hành với sự thỏa hiệp giữa hiệu quả và năng lực diễn tả lời giải bài toán. Các phương pháp đồng bộ truyền thống sẽ được mô tả sơ lược tại chương 3). 17/249
  20. Các phương tiện TTLQT được phát triển song hành với ĐBQT. Trong HĐH tập trung, TTLQT xuyên qua chia xẻ bộ nhớ dường như là giải pháp dễ dàng. Tuy nhiên, chia xẻ bộ nhớ vi phạm giả thiết cơ bản là các QT không đồng bộ và nhỡn chung là khụng chia xẻ khụng gian địa chỉ chung. Lựa chọn cũn lại là truyền thụng thông qua chuyển thông điệp (ghi tắt CTĐ, message passing). ưu điểm của CTĐ do nó là một phần bản chất của hệ phân tán và như vậy có thể đưa việc phát triển HĐH tập trung thích hợp với việc phát triển hệ phân tán. Điều rất có giá trị chính là mối quan hệ thân thiết giữa ĐBQT và truyền thông QT (TTQT). TTQT đũi hỏi một số giả thiết nền tảng từ ĐBQT, chẳng hạn như đồng bộ gửi và nhận dữ liệu. Với các dịch vụ nguyên thủy của truyền thông QT, cấu trúc đồng bộ mức cao có thể được thi hành chỉ dựa trên các TTQT nguyên thủy. Khởi đầu từ nguyên thủy đồng bộ và truyền thông cũng dẫn đến việc phát triển ngôn ngữ đồng thời: các ngôn ngữ cho phép đặc tả được QT đồng thời, đồng bộ và TTLQT. Ngôn ngữ đồng thời và đồng bộ/truyền thông trong hệ phân tán được bàn luận tương ứng trong chương 3 và chương 4. Cùng với ĐBQT và TTQT, quản trị QT cũn cú chức năng lập lịch. Quá trỡnh đang sẵn sàng (ready) hoặc ở dũng xếp hàng (waiting sequence) cần được lập lịch lại để thực hiện khi tài nguyên đó sẵn sàng hoặc điều kiện nào đó được thỏa món. Rất nhiều chiến lược được dùng nhằm đạt được hàm mục tiêu, chẳng hạn tối thiểu thời gian chuyển lịch hoặc tối đa thông lượng hệ thống (system throughput). Lập lịch bài toỏn (task, hoặc quỏ trỡnh - process) cho mỏy đơn-đa xử lý là một vấn đề nghiên cứu thao tác cổ điển. ứng dụng lập lịch bài toán vào hệ phân tán là phức tạp do tồn tại đa máy tính và tổng phí (overhead) truyền thông buộc phải tính đến trong lập lịch. Tồn tại hai kiểu lập lịch: Lập lịch QT tĩnh dựa trờn mụ hỡnh quan hệ đi trước và chia xẻ tải động quá trỡnh dựa trờn mụ hỡnh quan hệ phụ thuộc quỏ trỡnh. Quan hệ đi trước biểu diễn các QT buộc phải đồng bộ như thế nào, trong khi đó quan hệ phụ thuộc chỉ cho biết dấu hiệu tương tác giữa các QT. Hai kiểu lập lịch này biểu diễn độ hiểu biết khác nhau về mối tương tác giữa các QT trong đồng bộ và truyền thông. Lập lịch tĩnh, chia xẻ động và cân bằng tải được trỡnh bày trong chương 5. -Quản trị thiết bị vào - ra là trỏch nhiệm chặt chẽ của hệ thống cỏc thiết bị gắn kết vật lý. Nhằm giảm bớt độ phức tạp khi thiết kế hệ thống theo tính phụ thuộc máy, kiến trúc hệ thống của bộ xử lý thường được tách hoàn toàn khỏi tính chi tiết thiết bị vào-ra. Bộ xử lý cung cấp một giao diện chung tới tất cả thiết bị và căn cứ theo giao diện chung đó, nhà chế tạo thiết bị vào-ra phát triển thiết bi điều khiển thiết bị vào-ra và trỡnh điều khiển phần mềm để tích hợp vào hệ thống. Theo hướng trừu tượng, các thiết bị vào-ra chỉ là bộ ghi nhớ: Một số cho phép đọc và ghi (chẳng hạn, đĩa từ), một số khác chỉ cho phép đọc (chẳng hạn, bàn phím) và một số khác nữa chỉ cho phép ghi (chẳng hạn, máy in). Theo quan điểm của HĐH, thích hợp nhất coi tất cả thiết bị vào-ra là file lụgic. File lụgic biểu diễn thiết bị vật lý được gọi là thiết bị ảo. Các QT chỉ thao tác trên các file và hệ thống chịu trách nhiệm diễn giải file này tới thiết bị vật lý. 18/249
  21. Người ta sử dụng một số kỹ thuật nhằm tăng tốc thao tác vào-ra, đáng kể nhất là hai khỏi niệm spooling và buffering. Spooling (như đó được giới thiệu tại trang 10) làm thuận tiện chia xẻ các thiết bị vào - ra, cũn buffer (bộ đệm) căn bản được dùng để dàn xếp sự khác nhau về tốc độ làm việc giữa thiết bị vào-ra chậm và bộ xử lý nhanh. Buffer có thể được thi hành ở nhiều mức phần mềm khác nhau, chẳng hạn như hệ thống file, trỡnh điều khiển thiết bị, và trong một số trường hợp ở ngay trong thiết bị điều khiển vào-ra. Hai thiết bị vào - ra quan trọng nhất là ổ đĩa và trạm cuối. Đĩa tốc độ cao và dung lượng rộng (vài trăm gigabytes) là rất thông dụng. Đĩa dung lượng cao đóng vai trũ đáng kể trong việc thiết kế phần mềm lớn. Trạm cuối bản đồ - bộ nhớ tạo nên sự thi hành việc hỗ trợ các cửa sổ (windows) tại trạm cuối. Cửa sổ được khởi hành như một bàn giao tiếp ảo (virtual console) đơn giản. Với các chức năng bổ sung như một giao diện người dùng đồ họa và các cửa sổ đa tương tác, windows được tiến hóa thành giao diện đang phát triển một cách thăng hoa đối với hệ thống con và sẽ trở thành một máy tính ảo như trường hợp HĐH Windows 95. Một vấn đề đáng quan tâm liên quan tới quản trị vào-ra là bế tắc (deadlock). Bế tắc nảy sinh trong hệ thống do định vị sai tài nguyên khi có một tập QT không ưu tiên (nonpreemptable) mà mỗi từ chúng giữ tài nguyên lại đũi hỏi tài nguyờn từ QT trong tập đó, tạo ra một chu trỡnh xõu QT khụng thể thỏo rời. "Tài nguyờn" cú thể là thiết bị vật lý và (chung hơn) là các buffer và các điều kiện. Việc phũng ngừa, thoỏt ra, và phỏt hiện bế tắc đó được nghiên cứu rộng rói. Tuy nhiên, phát hiện và giải quyết bế tắc phân tán hiện vẫn đang là vấn đề mở. -Quản lý bộ nhớ bao gồm việc phõn phối - phõn phối lại bộ nhớ và ánh xạ không gian chương trỡnh lụgic vào bộ nhớ vật lý. Mục tiờu căn bản là bảo đảm tận dụng cao bộ nhớ và cung cấp bộ nhớ ảo hỗ trợ chương trỡnh lớn, đặc biệt là các chương trỡnh cú kớch thước vượt kích thước bộ nhớ vật lý. Hầu hết hệ thống máy tính hiện nay đều sử dụng các kỹ thuật điều khiển trang (paging)/ điều khiển segment (segmentation) khi thi hành bộ nhớ ảo. Thi hành bộ nhớ ảo đũi hỏi phần cứng bổ sung, thường được gọi là đơn vị quản lý bộ nhớ (memory managment unit). Cả trang và segment đều là các cơ chế phân phối bộ nhớ rời rạc. Sự khác nhau chính giữa hai cơ chế này phân chương trỡnh theo trang vật lý và theo segment logic. HĐH hiện đại thi hành bộ nhớ ảo theo cơ chế tổ hợp hai cơ chế này. Do không phải tất cả các trang và segment đồng thời nằm trong bộ nhớ trong, nên cần điều tiết những chỉ dẫn tới dữ liệu và chỉ thị (lệnh) mới khi thực hiện một chương trỡnh. Nhiều thuật toỏn thay trang được đề xuất nhằm rút gọn tần số lỗi trang. Hiệu suất của chiến lược thay trang phụ thuộc mạnh vào cách thực hiện chương trỡnh tại khoảng thời gian đó cho bất kỳ. Định hướng không gian và thời gian được mô tả tổng quát trong chương trỡnh cú ảnh hưởng đáng kể khi chọn thuật toán thay trang. Bộ nhớ ảo là giải pháp nhằm giải quyết sự khác nhau về kích thước và tốc độ giữa bộ nhớ đĩa chậm tương đối và bộ nhớ vật lý nhanh hơn. Tồn tại vấn đề tương tự khi bộ nhớ tốc độ cao (cache) được dùng như bộ đệm giữa bộ xử lý và bộ nhớ chớnh. Quỏ trỡnh buffer này chỉ đũi hỏi phải ỏnh xạ địa chỉ vật lý (được gọi là caching) mà thông thường 19/249
  22. được quan tâm theo hướng kiến trúc hơn là vấn đề của HĐH. Chọn lựa thuật toán thay trang, ảnh hưởng của cỡ trang và segment, ảnh hưởng của phân phối bộ nhớ, caching và liên kết cache là một số vấn đề của quản trị bộ nhớ. Trong HĐH tập trung, bộ nhớ chia xẻ cho giá trị là tính đơn giản đối với truyền thông và tương tác QT. Nhiều thuật toán được phát triển cho bộ nhớ chia xẻ. Trong môi trường phân tán, hy vọng mô phỏng được hệ thống bộ nhớ chia xẻ trong khi không có bộ nhớ vật lý chia xẻ. Khỏi niệm bộ nhớ phõn tỏn này đưa ra một số câu hỏi về tính nhất quán và hiệu năng của chia xẻ dữ liệu là tương tự như chia xẻ file trong hệ thống file phân tán. Chương 6 trỡnh bày về hệ thống file phõn tỏn. -Cuối cựng, song khụng kộm quan trọng, là quản trị file trong HĐH. File là một thực thể dữ liệu lôgic được thi hành trên các thiết bị nhớ, bao gồm đĩa, bộ nhớ, và thậm chí cả thiết bị vào-ra. Theo nghĩa trừu tượng nhất, mọi tính toán được xem như các quá trỡnh thao tỏc với file. Nếu bỏ đi hai thuật ngữ cơ bản là quá trỡnh và file, thỡ khụng cũn cú gỡ nghiờn cứu về HĐH. Do chúng ta chỉ giải quyết với quá trỡnh và file, mọi chủ đề tiếp theo đều liên quan đến chúng. Chúng ta không bàn luận nhiều về quản trị vào - ra và quản trị bộ nhớ vỡ điều đó chỉ thích hợp trong HĐH tập trung. File cần được cấu trúc và thi hành trước khi được thao tác. Mỗi khi một cấu trúc file chung và thi hành của chúng được quyết định thỡ cỏc chức năng cơ sở để quản trị file là truy nhập file (file acces) và chia xẻ file. Thêm nữa vỡ mục tiờu hiệu quả, truy nhập file đũi hỏi cơ chế điều khiển bảo vệ (protection) và an toàn, và chia xẻ file đồng bộ hoặc điều khiển đồng thời. Khác với quản trị bộ nhớ và quản trị vào-ra, file được phân tán và nhân bản trên mạng hoặc môi trường phân tán. An toàn và điều khiển đồng thời file để thao tác file trở thành những vấn đề thiết thực hơn trong thiết kế HĐH phân tán so với HĐH tập trung. ứng dụng caching trong truy nhập file cũng phức tạp hơn, do thực tế file được cache trên nhiều máy. Một số chương, đoạn tiếp thảo luận về thi hành và điều khiển hệ thống file phân tán. 20/249
  23. Sơ lược về hệ điều hành mạng Hiện nay, máy tính không được dùng một cách riêng lẻ và nhiều máy tính được kết nối thành một hệ thống tính toán chung; mỗi máy tính đảm nhận một chức năng bộ phận và toàn bộ hệ thống tính toán chung đó có năng lực hơn hẳn việc sử dụng riêng lẻ. Theo tiến trình đó các loại HĐH mạng, HĐH phân tán và HĐH tự trị cộng tác xuất hiện (hình 1.3). So với HĐH tập trung, kết nối phần cứng và phần mềm trong hệ thống máy tính trở nên mềm dẻo hơn, trong một số trường hợp (như HĐH mạng) kết nối đó là lỏng lẻo. HĐH mạng cho phép liên kết nhiều máy tính theo cách không thực sự chặt chẽ: không có sự điều khiển phần cứng hoặc phần mềm trực tiếp từ một trạm làm việc (workstation) tới những trạm làm việc khác tồn tại trong hệ thống, và tổng phí truyền thông giữa các trạm cuối (đo theo thời gian) là lớn hơn rất nhiều so với chuyển giao thông tin nội tại trong mỗi trạm cuối. Mục tiêu căn bản của HĐH mạng là chia xẻ tài nguyên (bao gồm chương trình và dữ liệu) trong mạng. Tương tác duy nhất trong hệ thống là trao đổi thông tin giữa các trạm thông qua một vài dạng kênh truyền thông ngoài. Đặc trưng duy nhất, liên thao tác (interoperability) là tính chất mong muốn trong hệ thống máy tính mạng. Liên thao tác cung cấp tính linh hoạt trong trao đổi thông tin dọc theo các trạm trong mạng máy tính hỗn tạp, đây được gọi là tính liên tác động. Liên thao tác được biểu thị bởi các giao thức truyền thông chuẩn và giao diện chung nhằm chia xẻ CSDL và hệ thống File. Ví dụ về cơ chế hỗ trợ liên thao tác là giao thức truyền thông chuẩn và giao diện chung tới các CSDL (data base) hoặc hệ thống file. Chức năng trao đổi thông tin được phân chia và thi hành theo cấu trúc mức. Tại mức phần cứng, mạng con truyền thông chịu trách nhiệm thi hành trao đổi thông tin. Cao hơn, HĐH cung cấp dịch vụ giao vận (transport service) dữ liệu và người dùng sử dụng các giao thức truyền thông quá trình điểm - điểm (peer to peer) hướng ứng dụng. Các mức có thể mịn hơn như kiến trúc bảy mức OSI của ISO. HĐH mạng có thể được coi là mở rộng trực tiếp HĐH truyền thống, được thiết kế nhằm làm thuận tiện chia xẻ tài nguyên và trao đổi thông tin. Do đó, thuận tiện mô tả HĐH mạng thông qua minh họa các ứng dụng mạng chung của nó và các dịch vụ giao vận cần có để hỗ trợ các ứng dụng này. Dịch vụ giao vận phục vụ như một giao diện đứng giữa QT ứng dụng mạng và mạng truyền thông vật lý, và nó thi hành giao thức truyền thông giữa hai hệ điều hành điểm. Hình 1.6 cho thấy sự tích hợp các dịch vụ giao vận trong HĐH đối với QT ứng dụng truy nhập hệ thống file từ xa. Ví dụ này được mô hình hóa theo Hệ thống file mạng (Network File System: NFS) của Sun. Truy nhập file từ xa dựa trên hệ thống file mạng truyền thông và được chuyển dịch bởi hệ thống mạng thành các giao vận dữ liệu giữa các dịch vụ điểm. 21/249
  24. Hình 1.6.Tích hợp dịch vụ giao vận Hầu hết các HĐH mạng dùng API mức cao chẳng hạn như socket và lời gọi thủ tục từ xa (Remote Procedure Call: RPC) đối với dịch vụ giao vận nhằm hỗ trợ truyền thông giữa các HĐH trong các miền mạng khác nhau. HĐH mạng được đặc trưng bởi tập gồm một mức giao vận và hỗ trợ ứng dụng mạng chạy trên dịch vụ giao vận. Các lớp ứng dụng mạng đáng chú ý là đăng nhập từ xa (remote login), chuyển file (file transfer), thông điệp, duyệt mạng (network browsing) và thực hiện từ xa (remote execution). Dưới đây trình bày sơ lược về chúng. -Đăng nhập từ xa: là khả năng cho phép trạm riêng của người dùng thành một trạm cuối đăng nhập vào một trạm làm việc từ xa trong mạng, cho phép chia xẻ trực tiếp CPU và tài nguyên tương ứng của nó. Để đăng nhập từ xa input từ bàn phím được chuyển đổi thành các bó dữ liệu của các giao thức truyền thông mạng. Tại điểm đối ngẫu áp dụng tới hiển thị output. Đôi lúc hy vọng mô phỏng rất nhiều kiểu trạm cuối (được gọi là mô phỏng trạm cuối). Như vậy, việc dàn xếp giữa các tham số trạm cuối là cần thiết trước khi kết nối được thiết lập. Dịch vụ với mở rộng kết hợp này được gọi là hỗ trợ trạm cuối ảo. Một ứng dụng mạng được sử dụng rộng rãi với mở rộng như vậy là telnet, một dịch vụ đăng nhập từ xa được thiết kế cho các trạm cuối không đồng bộ (asynchronous: dị bộ). Trong UNIX, rlogin là dịch vụ tương tự ngoại trừ nó không hỗ trợ mô phỏng trạm cuối. Thêm vào, rlogin giả thiết rằng host từ xa trong cùng một miền đồng nhất, và việc xác minh mật khẩu không phải là một lựa chọn ngầm định. -Truyền file: là năng lực truyền file hoặc mang chuyển file dọc theo các trạm làm việc khác nhau trong một hệ thống mạng. Truyền file không đơn thuần một trao đổi dữ liệu. File chứa dữ liẹu, cấu trúc file và cả các thuộc tính file. Như vậy, một giao thức truyền file (chẳng hạn, fpt trong UNIX) bắt buộc cung cấp một giao diện tới các hệ thống file địa phương và hỗ trợ các lệnh tương tác của người dùng. Thông tin về thuộc tính file, khuôn dạng dữ liệu, dòng dữ liệu, và điều khiển truy nhập bắt buộc phải được trao đổi và có giá trị như một phần của thao tác truyền file. Nhân bản file từ xa (rcp) trong UNIX 22/249
  25. là một dịch vụ truyền file có hạn chế bằng việc sao các fioe giữa các trạm làm việc, khi giả thiết rằng cấu trúc file UNIX là như nhau trong miền mạng (tức là HĐH tại các nút là đồng nhất). -Hệ thống thông điệp cho phép người sử dụng mạng gửi và nhận tài liệu hoặc thông điệp mà không cần tạo ra một kết nối thời gian thực. Hai ứng dụng thông điệp chính là Chuyển đổi dữ liệu điện tử (Electronic Data Interchange: EDI) đói với các giao dịch (transaction) kinh doanh và thư điện tử (e-mail). EDI là ứng dụng chuẩn mà nguyên tắc chủ đạo là truyền thông tin kinh doanh. E-mail là thông điệp cho phép trao đổi thông điệp giữa các người dùng mạng. Khác với truyền File, hệ thống mail là không thông dịch ngoại trừ những thông điệp chung được gắn vào trong mail (hiện nay, điều này không hoàn toàn do một số hệ thống mail có chức năng thực hiện từ xa). Thuộc tính cấu trúc và điều khiển truy nhập của dữ liệu mail không được chú ý. Điều căn bản là nắm giữ và truyền thông điệp và giao diện người dùng thao tác trên thông điệp mail. Rất nhiều chuẩn, chẳng hạn X.400 do CCITT (nay là, ITU-T) và Giao thức truyền mail đơn giản (Simple Mail Transfer Protocol: SMTP) của Bộ quốc phòng Mỹ, đã được đề xuát nhằm thi hành hệ thống mail mạng. Nhiều hệ thống e-mail tinh vi đã được xây dựng, để phục vụ như bộ chuyển đổi có năng lực truyền thông giữa các hệ thống mail khác nhau. -Duyệt mạng là dịch vụ thông tin để tìm kiếm và trình bày các tài liệu giữa các site mạng thành viên. Trình duyệt thường được thi hành như là một hệ thống Client/Server trong đó trình duyệt là khách truy nhập đối tượng tại phục vụ file từ xa. Hệ thống được sử dụng rộng rãi nhất hiện nay là WWW (World Wide Web). WWW là mô hình dữ liệu để liên kết các tài liẹu siêu phương tiện dùng các chỉ dẫn được gọi là Bộ định vị tài nguyên thống nhất (Universal Resource Locator: URL). Tài liệu được hiển thị bởi trình duyệt thường là siêu văn bản (hypertext) và có thể chứa nhiều con trỏ tới siêu văn bản khác hoặc siêu phương tiện khác. Trình duyệt, chăng hạn Mosaic, truyền thông với phục vụ WWW dùng giao thức truyền siêu văn bản (HyperText Transport Protocol: HTTP). Các giao thức khác, chẳng hạn ftp và telnet cũng được sử dụng. Tài liệu đa phương tiện điển hình được cấu trúc khi sử dụng Ngôn ngữ đánh dấu văn bản (HyperText Markup Language: HTML) và được phân tán nhờ dịch vụ Web. Hiện có nhiều hệ thóng duyệt khác với (cơ sở dữ liệu) tài nguyên phân tán lớn. Vào thời điểm 1997, Netscape hầu như là hệ thống duyệt phổ dụng nhất với hiẹu quả bổ sung của nó và sự mở rộng về an toàn. -Thực hiện từ xa là khả năng gửi thông điệp đòi hỏi sự thực hiện một chương trình tại site từ xa. Do các chương trình thực hiện được là phụ thuộc máy và không thể chạy trên máy tùy ý, sự thực hiện từ xa thường được làm theo cách thông dịch (không là biên dịch) một file script hoặc mã liên phương tiên độc lập máy được thông điệp đưa ra. Thực hiện từ xa là một công cụ mạng rất mạnh song nguy hiểm. Vì thế nó thường được giới hạn tới một số ứng dụng mà sự hạn chế có thể kéo theo việc ngăn ngừa đe doạ và bảo vệ khỏi vi phạm. 23/249
  26. ứng dụng tốt của thực hiện từ xa là chuyển vận dữ liệu đa phương tiện. File video và ảnh đòi hỏi khối lượng lớn băng thông nếu chúng được truyền dưới dạng dòng điểm. Chúng cũng phải gặp bài toán về tính không tương thích trong hiển thị output. Một số ngôn ngữ liên phương tiện phổ dụng có thể được dùng để đặc tả dạng thống nhất và cô đọng hơn. Tại điểm nhận, thông dịch tương ứng được gọi nhằm dịch dữ liệu hoặc thực hiện các chỉ thị trong ngôn ngữ đa phương tiện. Vấn đề chuyển đổi dữ liệu được giải quyết và việc tải trên mạng là rất lớn. Nhiều ứng dụng mạng sử dụng khái niệm thực hiện từ xa. Ví dụ, MIME (Multupurpose Internet Mail Extension) là hệ thống mail tích cực mà hỗ trợ trao đổi mail đa phương tiện giữa các máy tính khác nhau, chẳng hạn, thông điệp có thể mang một kiểu đặc biệt cho một hiển thị riêng. Phụ thuộc vào kiểu, quá trình tương ứng được gọi nhằm thực hiện bài toán. Thông điệp ytong mail MIME được thông dịch và có cùng hiệu quả như chương trình thực hiện ở xa. Cách tiếp cận tổng quát hơn tới thực hiện từ xa trong ngôn ngữ và môi trường lập trình Java. Java là ngôn ngữ lập trình hướng đối tượng mục đích - tổng quát, xuất pát từ C++. Biên dịch Java cho dãy các chỉ thị mã-byte hiệu năng cao và độc lập máy cô đọng có thể được gửi và thông dịch tại host bất kỳ miễn có sẵn thông dịch Java. Chương trình mã- byte được gọi là tiểu dụng (applet). Nhằm hỗ trợ dịch vụ mạng và phân tán, môi trường lập trình Java cung cấp thư viện gồm các thủ tục con kết hợp chặt chẽ các giao thức Internet, chẳng hạn http và fpt. Một tiểu dụng Java là một đối tượng mà có thể được chỉ dẫn tại một URRL nhằm mở các đối tượng khác. Một ứng dụng trực tiếp của tiểu dụng trong WWW là sử dụng thế mạnh động của tiểu dụng để kéo ảnh được tạo ra dễ dàng hơn trong hệ thống duyệt. Phiên bản mới của Netscape được thi hành nhờ sử dụng Java vì vậy hỗ trợ tiểu dụng Java. Do việc sử dụng những ứng dụng chia sẻ tài nguyên mạng như trên đang phát triển, chúng được thi hành như những phục vụ hệ thống chuẩn (quá trình chạy ngầm: daemon) thực hiện giao thức điểm trên một hạ tầng dịch vụ giao vận và trở thành bộ phận của HĐH mạng. -Ngoài ra, hiện có nhiều hướng cải tiến truyền thông trên mạng liên quan đến tính chất lin hoạt, thường được gọi là "tích cực" trong mạng, liên quan đến giao thức (thông điệp tích cực: active massage), liên quan đến môi trường (mạng tích cực: active network) Mặt khác, an ninh mạng đã và đang là một trong những vấn đề cốt lõi nhất hiện nay. 24/249
  27. Sơ lược về hệ điều hành phân tán và hệ tự trị cộng tác Sơ lược về hệ điều hành phân tán HĐH phân tán mới thực sự là một HĐH quản lý tài nguyên máy tính trên phạm vi lãnh thổ lớn. Các máy tính được kết nối lôgic (theo phần mềm) trong HĐH phân tán một cách tương đối chặt chẽ, hệ thống tài nguyên của mỗi máy tính đóng góp thực sự vào hệ thống tài nguyên chung thống nhất và tham gia vào việc giải quyết mỗi bài toán điều phối quá trình, điều phối bộ nhớ, điều phối vào-ra v.v. HĐH phân tán, về lôgic là một hệ thống thống nhất song về vật lý lại được “phân bố” chạy trên nhiều máy tính ở các vị trí khác nhau. Sự phát triển các trạm làm việc mạnh và những tiến bộ của công nghệ truyền thông tạo ra sự cần thiết và hợp lý để mở rộng việc chia xẻ tài nguyên thêm một bước nữa: để bao gồm dạng tổng quát hơn nữa các hoạt động cộng tác giữa một tập hợp gồm các máy tính tự trị, được kết nối bởi một mạng truyền thông. Chia xẻ tài nguyên và cộng tác các hoạt động phân tán kiểu này của môi trường tính toán là những mục tiêu chính trong thiết kế HĐH phân tán và là tiêu điểm chính của tập bài giảng này. Cần xác định những thành phần trong một hệ phân tán kết nối lỏng là cần phân tán hay không tập trung. Tài nguyên vật lý là phân tán vì được thừa hưởng tự nhiên từ hệ kết nối lỏng. Thông tin và nhu cầu thông tin trở nên phân tán do tính tự nhiên của nó hoặc do nhu cầu tổ chức, chẳng hạn về tính hiệu quả và tính an toàn. Hơn nữa, hiệu năng hệ thống cần được nâng cao nhờ tính toán phân tán. Làm thế nào để các tài nguyên và hoạt động phân tán được quản lý và điều khiển là những trách nhiệm căn bản của HĐH phân tán. Nên chăng HĐH phân tán tự nó cũng phân tán ? Lời giải đáp là về đại thể là nên theo cách thức đó chính do tính tự nhien của nó và nhu cầu tổ chức. Điều đó đặt ra vấn đề thi hành phân tán đối với các chức năng quản trị và điều khiển của HĐH phân tán, chính là thiết kế các thuật toán phân tán. Nhu cầu về các thuật toán phân tán trong các HĐH phân tán thúc đẩy việc tích hợp hai chủ thể có quan hệ mật thiết này trong một số tài liệu. Khi cho một HĐH phân tán trên một hệ phân tán, hy vọng có được sự che khuất các chi tiết thi hành của hệ thống đó đối với người dùng. Điều phân biệt mấu chốt giữa HĐH mạng và HĐH phân tán ở chính khái niệm trong suốt. Trong suốt là một khái niệm mới. Trong HĐH tập trung, người sử dụng chia xẻ thời gian có sự trong suốt đồng thời (concurrency transparency) nếu họ không nhận biết thực tế có nhiều người dung fkhác cũng đang chia xẻ cùng một hệ thống. Một chương trình được gọi trong suốt định vị (location transparrency) nếu như bản đồ của chương trình vào trong bộ nhớ vật lý và/ 25/249
  28. hoặc bộ xử lý là bị che khuất. Trong HĐH phân tán khái niệm này còn được mở rộng tới định vị file và đồng thời truy nhập nếu file có thể nằm bất kỳ trên hệ thống lưu trữ và truy nhập nó thông qua đường dẫn lôgic hơn là vật lý. Đối với quá trình phân tán, có thể đạt được phân tán song song và phân tán hiệu năng nếu quá trình có thể được thực hiện trên một bộ xử lý bất kỳ mà không kể sự nhận biết của người dùng và không kể sự khác nhau đáng kể về hiệu năng. Còn nhiều ví dụ nữa và có giới hạn hay không ? Một hệ thống trong suốt hoàn toàn là hợp lý hoặc thậm chí chỉ hy vọng là một câu hỏi còn được bàn luận. Nói chung, tính trong suốt là một cái tốt đẹp cần có và chúng ta vẫn sử dụng nó như mở rộng mấu chốt của HĐH phân tán. Trong các mục trước đây, hệ thống tính toán được mô tả như một hệ thống trừu tượng bao gồm các quá trình và các file. Cần bổ sung các thuật toán (chính xác hơn là các thuật toán điều khiển phân tán) mà quản lý sự thực hiện các quá trình trên các file trong hệ phân tán. Như vậy, HĐH phân tán bao gồm ba thành phần chính: điều phối các quá trình phân tán, quản trị các tài nguyên phân tán và thi hành các thuật toán phân tán. Tại mỗi nút trong hệ phân tán, giả thiết rằng tồn tại những môđun thực hiện việc quản trị tài nguyên địa phương. Một số HĐH phân tán điển hình như AMAEBA, MACH, CHORUS, DCE được giới thiệu trong [8]. Sơ lược về hệ tự trị cộng tác HĐH tự trị cộng tác cho một cách thức linh hoạt hơn so với HĐH phân tán. Các máy tính thành viên vừa được phép tham gia kết nối vào toàn bộ hệ thống lại vừa được phép chạy một cách độc lập. Khi tham gia vào hệ thống, tài nguyên của máy tính thành viên được toàn bộ hệ thống sử dụng (gần như theo cách thức của HĐH phân tán) còn khi máy thành viên chạy độc lập thì nó độc quyền sử dụng tài nguyên riêng. Về thực chất, trong hệ tự trị cộng tác, tính "tự trị" của máy thành viên được chú trọng hơn so với tính thống nhất lôgic của toàn bộ hệ thống. Như vậy, nếu chỉ cần duy trì tính trong suốt ở một mức độ nào đó và hủy bỏ về cái nhìn của một hệ thống nhất lôgic của hệ đa máy tính, nhận được cách nhìn khác nhau hoàn toàn của một hệ (phần cứng và phần mềm) lỏng lẻo thuần túy. Mỗi người dùng hoặc quá trình thao tác tự trị bằng cách cung cấp các dịch vụ của mình và yêu cầu các dịch vụ từ nơi khác. Nhóm các hành động có thể được điều phối bằng việc trao đổi dịch vụ và yêu cầu. Dịch vụ mức cao có thể được cung cấp bằng cách giải quyết chúng từ những dịch vụ ở mức thấp hơn. Mọi hệ thống phần mềm có thể được định danh một cách thoải mái bằng cách tích hợp nhiều dịch vụ với sự thoả thuận nào đó theo cấu trúc. Đây là cách tiệm cận đã bắt chước cách ứng xử trong xã hội loài người: ứng xử trong hệ thống máy tính làm theo cách ứng xử trong xã hội loài người phức tạp. Đây là cách nhìn của hệ tự trị cộng tác. 26/249
  29. Hình 1.8 minh họa một số khác biệt cơ bản giữa HĐH phân tán với hệ tự trị công tác. Hệ phân tán được đặc trưng bằng phân tích dịch vụ trong khi hệ tự trị cộng tác lại nhấn mạnh việc tích hợp dịch vụ. Hệ tự trị cộng tác là hệ thống phần mềm định hướng dịch vụ mức cao đòi hỏi hỗ trợ cơ chế truyền thông trên đó các giao thức truyền thông mức cai đã được xây dựng. Lấy ví dụ hình ảnh cách thức giao dịch bất động sản có thể được thực hiện trong một hệ tự trị cộng tác. Người mua nhà, là một quá trình khách, có thể tạo ra một yêu cầu tới hoặc trực tiếp tới chủ ngôi nhà hoặc gián tiếp tới đại lý bất động sản (cả hai đều là quá trình phục vụ). Chủ ngôi nhà là quá trình khách tới người môi giới. Người môi giới có thể từ một đại lý bất động sản, một phục vụ lớn hơn có thể chỉ dẫn cho người mua nhà một môi giới giành riêng. Người bán là khách tới đại lý bất động sản giống như một khách tới người môi giới. Người mua có thể định vị được đại lý bất động sản nhờ xem thông tin trên Trang vàng, đã được biết đến như một quá trình phục vụ trực tiếp. Nếu ngôi nhà được chủ của nó bán trực tiếp thì người chủ có thể quảng cáo tại đâu đó nhờ quá trình phục vụ với địa chỉ đã biết. Hình 1.9 trình bày một loạt các quan hệ Client/Server của một ứng dụng hệ tự trị cộng tác. Phục vụ kiểu Trang vàng và đại lý bất động sản cung cấp dịch vụ môi giới hoặc thương mại như những dịch vụ định vị. Khái niệm mấu chốt của hệ tự trị cộng tác là tích hợp các dịch vụ thành dạng hoạt động cộng tác. Cả phần cứng và phàn mềm là tách rời và không tập trung hoàn toàn. Tư tưởng của hệ tự trị không tập trung hình như gượng gạo. Tuy nhiên, một mở rộng đơn giản có khái niệm Làm việc cộng tác được hỗ trợ bằng máy tính (Computer 27/249
  30. Supported Cooperative Work: CSCW). CSCW là một khung nhằm hỗ trợ phần mềm nhóm (groupware), một ứng dụng phần mềm lớn mà bao gồm các người dùng cộng tác và tài nguyên phân tán dọc theo một mạng hỗn tạp. Một ví dụ là hội thảo phân tán, trong đó cuộc mit tinh điện tử trong một mạng vật lý phân tán có thể được tổ chức. Trái ngược với triết lý máy tính đơn được chỉ cho người dùng và tài nguyên có thể thiết kế và quản trị, là sự nhận biết rõ ràng sự tồn tại đa máy tính. Người dùng, từ mạng logic của họ với mụctiêu riêng và được sẵn sàng cho điều khiển truy nhập và bảo vệ của nhóm. Hệ cộng tác không tập trung là hệ thống cungg cấp những dịch vụ chuẩn cho phép tích hợp các dịch vụ cộng tác mức cao trong một hệ thống mạng lớn. Với số lượng rất lớn đã lên phương án về mạng và con người, đây là sự tiến hóa tự nhiên của HĐH mạng và HĐH phân tán. Nhu cầu trộn các ứng dụng hệ tự trị cộng tác có thể bùng phát một số cố gắng chuẩn hóa cho việc phát triển tương lai của phần mềm phân tán, đáng chú ý là Quá trình phân tán mở (Open Distributed Processing: ODP) và Kiến trúc môi giới yêu cầu đối tượng chung (Common Object Request Broker Architeturre: CORBA). ODP là khung hệ thống công cộng hõ trợ phân tán, liên thao tác và khả chuyển đối với các xử lý phân tán hõn tạp cả bên trong và dọc theo tổ chức tự trị. CORBA ccung cho cùng triết lý và sử dụng mô hình hướng đối tượng để thi hành yêu cầu dịch vụ trong suốt dọc theo một hệ thống phân tán đa đối tượng hỗn tạp liên kết nối. Cả ODP và CORBA dùng dịch vụ thông minh trader hoặc broker làm thuận tiện liên tương tác trong hệ tự trị cọng tác. Trang vàng và đại lý bất động sản như những thương nhân. Chúng có thể được nhìn như tuyến phần mềm liên kết quá trình khách và phục vụ và chúng phục vụ như một phần mềm lớp giữa (middleware) hỗ trợ các ứng dụng cộng tác phân tán. -Đồng thời với tiến trình phát triển trên đây của các HĐH, việc nghiên cứu về các hệ thống xử lý song song cũng được phát triển. Tương ứng với các mô hình song song trên các hệ thống tập trung SIMD, MISD, MIMD là các mô hình SPMD (Single Program 28/249
  31. Multiple Data), MPSD, MPSD trong đó đối tượng thực hiện song song là chương trình thay cho chỉ thị (instruction). Một hướng nghiên cứu thời sự hiện nay là mô hình tính toán cụm (Cluster Computing) trong đó việc song song hóa một cách hiệu quả là mục tiêu của các mô hình như vậy. Trong các mô hình tính toán song song thì cách thức SPMD là điển hình nhất. Tính toán song song trên mạng các máy tính cá nhân, khai thác công suất dư thừa của các máy tính cá nhân trong mạng cũng là hướng đang được đặc biệt chú ý, theo đó tìm cách "tổ hợp sức mạnh" các máy tính cá nhân trong mạng thành "siêu máy tính ảo" (có người còn gọi là "siêu máy tính con nhà nghèo). Cách thức nói trên liên quan đến việc tạo dựng "cụm máy tính cá nhân" (PC-cluster) bằng một hệ thống phần mềm (thuộc dạng middleware) với tên gọi là phần mềm PC-cluster. Hiện tại có hai lớp phần mềm PC- cluster miễn phí điển hình là PVM (Parallel Vitural Machine) và MPI (Message Passing Interface). Tính đến thời điểm năm 2002, một số hệ thống PC-cluster đã được cài đặt thử nghiệm tại một số cơ quan trong nước (trong đó có khoa Công nghệ, ĐHQGHN) song hiệu quả thực sự của chúng hiện vẫn còn ở mức rất khiêm tốn. Vấn đề thiết kế và nghiên cứu đối với HĐH tập trung (truyền thống), hoạt động trong một hệ thống có một hoặc nhiều bộ xử lý, đã được nghiên cứu tương đối dầy đủ. Tuy nhiên, với việc phát triển nhanh chóng các trạm làm việc cá nhân và mạng cục bộ dẫn đến sự phát triển nhanh chóng các khái niệm HĐH mới, là HĐH mạng và HĐH phân tán (một số tác giả, đặc biệt là các tác giả Việt kiều, dùng thuật ngữ "phân bố" thay cho thuật ngữ "phân tán" được dùng trong tài liệu này). Vấn đề quan hệ đến mạng và HĐH phân tán là mục tiêu nghiên cứu của giáo trình này. Một vấn đề khác nổi lên là phát triển các hệ thống tự động cộng tác, trong đó nhấn mạnh việc thiết kế các thuật toán phân tán trong một môi trường hệ thống mở. Một hệ thống mở liên quan đến tính mềm dẻo một cách toàn vẹn và che khuất đi sự hỗn tạp các thành phần nhằm hỗ trợ việc cộng tác nhiều cấp tại mức ứng dụng. Khái niệm này là rộng lớn hơn so với HĐH theo nghĩa truyền thống. Thuật toán phân tán Việc thiết kế các thuật toán phân tán, được đòi hỏi nhằm hỗ trợ việc thi hành dịch vụ HĐH phân tán để điều phối sự thực hiện của các quá trình đồng thời có vai trò quan trọng trong nghiên cứu về HĐH phân tán. Các thuật toán thường được chỉ dẫn như các giao thức do chức năng của chúng là chủ yếu thiết lập lệnh hoặc quy tắc đối với sự hạn chế của hệ phân tán là thiếu những thông tin trạng thái hệ thống toàn cục. Mỗi quá trình có nhận thức khác nhau của hệ thống do sự thiếu vắng bộ nhớ chia xẻ và độ trễ truyền thông đáng kế giữa các quá trình. Cái nhien của họ về hệ thống thường là không đầy đủ và không mạch lạc. Phần tử bản chất nhất của thông tin toàn cục là thông tin thời gian toàn cục cỡ hệ thống, thường được chỉ dẫn như một đồng hồ toàn cục. Về mặt lý thuyết, không thể đạt được nhằm đạt được một đồng hồ toàn cục thậm chí trong hệ phân tán có 29/249
  32. một đồng hồ trung tâm chung. Bỏ qua thông tin thời gian toàn cục, sự thúc ép sự sắp xếp sự xuất hiện các sự kiện trở thành một bài toán không tầm thường. Việc xấp xỉ đồng hồ toàn cục với sự thứ lỗi thời gian nào đó và cơ chế thực hiện thứ tự sự kiện đúng đắn không cần sử dụng thông tin đồng hồ toàn cục bắt buộc phải được phát triển. Nhiều thi hành của các chức năng điều khiển mức cao chẳng hạn ĐBQT và TTQT dựa vào sự thứ lỗi (fault tolerance) thời gian và cơ chế sắp xếp sự kiện này. Độ trễ truyền thông tạo ra khó khăn lớn để đạt được thỏa thuận về trạng thái hệ thống, bản chất của các hoạt động phân tán cộng tác. Bổ sung tới tính phức tạp do độ trễ truyền thông, thiết kế thuật toán phân tán là phức tạp hơn bởi vì nguồn lỗi và không tin cậy là phổ biến hơn trong hệ phân tán so với hệ tập trung. Thứ lỗi trong hệ phân tán là vấn đề khó tính hơn đối với các thuật toán phân tán. Bản chất là hệ thống bao gói nhiều kiểu của lỗi. Thậm chí nhiều thuật toán tập trung để ĐBQT, lập lịch, và điều khiển đồng thời buộc phải được xem xét kỹ lưỡng để dùng trong hệ phân tán. Thuật toán có thể được phân thành hai lớp: thuật toán không tập trung đầy đủ và thuật toán phân tán với một điều phối tập trung thứ lỗi. Loại thứ hai đơn giản hơn theo khái niệm cung cấp những cơ chế hiệu quả tồn tại nhằm kiểm soát lỗi của điều khiển tập trung và chọn những chỉ đạo mới. Kiến trúc phần cứng của hệ phân tán cũng có vai trò quan trọng trong thi hành các thuật toán phân tán. Các phương pháp truyền thông phụ thuộc vào việc tôpô mạng là kết nối đầy đủ hay không, thông thường hay không thông thường, và truyền dữ liệulà điểm- điểm hay đa điểm. Kiến trúc thậm chí cho phép cả việc thay đổi tôpô, lỗi kết nối và các nút là tồn tại. Về phía phần mềm dữ liệu thường được nhân bản nhằm cho phép truy nhập đồng thời và đạt được độ tin cậy cao hơn. Nhân bản dữ liêu lại đưa đến vấn đề tính chặt chẽ của dữ liệu. Quản lý nhân bản dữ liệu trở thành một vấn đề cũng khó tính trong thiết kế hệ phân tán. Dưới đây là một danh sách tổng quát các thuật toán phân tán khi lưu tâm tới những vấn đề đáng kể của hệ phân tán được tóm tắt từ những điều mô tả trên. -Chuyển thông điệp Hệ quả của việc không có bộ nhớ chia xẻ ngụ ý rằng điều phối giữa các quá trình đồng thời bắt buộc phải thực hiện bằng CTĐ. Như vậy, thuật toán đồng bộ và nắm giữ bế tắc cần được thiết kế lại trong môi trường phân tán. Thuật toán phân tán có thể không tập trung hoàn toàn hoặc tập trung. Trong thuật toán tập trung, thuật toán bầu cử phân tán thường được đòi hỏi để thiết lập và duy trì điều khiển tập trung. -Sự thiếu thông tin toàn cục. Hiệu lực của thuật toán phân tán phụ thuộc vào tri thức của nó về trạng thái của hệ thống. Do không hợp lý nếu đưa ra thông tin trạng thái toàn cục do độ trễ mạng và các thành phần trong hệ thống không tin cậy, tương tác giữa các quá trình bắt buộc phải dựa trên sự nhất trí nhận được từ một vài giao thức thỏa thuận nào đó. Giao thức thoả thuận tự nó là thuật toán phân tán. 30/249
  33. -Nhân bản dữ liệu. Quản lý nhân bản dữ liệu là chức năng cơ sở của hệ thống file và cơ sở dữ liệu phân tán. Mục tiêu căn bản của giao thức là duy trì tính nhất quán (consistency). Vấn đề tương đương lôgic cần đến tán phát tin cậy (reliable broadcast). Tập các dữ liệu được nhân bản là tương tự như một nhóm thành viên được tán phát. Vấn đề này kéo theo trong HĐH hoặc CSDL cũng được nhìn nhận. -Lỗi và khôi phục. Độ tin cậy của hệ thống có thể được nâng cao theo nghĩa thứ lỗi hoặc khôi phục tiếp sau lỗi. Tiếp cận thứ lỗi sử dụng giải pháp dư thừa hoặc đa phục vụ. Khôi phục là cách tiếp cận sẵn có trong đó trạng thái của hệ thống là được duy trì và được dùng để thực hiện lại từ điểm kiểm tra ngay trước. Thuật toán khôi phục giải quyết với việc đăng nhập vào trạng thái hệ thống, các điểm kiểm tra và nắm giữ các quá trình và thông điệp cô lập. Câu hỏi và bài tập 1. Trình bày khái niệm và hai chức năng cơ bản của hệ điều hành. 2. Trình bày sơ lược về quá trình tiến hóa của hệ điều hành, những nét đặc trưng nhất của mỗi lớp hệ điều hành. Nhận xét về quá trình tiến hóa đó. 3. Trình bày những bài toán điều khiển chủ yếu nhất của hệ điều hành truyền thống và sơ bộ về một số giải pháp giải quyết mỗi bài toán đó. 4. Khái niệm vi nhân và sơ bộ về giải pháp vi nhân. 5. Tính mở và tính khả chuyển của hệ điều hành. Sơ bộ về giải pháp thi hành tính mở và tính khả chuyển. 31/249
  34. Khái niệm và kiến trúc hệ phân tán Giới thiệu Như đã được trình bày trong chương trước, HĐH hiện đại thường tập trung vào chức năng máy tính ảo, nhấn mạnh mức dịch vụ hệ thống và vì vậy thuận tiện hơn quan niệm HĐH phân tán như một bộ tích hợp các dịch vụ hệ thống cho phép trình diễn cái nhìn trong suốt tới hệ thống máy tính với tài nguyên và điều khiển phân tán (đặt tại nhiều vị trí địa lý khác nhau). Có thể nói HĐH phân tán là HĐH kết nối chặt về phần mềm trên nền tảng kết nối lỏng về phần cứng. Theo một cách nói khác, HĐH phân tán cung cấp cho người sử dụng cách thức làm việc như với một HĐH tập trung trong điều kiện phân tán cả phần cứng lẫn phần mềm. Một vấn đề đặt ra cho chính khái niệm HĐH phân tán. Tồn tại nhiều cách hiểu về HĐH phân tán, song có rất hiếm tài liệu cho một định nghĩa chính thức về HĐH phân tán. Trong nhiều ngữ cảnh, người ta còn sử dụng khái niệm "hệ phân tán" thay thế cho khái niệm "HĐH phân tán". Chúng ta chấp nhận định nghĩa được đưa ra trong [8]: Hệ phân tán là tổ hợp bao gồm các máy tính độc lập với trình diễn hệ thống như một máy tính đơn trước người dùng. HĐH phân tán được phát triển trên cơ sở một số tiền đề sau đây: -Thứ nhất, do nhu cầu tăng không ngừng việc chia xẻ tài nguyên và thông tin mà các HĐH đã có từ trước không đáp ứng được. Trong quá trình triển khai ứng dụng Tin học vào đời sống, các mạng máy tính được phát triển không ngừng, các tài nguyên của các máy tính trong mạng (phần cứng, phần mềm) ngày càng được mở rộng và nâng cấp, giá trị các tài nguyên này càng tăng nhanh dẫn đến sự tăng trưởng vượt bậc nhu cầu chia xẻ tài nguyên và thông tin trong một hệ thống thống nhất. HĐH tập trung và HĐH mạng thuần túy không đáp ứng được nhu cầu đối với sự tăng trưởng đó. -Tiền đề thứ hai liên quan đến việc giá các trạm làm việc giảm nhanh chóng. Việc giảm giá các trạm làm việc làm cho chúng được sử dụng phổ dụng hơn, số lượng và chất lượng các trạm làm việc cũng tăng không ngừng mà từ đó làm tăng yêu cầu xử lý phân tán. Điều này tạo ra nhiều vị trí có khả năng xử lý và lưu trữ thông tin hơn mà từ đó cần thiết phải phối hợp để chia xẻ tốt hơn tiềm năng lưu trữ và xử lý của các vị trí đó. -Việc sử dụng rộng rãi các mạng 32/249
  35. Trên cơ sở việc kết nối mạng để triển khai HĐH mạng tạo nên một cơ sở kỹ thuật hạ tầng (phần cứng, kết nối mạng, phần mềm) làm nền tảng phát triển HĐH phân tán. -Tính thuần thục về kỹ nghệ phần mềm của các chuyên gia phát triển HĐH. Kinh nghiệm xây dựng HĐH trước đây (HĐH tập trung, HĐH mạng) cho phép nâng cao trình độ để đủ năng lực xây dựng HĐH phân tán. Các mục tiêu thiết kế hệ điều hành phân tán Đặc điểm của hệ phân tán Hệ phân tán có các đặc điểm cơ bản là Tính chia xẻ tài nguyên, Tính mở, Khả năng song song, Tính mở rộng, Khả năng thứ lỗi, Tính trong suốt. Tính chia xẻ tài nguyên Thuật ngữ tài nguyên được dùng để chỉ tất cả mọi thứ có thể được chia xẻ trong hệ phân tán, bao gồm từ các thiết bị phần cứng (Đĩa, máy in ) tới các đối tượng (file, các cửa sổ, CSDL và các đối tượng dữ liệu khác). Trong hệ phân tán, chia xẻ tài nguyên được hiểu là tài nguyên của hệ thống được các QT chia xẻ (sử dụng chung) mà không bị hạn chế bởi tình trạng phân tán tài nguyên theo vị trí địa lý. Việc chia xẻ tài nguyên trên hệ phân tán - trong đó tài nguyên bị lệ thuộc về mặt vật lý với một máy tính nào đó - được thực hiện thông qua truyền thông. Để chia xẻ tài nguyên một cách hiệu quả thì mỗi tài nguyên cần phải được quản lý bởi một chương trình có giao diện truyền thông, các tài nguyên có thể truy nhập, cập nhật được một cách tin cậy và nhất quán. Quản lý tài nguyên ở đây bao gồm lập kế hoạch và dự phòng, đặt tên các lớp tài nguyên, cho phép tài nguyên được truy cập từ nơi khác, ánh xạ tên tài nguyên vào địa chỉ truyền thông Tính mở Tính mở của một hệ thống máy tính là tính dễ dàng mở rộng phần cứng (thiết bị ngoại vi, bộ nhớ, các giao diện truyền thông ) và phần mềm (các mô hình HĐH, các giao thức truyền thông, các dịch vụ chia xẻ tài nguyên ) của nó. Nói một cách khác, tính mở của hệ thống phân tán mang ý nghĩa bao hàm tính dễ dàng cấu hình cả phần cứng lẫn phần mềm của nó. Tính mở của hệ phân tán được thể hiện là hệ thống có thể được tạo nên từ nhiều loại phần cứng và phần mềm của nhiều nhà cung cấp khác nhau với điều kiện các thành phần này phải theo một tiêu chuẩn chung (liên quan đến HĐH là tính đa dạng tài nguyên; liên 33/249
  36. quan đến nhà cung cấp tài nguyên là tính chuẩn). Vai trò của ASP và SPI trong HĐH đã được trình bày trong chương 1. Tính mở của Hệ phân tán được xem xét theo mức độ bổ sung thêm các dịch vụ chia xẻ tài nguyên mà không phá hỏng hay nhân đôi các dịch vụ đang tồn tại. Tính mở được hoàn thiện bằng cách xác định hay phân định rõ các giao diện chính của hệ phân tán và làm cho nó tương thích với các nhà phát triển phần mềm (tức là các giao diện chính của HĐH phân tán cần phổ dụng). Tính mở của HĐH phân tán được thi hành dựa trên việc cung cấp cơ chế truyền thông giữa các QT và công khai các giao diện được dùng để truy cập tài nguyên chung. Khả năng song song Hệ phân tán hoạt động trên một mạng truyền thông có nhiều máy tính, mỗi máy tính có thể có một hoặc nhiều CPU. Trong cùng một thời điểm nếu có từ hai QT trở lên cùng tồn tại, ta nói rằng chúng được thực hiện đồng thời. Việc thực hiện các QT đồng thời theo cơ chế phân chia thời gian (một CPU) hay song song (nhiều CPU). Khả năng làm việc song song trong hệ phân tán được thi hành do hai tình huống: - Nhiều người sử dụng đồng thời đưa ra các lệnh hay tương tác với chương trình ứng dụng (đồng thời xuất hiện nhiều QT khách). - Nhiều QT phục vụ chạy đồng thời, mỗi QT đáp ứng yêu cầu của một trong số các QT Khách. Từ điều kiện đa xử lý, khả năng song song của hệ thống phân tán trở thành một thuộc tính của nó. Khả năng mở rộng Hệ phân tán có khả năng hoạt động tốt và hiệu quả ở nhiều mức khác nhau. Một hệ phân tán nhỏ nhất có thể hoạt động chỉ cần hai trạm làm việc và một phục vụ file. Các hệ lớn có thể bao gồm hàng nghìn máy tính, nhiều phục vụ File và phục vụ máy in Khả năng mở rộng của một hệ phân tán được đặc trưng bởi tính không thay đổi phần mềm hệ thống và phần mềm ứng dụng khi hệ thống được mở rộng. Điều này chỉ đạt ở mức độ nào đó đối với hệ phân tán hiện tại (không thể hoàn toàn như định nghĩa trên). Yêu cầu mở rộng không chỉ là mở rộng về phần cứng hay về mạng trên đó hệ thống bao trùm mà còn cần phải được phân tích, đánh giá trên tất cả các khía cạnh khi thiết kế hệ phân tán. Một ví dụ đơn giản là tình huống tần suất sử dụng một file quá cao xuất hiện như kết quả của việc tăng số người sử dụng trên mạng. Để tránh tình trạng 34/249
  37. tắc nghẽn xảy ra nếu như chỉ có một phục vụ đáp ứng các yêu cầu truy cập file đó, cần nhân bản file đó trên một vài phục vụ và hệ thống được thiết kế sao cho dễ dàng bổ sung phục vụ. Có thể tính đến các giải pháp khác là sử dụng Cache và bản sao dữ liệu. Khả năng thứ lỗi Khả năng thứ lỗi thể hiện việc hệ thống không bị sụp đổ bởi các sự cố do các lỗi thành phần (cả phần cứng lẫn phần mềm) trong một bộ phận nào đó. Việc thiết kế khả năng chịu lỗi của các hệ thống máy tính dựa trên hai giải pháp sau đây: - Dùng khả năng thay thế để đảm bảo việc hoạt động liên tục và hiệu quả. - Dùng các chương trình đảm bảo cơ chế phục hồi dữ liệu khi xảy ra sự cố. Để xây dựng một hệ thống có thể khắc phục sự cố theo cách thứ nhất thì có thể chọn giải pháp nối hai máy tính với nhau để thực hiện cùng một chương trình mà một trong hai máy đó chạy ở chế độ Standby (không tải hay chờ). Giải pháp này khá tốn kém vì phải nhân đôi phần cứng của hệ thống. Giải pháp khác nhằm giảm bớt phí tổn là dùng nhiều phục vụ khác nhau cung cấp các ứng dụng quan trọng để các phục vụ này có thể thay thế nhau khi sự cố xuất hiện. Khi không có sự cố thì các phục vụ chạy bình thường (nghĩa là vẫn phục vụ các yêu cầu của khách). Khi xuất hiện sự cố trên một phục vụ nào đó, các ứng dụng khách tự chuyển hướng sang các phục vụ còn lại. Với cách thứ hai thì phần mềm phục hồi được thiết kế sao cho trạng thái dữ liệu hiện thời (trạng thái trước khi xảy ra sự cố) có thể được khôi phục khi lỗi được phát hiện. Chú ý rằng với cách thức này, một mặt thì cùng một dịch vụ có thể được sẵn sàng trên nhiều máy và mặt khác, trên một máy lại có sẵn một số dịch vụ khác nhau. Hệ phân tán cung cấp khả năng sẵn sàng cao để đối phó với các sai hỏng phần cứng. Khả năng sẵn sàng của hệ thống được đo bằng tỷ lệ thời gian mà hệ thống sẵn sàng làm việc so với thời gian có sự cố. Khi một máy trên mạng sai hỏng thì chỉ có công việc liên quan đến các thành phần sai hỏng bị ảnh hưởng. Người sử dụng có thể chuyển đến một trạm khác nếu máy họ đang sử dụng bị hỏng, một QT phục vụ có thể được khởi động lại trên một máy khác. Tính trong suốt Như đã được trình bày trong chương 1, tính trong suốt là tính chất căn bản của hệ phân tán. Tính trong suốt của hệ phân tán được hiểu như là sự che khuất đi các thành phần riêng biệt của hệ thống máy tính (phần cứng và phần mềm) đối với người sử dụng và những người lập trình ứng dụng. Người sử dụng có quyền truy cập đến dữ liệu đặt tại một điểm dữ liệu ở xa một cách tự động nhờ hệ thống mà không cần biết đến sự phân 35/249
  38. tán của tất cả dữ liệu trên mạng. Hệ thống tạo cho người dùng cảm giác là dữ liệu được coi như đặt tại máy tính cục bộ của mình. Các thể hiện điển hình về tính trong suốt của HĐH phân tán được trình bày trong phần sau. Mục tiêu thiết kế hệ điều hành phân tán Các đặc điểm của hệ phân tán cần được tính đến khi thiết kế HĐH phân tán. Mục tiêu thiết kế HĐH phân tán tương đồng với mục tiêu thiết kế HĐH nói chung và cần được xem xét theo hai góc độ: góc độ của người sử dụng và góc độ của nhà cung cấp HĐH. Trong thiết kế HĐH phân tán, những mục tiêu chung nhất theo cả hai góc độ này là cung cấp một mô hình đơn giản hướng tới một hệ thống hiệu quả (efficient), mềm dẻo (linh hoạt - flexible), nhất quán (consistency), mạnh mẽ (robust). Nội dung của bốn mục tiêu thiết kế này cũng bao gói được phần lớn các tính chất của hệ phân tán mà đã được giới thiệu trong mục trước. Do tính chất "phân tán" vật lý (tài nguyên phân tán, truyền thông mức cao, đa dạng hơn các lỗi thành phần) cho nên HĐH phân tán hoạt động phức tạp hơn, cũng có nghĩa là việc thi hành các mục tiêu trên đây là phức tạp và khó khăn hơn. Tính hiệu quả Tính hiệu quả trở nên phức tạp hơn so với HĐH tập trung do phải tính đến chi phí phải trả cho bài toán truyền thông mà trước đây trong HĐH tập trung đã bỏ qua yếu tố này. Truyền thông CTĐ trong môi trường phân tán địa lý dẫn đến độ trễ tới hàng micro giây, mili giây thậm chí là hàng giây và tạo ra một yếu tố phức tạp trong việc đánh giá mức độ hiệu quả của hệ thống. Nguồn gốc của "độ trễ" là do bổ sung nhiều yếu tố mới vào HĐH phân tán so với HĐH tập trung, đó là độ trễ do nhân bản dữ liệu, độ trễ do tính toán đến tổng phí theo các giao thức truyền thông ở các mức độ khác nhau và sự phân tán tải của hệ thống. Độ trễ do nhân bản dữ liệu là khá rõ ràng và hiển nhiên. Nhân bản dữ liệu là việc tạo thêm các bản sao dữ liệu từ nơi khác tới vị trí xử lý nhằm mục đích tăng tốc độ truy nhập dữ liệu. Tuy nhiên nhân bản dữ liệu cũng đòi hỏi chi phí phải trả gồm thời gian sao dữ liệu và thời gian đảm bảo yếu tố nhất quán của dữ liệu được nhân bản. Không thể đặt ra giải pháp nhằm hạn chế nhân bản dữ liệu. Tuy nhiên, việc truyền thông mức ngôn ngữ hay HĐH nên làm thật hiệu quả và giao thức truyền thông mức mạng nên làm cho thật tốt. Khi lưu ý đến phân bố tải hệ thống thì những vấn đề như hiện tượng thắt cổ chai hoặc tắc nghẽn hoặc trong mạng vật lý hoặc trong thành phần phần mềm bắt buộc phải được địa chỉ hóa. Các ứng dụng (hệ thống hoặc người dùng) có thể tiến thêm một bước là QT phân tán cần được cấu trúc tốt chẳng hạn như tính toán và truyền thông có thể được cân bằng tải và gối lên nhau một cách hợp lý. Một thuật toán lập lịch tối ưu trong HĐH tập trung có thể không trở thành thuật toán tốt khi áp dụng trong HĐH phân 36/249
  39. tán. Việc phân tán các QT sao cho hệ thống được cân bằng: các CPU dùng cho xử lý, các đường truyền thông được phát huy cao nhất có thể có. Hai thông số quan trọng đánh giá hiệu quả hệ phân tán là độ tăng tốc và thông lượng hệ thống. Độ tăng tốc (speedup) được hiểu là thời gian hoàn thiện QT là nhanh hay chậm. Thông lượng (throughput) được hiểu là số QT đồng thời được xử lý tại một thời điểm. Việc nâng cao hai thông số này thông qua việc lập lịch các QT phân tán, chia xẻ tải và hệ thống truyền thông cần được thiết kế tốt. Tính mềm dẻo Theo cách nhìn của người sử dụng, tính mềm dẻo được thể hiện thông qua tính thân thiện của hệ thống, tính tự do của người dùng khi sử dụng hệ thống. Tính thân thiện được hiểu rất rộng như dễ dàng sử dụng giao diện hệ thống, khả năng ánh xạ quá trình tính toán trong không gian bài toán tới hệ thống. Tiếp cận hướng đối tượng là chiến lược phổ biến để hoàn thành mục tiêu này. Tính thân thiện cũng liên kết với các tính chất nhất quán và tính tin cậy. Các hệ thống nhất quán và đáng tin cậy không có những hạn chế vô lý. Nó cần cung cấp môi trường hoạt động thích hợp trong đó các tool và dịch vụ mới dễ dàng được xây dựng. Theo cách nhìn của hệ thống, tính mềm dẻo là năng lực của hệ thống để tiến hóa và di trú. Các tính chất mấu chốt là môđun, co giãn, khả chuyển và liên thao tác. Trong những trường hợp khác, các tính chất này có độ quan trọng riêng trong hệ phân tán do hầu hết các hệ thống sử dụng các thành phần phần cứng và phần mềm hỗn tạp. Một mặt, chúng ta mong muốn có một quyền tự trị địa phương, nhưng mặt khác, chúng ta lại muốn cùng cộng tác thành một hệ liên kết chặt chẽ, và chính điều này đã dẫn đến hạn chế nào đó tới chúng ta. Chính từ hai mong muốn có vẻ đối lập nhau này đưa đến giải pháp dung hòa trong việc giải quyết tính mềm dẻo của hệ phân tán. Tính nhất quán Tính nhất quán trở nên khó khăn hơn khi thi hành trong hệ phân tán: thiếu vắng thông tin toàn cục, tiềm tàng nhân bản và phân hoạch dữ liệu mạnh, khả năng xẩy ra lỗi thành phần, mối liên quan phức tạp các môđun thành phần; tất cả các điều đó đều tham gia vào sự thiếu nhất quán của hệ thống. Theo phương diện người dùng, một hệ thống là nhất quán nếu như có được tính đồng nhất khi sử dụng và ứng xử hệ thống có thể khẳng định trước. Hơn nữa, hệ thống phải đủ năng lực duy trì tình trạng toàn vẹn nhờ cơ chế điều khiển đồng thời chính xác và các thủ tục kiểm soát lỗi và khôi phục. Điều khiển nhất quán trong dữ liệu và file (hoặc CSDL trong hệ thống định hướng giao dịch) là những vấn đề còn được bàn luận trong hệ thống file phân tán. 37/249
  40. Tính mạnh mẽ Bài toán tính mạnh mẽ càng trở nên quan trọng hơn trong hệ thống phân tán: lỗi kết nối truyền thông, lỗi tại nút xử lý và lỗi trong các QT Client/Server là thường xuyên hơn so với hệ thống máy tính tập trung. Quy tắc nào cần được hệ HĐH tuân thủ trong những trường hợp, chẳng hạn như một thông điệp hỏi/đáp bị mất hoặc nút xử lý hoặc phục vụ bị đổ vỡ ? Tính mạnh mẽ về khía cạnh thứ lỗi được hiểu rằng hệ thống đủ năng lực tự khởi động lại tới trạng thái mà tại đó tính toàn vẹn của hệ thống đã được bảo quản mà chỉ với một độ giảm sút hiệu năng một cách hợp lý. Để có tính mạnh mẽ, hệ thống nên được trang bị cơ chế kiểm soát được tình huống khác thường (thậm chí chưa phải là lỗi rõ ràng) và lỗi, chẳng hạn như thay đổi tôpô hệ thống, độ trễ thông điệp lớn, hoặc sự bất lực khi định vị phục vụ. Tính mạnh mẽ cũng nên được mở rộng để phủ được khía cạnh an toàn đối với người dùng và hệ thống. Tính tin cậy, bảo vệ và điều khiển truy nhập là trách nhiệm của HĐH phân tán. 38/249
  41. Tính trong suốt trong hệ phân tán và các dịch vụ Tính trong suốt trong hệ phân tán Tính chất mấu chốt nhất phân biệt hệ phân tán với các hệ thống khác là tính trong suốt, thuật ngữ thường xuyên được nhắc trong các hệ thống phân tán. Nó là mục tiêu thúc đẩy việc che khuất đi những chi tiết phụ thuộc hệ thống mà không thích hợp đối với người dùng trong mọi hoàn cảnh và tạo ra một môi trường thuần nhất cho người dùng. Nguyên lý này đã được thực tế hóa khi thiết kế hệ thống máy tính qua một thời gian dài. Tính trong suốt trở nên quan trọng hơn trong hệ thống phân tán và thực hiện khó khăn hơn chính từ tính hỗn tạp của hệ thống. Sự che khuất thông tin phụ thuộc hệ thống khỏi người dùng dựa trên việc cân bằng giữa tính đơn giản và tính hiệu quả. Một cách đáng tiếc, hai tính chất này là xung đột nhau. Bởi vậy, mong muốn một mục tiêu trong suốt hoàn toàn là không thích hợp. Hệ phân tán tốt là cố gắng đạt được tính trong suốt cao nhất có thể được. Tương tự như khái niệm "ảo" trong HĐH và "trừu tượng" trong ngôn ngữ lập trình, mục tiêu của tính trong suốt là cung cấp một cái nhìn lôgic thống nhất của một hệ thống vật lý hỗn tạp nhờ việc rút gọn hiệu quả việc nhận biết hệ thống vật lý tới cực tiểu (nói riêng, theo khía cạnh chia cắt vật lý của các đối tượng và điều khiển trong hệ thống). -Tính trong suốt thể hiện trong nhiều khía cạnh, dưới đây là một số khía cạnh điển hình nhất: - Trong suốt truy nhập: Truy nhập đối tượng địa phương/toàn cục theo cùng một cách thức. Sự tách rời vật lý của các đối tượng hệ thống được che khuất tới người dùng. - Trong suốt định vị (còn được gọi là trong suốt tên): Người dùng không nhận biết được vị trí của đối tượng. Đối tượng được định vị và chỉ dẫn theo tên lôgic trong một hệ thống thống nhất. - Trong suốt di trú (còn được gọi là độc lập định vị): là tính chất bổ sung vào trong suốt định vị theo nghĩa không những đối tượng được chỉ dẫn bằng tên lôgic mà đối tượng còn được di chuyển tới định vị vật lý khác mà không cần đổi tên. - Trong suốt đồng thời: cho phép chia xẻ đối tượng dùng chung không gặp tranh chấp. Nó tương tự như khái niệm phân chia thời gian theo nghĩa khái quát. 39/249
  42. - Trong suốt nhân bản: đưa ra tính nhất quán của đa thể hiện (hoặc vùng) của file và dữ liệu. Tính chất này quan hệ mật thiết với trong suốt đồng thời song được cụ thể hơn vì file và dữ liệu là loại đối tượng đặc biệt, - Trong suốt song song: cho phép các hoạt động song song mà người dùng không cần biết hoạt động song song đó xẩy ra như thế nào, ở đâu và khi nào. Tính song song có thể không được người dùng đặc tả. - Trong suốt lỗi: cung cấp khả năng thứ lỗi của hệ thống được hiểu là lỗi trong hệ thống có thể được biến đổi thành sự giảm hiệu năng hệ thống một cách mềm dẻo hơn chứ không phải chỉ là làm cực tiểu sự đổ vỡ và nguy hiểm đối với người dùng, - Trong suốt hiệu năng: cố gắng giành được tính nhất quán và khẳng định (không cần thiết ngang bằng) mức độ hiệu năng thậm chí khi thay đổi cấu trúc hệ thống hoặc phân bố tải. Hơn nữa, người dùng không phải chịu sự chậm trễ hoặc thay đổi quá mức khi thao tác từ xa. Trong suốt hiệu năng còn được thể hiện là hiệu năng hệ thống không bị giảm theo thời gian. - Trong suốt kích thước: liên quan đến tính mềm dẻo và tiềm tàng. Nó cho phép sự tăng trưởng của hệ thống được che khuất đối với người sử dụng. Kích thước hệ thống không tạo ra tác động đối với nhận thức của người dùng. - Trong suốt duyệt lại chỉ dẫn rằng sự tăng trưởng hệ thống theo chiều dọc là tỷ lệ nghịch với sự tăng trưởng hệ thống theo chiều ngang. Sự duyệt lại phần mềm bị che khuất đối với người dùng. Trong suốt duyệt lại cũng được hiểu như trong suốt phân đoạn. -Sau đây là một ví dụ giải thích. Trước đây khi điện thoại còn chưa phổ biến (điện thoại liên tỉnh hiếm hoặc rất đắt), dùng điện thoại nếu khoảng cách ngắn còn dùng thư nếu ở xa để liên lạc với người quen. Trường hợp này vi phạm tính trong suốt truy nhập do phương pháp liên lạc là không đồng nhất. Khi điện thoại liên tỉnh phát triển, giá cả giảm, nếu dùng điện thoại cố định thì liên lạc số điện thoại nội tỉnh khác với liên lạc với số điện thoại tỉnh ngoài (chẳng hạn, bổ sung thêm mã tỉnh). Trường hợp này vi phạm trong suốt định vị. Nếu một người chuyển chỗ ở phải thay số điện thoại mới (không thể dùng số điện thoại cũ) là vi phạm tính trong suốt di trú. Một phương pháp liên lạc lý tưởng là trên phạm vi toàn hệ thống, có thể "gặp" đối tượng bất kỳ chỉ bởi tên toàn cục (ký hiệu hoặc số) chẳng hạn như số chứng minh nhân dân. Tiếp tục các ví dụ trên đây, nếu mọi người chỉ sử dụng điện thoại di động để liên lạc với nhau thì hệ thống như vậy được coi là thỏa mãn các tính chất trong suốt truy nhập, định vị và di trú. Từ phân tích trên đây, nhận thấy rằng trong suốt truy nhập, định vị, và di trú có quan hệ gần gũi nhau. 40/249
  43. Trong suốt song song, đồng thời, và hiệu năng được thiết kế nhằm che chắn sự quản lý các hoạt động đồng thời đối với các người dùng, dựa trên các quan hệ nội tại người dùng (intrauser), liên người dùng (interuser) và liên nút (internode). Cho phép thực hiện đồng thời ở các mức thực hiện khác nhau: nội tại một người dùng, giữa các người dùng, và giữa các nút phân tán. Trong suốt nhân bản và trong suốt lỗi có quan hệ với việc duy trì tính toàn vẹn hệ thống. Trong suốt kích thước và trong suốt duyệt lại cung cấp sự biến đổi uyển chuyển của hệ thống theo sự tăng trưởng về phần cứng và phần mềm. Danh sách trong suốt được mô tả trên đây không phải là toàn diện. Tuy nhiên, danh sách này thích hợp với hệ phân tán. Chúng cũng được phân lớp khi xem xét mối quan hệ với các mục tiêu thiết kế hệ điều hành. Trong suốt đồng thời và hiệu quả cung cấp tính hiệu quả. Trong suốt truy nhập, định vị, di trú và kích thước liên quan đến tính mềm dẻo. Tính nhất quán liên quan tới trong suốt truy nhập, nhân bản và trong suốt hiệu năng. Cuối cùng, các trong suốt lỗi, nhân bản, và kích thước liên quan tới tính mạnh mẽ của hệ thống. Bảng 2.1 cho mối liên hệ giữa mục tiêu của hệ thống với tính trong suốt. Bảng 2.1 . Phân lớp các tính trong suốt theo mục tiêu hệ thống Mục tiêu của hệ thống Tính trong suốt Hiệu quả đồng thời / song song / hiệu năng Mềm dẻo truy nhập / định vị / di trú / kích thước / duyệt lại Bền vững truy nhập / nhân bản / hiệu năng Mạnh mẽ thứ lỗi / nhân bản / kích thước / duyệt lại Thi hành HĐH phân tán và các thuật toán điều khiển phân tán tương ứng liên quan chạt chẽ tới việc thực hiện các tính trong suốt này. Nói tóm lại, hệ phân tán cung cấp sự tách rời vật lý của các đối tượng, tính trong suốt được dùng để che khuất đi tác động của sự chia tách vật lý này. Kết quả cuối cùng là người dùng nhìn hệ đa máy tính như một hệ máy tính đơn lôgic. Bàn luận trên đây về tính trong suốt dựa trên các tính chất của hệ thống đáng mong muốn theo quan điểm của cả người dùng lẫn hệ thống. Các bài toán chính trong HĐH phân tán cũng được phân lớp theo tính trong suốt và được trình bày trong bảng 2.2. Nói tóm lại, mục tiêu của HĐH phân tán là cung cấp môi trường tính toán hiệu năng cao và mạnh mẽ với việc nhận biết ít nhất về quản lý và điều khiển của các tài nguyên hệ thống phân tán. Bảng 2.2. Vấn đề của hệ phân tán và tính trong suốt Vấn đề chính của hệ thống Tính trong suốt 41/249
  44. Trong suốt liên thao tác và điều Truyền thôngĐồng bộThuật toán phân tán khiển Lập lịch quá trìnhNắm giữ bế tắcCân bằng tải Trong suốt hiệu năng Lập lịch tài nguyênChia xẻ fileĐiều khiển đồng Trong suốt tài nguyên thời Kiểm soát lỗiCấu hìnhThu gọn Trong suốt lỗi Các dịch vụ HĐH được coi là "nhà" cung cấp dịch vụ và để thiết kế hiệu quả các dịch vụ này thì chúng nên được tổ chức và xây dựng theo phân cấp. Như vậy, dịch vụ được tạo nên từ các dịch vụ đã có và chúng ta nhận được một cấu trúc nhiều mức dịch vụ: dịch vụ nguyên thủy, dịch vụ từ phục vụ hệ thống và dịch vụ gia tăng giá trị. Dịch vụ nguyên thủy Dịch vụ nguyên thủy là mức thấp nhất trong hệ thống các mức dịch vụ, chúng là những dịch vụ cơ bản nhất, chúng tồn tại trong nhân của HĐH mỗi nút trong hệ thống. Dịch vụ nguyên thủy, bắt buộc phải được đưa vào nhân của HĐH: điều này tương ứng với cách tiệm cận "nhân tối thiểu" (vi nhân) của HĐH tập trung. Ba dịch vụ (chức năng) cơ bản mà nhân buộc phải cung cấp được định danh như sau: - Dịch vụ truyền thông: Trong hệ phân tán, truyền thông giữa các QT được thực hiện nhờ CTĐ, một tập các dịch vụ nguyên thủy gửi và nhận buộc phải được xác định và thi hành. Các dịch vụ nguyên thủy này truyền tin theo kênh lôgic. - Gửi và nhận có thể đồng bộ hoặc dị bộ. Truyền thông đồng bộ thêm vào phục vụ mục đích truyền thông, được phát triển từ đồng bộ truyền thông liên QT (tại một nút) nhằm giúp ích cho truyền thông liên nút. Nếu CTĐ chỉ theo nghĩa tương tác QT, đồng bộ QT phải dựa vào truyền thông hoặc chính ngữ nghĩa đồng bộ của truyền thông hoặc bởi các phục vụ đồng bộ nào đó dựa trên CTĐ. Trước hết cần có các dịch vụ nguyên thủy đồng bộ (syschronous primitive), còn được gọi là dịch vụ kết khối (blocking primitive). Đối ngẫu với chúng là nguyên thủy dị bộ (asyschronous primitive) hay dịch vụ không kết khối (nonblocking primitive). Ngoài ra còn có các cặp dịch vụ nguyên thủy buffer (buffered primitive/ unbuffered primitive) và cặp các dịch vụ nguyên thủy tin cậy (reliable primitive/ unreliable primitive). - Vì yêu cầu che đậy sự phụ thuộc vật lý trong hệ phân tán, mô tả bộ xử lý đa thành phần như là một phục vụ QT là phù hợp hơn. Dịch vụ QT quản lý việc phát sinh, loại bỏ và điều chỉnh các QT bằng cách định vị các tài nguyên cần thiết, chẳng hạn như bộ nhớ và 42/249
  45. thời gian xử lý. Việc giải đáp vấn đề bộ xử lý là cục bộ hay từ xa, yêu cầu bao nhiêu bộ xử lý rỗi tới các QT là trong suốt. Phục vụ QT tương tác với các phục vụ QT khác thông qua truyền thông từ xa và đồng bộ. Dịch vụ từ phục vụ hệ thống Có rất nhiều dịch vụ tuy rất cần thiết song không bắt buộc phải đưa vào nhân, các dịch vụ này được các phục vụ hệ thống cung cấp. Dưới đây là một số dịch vụ điển hình nhất được liệt kê theo mức độ quan hệ với hệ thống phân tán. Chức năng che giấu đối tượng vật lý bằng tên lôgic đòi hỏi tồn tại cơ chế ánh xạ tên lôgic thành đối tượng vật lý. Địa chỉ của một QT hay định vị một file có thể thu được theo cách ad-hoc (không dự tính trước), nhưng nói chung là qua xem xét của phục vụ tên hoặc phục vụ thư mục. Phục vụ tên thường được dùng để định vị (định danh) người dùng, QT, hoặc máy còn phục vụ thư mục thường được dùng để liên kết với file hoặc cổng truyền thông. Nếu không thể định vị được phục vụ thì phục vụ là vô dụng vì vậy mọi phục vụ cần được định vị bởi dịch vụ tên. Như vậy phục vụ tên là phục vụ thiết yếu nhất trong hệ phân tán. Việc thu được địa chỉ và định vị từ phục vụ tên phụ thuộc hệ thống và buộc phải được giải thích thành đường truyền thông trước khi đối tượng được truy nhập. Các dịch vụ giải thích này, gồm chọn đường đi và chọn lộ trình thực sự của thông tin, là các dịch vụ được cung cấp bởi phục vụ mạng. Phục vụ mạng được trong suốt theo mức độ HĐH. Việc truyền phát TĐ trong mạng mà chưa dùng đến khả năng hỗ trợ hiệu quả của phần cứng cần tới một phục vụ truyền phát hay phục vụ khuyếch tán trong HĐH. Phục vụ quan trọng tiếp theo là phục vụ thời gian. Đồng hồ (tổng quát hơn là bộ thời gian) được dùng để đồng bộ và lập lịch các hoạt động phần cứng và phần mềm trong mọi hệ thống máy tính. Về mặt lý thuyết thì không thể đưa vào hay chấp nhận một thông tin đồng hồ tổng thể tuyệt đối. Thậm chí có tồn tại một đồng hồ trung tâm (kiểu thời gian Greenwich) thì độ lệch thời gian vẫn xuất hiện do độ trễ khi tiếp nhận và ghi thông tin thời gian. Trong hệ phân tán, độ lệch này càng lớn do độ lệch truyền thông giữa các QT dài hơn. Tại nức HĐH, có hai kiểu sử dụng thông tin thời gian điển hình để đồng bộ các QT: (1) đòi hỏi một xấp xỉ gần gũi thời gian (chẳng hạn thời đoạn CPU phục vụ một QT) với đồng hồ thời gian thực và (2) sử dụng đồng hồ thời gian nhân tạo nhằm duy trì quan hệ nhân quả thứ tự sự kiện (sự kiện nào xuất hiện trước trong hai sự kiện). Tương ứng, chúng được gọi là đồng hồ vật lý và đồng hồ lôgic. Mục đích dùng đồng hồ vật lý là đảm bảo tính đồng bộ thao tác hoặc đòi hỏi rằng thao tác thực sự được giải quyết tại một thời điểm thời gian thực. Thời gian buộc phải phù hợp nhờ một độ đo thực sự nào đó song việc có gần gũi với thời gian thế giới thực hay không là không quan trọng. Đồng bộ các QT sử dụng đồng hồ lôgic do cần duy trì một thứ tự tổng thể việc xuất hiện 43/249
  46. các sự kiện nhằm tin chắc chắn vào tính đúng đắn về sự phụ thuộc lẫn nhau của các thao tác. Phục vụ thời gian cho đồng hồ vật lý dựa trên việc xấp xỉ tốt nhất đồng hồ thời gian "thực". Giải pháp thực hiện đồng bộ đồng hồ logic là hợp lý và được thực hiện bằng đồng hồ lôgic Lamport xuất hiện trước. Phục vụ tên và phục vụ thời gian là các phục vụ thông tin. Thông thường, còn đòi hỏi thêm các phục vụ hệ thống khác nhằm quản lý tài nguyên hệ thống được chia xẻ. Ví dụ quen thuộc đó là phục vụ file và phục vụ in. Phục vụ file có thể được nhân bản hay tách nếu file không biến đổi. Các phục vụ có thể được cấu trúc thứ bậc, chẳng hạn, phục vụ file có thể chứa các phục vụ con thư mục hoặc an toàn để điều khiển truy nhập và xác nhận quyền; phục vụ QT có thể bổ sung thành một phục vụ di trú với sự cộng tác của phục vụ QT để thuận tiện chuyển QT từ nút này sang nút khác. Trong một hệ thống phân tán rộng lớn mà các QT truyền thông có thể nghi ngại nhau, cần đến một phục vụ xác định tin cậy để xác định định danh quá trình. Phục vụ hệ thống cung cấp những dịch vụ cơ sở để quản lý quá trình, file, truyền thông quá trình. Dịch vụ gia tăng giá trị Dịch vụ gia tăng giá trị là dịch vụ không nhất thiết được thi hành trong hệ thống phân tán nhưng lại rất hữu ích để hỗ trợ các ứng dụng phân tán. Về phía người dùng, sử dụng các ứng dụng phân tán được thúc đẩy không chỉ với mong muốn làm tăng hiệu năng tính toán và tăng việc thứ lỗi mà còn cần được tạo ra các hoạt động cộng tác. Mặt khác, cần quan tâm tới khái niệm nhóm các quá trình tương tác. Nhóm tính toán tựa như một tổ chức xã hội và cần thiết phải được quản lý. Phục vụ nhóm quản lý việc khởi tạo và kết thúc các hoạt động nhóm, bao gồm cả địa chỉ nhóm và truyền thông. Nó thực hiện cả chức năng quản lý thông tin như tính thành viên, chính sách kết nạp và đặc quyền của thành viên. Quyết định của nhóm về việc thu nhận hoặc rời khỏi nhóm được thi hành bởi người lãnh đạo nhóm hoặc sự nhất trí của toàn thể thành viên trong nhóm. Nghi thức nhóm đảm bảo tính chất xác định của nhóm. Cấu trúc nhóm biến động theo các ứng dụng. Ví dụ, nhóm tin trên mạng, nhóm hội thảo phân tán, nhóm soạn thảo đồng thời, nhóm tính toán phân tán trải từ kết nối lỏng đến kết nối rất chặt (tăng dần theo mức độ gắn kết) với các quy tắc chi phối cứng rắn. Khi một ứng dụng nhóm trở thành chuẩn tắc thì nó được trộn vào hệ thống trở thành một dịch vụ mới. Theo nghĩa này, phục vụ hội thảo phân tán, phục vụ soạn thảo đồng thời là cần đưa vào hệ thống. Phục vụ Web là một ví dụ phục vụ giá trị giá tăng chuẩn tắc. 44/249