Hệ điều hành phân tán

Cách tiếp cận khác đầy đủ hơn để đồng bộ hoá là sự truyền token giữa các bộ xử lý. Token đưa ra sự cho phép đồng bộ. Nếu bộ xử lý có được token, nó được phép đi vào phần tới hạn. Token có thể tới tất cả các bộ xử lý gúp phần vào sự đồng bộ hoá trong thưũi gian hợp lý sau khi bộ xử lý yờu cầu token. Một cỏch để đảm bảo token có thể đi tới tất cả các bộ xử lý là đặt cấu trúc vật lý trong cỏc bộ xử lý và yờu cầu token đi theo cấu trúc vật lý. Cấu trỳc vật lý là một ring cú sự lan truyền token. Nếu bộ xử lý giữ token nú được phép đi vào phần tới hạn. Nếu bộ xử lý muốn thường xuyên đi vào phần tới hạn khi token đi tới, token truyền trong ring là một giải thuật đồng bộ. Token có thể đi qua hơn M lần trước khi bộ xử lý đi vào phần tới hạn. Tiếp theo ta cần giải quyết 2 vấn đề để yêu cầu thông qua token như thế nào và để token thông qua bộ xử lý tiếp theo như thế nào để vào phần tới hạn.

51 trang | Chia sẻ: haianh_nguyen | Lượt xem: 1607 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Hệ điều hành phân tán, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

hành, kèm theo tập các tài nguyên phục vụ cho hoạt động của tiến trình. Trong hầu hết các hệ điều hành, mỗi tiến trình có một không gian địa chỉ và chỉ có một dòng xử lý. Tuy nhiên, có nhiều tình huống người sử dụng mong muốn có nhiều dòng xử lý cùng chia sẻ một không gian địa chỉ, và các dòng xử lý này hoạt động song song tương tự như các tiến trình phân biệt (ngoại trừ việc chia sẻ không gian địa chỉ). b. Tiểu tiến trình( threads_Luồng của tiến trình). Trong hầu hết các hệ điều hành, mỗi tiến trình có một không gian địa chỉ và chỉ có một dòng xử lý. Tuy nhiên, có nhiều tình huống người sử dụng mong muốn có nhiều dòng xử lý cùng chia sẻ một không gian địa chỉ, và các dòng xử lý này hoạt động song song tương tự như các tiến trình phân biệt (ngoại trừ việc chia sẻ không gian địa chỉ). Ví dụ : Một server quản lý tập tin thỉnh thoảng phải tự khóa để chờ các thao tác truy xuất đĩa hoàn tất.Nếu server có nhiều dòng xử lý, hệ thống có thể xử lý các yêu cầu mới trong khi một dòng xử lý bị khoá. Như vậy việc thực hiện chương trình sẽ có hiệu quả hơn. Điều này không thể đạt được bằng cách tạo hai tiến trình server riêng biệt vì cần phải chia sẻ cùng một vùng đệm, do vậy bắt buộc phải chia sẻ không gian địa chỉ. Chính vì các tình huống tương tự, người ta cần có một cơ chế xử lý mới cho phép có nhiều dòng xử lý trong cùng một tiến trình. Ngày nay đã có nhiều hệ điều hành cung cấp một cơ chế như thế và gọi là tiểu trình (threads). c. Nguyên lý chung : Một tiểu trình là một đơn vị xử lý cơ bản trong hệ thốn. Mỗi tiểu trình xử lý tuần tự đoạn code của nó, sỡ hữu một con trỏ lệnh, tập các thanh ghi và một vùng nhớ stack riêng. Các tiểu trình chia sẻ CPU với nhau giống như cách chia sẻ giữa các tiến trình: một tiểu trình xử lý trong khi các tiểu trình khác chờ đến lượtù. Một tiểu trình cũng có thể tạo lập các tiến trình con, và nhận các trạng thái khác nhau như một tiến trình thật sự. Một tiến trình có thể sỡ hữu nhiều tiểu trình. Các tiến trình tạo thành những thực thể độc lập. Mỗi tiến trình có một tập tài nguyên và một môi trường riêng (một con trỏ lệnh, một Stack, các thanh ghi và không gian địa chỉ ). Các tiến trình hoàn toàn độc lập với nhau, chỉ có thể liên lạc thông qua các cơ chế thông tin giữa các tiến trình mà hệ điều hành cung cấp. Ngược lại, các tiểu trình trong cùng một tiến trình lại chia sẻ một không gian địa chỉ chung, điều này có nghĩa là các tiểu trình có thể chia sẻ các biến toàn cục của tiến trình. Một tiểu trình có thể truy xuất đến cả các stack của những tiểu trình khác trong cùng tiến trình. Cấu trúc này không đề nghị một cơ chế bảo vệ nào, và điều này cũng không thật cần thiết vì các tiểu trình trong cùng một tiến trình thuộc về cùng một sỡ hữu chủ đã tạo ra chúng trong ý định cho phép chúng hợp tác với nhau. Hình 2.4 Các tiểu trình trong cùng một tiểu trình d. Phân bổ thông tin lưu trữ. Hình 2.5 Cấu trúc mô tả tiến trình và tiểu trình Trong một số trường hợp tiểu tiến trình có thẻ gọi là “lightweight” của tiến trình. Đó là do hệ điều hành sẽ chỉ biết đến khái niệm tiến trình, do vậy cận có cơ chế để liên kết các tiểu trình cùng một tiến trình với tiến trình cha trong kernel_ đối tượng này đôi lúc được gọi là LWP (lightweight process). Hình 2.6 Tiểu tiển trình là một “lightweight proccess” 4. Các vấn đề trong quản lý tiến trình của. a. Sự loại trừ lẫn nhau trong hệ phân tán. Sự loại trừ lẫn nhau trong hệ phân tán xảy ra khi nhiều tiến trình đồng thời thực hiện một sự truy nhập nối tiếp để chia sẻ tài nguyên và dữ liệu ( ví dụ như cập nhật dữ liệu hay gửi các tín hiệu đến các thiết bị vào ra. Vấn đề ở đây là trong các trường hợp đó chúng ta cần phải làm gì để sự tương xảy ra là công bằng theo các tiêu chuẩn cho trước. Trong đó, các tiêu chuẩn này bao gồm: thời gian yêu cầu, thứ tự yêu tiên của yêu cầu hay sự lựa chọn. Chúng ta có một số thuật toán để giải quyết tranh chấp khi xảy ra tương tranh. Người dùng có thể dựa vào đó để có thể lấy quyền ưu tiên. Trong đó có một số phương pháp và dạng xảy ra tương tranh dưới đây: Loại trừ lẫn nhau dựa vào tranh chấp: là sự tranh chấp cho các phần tới hạn có thể quyết định bằng bất cứ tiêu chí vào để phá vỡ các dàng buộc khi các yêu cầu thực hiện xảy ra cùng một thời điểm. Cách tốt nhất cho phép yêu cầu tới các tiến trình được hỏi đầu tiên hoặc tiển trình được dưa ra nhiều nhất từ các tiến trình khác chúng ta sẽ gọi hai cách tiếp cận khác nhau này là các sơ đồ yêu tiên nhãn thời gian và bầu cử. Loại trừ dựa vào việc chuyển Token: Đây là sự tranh chấp dựa vào thuật toán. Cơ chế của thuật toán dựa trên việc cung cấp các Token cho các thành viên xảy ra tranh chấp làm sao đảm bảo chỉ có một Token. Có ba thuật toán chính để phân chia các Token theo kiến trúc mạng là : cấu trúc vòng, cây và quảng bá. b. Lập lịch xử lý hệ điều hành phân tán. Để tạo sự đồng bộ và thuận lợi trong truyền thông, các hệ thống hệ phân tán cần thiết phải có sự hỗ trợ cho việc giải quyết tương tranh của các tiến trình tương tác. Trước khi thực hiện, các tiến trình cần lập lịch và phân phối tài nguyên. Đối tượng được lập lịch chính là để nâng cao toàn bộ hiệu năng hệ thống như thời gian hoàn thành tiến trình và sự tận dụng các bộ xử lý. Sự tồn tại nhiều nút xử lý trong các hệ thống phân tán đưa ra vấn đề thách thức để lập lịc các tiến trình như ccs xử lý và ngược lại. Tiến trình lập lịch phân tán được tổ chức thành hai thành phần: tiến trình lập lịch tĩnh, phân chia và cân bằng tải động. c. Truyền thông liên tiến trình. Trong các hệ điều hành, tương tác giữa các tiến trình và luồng thông tin giữa các đối tượng phụ thuộc vào truyền thông. Tại mức thấp nhất, truyền thông báo chỉ có nghĩa truyền thông trong các hệ phân tán. Truyền thông liên tiến trình có thể được hoàn thành bằng cách dùng truyền thông báo đơn giản. Tuy nhiên, nó muốn có sự trong suốt trong truyền thông bằng cách cung cấp các phương thức truyền thông logic mức cao hơn để che các chi tiết vật lý của việc truyền thông báo. Hai khái niệm quan trọng để thực hiện kết quả này là mô hình khách/chủ (client/server) và gọi thủ tục từ xa (RPC). Mô hình client/server là mô hình lập trình cho các tiến trình cấu trúc trong hệ phân tán. Trong mô hình này, tất cả các tương tác hệ thống được thấy như một cặp thông báo trao đổi trong tiến trình client gửi thông báo yêu cầu tới server và đợi cho server trả lời với thông báo trả lời. Thông báo hỏi đáp (request/repply) trao đổi giữa client và server do vậy có thể được biểu diễn như gọi thủ tục đến server ở xa. Truyền thông gọi thủ tục từ xa (RPC) xây dựng trên mô hình client/server và truyền thông báo cho đã được đưa ra như một kỹ thuật truyền thông liên tiến trình chuẩn cho tất cả các hệ phân tán. c.1 Mô hình RPC. Các tiến trình là các đơn vị xử lý cơ bản trong hệ điều hành. Một tiến trình là một chương trình thực hiện. Một tiến trình là tuần tự nếu chuỗi điều chỉnh hoạt động của nó. Chúng ta dùng thuật ngữ tiến trình tương tranh (concurrent process) để mô tả các tiến trình giả lập tương tác tuần tự. Các tiến trình xảy ra là không đồng bộ và mỗi tiến trình có không gian địa chỉ logic của chính nó. Giữa hai tiến trình, một số thành phần trong các tiến trình được tách ra có thể được thực hiện đồng thời. Số khác cần để truyền thông hay đồng bộ giữa chúng. Cho phép nhiều nhánh điều khiển trong tiến trình đưa ra mức tương tranh mới trong hệ thống. Tiến trình mới có thể sinh ra tiến trình mới, do vậy tạo ra nhiều nhánh hoạt động. Trường hợp quan tâm đặc biệt khi các tiến trình con được nhóm lại với nhau để chia sẻ không gian địa chỉ chung, nhưng mỗi trạng thái lại có trạng thái cục bộ của nó. Tiến trình này được gọi là tiến trình nhánh hay là các tiến trình không quan trọng. Quá trình tương tranh trong hệ phân tán được chia làm hai mức của tiến trình và nhánh. Trong mức thấp hơn, các tiểntình xảy ra đồng thời thực hiện không đồng bộ trên hệ điều hành. Mỗi tiến trình xảy ra đồng thời chạy như một máy ảo để hỗ trợ việc thực hiện đồng thời các nhánh, tạo thành mức tương tranh thứ hai. Tiến trình chỉ là không gian địa chỉ logic trong lúc các nhánh hoạt động. Chúng ta dùng thuật ngữ khối điều khiển tiển trình ( PCB_Process Control Block) bao gồm các thông tín sau: bộ đếm chương trình, nội dung thanh ghi, con trỏ, ngăn xếp, các cổng truyền thôngm và các file mô tả. Khối điều khiển các nhánh (TCB_ Thread Control Block) chúng được sinh ra nhờ lời gọi của các tiến trình. Hình 2.7 Tương tranh hai mức của các tiến trình và các nhánh. c.2 Mô hình client/server. Một cách tiếp cận phổ biến là kiểu client/server. Kiểu client/server là mô hình lập trình biểu diễn các tiến trình và các cấu trúc hệ thống. Các tiến trình yêu cầu dịch vụ là các client, các tiến trình cung cấp dịch vụ là các server. Trong bất cứ trường hợp nào, một tiến trình là một client hay là một server hoặc cũng có thể là cả hai vai trò. Client và server tương tác thông qua một chuỗi các yêu cầu và đáp ứng trên cơ sở đồng bộ hoá các vấn đề truyền thông. Truyền thông liên tiến trình và quá trình xử lý tương tranh Trong mạng phân tán, chúng ta tập trung xử lý truyền thông trong đó việc nhận hay gửi là một phần chính của chúng. Ngoài ra, chúng còn có một số biến thể của nó. Tuy nhiên việc gửi và nhân là chức năng chính của truyền thông cơ bản. Truyền thông cơ bản chính là việc nhận và gửi thông báo trong đó bao gồm ba thành phần chính là địa chỉ đến và đi và nội dung cần gửi đi. Trong quá trình truyền đi,chúng ta thấy sự tồn tại một vùng đệm để lưu trữ dữ liệu. Bộ đệm này ngoài mang ý nghĩa giúp người dùng tạo cảm giác liên tục đồng đều. Chúng còn có vai trò quan trọng trong việc đồng bộ giữa bên nhận và bên gửi, giữa nhân và nhân. 5. TỔ CHỨC QUẢN LÝ TIẾN TRÌNH 5.1. Các trạng thái của tiến trình Trạng thái của tiến trình tại một thời điểm được xác định bởi hoạt động hiện thời của tiến trình tại thời điểm đó. Trong quá trình sống, một tiến trình thay đổi trạng thái do nhiều nguyên nhân như : phải chờ một sự kiện nào đó xảy ra, hay đợi một thao tác nhập/xuất hoàn tất, buộc phải dừng hoạt động do đã hết thời gian xử lý … Tại một thời điểm, một tiến trình có thể nhận trong một các trạng thái sau đây : Mới tạo : tiến trình đang được tạo lập. Running : các chỉ thị của tiến trình đang được xử lý. Blocked : tiến trình chờ được cấp phát một tài nguyên, hay chờ mộtsự kiện xảy ra. Ready : tiến trình chờ được cấp phát CPU để xử lý. Kết thúc : tiến trình hoàn tất xử lý. Hình 2.7Sơ đồ chuyển trạng thái giữa các tiến trình Tại một thời điểm, chỉ có một tiến trình có thể nhận trạng thái running trên một bộ xử lý bất kỳ. Trong khi đó, nhiều tiến trình có thể ở trạng thái blocked hay ready. Các cung chuyển tiếp trong sơ đồ trạng thái biễu diễn sáu sự chuyển trạng thái có thể xảy ra trong các điều kiện sau : Tiến trình mới tạo được đưa vào hệ thống Bộ điều phối cấp phát cho tiến trình một khoảng thời gian sử dụng CPU Tiến trình kết thúc Tiến trình yêu cầu một tài nguyên nhưng chưa được đáp ứng vì tài nguyên chưa sẵn sàng để cấp phát tại thời điểm đó ; hoặc tiến trình phải chờ một sự kiện hay thao tác nhập/xuất. Bộ điều phối chọn một tiến trình khác để cho xử lý. Tài nguyên mà tiến trình yêu cầu trở nên sẵn sàng để cấp phát ; hay sự kiện hoặc thao tác nhập/xuất tiến trình đang đợi hoàn tất. 5.2. Cấu trúc dữ liệu khối quản lý tiến trình Hệ điều hành quản lý các tiến trình trong hệ thống thông qua khối quản lý tiến trình (process control block -PCB). PCB là một vùng nhớ lưu trữ các thông tin mô tả cho tiến trình, với các thành phần chủ yếu bao gồm : Định danh của tiến trình (1) : giúp phân biệt các tiến trình Trạng thái tiến trình (2): xác định hoạt động hiện hành của tiến trình. Ngữ cảnh của tiến trình (3): mô tả các tài nguyên tiến trình đang trong quá trình, hoặc để phục vụ cho hoạt động hiện tại, hoặc để làm cơ sở phục hồi hoạt động cho tiến trình, bao gồm các thông tin về: Trạng thái CPU: bao gồm nội dung các thanh ghi, quan trọng nhất là con trỏ lệnh IP lưu trữ địa chỉ câu lệnh kế tiếp tiến trình sẽ xử lý. Các thông tin này cần được lưu trữ khi xảy ra một ngắt, nhằm có thể cho phép phục hồi hoạt động của tiến trình đúng như trước khi bị ngắt. Bộ xử lý: dùng cho máy có cấu hình nhiều CPU, xác định số hiệu CPU mà tiến trình đang sử dụng. Bộ nhớ chính: danh sách các khối nhớ được cấp cho tiến trình. Tài nguyên sử dụng: danh sách các tài mguyên hệ thống mà tiến trình đang sử dụng. Tài nguyên tạo lập: danh sách các tài nguyên được tiến trình tạo lập. Thông tin giao tiếp (4): phản ánh các thông tin về quan hệ của tiến trình với các tiến trình khác trong hệ thống : Tiến trình cha: tiến trình tạo lập tiến trình này. Tiến trình con: các tiến trình do tiến trình này tạo lập. Độ ưu tiên : giúp bộ điều phối có thông tin để lựa chọn tiến trình được cấp CPU. Thông tin thống kê (5): đây là những thông tin thống kê về hoạt động của tiến trình, như thời gian đã sử dụng CPU,thời gian chờ. Các thông tin này có thể có ích cho công việc đánh giá tình hình hệ thống và dự đoán các tình huống tương lai. Hình 2.8 Khối mô tả tiến trình 5.3. Thao tác trên tiến trình Hệ điều hành cung cấp các thao tác chủ yếu sau đây trên một tiến trình : tạo lập tiến trình (create) kết thúc tiến trình (destroy) tạm dừng tiến trình (suspend) tái kích hoạt tiến trình (resume) thay đổi độ ưu tiên tiến trình 5.3.1. Tạo lập tiến trình Trong quá trình xử lý, một tiến trình có thể tạo lập nhiều tiến trình mới bằng cách sử dụng một lời gọi hệ thống tương ứng. Tiến trình gọi lời gọi hệ thống để tạo tiến trình mới sẽ được gọi là tiến trình cha, tiến trình được tạo gọi là tiến trình con. Mỗi tiến trình con đến lượt nó lại có thể tạo các tiến trình mới…quá trình này tiếp tục sẽ tạo ra một cây tiến trình. Các công việc hệ điều hành cần thực hiện khi tạo lập tiến trình bao gồm : định danh cho tiến trình mới phát sinh đưa tiến trình vào danh sách quản lý của hệ thống xác định độ ưu tiên cho tiến trình tạo PCB cho tiến trình cấp phát các tài nguyên ban đầu cho tiến trình Khi một tiến trình tạo lập một tiến trình con, tiến trình con có thể sẽ được hệ điều hành trực tiếp cấp phát tài nguyên hoặc được tiến trình cha cho thừa hưởng một số tài nguyên ban đầu. Khi một tiến trình tạo tiến trình mới, tiến trình ban đầu có thể xử lý theo một trong hai khả năng sau : Tiến trình cha tiếp tục xử lý đồng hành với tiến trình con. Tiến trình cha chờ đến khi một tiến trình con nào đó, hoặc tất cả các tiến trình con kết thúc xử lý. Các hệ điều hành khác nhau có thể chọn lựa các cài đặt khác nhau để thực hiện thao tác tạo lập một tiến trình. 5.3.2. Kết thúc tiến trình Một tiến trình kết thúc xử lý khi nó hoàn tất chỉ thị cuối cùng và sử dụng một lời gọi hệ thống để yêu cầu hệ điều hành hủy bỏ nó. Đôi khi một tiến trình có thể yêu cầu hệ điều hành kết thúc xử lý của một tiến trình khác. Khi một tiến trình kết thúc, hệ điều hành thực hiện các công việc : thu hồi các tài nguyên hệ thống đã cấp phát cho tiến trình hủy tiến trình khỏi tất cả các danh sách quản lý của hệ thống hủy bỏ PCB của tiến trình Hầu hết các hệ điều hành không cho phép các tiến trình con tiếp tục tồn tại nếu tiến trình cha đã kết thúc. Trong những hệ thống như thế, hệ điều hành sẽ tự động phát sinh một loạt các thao tác kết thúc tiến trình con. 5.4. Cấp phát tài nguyên cho tiến trình Khi có nhiều người sử dụng đồng thời làm việc trong hệ thống, hệ điều hành cần phải cấp phát các tài nguyên theo yêu cầu cho mỗi người sử dụng. Do tài nguyên hệ thống thường rất giới hạn và có khi không thể chia sẻ, nên hiếm khi tất cả các yêu cầu tài nguyên đồng thời đều được thỏa mãn. Vì thế cần phải nghiên cứu một phương pháp để chia sẻ một số tài nguyên hữu hạn giữa nhiều tiến trình người dùng đồng thời. Hệ điều hành quản lý nhiều loại tài nguyên khác nhau (CPU, bộ nhớ chính, các thiết bị ngoại vi …), với mỗi loại cần có một cơ chế cấp phát và các chiến lược cấp phát hiệu qủa. Mỗi tài nguyên được biễu diễn thông qua một cấu trúc dữ liệu, khác nhau về chi tiết cho từng loại tài nguyên, nhưng cơ bản chứa đựng các thông tin sau : Định danh tài nguyên Trạng thái tài nguyên : đây là các thông tin mô tả chi tiết trạng thái tài nguyên : phần nào của tài nguyên đã cấp phát cho tiến trình, phần nào còn có thể sử dụng ? Hàng đợi trên một tài nguyên : danh sách các tiến trình đang chờ được cấp phát tài nguyên tương ứng. Bộ cấp phát : là đoạn code đảm nhiệm việc cấp phát một tài nguyên đặc thù. Một số tài nguyên đòi hỏi các giải thuật đặc biệt (như CPU, bộ nhớ chính, hệ thống tập tin), trong khi những tài nguyên khác (như các thiết bị nhập/xuất) có thể cần các giải thuật cấp phát và giải phóng tổng quát hơn. Hình 2.9 Khối quản lý tài nguyên Các mục tiêu của kỹ thuật cấp phát : Bảo đảm một số lượng hợp lệ các tiến trình truy xuất đồng thời đến các tài nguyên không chia sẻ được. Cấp phát tài nguyên cho tiến trình có yêu cầu trong một khoảng thời gian trì hoãn có thể chấp nhận được. Tối ưu hóa sự sử dụng tài nguyên. Để có thể thõa mãn các mục tiêu kể trên, cần phải giải quyết các vấn đề nảy sinh khi có nhiều tiến trình đồng thời yêu cầu một tài nguyên không thể chia sẻ. 5.5. Xử lý tiểu tiến trình tại server. hình 2.10. Mô hình xử lý các luồng tại Server. Xử lý threads tại server. Khi nhận được yêu cầu của client thì server sẽ dựa vào các thuật toán để đáp ứng các yêu cầu của client gồm có 3 phương pháp chính sau: Server lúc nào cũng có tạo ra các vòng lặp để tìm xem có yêu cầu nào của server gửi đến hay không trong các hành đợi. Đồng thời server chụi trách nhiệm phân quyền nếu có thể. Server có thể nhận các yêu cầu thông qua ba phương pháp chính đó là: Phương pháp worker: là phương pháp mà client kết nối vào cổng và tập trung tạo ra các thread để sử lý theo từng yêu cầu Phương pháp thread per connection: Tức là một yêu cầu của client gửi đến đều được sử lý song song vào các cổng truyền thông và xử lý tập trung. Phương pháp thread per object: là các yêu cầu được đưa vào hàng đợi và đưa ra xử lý song song. Trong môi trường đa chương, một tiến trình không đơn độc trong hệ thống, mà có thể ảnh hưởng đến các tiến trình khác, hoặc bị các tiến trình khác tác động. Nói cách khác, các tiến trình là những thực thể độc lập, nhưng chúng vẫn có nhu cầu liên lạc với nhau để: Chia sẻ thông tin: nhiều tiến trình có thể cùng quan tâm đến những dữ liệu nào đó, do vậy hệ điều hành cần cung cấp một môi trường cho phép sự truy cập đồng thời đến các dữ liệu chung. Hợp tác hoàn thành tác vụ: đôi khi để đạt được một sự xử lý nhanh chóng, người ta phân chia một tác vụ thành các công việc nhỏ có thể tiến hành song song. Thường thì các công việc nhỏ này cần hợp tác với nhau để cùng hoàn thành tác vụ ban đầu, ví dụ dữ liệu kết xuất của tiến trình này lại là dữ liệu nhập cho tiến trình khác …Trong các trường hợp đó, hệ điều hành cần cung cấp cơ chế để các tiến trình có thể trao đổi thông tin với nhau. Do mỗi tiến trình sỡ hữu một không gian địa chỉ riêng biệt, nên các tiến trình không thể liên lạc trực tiếp dễ dàng mà phải nhờ vào các cơ chế do hệ điều hành cung cấp. Khi cung cấp cơ chế liên lạc cho các tiến trình, hệ điều hành thường phải tìm giải pháp cho các vấn đề chính yếu sau : Liên kết tường minh hay tiềm ẩn (explicit naming/implicit naming) : tiến trình có cần phải biết tiến trình nào đang trao đổi hay chia sẻ thông tin với nó ? Mối liên kết được gọi là tường minh khi được thiết lập rõ ràng, trực tiếp giữa các tiến trình, và là tiềm ẩn khi các tiến trình liên lạc với nhau thông qua một qui ước ngầm nào đó. Liên lạc theo chế độ đồng bộ hay không đồng bộ (blocking / non-blocking): khi một tiến trình trao đổi thông tin với một tiến trình khác, các tiến trình có cần phải đợi cho thao tác liên lạc hoàn tất rồi mới tiếp tục các xử lý khác ? Các tiến trình liên lạc theo cơ chế đồng bộ sẽ chờ nhau hoàn tất việc liên lạc, còn các tiến trình liên lạc theo cơ chế nonblocking thì không. Liên lạc giữa các tiến trình trong hệ thống tập trung và hệ thống phân tán: cơ chế liên lạc giữa các tiến trình trong cùng một máy tính có sự khác biệt với việc liên lạc giữa các tiến trình giữa những máy tính khác nhau? Do mỗi tiến trình sỡ hữu một không gian địa chỉ riêng biệt, nên các tiến trình không thể liên lạc trực tiếp dễ dàng mà phải nhờ vào các cơ chế do hệ điều hành cung cấp. Khi cung cấp cơ chế liên lạc cho các tiến trình, hệ điều hành thường phải tìm giải pháp cho các vấn đề chính yếu sau : Liên kết tường minh hay tiềm ẩn (explicit naming/implicit naming) : tiến trình có cần phải biết tiến trình nào đang trao đổi hay chia sẻ thông tin với nó ? Mối liên kết được gọi là tường minh khi được thiết lập rõ ràng, trực tiếp giữa các tiến trình, và là tiềm ẩn khi các tiến trình liên lạc với nhau thông qua một qui ước ngầm nào đó. Liên lạc theo chế độ đồng bộ hay không đồng bộ (blocking / non-blocking): khi một tiến trình trao đổi thông tin với một tiến trình khác, các tiến trình có cần phải đợi cho thao tác liên lạc hoàn tất rồi mới tiếp tục các xử lý khác ? Các tiến trình liên lạc theo cơ chế đồng bộ sẽ chờ nhau hoàn tất việc liên lạc, còn các tiến trình liên lạc theo cơ chế nonblocking thì không. Liên lạc giữa các tiến trình trong hệ thống tập trung và hệ thống phân tán: cơ chế liên lạc giữa các tiến trình trong cùng một máy tính có sự khác biệt với việc liên lạc giữa các tiến trình giữa những máy tính khác nhau? Trao đổi thông điệp (Message) Giới thiệu: Hệ điều hành còn cung cấp một cơ chế liên lạc giữa các tiến trình không thông qua việc chia sẻ một tài nguyên chung, mà thông qua việc gởi thông điệp. Để hỗ trợ cơ chế liên lạc bằng thông điệp, hệ điều hành cung cấp các hàm IPC chuẩn (Interprocess communication), cơ bản là hai hàm: Send(message) : gởi một thông điệp Receive(message) : nhận một thông điệp Nếu hai tiến trình P và Q muốn liên lạc với nhau, cần phải thiết lập một mối liên kết giữa hai tiến trình, sau đó P, Q sử dụng các hàm IPC thích hợp để trao đổi thông điệp, cuối cùng khi sự liên lạc chấm dứt mối liên kết giữa hai tiến trình sẽ bị hủy. Có nhiều cách thức để thực hiện sự liên kết giữa hai tiến trình và cài đặt các theo tác send /receive tương ứng : liên lạc trực tiếp hay gián tiếp, liên lạc đồng bộ hoặc không đồng bộ, kích thước thông điệp là cố định hay không … Nếu các tiến trình liên lạc theo kiểu liên kết tường minh, các hàm Send và Receive sẽ được cài đặt với tham số : Send(destination, message) : gởi một thông điệp đến destination Receive(source,message) : nhận một thông điệp từ source 5.6. Sockets Giới thiệu: Một socket là một thiết bị truyền thông hai chiều tương tự như tập tin, chúng ta có thể đọc hay ghi lên nó, tuy nhiên mỗi socket là một thành phần trong một mối nối nào đó giữa các máy trên mạng máy tính và các thao tác đọc/ghi chính là sự trao đổi dữ liệu giữa các ứng dụng trên nhiều máy khác nhau. Sử dụng socket có thể mô phỏng hai phương thức liên lạc trong thực tế : liên lạc thư tín (socket đóng vai trò bưu cục) và liên lạc điện thoại (socket đóng vai trò tổng đài). Các thuộc tính của socket: Type: định nghĩa các đặc điểm liên lạc: Sự tin cậy Sự bảo toàn thứ tự dữ liệu Lặp lại dữ liệu Chế độ nối kết Bảo toàn giới hạn thông điệp Khả năng gởi thông điệp khẩn Để thực hiện liên lạc bằng socket, cần tiến hành các thao tác : Tạo lập hay mở một socket Gắn kết một socket với một địa chỉ Liên lạc : có hai kiểu liên lạc tùy thuộc vào chế độ nối kết: a) Liên lạc trong chế độ không liên kết : liên lạc theo hình thức hộp thư: Hai tiến trình liên lạc với nhau không kết nối trực tiếp Mỗi thông điệp phải kèm theo địa chỉ người nhận. Hình thức liên lạc này có đặc điểm được : người gởi không chắc chắn thông điệp của học được gởi đến người nhận, Một thông điệp có thể được gởi nhiều lần, Hai thông điệp đượ gởi theo một thứ tự nào đó có thể đến tay người nhận theo một thứ tự khác. Một tiến trình sau khi đã mở một socket có thể sử dụng nó để liên lạc với nhiều tiến trình khác nhau nhờ sử hai primitive send và receive. b) Liên lạc trong chế độ nối kết: Một liên kết được thành lập giữa hai tiến trình. Trước khi mối liên kết này được thiết lập, một trong hai tiến trình phải đợi có một tiến trình khác yêu cầu kết nối.Có thể sử dụng socket để liên lạc theo mô hình client-serveur. Trong mô hình này, server sử dụng lời gọi hệ thống listen và accept để nối kết với client, sau đó, client và server có thể trao đổi thông tin bằng cách sử dụng các primitive send và receive. Hủy một socket Ví dụ : Trong nghi thức truyền thông TCP, mỗi mối nối giữa hai máy tính được xác định bởi một port, khái niệm port ở đây không phải là một cổng giao tiếp trên thiết bị vật lý mà chỉ là một khái niệm logic trong cách nhìn của người lập trình, mỗi port được tương ứng với một số nguyên dương. Hình 2.11. Các socket và port trong mối nối TCP. Hình trên minh họa một cách giao tiếp giữa hai máy tính trong nghi thức truyền thông TCP. Máy A tạo ra một socket và kết buộc (bind) socket nầy với một port X (tức là một số nguyên dương có ý nghĩa cục bộ trong máy A), trong khi đó máy B tạo một socket khác và móc vào (connect) port X trong máy A. PHẦN III:NGHIÊN CỨU CÁC GIẢI THUẬT PHÂN TÁN Các khái niệm cơ bản: Các giao thức dùng để gửi thông báo điều khiển. Thông báo điều khiển chỉ rõ hoạt động mà bộ xử lý gửi đi muốn nhận lại để thực hiện và đặt tham số. Một bộ xử lý có thể gửi một thông báo kiểu action tới bộ xử lý với các tham số p bằng các câu lệnh sau: Send (d,action;p); Thông báo gửi đi không bị chặn và tin cậy. Các giao thức trả lời các ngắt bên trong và thời gian timeout như các thông báo bên ngoài. Bộ xử lý phải có khả năng quản lý sự việc tại bất cứ lúc nào, nó phải thực hiện một chuỗi khai báo để quản lý sự việc. Một bộ xử lý khai báo rằng nó đang đợi các sự việc A1,…,An bằng cách thực hiện mã lệnh sau: Wait for A1,A2,…,An A1(source;p) Code to handle A1 ….. An (source;p) Code to handle An Khi bộ xử lý p thực hiện send(q,A1;p) và bộ xử lý q thực hiện mã lệnh như trên, q sẽ thông báo gửi bởi p. Biến source sẽ chứa tên bộ xử lý p và các tham số mà p gửi sẽ được mở bởi q. Các lỗi thường xuyên được phát hiện bởi thời gian timeout. Chúng ta dùng cấu trúc cho dưới đây để chỉ ra rằng giao thức phải đợi thông báo kiểu sự kiện từ P tới T giây và xác định thời gian timeout hoạt động nếu không có thông báo như vậy được nhận: Wait until P sends (event;p),timeout=T on timeout timeout action Thường chúng ta muốn thực hiện một hoạt động chỉ nếu chúng ta đã nhận được trả lời và không thực hiện hoạt động trong thời gian timeout. Trong trường hợp này, chúng ta sẽ dùng đến cấu trúc như sau để chỉ ra hoạt động thực hiện thông báo nếu thông báo quay lại được nhận: Wait until P sends(event;p),timeout=T on timeout; If no timeout occurred (successful response actions) Lúc khác, giải thuật không cần đợi trả lời từ bộ xử lý đặc biệt nhưng phải đợi các trả lời từ tập các bộ xử lý. Trong cấu trúc đã cho, bộ xử lý phải đợi mất T giây để trả lời. Có nghĩa là, nếu bộ xử lý tìm thấy rằng không có trả lời được xử lý tại thời gian T giây sau khi bắt đầu đợi, tiến trình đợi kết thúc và giao thức sẽ tiếp tục. Như rút gọn, giao thức có thể dừng tiến trình đợi khi tất cả các trả lời mong đợi đến. Quan hệ nhân quả. Giả sử rằng hệ phân tán gồm một tập các bộ xử lý P={p1,…,pM}. Ta coi mỗi việc gửi đi và nhận thông báo là một sự kiện. Hơn nữa, một số hoạt động bên trong bộ xử lý được coi là một sự kiện. Chúng ta định nghĩa e là một tập tất cả các sự kiện bên trong hệ thống của chúng ta và ep là tất cả các sự kiện trong e xảy ra tại bộ xử lý p. Chúng ta xác định thứ tự giữa các sự kiện khác nhau. Nếu chúng ta biết rằng sự kiện e1 xảy ra trước sự kiện e2, chúng ta viết e1<e2. Như vậy, nếu nguồn thông tin I cho chúng ta biết e1 đến trước e2 thì chúng ta viết e1<Ie2. Chúng ta xác định quan hệ xảy ra trước là sự đóng kín bên ngoài của thứ tự bộ xử lý và thông báo qua các thứ tự: Nếu e1<pe2 thì e1<He2. Nếu e1<me2 thì e1<He2. Nếu e1<He2 và e2<He3 thì e1<He3. Hình 3.1– Quan hệ xảy ra trước 3.Truyền thông nhân quả. Chúng ta thấy rằng tất cả các thông báo kiểu điểm tới điểm (point-to-point) được phân chia và gửi đi theo thư tự, có thể sử dụng nhãn thời gian duy trì liên kết nhân quả. Kết quả là giữ lại thông báo m gửi từ bộ xử lý p cho đến khi chúng ta đảm bảo rằng không có thông báo m’<Hm sẽ được phân chia từ bất cứ bộ xử lý nào. Mỗi một bộ xử lý p giữ một mảng earliest[1…M] cất trong phạm vi thấp nhất trong nhãn thời gian của các thông báo mà có thể được phân chia ra từ các bộ xử lý khác nhau. Mỗi bộ xử lý giữ một mảng các khối hàng đợi thông báo blocked[1…M] và một hàng đợi FIFO cho các thông báo từ mỗi bộ xử lý khác. Giải thuật để phân chia thông báo nhân quả được thấy trong giải thuật dưới đây: Giải thuật 1: Phân phát thông báo nhân quả Initially, each earliest[k] is set to the 1k timestamp, k=1…M each bloked[k] is set to {},k=1…M On the receipt of message m from processor p delivery_list={} if (blocked[p] is empty) earliest[p]=m.timestamp Add m to the tail of blocked[p] while (there is a k such that blocked[k] is not empty), and for every i=1…M, except for k and Seft, not_earlier(earliest[i],earliest[k],i)) remove the message at the head of blocked[k], put it in delivery_list if blocked[k] is not empty set earliest[k] to m’.timestamp, where m’ is at the head of blocked[k] else increment earliest[k] by 1k Deliver the message in delivery_list, in causal order Nhãn thời gian của thông báo sớm nhất có thể được phân chia từ bộ xử lý k được nạp trong earliest[k]. Biến earliest[k] được bắt đầu từ lk là nhãn thời gian nhỏ nhất mà bộ xử lý pk có thể được gắn vào một thông báo. Khi một bộ xử lý nhận thông báo m từ bộ xử lý p, thông báo được đặt vào hàng đợi blocked[p] và giữ ở đó cho tới khi nó an toàn để phân chia. Nếu không có thông báo trong blocked[p] thì earliest[p] là tập m.timestamp, bởi vì chúng ta bây giờ biết rằng không có thông báo sớm hơn được phân chia từ p. Một thông báo không bị chặn chỉ nếu không có thông báo với nhãn thời gian sớm hơn có thể được phân chia từ các bộ xử lý khác. Có nghĩa là, thông báo m tại đầu của blocked[p] không bị chặn chỉ nếu không có earliest[i] mà nhỏ hơn m.timestamp=earliest[k]. Từ khi m có thể được phân chia, chúng ta cần cập nhật earliest[k]. Nếu blocked[k] là không trống, thông báo sớm nhất có thể được phân chia từ k là thông báo tiếp theo trong blocked[k]. Cách khác, thông báo sớm nhất có thể tới từ bộ xử lý k phải có nhãn thời gian tại ít nhất lk lớn hơn m.timestamp = earliest[k]. 4.Quản lý bản sao dữ liệu. Quản lý bản sao dữ liệu là xây dựng các khối cơ bản cho các hoạt động của hệ phân tán. Các cơ sở dữ liệu phân tán có mục đích quản lý dữ liệu là chính. Nhiều thành phần hệ thống như dịch vụ tên hay dịch vụ file được thiết kế để cất giữ và xây dựng lại dữ liệu một cách phù hợp. Các thành phần của việc tính toán cần duy trì kết quả trạng thái hiện thời của việc tính toán. Có các kỹ thuật cơ sở dữ liệu để quản lý dữ liệu bản sao sau: Đăng ký và khôi phục cơ sở dữ liệu. Xác nhận hai giai đoạn. Xác nhận ba giai đoạn. 5. Quản lý và chọn lọc lỗi. Để quản lý các lỗi tốt nhất xảy ra, chúng ta thường đề cập đến hai giải thuật chính của Garcia-Molina. Hai giải thuật chính đó là: giải thuật bắt buộc(Bully) và giải thuật được mời (invitation). Giải thuật bắt buộc (bully). Giải thuật bao gồm hai giai đoạn chính: Hệ thống con phân chia thông báo phân chia tất cả các thông báo trong Tm giây của việc gửi thông báo. Các nút trả lời trong Tp giay phân phát chúng Dựa vào nguyên tắc trên chúng ta có thể phát hiện lỗi tại các máy dựa vào thời gian trả lời là: T>2 Tm+ Tp. Dựa vào đó ta có thể phát hiện và khôi phục. Giải thuật được mời (Invitation). Nếu chúng ta thừa nhận khả năng mà mạng và các bộ xử lý phải trải qua các độ trễ tuỳ ý, nó không hiểu hơn để nói về bộ xử lý khởi tạo toàn cục. Nếu có phân chia mạng, bộ xử lý khởi tạo sẽ xuất hiện trong cả hai phần. Hai bộ xử lý trong cùng một phần có thể không liên kết với nhau và như vậy cả hai tự khai báo. Nếu một bộ xử lý không thể tạo ra sự đảm nhận an toàn về điều chỉnh các sự kiện hệ thống, một bộ xử lý đang triển các giải thuật cho hệ thống không đồng bộ. Từ khi khai báo người dẫn dầu toàn bộ chứa đầy nguy hiểm, chúng ta cần xem xét lại những gì chúng ta giải thích bằng bộ xử lý khởi tạo. Bộ xử lý khởi tạo cần hướng dẫn một nhóm bộ xử lý qua việc tính toán phân tán. Sau đây, nó cảm thấy ràng buộc xử lý khởi tạo tới nhóm mà nó phân phối. Hơn nữa để dẫn đầu, bộ xử lý khởi tạo đảm bảo rằng những bộ xử lý khác trong nhóm đang thực hiện cùng một sơ đồ. Bộ xử lý khởi tạo sẽ tạo ra nhưng bộ đôi nhưng với sơ đồ khác quanh thời gian thứ hai. Đối với nguyên nhân này, nó thuận lợi tạo ra những nhóm giống nhay rõ rành với số nhóm. Sau đây là một số kết quả giống nhau và khác nhau giữa hai giả thuật trên: Cấu trúc logic: giải thuật bắt buộc đơn giản và hiệu quả bởi vì nó bắt phải chịu cấu trúc logic trên các bộ sử lý. Có lẽ mất thời gian cho các nhóm liên kết hợp khi dùng giải thuật được mời bởi vì không có định nghĩa cấu trúc phù hợp trên chúng. Đồng bộ chống lại không đồng bộ: giả thuật bắt buộc dùng kỹ thuật thúc đẩy thông tin từ tất cả các bộ xử lý khác, như vậy nó cảm thấy giống với giải thuật chọn động phân tán. Nó thực hiện hiệu quả việc đưa ra đường bao thời gian đáp ứng để xây dựng giải thuật đơn giản. Giải thuật được mời làm việc chính xác trong sự xuất hiện thời gian lỗi và đó là giải thuật thực tế. Sự chắc chắn trong liên kết: từ khi có thể có vài nhóm, sự chắc chắn là lquan hệ tới nhóm. Các bộ xử lý không liên kết có thể bị loại bỏ một cách an toàn. Giải thuật được mời đưa ra việc sử dụng hiệu quả các số liên tiếp. Giải thuật rất đơn giản- bộ xử lý khởi tạo mời các nút khác tham gia nhóm của nó. 6. Đồng bộ và chọn lọc a. Sự loại trừ lẫn nhau phân tán Loại trừ lẫn nhau cần thiết cho các hoạt động như là truy nhập dữ liệu dùng chung và phân phối chương trình phân tán. Nghiên cứu các giải thuật loại trừ phân tán giúp cho việc nghiên cứu kỹ thuật thiết kế giải thuật phân tán. b. Giải thuật nhãn thời gian Giải thuật nhãn thời gian dùng nhãn thời gian của Lamport đảm bảo truy nhập chính xác tới phần tới hạn. Giao thức thực hiện bởi vì có một phương pháp ưu tiên của các yêu cầu có thể được sắp xếp toàn cục. Có một bộ xử lý cho phép từ các bộ xử lý khác đi vào phần tới hạn, và bộ xử lý này sẽ từ chối cho phép tới tất cả các bộ xử lý khác. Nhãn thời gian Lamport phục vụ như 1 đồng hồ toàn cục. Vì nó là thứ tự tuyệt đối, có sự sắp xếp toàn cục giữa tất cả các bộ xử lý đã yêu cầu phần tới hạn. Một cách chuyển giải thuật dễ thấy trong giao thức là để mỗi bộ xử lý báo yêu cầu của nó đi vào phần tới hạn. Tất cả các bộ xử lý khác phải trả lời, đưa ra các yêu cầu hiện thời. Các trả lời này mang nhãn thời gian tại bên trả lời yêu cầu phần tới hạn hay giá trị không nếu bên trả lời không đợi hay sử dụng phần tới hạn. Khi bộ xử lý đi ra phần tới hạn, nó báo cho tất cả các bộ xử lý khác. Bằng cách xem xét các thông tin này, mỗi bộ xử lý có thể đặt hàng đợi ưu tiên giống nhau của các bộ xử lý đợi đi vào phần tới hạn. Khi bộ xử lý tìm thấy hàng đợi ưu tiên, nó biết rằng không có bộ xử lý khác nghĩ rằng nó ở đầu của hàng đợi ưu tiên, như vậy nó an toàn đi vào phần tới hạn. Các biến dùng trong giải thuật Ricarat và Agrawala timestamp currentime Thời gian Lamport hiện thời timestamp my_timestamp Nhãn thời gian yêu cầu integer reply_count Số hiệu cho phép cần tập hợp trước khi vào phần tới hạn CS(critical section). boolean is_requesting Đúng nếu đang yêu cầu hay dùng CS boolean reply_deffered[M] reply_deffered[i] đúng nếu trì hoãn trả lời yêu cầu của bộ xử lý j Giả sử bộ xử lý p gửi yêu cầu đến bộ xử lý q. Bộ xử lý p sẽ bị chặn ít nhất chođến khi có trả lời của q.Nếu q có yêu cầu ưu tiên cao hơn p, p sẽ bị chặn cho đến khi q tách ra khỏi phần tới hạn. Bộ xử lý q biết quan hệ ưu tiên của các yêu cầu; do vậy không cần đến vòng liên kết. Giải thuật 2 vòng thực hiện như sau : Khi bộ xử lý muốn đi vào phần tới hạn, nó ghi lại nhãn thời gian hiện thời và gửi yêu cầu tới tất cả bộ xử lý khác. Khi bộ xử lý nhận yêu cầu mà nó sẽ cấp, nó gửi trả lời tới bên yêu cầu. Khi bộ xử lý nhận một yêu cầu muộn hơn chủ của nó, nó sẽ từ chối yêu cầu. Khi đó bộ xử lý chỉ cần làm trễ việc gửi trả lời tới bên yêu cầu mà không cần gửi thông báo bắt đầu. Khi bộ xử lý nhận các trả lời của tất cả các yêu cầu của nó, nó biết yêu cầu của nó sớm hơn tất cả các người khác và nó đi vào phần tới hạn. Khi rời khỏi phần tới hạn, nó gửi các yêu cầu mà nó đã chậm lại. Dưới đây là các giải thuật yêu cầu token, giám sát phần tới hạn Giải thuật yêu cầu phần tới hạn Request_CS() my_timestamp= current_timestamp is_requesting=TRUE reply_pending=M-1 for every other processor j, send(j,REMOTE_REQUEST;my_timestamp) wait until reply_pending is 0 Giải thuật cho nhánh giám sát phần tới hạn CS_Monitor(): wait until a REMOTE_REQUEST or a REPLY message is received REMOTE_REQUEST (sender;request_time): let j be the sender of the REMOTE_REQUEST message. if( not is_requesting or my_timestamp>request_timestamp) send(j,REPLY) else reply_deffered[j]=TRUE REPLY(sender): reply_pending=reply_pending-1 Để tách ra khỏi phần tới hạn,bộ xử lý xử lý tất cả các trả lời trì hoãn của nó. Sau đây là giải thuật Giải thuật giải phóng phần tới hạn Release_CS() is_requesting=FALSE for j=1 through M if reply_deffered[j]=TRUE send (j,REPLY) reply_deffered[j]=FALSE c. Cấu trúc vật lý cố định Cách tiếp cận khác đầy đủ hơn để đồng bộ hoá là sự truyền token giữa các bộ xử lý. Token đưa ra sự cho phép đồng bộ. Nếu bộ xử lý có được token, nó được phép đi vào phần tới hạn. Token có thể tới tất cả các bộ xử lý góp phần vào sự đồng bộ hoá trong thưòi gian hợp lý sau khi bộ xử lý yêu cầu token. Một cách để đảm bảo token có thể đi tới tất cả các bộ xử lý là đặt cấu trúc vật lý trong các bộ xử lý và yêu cầu token đi theo cấu trúc vật lý. Cấu trúc vật lý là một ring có sự lan truyền token. Nếu bộ xử lý giữ token nó được phép đi vào phần tới hạn. Nếu bộ xử lý muốn thường xuyên đi vào phần tới hạn khi token đi tới, token truyền trong ring là một giải thuật đồng bộ. Token có thể đi qua hơn M lần trước khi bộ xử lý đi vào phần tới hạn. Tiếp theo ta cần giải quyết 2 vấn đề để yêu cầu thông qua token như thế nào và để token thông qua bộ xử lý tiếp theo như thế nào để vào phần tới hạn. Khi bộ xử lý yêu cầu cho phép đi vào phần tới hạn, nó gửi yêu cầu trong hướng current_dir. Khi bộ xử lý nhạn được yêu cầu đi vào phần tới hạn, nó gửi tiếp yêu cầu đi vào phần tới hạn theo hướng current_dir nếu chưa sẵn sàng. Các bộ xử lý trong đường dẫn từ bên yêu cầu tới token phải ghi đường dẫn quay lại cho token. Bộ xử lý nhận được yêu cầu, đặt yêu cầu vào trong hàng đợi FIFO. Chú ý đầu hàng đợi FIFO chỉ rõ đường dẫn quay lại. Khi bộ xử lý giải phóng token, nó kiểm tra thấy nếu có bất cứ yêu cầu từ chối cho token. Các yêu cầu này sẽ được cất trong hàng đợi FIFO. Nếu có yêu cầu từ chối, token được gửi tới láng giềng tại đầu FIFO. Nếu có yêu cầu khác trong FIFO, bộ xử lý bắt đầu thoả mãn yêu cầu bị từ chối. Các biến dùng bởi giải thuật cấu trúc vật lý cố định Token_hldr Đúng nếu bộ xử lý giữ lệnh bài. Incs Đúng nếu bộ xử lý đang dùng phần tới hạn current_dir Bên cạnh là gốc của cây con giữ lệnh bài requestQ FIFO cất giứ tên của các bộ xử lý bên cạnh. Các phép toán trên requestQ Nq(neighbor) Thêm bộ xử lý bên cạnh vào requestQ Dq() Di chuyển và quay lại đầu của requestQ ismt() Quay lại đúng nếu requestQ. Giao thức bao gồm các thủ tục yêu cầu và giải phóng token. Mỗi bộ xử lý thực hiện 1 luồng để trả lời các thông báo REQUEST và TOKEN. Giải thuật yêu cầu và giải phóng phần tới hạn Request_CS() if not Token_hldr if ismt() send (current_dir,REQUEST) Nq(self) wait until Token_hldr Incs=True Release_CS() Incs=False if not ismt() current_dir=Dq() send(current_dir, TOKEN) Token_hldr=False if not ismt() send (current_dir,REQUEST) Giải thuật thực hiện bằng nhánh giám sát phần tới hạn Monitor_CS() while (True) wait for a REQUEST or a TOKEN message. REQUEST : If Token_hldr if Incs Nq(sender) else if ismt() send(current_dir, TOKEN) Token_hldr =False else send (current_dir,REQUEST) Nq(sender) TOKEN: current_dir=Dq() current_dir = self Token_hldr =True else send(current_dir, TOKEN) if not ismt() send (current_dir,REQUEST). PHẦN IV: BẢO VỆ VÀ AN TOÀN HỆ THỐNG An toàn và bảo vệ hệ thống là chức năng không thể thiếu của các hệ điều hành hiện đại phân tán. Trong bài học này, chúng ta sẽ làm quen với các khái niệm về tổ chức an toàn hệ thống, cũng như các cơ chế bảo vệ hỗ trợ việc triển khai các chiến lược này. I. mỤC TIÊU BẢO VỆ HỆ THỐNG (Protection). Mục tiêu của việc bảo vệ hệ thống là: Bảo vệ chống lỗi của tiến trình : khi có nhiều tiến trình cùng hoạt động, lỗi của một tiến trình j phải được ngăn chặn không cho lan truyền trên hệ thống làm ảnh hưởng đến các tiến trình khác. Đặc biệt, qua việc phát hiện các lỗi tiềm ẩn trong các thành phần của hệ thống có thể tăng cường độ tin cậy hệ thống ( reliability). Chống sự truy xuất bất hợp lệ : Bảo đảm các bộ phận tiến trình sử dụng tài nguyên theo một cách thức hợp lệ được qui định cho nó trong việc khai thác các tài nguyên này. Vai trò của bộ phận bảo vệ trong hệ thống là cung cấp một cơ chế để áp dụng các chiến lược quản trị việc sử dụng tài nguyên. Cần phân biệt khái niệm cơ chế và chiến lược: Cơ chế : xác định làm thế nào để thực hiện việc bảo vệ, có thể có các cơ chế phần mềm hoặc cơ chế phần cứng. Chiến lược: quyết định việc bảo vệ được áp dụng như thế nào : những đối tượng nào trong hệ thống cần được bảo vệ, và các thao tác thích hợp trên các đối tượng này Để hệ thống có tính tương thích cao, cần phân tách các cơ chế và chiến lược được sử dụng trong hệ thống. Các chiến lược sử dụng tài nguyên là khác nhau tùy theo ứng dụng, và thường dễ thay đổi. Thông thường các chiến lược được lập trình viên vận dụng vào ứng dụng của mình để chống lỗi truy xuất bất hợp lệ đến các tài nguyên, trong khi đó hệ thống cung cấp các cơ chế giúp người sử dụng có thể thực hiện được chiến lược bảo vệ của mình. II. MIỀN BẢO VỆ (Domain of Protection ) II.1. Khái niệm Một hệ thống máy tính được xem như một tập các đối tượng (objects). Một đối tượng có thể là một bộ phận phần cứng ( CPU, bộ nhớ, ổ đĩa...) hay một thực thể phần mềm ( tập tin, chương trình, semaphore...). Mỗi đối tượng có một định danh duy nhất để phân biệt với các đối tượng khác trong hệ thống, và chỉ được truy xuất đến thông qua các thao tác được định nghĩa chặt chẽ và được qui định ngữ nghĩa rõ ràng. Các thao tác có thể thực hiện được trên một đối tượng được xác định cụ thể tùy vào đối tượng. Để có thể kiểm soát được tình hình sử dụng tài nguyên trong hệ thống, hệ điều hành chỉ cho phép các tiến trình được truy xuất đến các tài nguyên mà nó có quyền sử dụng, hơn nữa tiến trình chỉ được truy xuất đến các tài nguyên cần thiết trong thời điểm hiện tại để nó hoàn thành tác vụ (nguyên lý need-to-know) nhăm hạn chế các lỗi truy xuất mà tiến trình có thể gây ra trong hệ thống. Mỗi tiến trình trong hệ thống đều hoạt động trong một miền bảo vệ (protection domain) nào đó. Một miền bảo vệ sẽ xác định các tài nguyên ( đối tượng) mà những tiến trình hoạt động trong miền bảo vệ này có thể sử dụng, và các thao tác hợp lệ các tiến trình này có thể thực hiện trên những tài nguyên đó. II.2. Cấu trúc của miền bảo vệ Các khả năng thao tác trên một đối tượng được gọi là quyền truy xuất (access right). Một miền bảo vệ là một tập các quyền truy xuất, mỗi quyền truy xuất được định nghĩa bởi một bộ hai thứ tự . Các miền bảo vệ khác nhau có thể giao nhau một số quyền truy xuất : Hình vẽ 4.1 Hệ thống với 3 miền bảo vệ Mối liên kết giữa một tiến trình và một miền bảo vệ có thể tĩnh hay động : Liên kết tĩnh : trong suốt thời gian sống của tiến trình, tiến trình chỉ hoạt động trong một miền bảo vệ. Trong trường hợp tiến trình trải qua các giai đoạn xử lý khác nhau, ở mỗi giai đoạn tiến trình có thể thao tác trên những tập tài nguyên khác nhau bằng các thao tác khác nhau. Tuy nhiên, nếu sử dụng liên kết tĩnh, rõ ràng là ngay từ đầu miền bảo vệ đã phải đặc tả tất cả các quyền truy xuất qua các giai đoạn cho tiến trình, điều này có thể khiến cho tiến trình có dư quyền trong một giai đoạn nào đó, và vi phạm nguyên lý need-to-know. Để có thể tôn trọng nguyên lý này, khi đó cần phải có khả năng cập nhật nội dung miền bảo vệ để có thể phản ánh các quyền tối thiểu của tiến trình trong miền bảo vệ tại một thời điểm! Liên kết động : cơ chế này cho phép tiến trình chuyển từ miền bảo vệ này sang miền bảo vệ khác trong suốt thời gian sống của nó. Để tiếp tục tuân theo nguyên lý need-to-know, thay vì sửa đổi nội dung của miền bảo vệ, có thể tạo ra các miền bảo vệ mới với nội dung thay đổi qua từng giai đoạn xử lý của tiến trình, và chuyển tiến trình sang hoạt động trong miền bảo vệ phù hợp theo từng thời điểm. Một miền bảo vệ có thể được xây dựng cho: Một người sử dụng : trong trường hợp này, tập các đối tượng được phép truy xuất phụ thuộc vào định danh của người sử dụng, miền bảo vệ được chuyển khi thay đổi người sử dụng. Một tiến trình : trong trường hợp này, tập các đối tượng được phép truy xuất phụ thuộc vào định danh của tiến trình, miền bảo vệ được chuyển khi quyền điều khiển được chuyển sang tiến trình khác. Một thủ tục : trong trường hợp này, tập các đối tượng được phép truy xuất là các biến cục bộ được định nghĩa bên trong thủ tục, miền bảo vệ được chuyển khi thủ tục được gọi. III. An toàn hỆ THỐNG (Security) Bảo vệ hệ thống (protection) là một cơ chế kiểm soát việc sử dụng tài nguyên của các tiến trình hay người sử dụng để đối phó với các tình huống lỗi có thể phát sinh từ trong hệ thống. Trong khi đó khái niệm an toàn hệ thống (security) muốn đề cập đến mức độ tin cậy mà hệ thống duy trì khi phải đối phó không những với các vấn đề nội bộ, mà còn cả với những tác hại đến từ môi trường ngoài. 1. Các vấn đề về an toàn hệ thống Hệ thống được gọi là an toàn nếu các tài nguyên được sử dụng đúng như quy ước trong mọi hoàn cảnh. Kém may mắm là điều này hiếm khi đạt được trong thực tế ! Thông thường, an toàn bị vi phạm vì các nguyên nhân vô tình hay cố ý phá hoại. Việc chống đỡ các phá hoại cố ý là rất khó khăn và gần như không thể đạt hiệu quả hoàn toàn. Bảo đảm an toàn hệ thống ở cấp cao chống lại các tác hại từ môi trường ngoài như hoả hoạn, mất điện, phái hoại...cần được thực hiện ở 2 mức độ vật lý (trang bị các thiết bị an toàn cho vị trí đạt hệ thống...) và nhân sự (chọn lọc cẩn thận những nhân viên làm việc trong hệ thống...). Nếu an toàn môi trường được bảo đảm khá tốt, an toàn của hệ thống sẽ được duy trì tốt nhờ các cơ chế của hệ điều hành (với sự trợ giúp của phần cứng). Lưu ý rằng nếu bảo vệ hệ thống có thể đạt độ tin cậy 100%, thì các cơ chế an toàn hệ thống được cung cấp chỉ với hy vọng ngăn chặn bớt các tình huống bất an hơn là đạt đến độ an toàn tuyệt đối. 2. Kiểm định danh tính (Authentication) Để đảm bảo an toàn, hệ điều hành cần giải quyết tốt vấn đề chủ yếu là kiểm định danh tính (authentication). Hoạt động của hệ thống bảo vệ phụ thuộc vào khả năng xác định các tiến trình đang xử lý. Khả năng này, đến lượt nó, lại phụ thuộc vào việc xác định được người dùng đang sử dụng hệ thống để có thể kiểm tra người dùng này được cho phép thao tác trên những tài nguyên nào. Cách tiếp cận phổ biến nhất để giải quyết vấn đề là sử dụng password để kiểm định đúng danh tính của người dùng. Mỗi khi người dùng muốn sử dụng tài nguyên, hệ thống sẽ kiểm tra password của người dùng nhập vào với password được lưu trữ, nếu đúng, người dùng mới được cho phép sử dụng tài nguyên. Password có thể đuợc để bảo vệ từng đối tượng trong hệ thống, thậm chí cùng một đối tượng sẽ có các password khác nhau ứng với những quyền truy xuất khác nhau. Cơ chế password rất dễ hiểu và dễ sử dụng do vậy được sử dụng rộng rãi, tuy nhiên yếu điểm nghiêm trọng của phương pháp này là khả năng bảo mật password rất khó đạt được sự hoàn hảo, những tác nhân tiêu cực có thể đoán ra password của người khác nhờ nhiều cách thức khác nhau. 3. Mối đe dọa từ hệ thống Hầu hết các hệ điều hành đều cung cấp phương tiện cho phép các tiến trình khi hoạt động có thể tạo ra (spawn) những tiến trình khác. Trong các môi trường như thế, tài nguyên hệ thống và các tập tin của người dùng có thể bị sử dụng sai lạc để gây tác hại. Hai phương pháp phổ biến để phá hoại hệ thống theo phương thức này là : a. Các chương trình « sâu bọ » ( Worm) Một chương trình « sâu bọ » là chương trình lợi dụng cơ chế phát sinh tiến trình của hệ thống để đánh bại chính hệ thống. Tiến trình « sâu bo »ï có khả năng tự động phát sinh các phiên bản ngay cả trên môi trường mạng, lan tràn trên nhiều máy tính khác nhau, sau đó chiếm dụng các tài nguyên hệ thống và làm ngừng trệ hoàn toàn hoạt động của các tiến trình khác trên hệ thống mạng. Ví dụ : chương trình của Robert Tappan Morris, 11/1988 lan truyền trên Internet b. Các chương trình Virus Virus là một dạng phá hoại nguy hiểm khác đối với các hệ thống thông tin. Khác với « sâu bọ » là những chương trình hoàn chỉnh, virus chỉ là những đoạn code có khả năng lây truyền vào các chương trình chính thống khác và từ đó tàn phá hệ thống. Virus thường hoành hành trên các máy đơn, và chủ yếu lây truyền giữa các máy qua việc trao đổi đĩa mềm. 4. Giám sát các mối đe doạ Nhìn chung việc bảo đảm an toàn hệ thống là rất khó do có các yếu tố con người. Hệ điều hành chỉ có thể áp dụng một số kỹ thuật để giảm bớt khả năng bị phá hoại như ghi nhận các sự kiện như : cố gắng nhập nhiều lần password sai sử dụng các password dễ đoán các tiến trình với định danh nghi ngờ không được ủy quyền các tiến trình không được ủy quyền trong những thư mục hệ thống các chương trình kéo dài xử lý một cách đáng ngờ bảo vệ các tập tin và thư mục không hợp lý thay đổi kích thước của các chương trình hệ thống Việc kiểm tra thường kỳ và ghi nhận các thông tin này giúp hệ thống phát hiện kịp thời các nguy cơ, và cho phép phân tích, dự đoán các cách đối phó về sau.

Các file đính kèm theo tài liệu này:

P0162.doc