Kĩ thuật lập trình - Agent architectures

Là kiến trúc mà quá trình ra quyết định được cài đặt một cách trực tiếp, tức là sẽ có một ánh xạ trực tiếp từ tình huống tới hành động No central symbolic representation of world Không suy luận phức tạp Sự suy diễn phức tạp có thể dẫn đến không lời giải hay đáp ứng về mặt thời gian

9 trang | Chia sẻ: huyhoang44 | Lượt xem: 1071 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Kĩ thuật lập trình - Agent architectures, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

1Agent Architectures Kiến trúc Agent và Hệ Agent (C)Copyright Software Engineering Department Lê Tấn Hùng CNTT – ĐHBK Hà nội 2 Nội dung 1. Agent architecture (internal) là gì? 2. Abstract Agent-Architecture 3. Deliberative Architectures (Kiến trúc suy diễn) 4. Reactive Architectures (Kiến trúc phản xạ) 5. Hybrid Architectures (Kiến trúc lai) • Kiến trúc Phân lớp (Layer) 6. Kiến trúc BDI (Belief- Desire- Intention) 7. Kiến trúc mở (OAA) 3 I. Kiến trúc Agent 1.Lý do Kiến trúc Agent? Thay thế cho việc chuyển từ ý tưởng, chỉ dẫn thành thực thi chúng E.g. after or in the late steps of Gaia Làm thế nào để xây dựng những hệ thống máy tính thoả mãn những yêu cầu đặc biệt bằng agent theoritists Những kiến trúc phần mềm như thế nào là phù hợp? 4 2. Định nghĩa kiến trúc Agent - I Pattie Maes Một phương pháp học đặc biệt để xây dựng agents. Nó chỉ rõ làm thế nào agent có thể được tách ra thành cấu trúc của 1 tập các modules thành phần và làm thế nào những modules đó có thể tương tác với nhau. Toàn bộ tập modules và sư tương tác giữa chúng cho ta câu trả lời làm thế nào mà những dữ liệu cảm biến and trạng thái hiện tại của agent xác định actions và những trạng thái trong tiếp theo của agent. Một kiến trúc bao gồm các kỹ thuật và thuật toán hỗ trợ cho phương pháp này. 5 Definitions of Agent Architecture - II Kaelbling Một tập hợp đặc biệt các software (or hardware) modules, được thiết kế đặc trưng bởi những hộp với những mũi tên để chỉ ra dữ liệu và dòng điều khiển giữa các modules Một cách nhìn trừu tượng hơn với kiến trúc agent là một phương pháp chung để thiết kế được những modules riêng biệt cho những nhiệm vụ cụ thể 6 Kiến trúc Agent? Mô tả các trạng thái trong của agent Cấu trúc dữ liệu của nó Thao tác có thể thực hiện trên các cấu trúc Luồng điều khiển giữa các cấu trúc dữ liệu. Kiến trúc agent khác nhau trên nhiều khía cạnh khác nhau về cấu trúc dữ liệu và thuật toán được biểu diễn bên trong agent 27 3. Abstract Agent Arch. a.Standard Agent S = { s1, s2, ... } Tập trạng thái môi trường có thể có A = { a1, a2, ... } Tập hành vi của Agent Agent: ÅÆ Function Action: S* Æ A Agent tập ánh xạ các trạng thái của môi trường vào các hành động của agent Kiểu agent này gọi là standard agent.(agent chuẩn) • Một agent chuẩn quyết định hành động để thực thi phụ thuộc vào history của nó, i.e., its experiences to date. AGENT ENVIRONMENT Action Input Sensor Output 8 (Non-)Deterministic Behavior Hành vi của Môi trường mô hình hóa : env: S x A Æ ρ(S) P means the powerset or set of all subsets non-determistic if ρ(S) = {sx, sy} Không xác định trạng thái kế tiếp của Agent deterministic if ρ(S) = {sx} Î Trạng thái kế tiếp xác định và là duy nhất Interested in agents whose interactions with environment doesn’t end (e.g. infinite) 9 Mô hình trong abstract agent – Sub system Lý thuyết tổng quan về Agent là rất hữu ích, nhưng nó không giúp ta xây dựng agent một cách hiệu quả,vì không chỉ ra việc làm thế nào để thiết kế ra những action của agent Chúng ta cải tiến lại abstract model, bằng cách chia nhỏ nó thành những hệ thống nhỏ hơn (sub-systems) (like top-down refinement in software engineering). Việc cải tiến thành những sub-systems liên quan tới việc lựa chọn dữ liệu và các cấu trúc điều khiển, những thứ hợp thành agent. 10 Kiến trúc trong (Sub-system) The sub-system view of an agent: một kiến trúc agent là mô tả thành phần bên trong của Agent: cấu trúc dữ liệu của nó, những hành động sẽ thao tác trên cấu trúc dữ liệu đó dòng điểu khiểu dữ liệu giữa các dữ liệu đó. Thường chia chức năng quyết định (desicion) thành hai sub-systems: nhận thức (perception) hành động (action) 11 Perception và Action Nhận thức và hành động Hàm see sẽ quan sát môi trường trong khi đó hàm action biểu diễn hệ thống ra quyết định của agent. ENVIRONMENT seesee actionaction AGENT •Hàm see() Có thể được cài đặt dưới dạng phần cứng/mềm Đầu ra của hàm see() là một tập các tri thức (percept) thu nhận 12 See() và Action() Với P là tập nhận thức đầu vào See: S -> P Action: P* -> A Giả sử môi trường có hai trạng thái:s1 và s2; s2≠ s1 nhưng see(s1) = see(s1) có nghĩa là hai trạng thái môi trường khác nhau nhưng đều được cảm nhận giống nhau (nhìn thấy giống nhau) => thông tin thu nhận được là giống nhau 313 Vi dụ Cho 2 trạng thái của môi trường, s1 and s2, có thể phân biệt được các agent nếu chúng map to the same percept. Ví dụ 1 bộ ổn nhiệt có thể phân biệt được các trạng thái của môi trường: x = tooCold y = WomanIsDanger •:Có nghĩa là trạng thái môi trường cho bởi tập: S = {{x,y},{x,!y},{!x,y},{!x,!y}} 14 Bây giờ, để hoạt động một cách hiệu quả, bộ cảm nhiệt không quan tâm liệu y = true không? – điều này không ảnh hưởng tới action của nó. Vì vậy hàm nhận thức see sẽ là: 15 c.History Chúng ta có thể thay thế sự tương tác của agent với môi trường là history, Ví dụ:.một chuỗi các cặp: state-action với s0 là trạng thái đầu tiên của môi trường ai hành động của agent khi nó ở trạng thái si. 16 History of Agent với mọi chuỗi h có thể là history của một agent đều bắt đầu từ trạng thái đầu tiên s0: Với i ∈ N, ai = action((s0,s1,s2,, si)) (tất cả mọi hành động đều phải qua một chuỗi trạng thái) i ∈ N such that i> 0, si ∈ env(si-1,ai-1) (mỗi trạng thái mới của agent phải thuộc một tập các trạng thái có thể có của môi trường từ trạng thái trước đó và một action cụ thể) N là tập số tự nhiên (0,1,2,) 17 Characteristic behaviour action:S* ->A , trong một môi trường, env:S x A ->P(S), là tập tất cả histories có thể có của agent. Chúng ta sẽ biểu thị tập histories của agent bằng hist(agent,env). • Hai agents, agent1 and agent2, được gọi là tương tác tương đương nhau đối với một môi trường, env, iff hist(agent1 ,env) ≡ hist(agent2,env) • nếu chúng tương tác tương đương nhau đối với mọi môi trường chúng được gọi đơn giản là behaviourally equivalent. 18 b.State based Agent Các agent thường có dữ liệu bên trong Dữ liệu: thông tin về trạng thái của môi trường Thông tin về quá khứ của Agent seesee nextnext state actionaction AGENT ENVIRONMENT thường sử dụng một chuỗi nhận thức, một agent có trạng thái trong nơi nơi ghi những thông tin về trạng thái môi trường và quá khứ của chính nó 419 Trạng thái trong Internal State Gọi I là tập tất cả các trạng thái trong có thể có của agent. see : S -> P action : I -> A Hàm thực hiện quá trình lựa chọn hành động bây giờ được định nghĩa như một ánh xạ từ các trạng thái trong của agent đến tập các hành động có thể được thực hiện: 20 Next() : I x P -> I Hàm next(): hàm ánh xạ từ một trạng thái trong I và tri thức thu nhận được P vào một trạng thái trong khác I’ (tức là khi nhận được tri thức mới, trạng thái trong của agent đã thay đổi) Vòng lặp: while(true) { p = see(s); i = next(i,p); perform(action(i)); } 21 Behavior – Abstract Agent Arch. 1. Khởi tạo với trạng thái s0 2. Quan sát môi trường với trang thái s, tạo lập và thu nhận tri thức bằng see(s) 3. Trạng thái trong của agent được thay dổi và cập nhật thông qua hàm next(i0,see(s)) 4. Các hành động tiếp theo mà agent thực hiện sẽ được lựa chọn nhờ hàm, action(next(i0,see(s))) 5. Hành động thực hiện sẽ đưa đến 1 chu trình mới (thu nhận tri thức), goto 2 22 State-based vs standard agents State-based agents không hiệu quả hơn agent chuẩn (standard agents), đã định nghĩa phần trước • Thực tế chúng đồng nhất in their expressive power • Tất cả state-based agent có thể được biến đổi thành 1 agent chuẩn có behaviourally equivalent. 23 II.Phân loại kiến trúc Agent Deliberative (Kiến trúc suy diễn) Logic-Based Architectures Belief-desire-intension BDI(Suy luận thông minh) Reactive (Kiến trúc phản xạ) Hybrid (Kiến trúc lai) Layered architectures (Kiến trúc lớp) 24 1. Kiến trúc suy diễn Dựa trên symbolic AI Kiến trúc mà quá trình ra quyết định được thực hiện nhờ suy diễn logic. Các phương pháp ra quyết định •Logical Reasoning •Pattern matching •Symbolic manipulation 525 Kiến trúc suy diễn Symbolic description of World Mục đích cần đạt tới Tập miêu tả hành động Î Tìm một chuỗi actions để đạt tới mục đích. Sử dụng thuật toán đơn giản Tạo kế hoạch không hiểu quả 26 Kiến trúc suy diễn 27 Kiến trúc (BDI) Belief-Desire-Intention Kiến trúc dựa trên quá trình suy luận thông minh (practical reasoning) trong đó quá trình ra quyết định được tiến hành từng bước, các hành động được thực hiện xuất phát từ yêu cầu của hàm mục tiêu đề ra. Beliefs:biểu diễn tập các thông tin mà agent biết về môi trường hiện tại của nó.(và có thể một vài trạng thái trong), Desires: cái xác định động cơ của nó - ví dụ cái nó đang khám phá, .. Intentions: biểu diễn những quyết định phải hành động như thế nào để hoàn toàn đạt tới desires của nó (committed desires) 28 BDI Architecture [Brenner et al, simplified; origin Rao and Georgeff] 5 • BDI - beliefs = “hiểu biêt của agent” - desires = “những mục đích của agent” - intentions = “những mục đích cần hoàn thành” (tập con của desires) • Extended + goals + plans interaction knowledge base BDI reasoner plan, schedule, execute actions perception AGENT 29 Các thành phần của agent BDI w Tập các niềm tin hiện tại (belief): biểu diễn tập các thông tin mà agent biết được về môi trường hiện tại của nó. w Hàm thu nhận tri thức từ môi trường (belief revision function) thu nhận thông tin mới, cùng với niềm tin đã có tạo ra những hiểu biết mới về môi trường w Hàm sinh các lựa chọn (option generation function): đưa ra các lựa chọn có thể có đối với agent (desire) dựa trên hiểu biết đang có về môi trường và mong muốn của nó. 30 w Các tuỳ chọn hiện tại (set of current options) biểu diễn tập các hành động mà agent có thể thực hiện. w Hàm lọc (filter function): biểu diễn cho quá trình cân nhắc của agent để chọn ra mong muốn dựa trên những điều kiện đang có, đang biết. w Tập các mong muốn (intention): biểu diễn mong muốn hiện tại của agent. w Hàm chọn hành động để thực hiện (action selection function): xác định hành động sẽ được thực hiện. 631 Những hạn chế của kiến trúc suy diễn Performance problems Vấn đề Transduction Tốn nhiều thời gian để chuyển đổi tất cả những thông tin cần thiết thành symbolic representation, đặc biệt nếu môi trường thay đổi rất nhanh. Vấn đề representation Làm thế nào để world-model được biểu diễn một cách tượng trương và làm thế nào để agent có thể suy diễn kịp thời với sự thay đổi thông tin Cho những kết quả hữu ích. Những kết quả sau cùng có thể là vô dụng Does not scale to real-world scenarios 32 2. Kiến trúc phản xạ Là kiến trúc mà quá trình ra quyết định được cài đặt một cách trực tiếp, tức là sẽ có một ánh xạ trực tiếp từ tình huống tới hành động No central symbolic representation of world Không suy luận phức tạp Sự suy diễn phức tạp có thể dẫn đến không lời giải hay đáp ứng về mặt thời gian 33 Kiến trúc phản xạ Brooks: Những kiến trúc thông minh có thể được tạo ra không cần symbolic (AI) representation Behavior thông minh có thể được tạo ra không cần explicit abstract symbolic reasoning (AI) mechanisms Tính thông minh là thuộc tình nổi bật trong hệ thống phức tạp Î Effect of combined components > effect of each component times number of components ”Real” intelligence is situated in the real world, not in disembodied systems such as theorem provers or expert systems Behavior thông minh là kết quả của việc tương tác với môi trường 34 Sơ đồ kiến trúc 35 Đặc thù của agent phản xạ Tính phản xạ là một behavior based model of activity ÍÎ symbol manipulation model used in planning Các thành phần của Perception: 1. Ngữ nghĩa học của đầu vào agent 2. Tập kiến thức cơ sở. 3. A specification of state transitions Actions được tạo ra bởi ngữ nghĩa của đầu ra agent (reaction) Tất cả symbolic manipulation được thực hiện trong thời gian dịch 36 Ví dụ Bộ tản nhiệt đơn giản là agent phản xạ: S = {tooCold, okay} A = {heatingOn, heatingOff } action(okay) = heatingOff action(tooCold) = heatingOn 737 Ví dụ agent phản xạ Robot’s objective: khám phá các hành tinh (ví dụ. Mars), and more concretely, sưu tầm những mẫu vật của 1 loại đá đặc biệt 1. Nếu nhận ra vật cản thì đổi hướng 2. Nếu đang cầm mẫu vật và ở tại căn cứ thì sẽ nhả vật mẫu 3. Nếu đang cầm mẫu vật và chưa ở tại căn cứ thì đi về phía căn cứ 4. Nếu phát hiện ra mẫu vật thì cầm nó lên 5. If true then move randomly 38 Ưu điểm đơn giản kinh tế kiểm soát được khả năng tính toán khả năng chịu lỗi cao 39 Các vấn đề của agent phản xạ – một lượng lớn thông tin cố định cần cho agent – việc học? – có đặc thù là thủ công (handcraffed) – Sự phát triển mất rất nhiều thời gian – không thể xây dựng một hệ thống lớn? – chỉ được sử dụng cho những mục đích ban đầu? 40 Nhược điểm w Nếu agent không sử dụng mô hình giống như mô hình của môi trường trong đó nó hoạt động thì chúng phải có đầy đủ những thông tin cần thiết bên trong để có thể thực hiện các action thích hợp. w Hầu hết các agent đều ra quyết định dựa trên các thông tin mang tính cục bộ của riêng mình. Các agent đều không có khả năng học từ những kinh nghiệm đã gặp phải cũng như nâng cao khả năng của hệ thống kể cả đã hoạt động trong một thời gian dài. 41 3.Kiến trúc lai - Hybrid • Kết hợp tính phản xạ và tính suy diễn •deliberative component: Subsystems tạo ra những kế hoạnh và quyết định sử dụng symbolic reasoning •reactive component: Subsystems phản ứng lại sự kiện nhanh chóng mà không cần những reasoning phức tạp •Thành phần phản xạ có quyền ưu tiên hơn thành phần không phản xạ 42 Mô hình Hybrid 843 Kiến trúc lớp Phân lớp theo chiều ngang Phân lớp theo chiều dọc 1 chiều 2 chiều 44 3.1Phân lớp theo chiều ngang (horizontal layering) trong kiến trúc này tất cả các thành phần trên các lớp đều tiếp xúc trực tiếp tới đầu vào và đầu ra mỗi thành phần trên một lớp có thể coi là một agent. 45 Ưu nhược điểm Đơn giản. Nếu ta cần một agent có n cách cư xử khác nhau thì sẽ cài đặt mô hình này. Tuy nhiên luôn có sự trành giành trong việc ra quyết định, để đảm bảo sự tương thính ta thường đưa vào một hàm điều khiển trung tâm (mediator) để quyết định xem lớp nào đang điều khiển hoạt động của agent. Giả sử trong mô hình của ta có n lớp và mỗi lớp có thể thực hiện m action khác nhau vậy có nghĩa là có thể có đến mn khả năng tương tác lẫn nhau, theo quan điểm thiết kế thì đây là một vấn đề khó và khi hoạt động có thể gây ra hiện tượng thắt cổ chai (bottleneck) trong quá trình ra quyết định 46 3.2 Phân lớp theo chiều dọc (vertical layering) Kiến trúc chỉ có hai thành phần tiếp xúc với đầu vào và đầu ra, ta có thể coi như là một agent Đơn giản hơn rất nhiều so với phân lớp theo chiều ngang. Phân làm 2 loại: Một chiều: Luồng điều khiển lần lượt đi qua từng lớp cho tới khi tới lớp cuối cùng sẽ tạo ra hành động cần thực hiện. Hai chiều: Thông tin được đi theo một chiều (lên) và điều khiển được đi theo chiều khác (xuống). 47 Ưu /nhược điểm Sự phức tạp trong tương tác giữa các lớp đã được giảm Luồng điều khiển phải đi qua toàn bộ các lớp vì thế nếu một lớp nào đó hoạt động không ổn định sẽ ảnh hưởng đến toàn bộ hệ thống 48 Phân lớp Lớp phản xạ thực thi như là một tập quy tắc hành động tuỳ thuộc vào trạng thái, a la subsumption architecture. Lớp planning tạo ra những kế hoạch và lựa chọn actions để thực thi nhằm đặt tới mục đích của agent Lớp modelling chứa những mẫu nhận biết về các agent khác trong môi trường. Giữa ba lớp này có sự liên lạc với nhau và được gói trọn vào một framework điều khiển, cái sử dụng những quy luật điều khiển. 949 Kiến trúc lớp Control unit & knowledge base • Các lớp: - Thấp: phản xạ, cao: suy luận, cao nhất: đa agent communication cooperative planning layer sensors actuators local planning layer behaviour-based layer social model mental model world model knowledge base control unit A G EN T 50 III. Chọn một kiến trúc Agent “Agent của tôi lưu trữ thông tin về môi trường. Dựa trên những hiểu biết đó nó tạo ra reasoning và planning.” “Agent của tôi quan sát môi trường. Nó nhận ra những thay đổi của môi trường, cái mà sẽ bắt đầu các hành vi của nó.” Agent suy diễn Agent lai agent phản xạ both 51 Exercise! Thảo luận trong vài phút Kiến trúc bên trong nào là tôt nhất cho Peer-to-peer project? Deliberative ... Or ... Reactive? 52 Exercise! Thảo luận trong vài phút: Kiến trúc bên trong nào là tôt nhất cho Weather project? Deliberative ... Or ... Reactive?

Các file đính kèm theo tài liệu này:

l02_agent_architectures_7946_7478.pdf