Temperature adaptive sleep scheduling using reinforcement learning in wireless sensor networks

Định nghĩa state 00 nếu EW thấp và overlap thấp 01 nếu EW thấp và overlap cao 10 nếu EW cao và overlap thấp 11 nếu EW cao và overlap cao Tính toán state, dựa vào bảng kết quả mà thực hiện hành động Lấy dữ liệu từ các node xung quanh để tính toán reward và update lại bảng output Lấy dữ liệu từ các node xung quanh để tính toán reward và update lại bảng output

28 trang | Chia sẻ: hachi492 | Lượt xem: 598 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Temperature adaptive sleep scheduling using reinforcement learning in wireless sensor networks, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

Temperature Adaptive Sleep Scheduling using Reinforcement Learning in Wireless Sensor Networks GVHD: PGS. TS. Huỳnh Thị Thanh Bình Nhóm 3 Nguyễn Văn Cao - 20183485 Thông tin bài báo 2 RL-Sleep: Temperature Adaptive Sleep Scheduling using Reinforcement Learning for Sustainable Connectivity in Wireless Sensor Networks - 2020 Tác giả: Partha Sarathi Banerjeea, Satyendra Nath Mandal, Debashis De, Biswajit Maiti Nguồn: Sustainable Computing: Informatics and Systems TABLE OF CONTENTS Giới thiệu bài toán Điều kiện để mạng đảm bảo kết nối Định nghĩa state, action, và reward của bài toán 04 01 02 03 Thuật toán 05 Kết quả bài báo 3 Giới thiệu bài toán Mạng không dây bao gồm một hệ thống các node: Chạy bằng pin Có khả năng xử lý dữ liệu Truyền thông trong phạm vi nhỏ Có khả năng chạy trong môi trường đa dạng trong thời gian daì 4 Giới thiệu bài toán Sự thay đổi nhiệt độ của môi trường xung quanh ảnh hưởng trực tiếp đến tính kết nối của mạngQuá ít node sẽ dẫn đến không đảm bảo tính kết nối của mạng Quá nhiều node active sẽ dẫn đến việc tiêu tốn năng lượng và tài nguyên không cần thiết 5 Giới thiệu bài toán Cần một thuật toán lập lịch tắt mở các node một cách hợp lý Đảm bảo tính kết nối Tối ưu tài nguyên của mạng 6 Điều kiện để bài toán đảm bảo kết nối 7 Trong đó: là số node cần active để mạng có thể đảm bảo tính kết nối là mật độ node trong mạng cần để đảm bảo tính kết nối trong nhiệt độ T là diện tích giao tiếp bao phủ của node Điều kiện để bài toán đảm bảo kết nối 8 là độ tự tin để mạng đảm bảo kết nối Định nghĩa state State của một node được định nghĩa bởi 2 thuộc tính của các node neighbors Energy Welfare : Độ mạnh yếu của năng lượng các node xung quanh Overlap Neighborhood : Độ bao phủ so với các node xung quanh 9 Định nghĩa state 00 nếu EW thấp và overlap thấp 01 nếu EW thấp và overlap cao 10 nếu EW cao và overlap thấp 11 nếu EW cao và overlap cao 10 Định nghĩa action 11 Trong 1 node sẽ có 3 action được thực hiện Sleep Transmit Listen Định nghĩa action 12 Định nghĩa reward 13 Định nghĩa output 14 Trong đó: chỉ xác suất để ở trạng thái ta thực hiện hành động 15 Tính toán entropy relative 16 Trong đó: là số xác suất của node bị die khi nhiệt độ ở mức là nhiệt độ cao nhất mà node có thể chịu được Entropy đặc trưng cho tính ổn định của một node so với node xung quanh Thuật toán neighbor learn 17 Thuật toán cập nhật ma trận đầu ra 18 Trong đó: là learning rate, nó càng gần 1 thì Q thay đổi càng nhanh là giá trị reward cao nhất có thể ở trạng thái Mô tả 19 Thực hiện neighbor learn Mô tả 20 Lấy dữ liệu để tính toán state, entropy Mô tả 21 Tính toán state, dựa vào bảng kết quả mà thực hiện hành động Mô tả 22 Lấy dữ liệu từ các node xung quanh để tính toán reward và update lại bảng output Mô tả 23 Lấy dữ liệu từ các node xung quanh để tính toán reward và update lại bảng output Mô phỏng 24 Kết quả bài báo 25 Kết quả bài báo 26 Kết quả bài báo 27 Thanks for listening 28

Các file đính kèm theo tài liệu này:

temperature_adaptive_sleep_scheduling_using_reinforcement_le.pptx