Đề tài Time - Series forecasting by deep learning

Thực nghiệm Datasets: thực nghiệm trên 3 tập dữ liệu electricity, traffic và wiki Electricity: điện năng tiêu thụ của 370 gia đình 25.968 time-points (1 time-point/hr) Task: dự đoán điện năng tiêu thụ của từng hộ trong vòng 7 ngày tiếp theo Traffic: Mật độ giao thông của 963 con đường ở San Francisco theo giờ 10.392 time-points (1 time-point/hr) Task: dự đoán lưu lượng giao thông trên từng con đường trong vòng 7 ngày tới, mỗi ngày 24 giờ Wiki: lưu lượng truy cập vào 115048 bài viết trên Wikipedia 747 time-points Task: dự đoán lượng truy cập trong 7 ngày tiếp theo Nhận xét và kết luận Sử dụng lợi thế tính toán của CNN so với RNN để áp dụng vào bài toán dự đoán time-series, tránh được vấn đề trong việc tối ưu hàm mất mát Khởi tạo LeveledInit thể hiện được tính hiệu quả trong các mô hình được đề xuất Nhìn chung DeepGLO chạy hiệu quả hơn TCN – MF nhưng với dữ liệu có số chiều quá lớn thì cả hai mô hình đều chưa hiệu quả Cần một cách thức hiệu quả hơn khi xây dựng ma trận tương quan giữa các time-series

16 trang | Chia sẻ: hachi492 | Ngày: 05/01/2022 | Lượt xem: 400 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Đề tài Time - Series forecasting by deep learning, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Time-series forecasting by Deep Learning Sinh viên: Vũ Thị Thu Hằng – 20183524 GVHD: PGS. TS Huỳnh Thị Thanh Bình, Đỗ Bảo Sơn 2 Nội dung Bài toán dự đoán time-series Khởi tạo LeveledInit Mô hình TCN-MF (Global model) Mô hình DeepGLO (Hybrid model) Tập dữ liệu và kết quả Nhận xét và kết luận 3 1. Tổng quan bài toán Input : chuỗi các điểm dữ liệu, thường bao gồm các phép đo liên tiếp được thực hiện trong một khoảng thời gian Output : các giá trị dự đoán sẽ xảy ra trong tương lai Vấn đề : Mỗi chiều d ữ liệu chỉ được xem xét và dự đoán một cách độc lập Cần chuẩn hóa dữ liệu đầu vào vì khoảng phân phối có sự khác biệt giữa các đối tượng Khó khăn trong việc tính toán khi sử dụng các mô hình RNN – LSTM với tập dữ liệu lớn 4 1. Tổng quan bài toán Các nghiên cứu liên quan: [1] Guokun Lai, Wei-Cheng Chang, Yiming Yang, and Hanxiao Liu. Modeling long-and short-term temporal patterns with deep neural networks. In The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval , pages 95–104. ACM, 2018. Đề xuất mạng LSTNet sử dụng kết hợp cấu trúc 2D giống CNN và cấu trúc tính toán hồi quy của RNN Đưa vào sử dụng thử nghiệm các dạng mạng CNN nhưng thuật toán quan trọng nhất vẫn nằm ở RNN nên chưa giải quyết được điểm yếu khi tính toán đạo hàm ngược [2] Kevin W Wilson, Bhiksha Raj, and Paris Smaragdis. Regularized non-negative matrix factorization with temporal dependencies for speech denoising. In Ninth Annual Conference of the International Speech Communication Association , 2008. Đề xuất phương pháp phân tích ma trận đối với dữ liệu dạng speech, sử dụng mạng TCN [3] Hsiang-Fu Yu, Nikhil Rao, and Inderjit S Dhillon. Temporal regularized matrix factorization for highdimensional time series prediction. In Advances in neural information processing systems , pages 847–855, 2016. Đề xuất mô hình TRMF – AR để phân tích ma trận với số chiều lớn, có thể hoạt động với dữ liệu có những điểm bị thiếu dữ liệu Xây dựng mô hình tính toán, độ phức tạp của thuật toán cao. Cần phải chọn tham số điều chỉnh phụ thuộc vào miền phân phối của dữ liệu. 5 1. Tổng quan bài toán Think Globally, Act Locally: A Deep Neural Network Approach R. Sen, H.-F. Yu, and I. S. Dhillon, “Think globally, act locally: A deepneural network approach to high-dimensional time series forecasting,” in Advances in Neural Information Processing Systems (NeurIPS 2019) Sử dụng cách khởi tạo trọng số LeveledInit cho mô hình mạng TCN X ây dựng mô hình TCN-MF để lấy được global pattern trong tập dữ liệu Kết hợp sự phụ thuộc tổng quát và các tính chất đặc trưng của từng time-series trong mô hình DeepGLO để đưa ra dự đoán 6 2. Khởi tạo LeveledInit: Mạng TCN: TCN = 1D Fully Convolution Network + Causal Convolution Output có độ dài bằng Input Không có sự kết nối ngược từ node ở thời điểm sau về node ở thời điểm trước LeveledInit: là mạng TCN với một channel ở mỗi layer Kernel k, số layer d Hàm kích hoạt ReLu  Tất cả trọng số bằng 1/k, bias bằng 0 7 Kí hiệu: lần lượt là dữ liệu và ma trận covariate thể hiện tương quan giữa time-series I và time-point j là mạng TCN Cần dự đoán: 3. TCN – MF 3. TCN – MF 8 Loss function: Trong đó: Temporal Regularization: Thuật toán: (sử dụng mini-batch SGD) Khởi tạo bằng LeveledInit Luân phiên giữ cố định và để tìm giá trị tối ưu của thành phần còn lại 3. TCN – MF 9 Giải thuật: Cuối cùng, dùng mô hình học được: trong dữ liệu , đưa vào các giá trị Thì sẽ có đầu ra: Từ đó: 4. DeepGLO 10 Kết hợp Global Model và Local Features: Input có (r + 2) chiều: 1 chiều cho chuỗi time-series R chiều cho ma trận tương quan 1 chiều cho output tương ứng từ thuật toán 1 và 3 4. DeepGLO 11 5. Thực nghiệm 12 Datasets: thực nghiệm trên 3 tập dữ liệu electricity, traffic và wiki Electricity: điện năng tiêu thụ của 370 gia đình 25.968 time-points (1 time-point/hr) T ask: dự đoán điện năng tiêu thụ của từng hộ trong vòng 7 ngày tiếp theo Traffic: Mật độ giao thông của 963 con đường ở San Francisco theo giờ 10.392 time-points (1 time-point/hr) Task: dự đoán lưu lượng giao thông trên từng con đường trong vòng 7 ngày tới, mỗi ngày 24 giờ Wiki: lưu lượng truy cập vào 115048 bài viết trên Wikipedia 747 time-points Task: dự đoán lượng truy cập trong 7 ngày tiếp theo 5. Thực nghiệm 13 Các hàm đánh giá: MAE: MAPE: RMSE: 5. Thực nghiệm 14 Thuật toán Electricity Traffic Wiki MAE MAPE RMSE MAE MAPE RMSE MAE MAPE RMSE LeveledInit 197.553 0.2176 1356.99 0.0261 0.1432 0.0229 50.3218 0.6672 5230.12 TCN - MF 241.70 0.5458 1410.76 0.0160 0.4353 0.0296 723.66 5.5659 11428.9 DeepGLO 162.494 0.2748 1149.73 0.0088 0.2262 0.0224 250.21 0.9170 5150.75 6. Nhận xét và kết luận 15 Sử dụng lợi thế tính toán của CNN so với RNN để áp dụng vào bài toán dự đoán time-series, tránh được vấn đề trong việc tối ưu hàm mất mát Khởi tạo LeveledInit thể hiện được tính hiệu quả trong các mô hình được đề xuất Nhìn chung DeepGLO chạy hiệu quả hơn TCN – MF nhưng với dữ liệu có số chiều quá lớn thì cả hai mô hình đều chưa hiệu quả Cần một cách thức hiệu quả hơn khi xây dựng ma trận tương quan giữa các time-series 16 THANK YOU !

Các file đính kèm theo tài liệu này:

de_tai_time_series_forecasting_by_deep_learning.pptx