Đề tài Forecasting at scale

Datasets: thực nghiệm trên  tập dữ liệu traffic, electricity.​​ Traffic: Mật độ giao thông của 963 con đường ở San Francisco theo giờ​ 10.392 time-points (1 time-point/hr)​ Task: dự đoán lưu lượng giao thông trên từng con đường trong vòng 7 ngày tới, mỗi ngày 24 giờ​ Electricity: điện năng tiêu thụ của 370 hộ gia đình 25.968 time-points (1 time-point/hr) Task: dự đoán điện năng tiêu thụ trong vòng 7 ngày tới​ - Prophet là một mô hình đơn giản, cho kết quả tương đối tốt với các bộ dữ liệu vừa và nhỏ. Với các bộ dữ liệu lớn(wiki) , có thể sẽ không chạy được. Chỉ có thể dự báo cho chuỗi thời gian 1 chiều.

pptx15 trang | Chia sẻ: hachi492 | Ngày: 05/01/2022 | Lượt xem: 365 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Đề tài Forecasting at scale, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Forecasting at Scale Taylor, Sean J., and Benjamin Letham. "Forecasting at scale."  The American Statistician  72.1 (2018): 37-45. Sinh viên thực hiện: Nguyễn Kim Tùng Giảng viên hướng dẫn: PGS.TS Huỳnh Thị Thanh Bình Ths. Đỗ Bảo Sơn Nội dung Giới thiệu: Đặc điểm của Business T ime S eries: Mô hình Prophet Thực nghiệm: Nhận xét và kết luận: 1.Giới thiệu: Các kĩ thuật dự báo hoàn toàn tự động có thể khó điều chỉnh và thường quá khó để kết hợp với các giả định hữu ích hoặc kinh nghiệm. Các nhà phân tích chịu trách nhiệm về các nhiệm vụ khoa học dữ liệu trong toàn tổ chức thường có chuyên môn sâu về lĩnh vực sản phẩm hoặc dịch vụ mà họ hỗ trợ nhưng thường không được không được đào tạo về dự báo chuỗi thời gian. Các nhà phân tích có thể đưa ra các dự báo lượng cao khá hiếm. Nhu cầu về dự báo chất lượng cao thường vượt xa tốc độ mà chúng có thể được tạo ra. Động lực để đưa ra những hướng dẫn hữu ích về dự báo quy mô 1.Giới thiệu: Phương pháp dự báo kinh doanh phải phù hợp với: Một lượng lớn người làm dự báo, có thể không được đào tạo về phương pháp chuỗi thời gian. Một loạt các vấn đề dự báo với các đặc trưng tiềm ẩn. Trong hầu hết các cài đặt thực tế, một số lượng lớn các dự báo sẽ được tạo ra, đòi hỏi phải có các phương tiện tự động, hiệu quả để đánh giá và so sánh chúng. 2. Đặc điểm của Business Time Series: Một số hành vi theo mùa: chu kì hàng tuần, hàng năm, Bị ảnh hưởng bởi các sản phẩm mới hoặc thay đổi thị trường. 3 . Mô hình Prophet: g(t) : hàm xu hướng, mô hình hóa những thay đổi không định kì trong giá trị của các chuỗi thời gian. s ( t ) : đại diện cho những thay đổi định kì (hàng tuần, hàng năm,) h ( t ): đại diện cho các kì nghỉ lễ, có thể xảy ra trong 1 hoặc nhiều ngày. €t: đại diện cho bất kì thay đổi nào không phù hợp với mô hình. Giả định € t phụ thuộc phân phối chuẩn. Sử dụng mô hình chuỗi thời gian có thể phân tách: 3 . Mô hình Prophet: Lợi thế so với các mô hình tổng hợp(ARIMA,..): Tính linh hoạt: có thể dễ dàng điều chỉnh tính thời vụ với nhiều thời kì và cho phép nhà phân tích đưa ra các giả định khác nhau về xu hướng. Không giống như các mô hình ARIMA, các phép đo không cần phải cách đều nhau, không cần nội suy các giá trị bị thiếu. Cho phép nhà phân tích khám phá nhiều thông số kĩ thuật của mô hình. Mô hình dự báo có các tham số có thể diễn giải được dễ dàng 3 . 1. Mô hình xu hướng C(t): khả năng mang K: tốc độ tăng trưởng m: offset parameter Mô hình tăng trưởng logistic: 3.2. Tính mùa vụ Dựa vào chuỗi Fourier để đưa ra mô hình về các hành vi tuần hoàn: P: khoảng thời gian mà chuỗi thời gian được mong đợi sẽ có tính thời vụ. Ví dụ: P=7 đối với dữ liệu hàng tuần,.. Đặt: (n=10, P= 365.25) 3.3. Nghỉ lễ và các sự kiện Ví dụ danh sách các kì nghỉ: - Tác động của một kì nghỉ cụ thể lên chuỗi thời gian thường tương tự năm này qua năm khác. 3.3. Nghỉ lễ và các sự kiện Di: tập hợp các ngày trong quá khứ và tương lai của kì nghỉ i. Gán cho mỗi ngày lễ một tham số k i : Giả sử các kì nghỉ lễ là độc lập 4. Thực nghiệm: Datasets: thực nghiệm trên  tập dữ liệu  traffic , electricity . ​ ​ ​ Traffic : Mật độ giao thông của 963 con đường ở San  Francisco theo giờ​ 10.392  time-points (1 time-point/hr) ​ Task : dự đoán lưu lượng giao thông trên  từng con đường trong vòng 7 ngày tới, mỗi ngày 24 giờ ​ Electricity : điện năng tiêu thụ của 370 hộ gia đình 25.968 time-points (1 time-point/hr) Task: dự đoán điện năng tiêu thụ trong vòng 7 ngày tới ​ 4. Thực nghiệm: Thuật toán ​ ​ Traffic ​ Electricity MAE​ MAPE​ RMSE​ MAE MAPE RMSE LeveledInit ​ 0.0261​ 0.1432 ​ 0.0229​ 197.553 0.2176 1356.99 TCN - MF​ 0.0160 ​ 0.4353 ​ 0.0296 ​ 241.70 0.5458 1410.76 DeepGLO ​ 0.0088 ​ 0.2262 ​ 0.0224 ​ 162.494 0.2748 1149.73 Prophet 0.009 0.2386 0.021 18.249 25.33 5. Nhận xét và kết luận: - Prophet là một mô hình đơn giản, cho kết quả tương đối tốt với các bộ dữ liệu vừa và nhỏ. Với các bộ dữ liệu lớn(wiki) , có thể sẽ không chạy được. Chỉ có thể dự báo cho chuỗi thời gian 1 chiều. Cảm ơn cô và các bạn đã theo dõi

Các file đính kèm theo tài liệu này:

  • pptxde_tai_forecasting_at_scale.pptx