Đề tài Forecasting at scale
Datasets: thực nghiệm trên tập dữ liệu traffic, electricity.
Traffic: Mật độ giao thông của 963 con đường ở San Francisco theo giờ
10.392 time-points (1 time-point/hr)
Task: dự đoán lưu lượng giao thông trên từng con đường trong vòng 7 ngày tới, mỗi ngày 24 giờ
Electricity: điện năng tiêu thụ của 370 hộ gia đình
25.968 time-points (1 time-point/hr)
Task: dự đoán điện năng tiêu thụ trong vòng 7 ngày tới
- Prophet là một mô hình đơn giản, cho kết quả tương đối tốt với các bộ dữ liệu vừa và nhỏ.
Với các bộ dữ liệu lớn(wiki) , có thể sẽ không chạy được.
Chỉ có thể dự báo cho chuỗi thời gian 1 chiều.
15 trang |
Chia sẻ: hachi492 | Ngày: 05/01/2022 | Lượt xem: 365 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Đề tài Forecasting at scale, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Forecasting at Scale
Taylor, Sean J., and Benjamin Letham. "Forecasting at scale." The American Statistician 72.1 (2018): 37-45.
Sinh viên thực hiện: Nguyễn Kim Tùng
Giảng viên hướng dẫn: PGS.TS Huỳnh Thị Thanh Bình
Ths. Đỗ Bảo Sơn
Nội dung
Giới thiệu:
Đặc điểm của Business T ime S eries:
Mô hình Prophet
Thực nghiệm:
Nhận xét và kết luận:
1.Giới thiệu:
Các kĩ thuật dự báo hoàn toàn tự động có thể khó điều chỉnh và thường quá khó để kết hợp với các giả định hữu ích hoặc kinh nghiệm.
Các nhà phân tích chịu trách nhiệm về các nhiệm vụ khoa học dữ liệu trong toàn tổ chức thường có chuyên môn sâu về lĩnh vực sản phẩm hoặc dịch vụ mà họ hỗ trợ nhưng thường không được không được đào tạo về dự báo chuỗi thời gian.
Các nhà phân tích có thể đưa ra các dự báo lượng cao khá hiếm.
Nhu cầu về dự báo chất lượng cao thường vượt xa tốc độ mà chúng có thể được tạo ra.
Động lực để đưa ra những hướng dẫn hữu ích về dự báo quy mô
1.Giới thiệu:
Phương pháp dự báo kinh doanh phải phù hợp với:
Một lượng lớn người làm dự báo, có thể không được đào tạo về phương pháp chuỗi thời gian.
Một loạt các vấn đề dự báo với các đặc trưng tiềm ẩn.
Trong hầu hết các cài đặt thực tế, một số lượng lớn các dự báo sẽ được tạo ra, đòi hỏi phải có các phương tiện tự động, hiệu quả để đánh giá và so sánh chúng.
2. Đặc điểm của Business Time Series:
Một số hành vi theo mùa: chu kì hàng tuần, hàng năm,
Bị ảnh hưởng bởi các sản phẩm mới hoặc thay đổi thị trường.
3 . Mô hình Prophet:
g(t) : hàm xu hướng, mô hình hóa những thay đổi không định kì trong giá trị của các chuỗi thời gian.
s ( t ) : đại diện cho những thay đổi định kì (hàng tuần, hàng năm,)
h ( t ): đại diện cho các kì nghỉ lễ, có thể xảy ra trong 1 hoặc nhiều ngày.
€t: đại diện cho bất kì thay đổi nào không phù hợp với mô hình. Giả định € t phụ thuộc phân phối chuẩn.
Sử dụng mô hình chuỗi thời gian có thể phân tách:
3 . Mô hình Prophet:
Lợi thế so với các mô hình tổng hợp(ARIMA,..):
Tính linh hoạt: có thể dễ dàng điều chỉnh tính thời vụ với nhiều thời kì và cho phép nhà phân tích đưa ra các giả định khác nhau về xu hướng.
Không giống như các mô hình ARIMA, các phép đo không cần phải cách đều nhau, không cần nội suy các giá trị bị thiếu.
Cho phép nhà phân tích khám phá nhiều thông số kĩ thuật của mô hình.
Mô hình dự báo có các tham số có thể diễn giải được dễ dàng
3 . 1. Mô hình xu hướng
C(t): khả năng mang
K: tốc độ tăng trưởng
m: offset parameter
Mô hình tăng trưởng logistic:
3.2. Tính mùa vụ
Dựa vào chuỗi Fourier để đưa ra mô hình về các hành vi tuần hoàn:
P: khoảng thời gian mà chuỗi thời gian được mong đợi sẽ có tính thời vụ.
Ví dụ: P=7 đối với dữ liệu hàng tuần,..
Đặt:
(n=10, P= 365.25)
3.3. Nghỉ lễ và các sự kiện
Ví dụ danh sách các kì nghỉ:
- Tác động của một kì nghỉ cụ thể lên chuỗi thời gian thường tương tự năm này qua năm khác.
3.3. Nghỉ lễ và các sự kiện
Di: tập hợp các ngày trong quá khứ và tương lai của kì nghỉ i.
Gán cho mỗi ngày lễ một tham số k i :
Giả sử các kì nghỉ lễ là độc lập
4. Thực nghiệm:
Datasets: thực nghiệm trên tập dữ liệu traffic , electricity .
Traffic : Mật độ giao thông của 963 con đường ở San Francisco theo giờ
10.392 time-points (1 time-point/hr)
Task : dự đoán lưu lượng giao thông trên từng con đường trong vòng 7 ngày tới, mỗi ngày 24 giờ
Electricity : điện năng tiêu thụ của 370 hộ gia đình
25.968 time-points (1 time-point/hr)
Task: dự đoán điện năng tiêu thụ trong vòng 7 ngày tới
4. Thực nghiệm:
Thuật toán
Traffic
Electricity
MAE
MAPE
RMSE
MAE
MAPE
RMSE
LeveledInit
0.0261
0.1432
0.0229
197.553
0.2176
1356.99
TCN - MF
0.0160
0.4353
0.0296
241.70
0.5458
1410.76
DeepGLO
0.0088
0.2262
0.0224
162.494
0.2748
1149.73
Prophet
0.009
0.2386
0.021
18.249
25.33
5. Nhận xét và kết luận:
- Prophet là một mô hình đơn giản, cho kết quả tương đối tốt với các bộ dữ liệu vừa và nhỏ.
Với các bộ dữ liệu lớn(wiki) , có thể sẽ không chạy được.
Chỉ có thể dự báo cho chuỗi thời gian 1 chiều.
Cảm ơn cô và các bạn đã theo dõi
Các file đính kèm theo tài liệu này:
- de_tai_forecasting_at_scale.pptx