Nghiên cứu, sử dụng mạng Nơ-Ron nhân tạo trong dự báo lưu lượng nước đến hồ Hoà Bình trước mười ngày
Mạng nơ-ron nhân tạo được ứng dụng trong rất nhiều lĩnh vực: nhận dạng, điều khiển, tối
ưu hoá, Trong nghiên cứu này, chúng tôi đã ứng dụng mạng nơ-ron nhân tạo vào việc dự
báo lưu lượng nước đến hồ Hoà Bình trước 10 ngày. Kết quả thu được khá khả quan với chỉ
số R2 đạt 0.8737 (phương án 3), một chỉ số khá cao đối với dự báo lưu lượng nước trước 10
ngày. Trong thời gian tới, tiếp tục phát triển thêm kết quả nghiên cứu của Ibrahim Can và các
đồng tác giả [4], chúng tôi hy vọng mô hình sẽ cho độ chính xác dự báo cao hơn và mở rộng
thời gian dự báo. Hơn nữa, chúng tôi cũng quan tâm cải tiến mô hình theo hướng tăng tốc độ
thực hiện chương trình.
8 trang |
Chia sẻ: honghp95 | Lượt xem: 539 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Nghiên cứu, sử dụng mạng Nơ-Ron nhân tạo trong dự báo lưu lượng nước đến hồ Hoà Bình trước mười ngày, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
NGHIÊN CỨU, SỬ DỤNG MẠNG NƠ-RON NHÂN TẠO TRONG
DỰ BÁO LƯU LƯỢNG NƯỚC ĐẾN HỒ HOÀ BÌNH TRƯỚC MƯỜI NGÀY
Phạm Thị Hoàng Nhung *, Hà Quang Thuỵ **
* Khoa Công nghệ thông tin - Đại học Thuỷ lợi
** Đại học Công nghệ - Đại học Quốc gia Hà nội
Tóm tắt: Dự báo thuỷ văn nói chung, dự báo lưu lượng nước nói riêng đóng vai trò hết sức quan trọng
trong việc điều tiết, phòng chống thiên tai ở Việt Nam [2]. Sử dụng mô hình mạng nơ-ron nhân tạo
trong dự báo lưu lượng nước đến các hồ chứa là một hướng tiếp cận được sự quan tâm đặc biệt của một
số nhóm nghiên cứu trên thế giới [3-6,8-11]. Áp dụng các giải pháp được trình bày trong [4,6,9,11] vào
thực tế dự báo thủy văn Việt Nam, báo cáo này trình bày một mô hình áp dụng mạng nơron nhân tạo dự
báo lưu lượng nước đến hồ Hòa Bình với thời gian dự kiến 10 ngày. Kết quả thực nghiệm đưọc thực
hiện trên phần mềm tương ứng cho thấy mô hình dự báo được đề xuất là có tính khả thi cao.
Từ khoá: chỉ số hiệu quả (Coefficient of Efficiency), chỉ số xác định (Coefficient of Determination), dữ
liệu học (training set), dữ liệu kiểm tra (test set), dự báo lưu lượng (flow prediction), mạng nơ-ron nhân
tạo (Artificial Neural Networks), sai số quân phương (Mean Square Error), sai số căn quân phương
(Root Mean Square Error), sai số tuyệt đối (Mean Absolute Error).
1. GIỚI THIỆU
Hiện nay có rất nhiều bài toán được đặt ra trong dự báo thuỷ văn như dự báo mực nước,
dự báo lũ và các hiện tượng khác trên sông ngòi và hồ [1-11].
Cùng với sự phát triển của dự báo thuỷ văn, dự báo lưu lượng nước đến hồ chứa (nói
riêng là hồ Hoà Bình) đã và đang trở nên vô cùng quan trọng vì ý nghĩa thực tiễn của nó. Dự
báo chính xác lưu lượng nước đến hồ có ý nghĩa đặc biệt quan trọng trong hoạch định kế
hoạch đảm bảo tốt các chức năng mà công trình phải thực hiện. Đối với hồ Hoà Bình, đó là
phòng lũ cho hạ du và cho chính công trình, phòng tránh hạn hán và ổn định năng lượng điện
cho cả nước1.
Dự báo lưu lượng chịu tác động của rất nhiều nhân tố như mưa, nhiệt độ, độ ẩm, khí hậu,
địa chất thổ nhưỡng, thảm phủ thực vật và hoạt động của con người trên lưu vực Trong
những nhân tố đó, nhân tố địa chất, thổ nhưỡng, thảm phủ thực vật ít thay đổi. Sự thay đổi của
chế độ dòng chảy, nguồn nước theo thời gian chủ yếu do các nhân tố khí hậu quyết định, đặc
biệt là nhân tố mưa, sau đó là tác động của nguồn nước dự trữ trong các tầng chứa nước trong
lưu vực.
Thời gian dự báo của công trình được yêu cầu là trước 1-2 ngày (dự báo ngắn hạn), 5-10
ngày (dự báo trung hạn), 1 tháng (dự báo dài hạn)) và 1 mùa (dự báo siêu dài hạn). Hiện nay,
dự báo thủy văn ngắn hạn đã đạt được những thành công đáng kể cả về phương pháp dự báo
lẫn kết quả dự báo. Phương pháp dự báo dài hạn cho kết quả tin cậy là vấn đề nghiên cứu vẫn
nhận được sự quan tâm đặc biệt trên thế giới2.
Trong những năm gần đây sử dụng mô hình mạng nơ-ron nhân tạo (Artificial Neural
Network - ANN) trong dự báo lưu lượng nước đến các hồ chứa là một hướng tiếp cận được sự
quan tâm đặc biệt của một số nhóm nghiên cứu trên thế giới [3-6,8-11]. ANN được coi là một
công cụ mạnh để giải quyết các bài toán có tính phi tuyến, phức tạp và đặc biệt trong các
trường hợp mà mối quan hệ giữa các quá trình không dễ thiết lập một cách tường minh. Khai
1 12/10/2006. Hiệu quả các công trình thủy điện với
công tác phòng chống lũ.
2 Proceeding of the AGU Hydrology Days 2007, March 19 - March 21, 2007, Colorado State University, Fort Collins,
Colorado, USA.
thác các giải pháp được trình bày trong [4,6,9,11], chúng tôi đề xuất các phương án ứng dụng
mô hình ANN vào việc dự báo lưu lượng nước đến hồ Hoà Bình với thời gian dự kiến 10
ngày.
2. GIỚI THIỆU VỀ MẠNG NƠRON NHÂN TẠO
Mạng nơ-ron nhân tạo là sự mô phỏng toán học của mạng nơ-ron sinh học. Một mạng nơ-
ron nhân tạo được xây dựng từ những thành phần cơ sở là những nơ-ron nhân tạo gồm nhiều
đầu vào và một đầu ra (hình 1). Các đầu vào tiếp nhận kích thích từ đầu ra của những nơ-ron
khác hoặc từ môi trường. Mỗi nơ-ron vào có một bộ trọng số nhằm khuếch đại tín hiệu kích
thích sau đó tất cả sẽ được cộng lại. Tín hiệu sau đó sẽ được tiếp tục biến đổi nhờ một hàm
phi tuyến, thường gọi là hàm kích hoạt. Và cuối cùng tín hiệu sẽ được đưa đến đầu ra của nơ-
ron để lại trở thành đầu vào của các nơ-ron khác hoặc trở thành tín hiệu ra của toàn bộ mạng.
Hình 1. Kiến trúc một nơ-ron nhân tạo
Khi kết hợp các nơ-ron lại với nhau ta có một mạng nơ-ron nhân tạo. Tuỳ theo cách thức
liên kết giữa các nơ-ron mà ta có các loại mạng khác nhau như: mạng truyền thẳng (Hình 2),
mạng phản hồi, Ta có thể xem như mạng nơ-ron nhân tạo là một mô hình toán Y=F(X) với
X là véctơ số liệu đầu vào và Y là véctơ số liệu đầu ra. Ưu điểm của một mạng nơ-ron nhân
tạo là nó cho phép xây dựng một mô hình tính toán có khả năng học dữ liệu rất cao. Có thể
coi mạng nơ-ron nhân tạo là một hộp đen có nhiều đầu vào và nhiều đầu ra có khả năng học
được mối quan hệ giữa đầu ra và đầu vào dựa trên dữ liệu được học.
Chin-Teng Lin và C.S. George Lee [10] cho rằng chỉ cần đưa vào mạng một tập mẫu dữ
liệu trong quá trình học mạng sẽ phát hiện được các ràng buộc dữ liệu hữu ích mà không cần
phải có thêm các tri thức về miền ứng dụng và vì vậy rất thuận lợi khi xây dựng mô hình dữ
liệu. Chính vì lý do đó, mạng nơ-ron có thể được ứng dụng trong các mô hình dự báo. Theo
các tác giả, cần đưa thêm hằng số quán tính để tăng tốc độ học và tránh cực tiểu cục bộ
i
x1
x2
xm
w1
w2
wm
.
.
.
Hình 2. Mạng nơ-ron lan truyền thẳng
Demetris F. Lekkas [8] giới thiệu hai tiếp cận mô hình mạng nơ-ron nhân tạo dự báo lưu
lượng là Iterative Forecasting Procedure (Sequential Forecasting Procedure) và Simultaneous
Forecasting Procedure (Direc multi-step Forecasting Procedure).
Các chỉ số dự báo được sử dụng để đánh giá chất lượng của phương pháp dự báo. Dưới
đây là một số chỉ số dự báo thông dụng nhất [1]:
Sai số quân phương (Mean Square Error):
2
1
1 ˆ
n
i i
i
MSE Q Q
n
(1)
Sai số căn quân phương (Root Mean Square Error):
2
1
1 ˆ
n
i i
i
RMSE Q Q
n
(2)
Sai số tuyệt đối (Mean Absolute Error):
1
1 ˆ
n
i i
i
MAE Q Q
n
(3)
Trong đó:
o ˆiQ : Giá trị tính toán tại thời điểm i
o iQ : Giá trị thực đo tại thời điểm i
Tuy các chỉ số (1)-(3) là trực quan và được tính toán dễ dàng song trong nhiều trường hợp
khi dung lượng dữ liệu lớn hay dữ liệu có độ biến động cao thì các chỉ số này không đánh giá
tốt được các kết quả dự báo. D.R. Legates và G.J. McCabe Jr. [7] trình bày về chỉ số hiệu quả
- E (Coefficient of Efficiency) và chỉ số xác định - R2 (Coefficient of Determination) tuy có độ
phức tạp tính toán cao hơn song khắc phục được các hạn chế của các chỉ số (1)-(3):
2
1
2
1
ˆ
1
n
i i
i
n
i
i
Q Q
E
Q Q
(4)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x1
xj
xm
y1
yi
yn
Lớp vào Lớp ẩn Lớp ra
vqj wiq
zq (q=1,, l)
zq
2 1
22
1 1
ˆ ˆ
ˆ ˆ
n
i i
i
n n
i i
i i
Q Q Q Q
R
Q Q Q Q
(5)
Các chỉ số E và R2 có thể được dùng theo cách kết hợp hoặc riêng rẽ. Phương pháp tốt là
phương pháp nhận được giá trị của các chỉ số này lớn.
Lekkas D.F. và Onof C [9] trình bày một số phương pháp cập nhật mạng nơ-ron dự báo
lưu lượng để nâng cao hiệu quả dự báo. Ibrahim Can và các đồng tác giả [4] trình bày việc
ứng dụng hai mô hình mạng nơ-ron mô hình one-hidden layer feed forward backpropagation
(FFBP) và mô hình Generalized Regression Neural Networks (GRNN) vào dự báo tháng lưu
lượng nước sông Karasu ở Thổ Nhĩ Kỳ. Các tác giả chỉ ra rằng mô hình GRNN cho kết quả
rất tốt (chỉ số R2 đạt tới 0.8572).
Bài báo ứng dụng mạng nơ-ron nhiều lớp lan truyền thẳng làm công cụ cho dự báo lưu
lượng nước đến hồ Hoà Bình với giải thuật học lan truyền ngược sai số (Hình 2). Chỉ số sai số
căn quân phương - RMSE và chỉ số xác định R2 được sử dụng để đánh giá độ chính xác của
dự báo.
3. ỨNG DỤNG MẠNG NƠ-RON NHÂN TẠO DỰ BÁO LƯU LƯỢNG
NƯỚC ĐẾN HỒ HOÀ BÌNH TRƯỚC 10 NGÀY
3.1 Số liệu sử dụng
Chúng tôi sử dụng số liệu từ năm 1964 đến năm 2002 tại trạm đo Tạ Bú trên sông Đà,
trạm đo lưu lượng gần hồ Hoà Bình nhất, bao gồm số liệu về lưu lượng và lượng mưa trong
quá khứ và tại thời điểm hiện tại. Số liệu này được đo trong mùa cạn từ tháng 12 năm trước
đến tháng 5 năm sau. Bộ dữ liệu được chia làm hai phần:
- Phần dữ liệu học (training set): Từ cuối năm 1964 đến đầu năm 1995.
- Phần dữ liệu kiểm tra (test set): Từ cuối năm 1995 đến đầu năm 2002.
3.2 Các tham số của mạng
- Kiến trúc mạng: chúng tôi sử dụng mạng nơ-ron lan truyền thẳng ba lớp: lớp vào,
lớp ẩn và lớp ra. Trong đó lớp vào là đầu vào của các tham số phục vụ cho việc dự
báo. Lớp ra chỉ có một nơ-ron, giá trị đầu ra của nơ-ron này chính là lưu lượng
nước cần dự báo.
- Hàm kích hoạt được sử dụng là hàm sigmoid.
- Giá trị trọng số được khởi tạo ngẫu nhiên trong khoảng (-3, 3).
- Chúng tôi sử dụng thêm hằng số quán tính nhằm tăng tốc độ học và tránh cực tiểu
cục bộ [10].
3.3 Các phương án thử nghiệm
Chúng tôi đã tiến hành thử nghiệm một số phương án dự báo để tìm ra phương án tối ưu.
Để thực hiện điều này chúng tôi đã xây dựng một phần mềm mô phỏng mạng nơ-ron truyền
thẳng sử dụng thuật toán học lan truyền ngược sai số. Phần mềm được phát triển riêng cho
việc dự báo dòng chảy do đó trong quá trình chạy các tham số dự báo luôn được tính toán và
hiển thị trực quan giúp cho người dự báo dễ dàng lựa chọn các phương án (hình 3).
Hình 3. Giao diện phần mềm dự báo
3.3.1 Phương án 1
Trong phương án này việc dự báo lưu lượng nước tương lai trước 10 ngày Q(t+10) dựa
vào các lưu lượng nước tại thời điểm hiện tại và quá khứ. Chúng tôi sử dụng ba giá trị lưu
lượng làm đầu vào của mạng gồm:
- Lưu lượng nước hiện tại: Q(t)
- Lưu lượng nước trung bình của 10 ngày trước đó: Q(t-10)
- Lưu lượng nước trung bình của 20 ngày trước đó: Q(t-20)
( 10) ( ), ( 10), ( 20)Q t f Q t Q t Q t (6)
Ta sẽ dùng mạng nơ-ron để học được mối quan hệ này. Kết quả sau khi học, các chỉ số
dự báo với dữ liệu kiểm tra (test file):
- Sai số căn quân phương RSME = 110.49 m3/s
- Chỉ số R2 = 0.7509
0
200
400
600
800
1000
1200
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86
Mẫu thử
L
ư
u
l
ư
ợ
n
g
(
m
3
/s
)
Thực tế
Dự báo
Hình 4. Kết quả dự báo với dữ liệu kiểm tra theo phương án 1
3.3.2 Phương án 2
Theo các nghiên cứu thuỷ văn, dữ liệu về mưa trên lưu vực cũng ảnh hưởng rất lớn đến
lưu lượng nước trong tương lai. Việc dự báo cần cả thông số về lượng mưa tại thời điểm hiện
tại và lượng mưa trong quá khứ (do ảnh hưởng đến trữ lượng nước ngầm). Trong phương án
này, dự báo lưu lượng nước tương lai trước 10 ngày Q(t+10) không những chỉ dựa vào các
lưu lượng nước quá khứ và hiện tại ( ), ( 10), ( 20)Q t Q t Q t như phương án 1 mà còn phụ
thuộc vào lượng mưa trong quá khứ và hiện tại tại lưu vực đó ( ), ( 10), ( 20)X t X t X t .
( 10) ( ), ( 10), ( 20), ( ), ( 10), ( 20)Q t f Q t Q t Q t X t X t X t (7)
Chúng tôi đã tiến hành cho mạng nơ-ron học mối quan hệ này và cho kết quả dự báo
chính xác hơn phương án 1.
Kết quả với dữ liệu kiểm tra:
- Sai số căn quân phương RSME = 103.22 m3/s
- Chỉ số R2 = 0.7866
0
200
400
600
800
1000
1200
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86
Mẫu thử
L
ư
u
l
ư
ợ
n
g
(
m
3
/s
)
Thực tế
Dự báo
Hình 5. Kết quả dự báo với dữ liệu kiểm tra theo phương án 2
3.3.3 Phương án 3
Chúng tôi nhận thấy ngoài các yếu tố như đã nêu trong phương án 2, lưu lượng nước
trong 10 ngày tới còn phụ thuộc vào lưu lượng nước của ngày hiện tại Qng(t) và lượng mưa tại
ngày hiện tại Xng(t) (khác với Q(t) và X(t) là giá trị lưu lượng và lượng mưa trung bình trong
10 ngày). Do đó:
( 10) ( ), ( 10), ( 20), ( ), ( ), ( 10), ( 20), ( )ng ngQ t f Q t Q t Q t Q t X t X t X t X t (8)
Kết quả với dữ liệu kiểm tra:
- Sai số căn quân phương RSME = 76.10 m3/s
- Chỉ số R2 = 0.8737
0
200
400
600
800
1000
1200
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86
Mẫu thử
L
ư
u
l
ư
ợ
n
g
(
m
3
/s
)
Thực tế
Dự báo
Hình 6. Kết quả dự báo với dữ liệu kiểm tra theo phương án 3
Độ chính xác của phương án dự báo này cao hơn nhiều so với hai phương án trên.
4. KẾT LUẬN
Mạng nơ-ron nhân tạo được ứng dụng trong rất nhiều lĩnh vực: nhận dạng, điều khiển, tối
ưu hoá, Trong nghiên cứu này, chúng tôi đã ứng dụng mạng nơ-ron nhân tạo vào việc dự
báo lưu lượng nước đến hồ Hoà Bình trước 10 ngày. Kết quả thu được khá khả quan với chỉ
số R2 đạt 0.8737 (phương án 3), một chỉ số khá cao đối với dự báo lưu lượng nước trước 10
ngày. Trong thời gian tới, tiếp tục phát triển thêm kết quả nghiên cứu của Ibrahim Can và các
đồng tác giả [4], chúng tôi hy vọng mô hình sẽ cho độ chính xác dự báo cao hơn và mở rộng
thời gian dự báo. Hơn nữa, chúng tôi cũng quan tâm cải tiến mô hình theo hướng tăng tốc độ
thực hiện chương trình.
LỜI CẢM ƠN. Chúng tôi xin chân thành cảm ơn GS. TS. Hà Văn Khối, Trường Đại học
Thuỷ lợi đã hỗ trợ cung cấp tài liệu và số liệu thử nghiệm.
TÀI LIỆU THAM KHẢO
[1]. Lê Văn Nghinh, Bùi Công Quang, Hoàng Thanh Tùng (2006). Mô hình toán thuỷ văn, Nhà
xuất bản xây dựng.
[2]. Viện Khí tượng Thủy văn. Danh sách các đề tài, dự án nghiên cứu khoa học công nghệ.
[3]. Paulin Coulibaly, Francois Anctil, and Bernard Bobee (2001). Multivariate Reservoir Inflow
Forecasting Using Temporal Neural Networks. Journal of Hydrologic Engineering, 6(5),
367-376.
[4]. Ibrahim Can, Cahit Yerdelen, Ercan Kahya1 (2007). Stochastic modeling of Karasu River
(Turkey) using the methods of Artificial Neural Networks, Proceeding of the AGU
Hydrology Days 2007, March 19 - March 21, 2007, Colorado State University, Fort Collins,
Colorado, USA, 138-144.
[5]. Oscar R. Dolling, Eduardo A. Varas (2002). Artificial neural networks for stream flow
prediction. Journal of Hydraaulic research, 40(5), 547-554.
[6]. Ismail Kilinş, Kerem Ciğizouğlu (2005). Reservoir Management Using Artificial Neural
Networks, 14th. Reg. Directorate of DSI (State Hydraulic Works), Istanbul, Turkey,
(
[7]. D.R. Legates, G.J. McCabe Jr. (1998). Evaluating the Use of "Goodness-of-Fit" Measures in
Hydrologic and Hydroclimatic Model Validation; Water Resour. Res. 1998WR900018, 35
(1): 233.
[8]. Demetris F. Lekkas (2002). Development and Comparison of Data-Based Flow Forecasting
Methods, PhD Thesis, Department of Civil and Environmental Engineering, Imperial
College of Science, Technology and Medicine, London, March 2002.
[9]. Lekkas D.F., Onof C (2005). Improved flow forecasting using artificial neural networks. 9th
International Conference on Environmental and Technology, Rhodes Island, Greece, 1-3
September 2005, 877-884.
[10]. Chin-Teng Lin, C.S. George Lee (1996). Neural fuzzy systems: a neuro-fuzzy synergism to
intelligent systems, Prentice-Hall Inc.
[11]. Cristiane Medina Finzi Quintao, Walmir Matos Caminhas, Selenio Rocha Silva, Bruno
Rabelo Versiani (2004). Neo Fuzzy Neuron and its applications to Prediction flood and wind
in Brazil. Workshop on Modelling and Control for Participatory Planning and Managing
Water Systems, September 29-October 1, 2004 (Poster), Venice, Italia.
Các file đính kèm theo tài liệu này:
- 07_pham_hoang_nhung_hoa_binh_incoming_flow_forecast_full_paper_final_0898_2108662.pdf