In this article, the LSTM (Long Short-Term Memory) model is applied to predict the river water
level without utilization of rainfall – forecast information and terrain data. The data required for
simulation are hourly water levels at hydrological stations in Hai Phong city. The model was
formulated to predict water level at the Quang Phuc station and the Cua Cam station, in Hai Phong
city for many cases from 1 to 5 hours of lead time. Although the model does not require many input
data such as climate, geography, land-use for rainfall-runoff simulation, the prediction results are
very stable and reliable: the Nash – Sutcliffe efficiency (NSE) is higher than 97.8% and the root
mean square error (RMSE) is lower than 0.10m for 3 hours of lead time prediction. The result
illustrated that the LSTM model is able to produce the river water level time series and useful for
the practical flood forecasting.
8 trang |
Chia sẻ: huongthu9 | Lượt xem: 472 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Ứng dụng mạng long short-Term memory (lstm) để dự báo mực nước tại trạm Quang phục và cửa cấm, Hải Phòng, Việt Nam, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
KHOA HC K THUT THuhoahoiY LI VÀ MÔI TRuchoaNG uhoahoiuhoahoiuhoahoi - S 62 (9/2018) 9
BÀI BÁO KHOA H
C
ỨNG DỤNG MẠNG LONG SHORT-TERM MEMORY (LSTM)
ĐỂ DỰ BÁO MỰC NƯỚC TẠI TRẠM QUANG PHỤC
VÀ CỬA CẤM, HẢI PHÒNG, VIỆT NAM
Lê Xuân Hiền1, 2; Hồ Việt Hùng1
Tóm tắt: Trong bài báo này, mô hình Bộ nhớ gần xa (Long Short-Term Memory - LSTM) được sử
dụng để dự báo mực nước sông mà không cần các số liệu địa hình và dự báo mưa. Dữ liệu cần thiết
cho mô phỏng là mực nước theo giờ tại các trạm thủy văn ở thành phố Hải Phòng. Mô hình được
thiết lập để dự báo mực nước cho trạm Quang Phục và trạm Cửa Cấm trước 5 giờ (dự báo từ 1 giờ
đến 5 giờ). Mặc dù mô hình không yêu cầu các dữ liệu về khí hậu, địa hình nhưng kết quả dự báo
có độ chính xác cao. Trong trường hợp dự báo mực nước trước 3 giờ, hệ số NSE (hệ số Nash) cho
giá trị trên 97,8% và giá trị RMSE (sai số căn quân phương) nhỏ hơn 0,10 m cho cả 2 trạm. Kết
quả này cho thấy rằng, mô hình LSTM mà các tác giả đề xuất dự báo chính xác mực nước theo thời
gian thực, có thể áp dụng mô hình này để cảnh báo lũ trên các sông của Việt Nam.
Từ khóa: Hải Phòng, dự báo mực nước, LSTM, DNN, Quang Phục, Cửa Cấm.
1. MỞ ĐẦU *
Diễn biến mực nước sông là một quá trình
phức tạp, biến đổi theo không gian và thời gian.
Việc dự báo chính xác mực nước là một trong
những yêu cầu cấp bách nhằm giảm thiểu các
rủi ro do lũ gây ra và có ý nghĩa quan trọng
trong việc xây dựng phương án phòng, chống
lũ. Các mô hình truyền thống được sử dụng để
dự báo ở Việt Nam cũng như trên thế giới là các
mô hình số về thủy lực và thủy văn. Các mô
hình này yêu cầu một số lượng lớn các dữ liệu
đầu vào như: đặc điểm lưu vực, địa hình, dự báo
lượng mưa, quan hệ mưa – dòng chảy, quan hệ
lưu lượng - mực nước theo thời gian tại một số
vị trí.
Một trong những giải pháp hiệu quả cho việc
dự báo là sử dụng mô hình Mạng thần kinh nhân
tạo (Artificial Neural Network – ANN). Trên thế
giới các mô hình ANN đã được sử dụng rộng rãi
trong dự báo lũ từ những năm 1990 (Sung, J.Y.
và các cộng sự, 2017). Cùng với đó, các nhà
nghiên cứu đã áp dụng các thuật toán vào mô
hình Mạng thần kinh để làm tăng độ chính xác
1 Khoa Kỹ thuật Tài nguyên nước, Trường Đại học Thủy lợi
2 Dept. of Construction & Disaster Prevention Engineering,
Kyungpook National University, Sangju, Korea
của kết quả dự báo. Trong những năm gần đây,
phương pháp Học sâu (Deep learning) dựa trên
nền tảng là các mạng thần kinh nhân tạo đang
phát triển rất nhanh và thu hút sự quan tâm của
nhiều nhà khoa học. Có thể kể đến nghiên cứu
của Chen, J.F. và các cộng sự (2014), ở đây
thuật toán Cuckoo Search đã được áp dụng để
dự báo dòng chảy đến hồ Hòa Bình, Việt Nam;
Nguyễn Thanh Tùng (2016) đã sử dụng phương
pháp Random Forest cũng để dự báo dòng chảy
đến hồ này; Trương Xuân Nam và các cộng sự
(2016) đã sử dụng phương pháp Học sâu để dự
báo lưu lượng nước đến hồ Hòa Bình. Các
nghiên cứu này đều có một điểm chung, đó là sử
dụng dữ liệu của mùa kiệt với bước thời gian
quan trắc 10 ngày làm đầu vào và đưa ra dự báo
dòng chảy cho 10 ngày sau đó. Các kết quả
nghiên cứu đều khẳng định khả năng tiềm ẩn
của mô hình mạng thần kinh. Mô hình ANN
cũng được áp dụng để dự báo mực nước ở trạm
Hirakata, Nhật Bản (Kim, S. và các cộng sự,
2017). Nghiên cứu này chỉ sử dụng dữ liệu mực
nước thực đo theo giờ ở các trạm thượng lưu để
dự báo mực nước ở hạ lưu trước 3, 6 và 9 giờ.
Kết quả đạt được cho thấy mô hình mạng thần
kinh có thể áp dụng cho việc cảnh báo lũ trên
KHOA HC K THUT THuhoahoiY LI VÀ MÔI TRuchoaNG uhoahoiuhoahoiuhoahoi - S 62 (9/2018) 10
sông. Wang, Y. và các cộng sự (2017) đã sử
dụng mạng thần kinh LSTM để dự báo chất
lượng nước cho hồ Taihu, Trung Quốc. Nghiên
cứu chỉ ra rằng mô hình LSTM đưa ra dự báo
chính xác hơn so với các mô hình mạng thần
kinh khác.
Trong bài báo này, các tác giả sử dụng mô
hình LSTM để dự báo mực nước sông mà
không cần các thông tin dự báo lượng mưa,
cũng như số liệu địa hình và tình hình sử dụng
đất. Mô hình này được áp dụng để dự báo mực
nước trước 1h, 2h, 3h, 4h và 5h tại trạm Quang
Phục trên sông Văn Úc và trạm Cửa Cấm trên
sông Cấm.
2. PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Mô hình LSTM
Mô hình đề xuất dựa trên mô hình mạng thần
kinh sâu LSTM, đây là một dạng đặc biệt của
RNN (Recurrent Neural Network - Mạng thần
kinh hồi quy). LSTM được giới thiệu bởi
Hochreiter và Schmidhuber (1997) nhằm giải
quyết các bài toán về phụ thuộc xa (long-term
dependency).
Hình 1. Cấu trúc của mô hình LSTM
(Nguồn: Internet)
Theo Olah (2015), mọi mạng hồi quy đều có
dạng là một chuỗi các mô đun lặp đi lặp lại của
một mạng thần kinh, mỗi mô đun này thường có
cấu trúc đơn giản được gọi là một tầng “tanh”.
LSTM cũng có kiến trúc dạng chuỗi như vậy và
thay vì chỉ có 1 tầng mạng thần kinh như RNN
chuẩn thì chúng có tới 4 tầng và tương tác với
nhau một cách đặc biệt. Cấu trúc của mô hình
mạng thần kinh LSTM được thể hiện ở Hình 1.
Cốt lõi của LSTM bao gồm trạng thái tế bào
(cell state) và cổng (gate). Trạng thái tế bào
giống như băng chuyền, chạy xuyên suốt qua tất
cả các nút mạng giúp thông tin được truyền đạt
dễ dàng, còn cổng là nơi sàng lọc thông tin đi
qua nó, chúng được kết hợp bởi một tầng mạng
sigmoid. Một LSTM gồm có 3 cổng để duy trì
hoạt động trạng thái của tế bào.
Bước đầu tiên của mô hình LSTM được gọi
là tầng cổng quên (forget gate layer). Bước này
sẽ quyết định xem thông tin nào cần bỏ đi từ
trạng thái tế bào. Đầu vào cho bước này là ht-1
(giá trị đầu ra tại thời điểm t-1) và xt (dữ liệu
đầu vào); đầu ra ft là một số trong khoảng từ 0
đến 1 cho mỗi số trong trạng thái tế bào Ct-1.
t f t 1 t ff (W .[h ,x ] b )σ −= + (1)
Trong đó: σ là hàm sigmoid, Wf và bf lần lượt là
trọng số và tham số của tầng cổng quên.
Các bước tiếp theo sẽ quyết định thông tin
lưu vào trạng thái tế bào và cập nhật giá trị cho
trạng thái. Bao gồm một tầng sigmoid hay còn
được gọi là cổng vào (input gate layer, it) và
một véc tơ giá trị được tạo từ tầng tanh.
t i t 1 t ii (W .[h ,x ] bσ −= + (2)
Ct t C t 1 t CC tanh(W .[h ,x ] b )−= + (3)
t t t 1 tC f * C i * C−= + Ct (4)
Trong đó: Ct-1 và Ct là trạng thái tế bào lần
lượt ở thời điểm t-1 và t; WC và bC lần lượt là
trọng số và tham số của trạng thái tế bào.
Ở bước cuối cùng, giá trị đầu ra (ht) sẽ được
quyết định bởi trạng thái của tế bào muốn xuất
ra (output gate, ot).
t o t 1 t oo (W .[h ,x ] b )σ −= + (5)
t t th o * tanh( C )= (6)
2.2 Thu thập dữ liệu về khu vực nghiên cứu
Dữ liệu được thu thập bao gồm: điều kiện tự
nhiên, đặc điểm khí tượng, thủy văn, hải văn.
Các số liệu lượng mưa và mực nước theo giờ tại
các trạm thủy văn có trong 19 ngày, bắt đầu từ
0h ngày 14/7/2011. Khu vực nghiên cứu gồm
KHOA HC K THUT THuhoahoiY LI VÀ MÔI TRuchoaNG uhoahoiuhoahoiuhoahoi - S 62 (9/2018) 11
sông Văn Úc và sông Cấm thuộc địa phận thành
phố Hải Phòng (Hình 2). Đây là khu vực chịu
ảnh hưởng của thủy triều. Các dữ liệu phục vụ
cho bài báo này được thể hiện trong Bảng 1.
Hình 2. Hệ thống sông khu vực TP. Hải Phòng
(Nguồn: Viện Kỹ thuật tài nguyên nước, 2011)
Bảng 1. Thống kê các số liệu đã thu thập
TT Trạm Sông Yếu tố đo
1 Chanh Chữ Luộc H, X
2 Tiên Tiến Mới H
3 Trung Trang Văn Úc H
4 Quang Phục* Văn Úc H
5 Cao Kênh Kinh Thầy H, X
6 Cửa Cấm* Cấm H, X
7 Hòn Dấu Biển Đông H
(Nguồn: Viện Kỹ thuật tài nguyên nước, 2011)
Trong Bảng 1: H là mực nước; X là lượng
mưa; * là các trạm cần dự báo mực nước.
Đoạn sông Văn Úc chảy qua Hải Phòng từ
ngã ba Gùa ra đến biển dài 45 km. Đây là sông
sâu và rộng nhất trong số các sông ở hạ du
sông Thái Bình, với chiều rộng trung bình từ
500 đến 800m. Dưới ngã ba Gùa khoảng 1 km,
sông Văn Úc phân ra một nhánh chính là sông
Lạch Tray đổ ra cửa Lạch Tray. Sông Cấm là
ranh giới giữa hệ thống An Hải và Thuỷ
Nguyên, toàn bộ sông Cấm thuộc địa phận Hải
Phòng. Đây chính là nhánh của sông Kinh
Môn, có chiều dài 23 km, bắt đầu từ ngã ba
Hợp Thành đến nhập lưu vào sông Bạch Đằng
để đổ ra biển qua cửa Nam Triệu. Sông Cấm có
chiều rộng khoảng 200-700m.
2.3 Phương pháp đánh giá
Để đánh giá hiệu quả của mô hình dự báo,
chúng tôi sử dụng hai trị số, đó là RMSE
(Root Mean Squared Error – sai số căn quân
phương) và NSE (Nash Sutcliffe Efficiency –
hệ số Nash)
( )n 2i i
i 1
1RMSE O P
n
=
= −∑ (7)
( )
( )
n
2
i i
i 1
n 2
ii
i 1
O P
NSE 1
O O
=
=
−
= −
−
∑
∑
(8)
Trong đó: Oi, iO và Pi lần lượt là giá trị thực
đo, giá trị thực đo trung bình và giá trị dự báo
của mẫu thứ i tương ứng. Mô hình dự báo cho
kết quả tốt nếu RMSE nhỏ và NSE lớn.
3. THIẾT LẬP THÔNG SỐ MÔ HÌNH
Mô hình LSTM được đề xuất để dự báo mực
nước trong nhiều trường hợp, từ 1 giờ đến 5 giờ
tại trạm Quang Phục (sông Văn Úc) và trạm
Cửa Cấm (sông Cấm). Mỗi mô hình LSTM
được hiệu chỉnh (training) và kiểm định (test) để
dự báo mực nước lần lượt cho từng trạm. Các
thông số của mô hình được hiệu chỉnh và kiểm
định để đảm bảo mô hình cho kết quả tốt nhất,
chi tiết về các thông số này được tóm tắt trong
Bảng 2. Sau quá trình hiệu chỉnh và kiểm định,
các thông số tốt nhất của mô hình cho mỗi
trường hợp đã được lựa chọn để phục vụ việc dự
báo. Dữ liệu đầu vào của mô hình LSTM dựa
trên mực nước thực đo tại các trạm thủy văn
trong 3 giờ gần nhất (t-2, t-1, t-0), hoặc trong 6
giờ gần nhất (từ t-5 đến t-0).
KHOA HC K THUT THuhoahoiY LI VÀ MÔI TRuchoaNG uhoahoiuhoahoiuhoahoi - S 62 (9/2018) 12
Bảng 2. Các thông số của mô hình LSTM
Đặc trưng Chi tiết
Mục tiêu dự báo Mực nước tại trạm Quang Phục và Cửa Cấm trước 1h, 2h, 3h, 4h, 5h
Dữ liệu đầu vào
Lượng mưa tại khu vực nghiên cứu.
Mực nước thực đo tại các trạm thủy văn trong 3 giờ: t-2, t-1, t-0.
Mực nước thực đo tại các trạm thủy văn trong 6 giờ: từ t-5 đến t-0
Cấu trúc mô hình TensorFlow với BasicLSTMCell
Thông số hiệu
chỉnh mô hình
Số lượng lớp ẩn: 10, 20; 50
Hệ số học: 0,1; 0,5; 0,01; 0,05; 0,001; 0,005
Số lượng Epoch: 10.000; 20.000; 50.000
Để dự báo mực nước cho trạm Quang Phục,
mực nước thực đo tại các trạm Trung Trang,
Chanh Chữ, Tiên Tiến, Hòn Dấu và Quang
Phục đã được sử dụng. Tương tự như vậy,
mực nước thực đo tại các trạm Cao Kênh, Hòn
Dấu và Cửa Cấm được dùng để dự báo mực
nước cho trạm Cửa Cấm. Các dữ liệu về
lượng mưa tại 2 khu vực này đã được đưa vào
để kiểm định, tuy nhiên việc đưa thêm các số
liệu này không làm các kết quả dự báo tốt
hơn. Việc này có thể giải thích như sau: diện
tích mặt sông nhỏ và lượng mưa không lớn,
ngoài ra còn có tác động của bốc hơi và thấm
nên ảnh hưởng của mưa là không đáng kể; mặt
khác, lượng mưa ở khu giữa trên mỗi đoạn
sông còn được thể hiện trong chính mực nước
thực đo của trạm cần dự báo. Vì vậy trong bài
báo này, kết quả dự báo chỉ phụ thuộc vào dữ
liệu mực nước thực đo tại các trạm. Trong mô
hình thủy lực sông, các mực nước này chính là
các biên của mô hình.
Để hiệu chỉnh và kiểm định mô hình, dữ liệu
được sử dụng bao gồm 456 bản ghi là số liệu
mực nước theo giờ, từ 0h ngày 14/7/2011 đến
23h ngày 01/8/2011, thời điểm này đang là mùa
lũ ở Hải Phòng. Bộ dữ liệu này được chia thành
2 tập: tập dữ liệu hiệu chỉnh gồm 408 bản ghi để
hiệu chỉnh mô hình nhằm chọn các thông số tốt
nhất; tập dữ liệu kiểm định gồm 48 bản ghi để
đánh giá hiệu quả của mô hình với các thông số
đã chọn. Các dữ liệu đã thu thập cho thấy, mực
nước lớn nhất ở cả 2 trạm Quang Phục (2,26m)
và Cửa Cấm (2,09m) đều rơi vào ngày
30/7/2011. Các giá trị này nằm trong tập dữ liệu
hiệu chỉnh nhằm đảm bảo đưa ra kết quả chính
xác hơn cho quá trình dự báo đỉnh lũ.
Một điểm lưu ý nữa là, không có quy tắc nào
trong việc lựa chọn cấu trúc mô hình cũng như
các thông số mô hình (Kim, S., và các cộng sự,
2017). Việc lựa chọn cấu trúc mô hình và thông
số mô hình dựa trên việc đánh giá về kích cỡ dữ
liệu và quá trình thử để đảm bảo chọn được các
thông số phù hợp nhất cho nghiên cứu này.
4. KẾT QUẢ NGHIÊN CỨU
4.1 Dự báo mực nước trạm Quang Phục
Kết quả dự báo mực nước cho trạm Quang
Phục trong các trường hợp từ 1 giờ đến 5 giờ
được thể hiện tương ứng trong các Hình 3(a),
Hình 4 và Hình 5.
Có thể thấy rằng mô hình dự báo cho kết quả
rất ấn tượng, đặc biệt cho các trường hợp dự báo
từ 1-3 giờ với sai số trung bình nhỏ hơn 0,095m
và hệ số NSE trên 97,8%. Hình 3 (a) mô tả sự
tương quan chặt chẽ giữa kết quả dự báo và giá
trị thực đo trong trường hợp dự báo mực nước
(MN) trạm Quang Phục trước 1 giờ, hệ số Nash
lên tới 99,7% và RMSE chỉ 0,038m. Trong
trường hợp dự báo trước 4 giờ và 5 giờ (Hình
5), mặc dù hệ số NSE tương đối tốt (lần lượt là
94% và 92%) nhưng giữa kết quả dự báo và
thực đo có chênh lệch nhỏ (1 giờ) về thời gian
xuất hiện đỉnh lũ.
KHOA HC K THUT THuhoahoiY LI VÀ MÔI TRuchoaNG uhoahoiuhoahoiuhoahoi - S 62 (9/2018) 13
(a) (b)
Hình 3. So sánh MN thực đo với dự báo 1 giờ tại Quang Phục (a) và Cửa Cấm (b)
Hình 4. Dự báo MN 2 giờ (trái) và 3 giờ (phải) tại Quang Phục
Hình 5. Dự báo MN 4 giờ (trái) và 5 giờ (phải) tại Quang Phục
Bảng 3 tổng hợp các kết quả kiểm định tốt
nhất và các thông số mô hình đã được lựa chọn
để dự báo mực nước trạm Quang Phục.
Bảng 3. Kết quả kiểm định dự báo mực nước cho trạm Quang Phục
Thời gian dự
báo(giờ)
Chiều dài
dữ liệu
Số trạm
đầu vào
Số lượng
lớp ẩn
Hệ số
học
Số lượng
Epoch
RMSE
(m) NSE (%)
1 6 5 50 0.01 50000 0.038 99.7%
2 3 5 50 0.001 20000 0.064 99.0%
3 6 5 50 0.1 20000 0.095 97.8%
4 6 5 50 0.1 20000 0.155 94.1%
5 6 5 50 0.1 20000 0.177 92.4%
KHOA HC K THUT THuhoahoiY LI VÀ MÔI TRuchoaNG uhoahoiuhoahoiuhoahoi - S 62 (9/2018) 14
4.2 Dự báo mực nước trạm Cửa Cấm
Đối với trạm Cửa Cấm, kết quả kiểm định tốt
nhất của các trường hợp được thể hiện trong
Bảng 4 và được mô tả chi tiết ở Hình 3(b), Hình
6 và Hình 7. Trong cả 5 trường hợp, kết quả dự
báo mực nước trạm Cửa Cấm tốt hơn một chút
so với kết quả của trạm Quang Phục.
Hình 6. Dự báo MN 2 giờ (trái) và 3 giờ (phải) tại Cửa Cấm
Hệ số NSE của trạm Cửa Cấm rất cao, giá trị
NSE nhỏ nhất là 94,1% khi dự báo cho 5 giờ.
Đặc biệt, với trường hợp dự báo từ 1 đến 3 giờ
giá trị này là trên 98%, sai số RMSE tương ứng
nhỏ hơn 0,107m. Hình 3(b) so sánh giữa kết quả
tính toán mực nước với thực đo khi dự báo 1 giờ
cho thấy rằng, hầu như không có sự sai lệch
đáng kể nào giữa giá trị dự báo và thực đo. Hệ
số NSE lên tới 99,88% và sai số trung bình chỉ
xấp xỉ 2,7cm.
Hình 7. Dự báo MN 4giờ (trái) và 5 giờ (phải) tại Cửa Cấm
Trong trường hợp dự báo trước 4 giờ và 5
giờ, mặc dù kết quả dự báo có hệ số NSE rất cao
(97,5% và 94,1%), nhưng Hình 7 cho thấy có sự
sai lệch giữa giá trị dự báo và thực đo. Tuy
nhiên, các giá trị dự báo có xu hướng cao hơn so
với giá trị thực đo tại đỉnh lũ, điều này cho thấy
kết quả mô phỏng có xu hướng an toàn hơn. Khi
dự báo thời gian dài, kết quả dự báo sẽ có độ
chính xác cao nếu chuỗi số liệu thực đo đủ dài.
Bảng 4. Kết quả kiểm định dự báo mực nước cho trạm Cửa Cấm
Thời gian dự
báo (giờ)
Chiều dài
dữ liệu
Số trạm
đầu vào
Số lượng
lớp ẩn
Hệ số
học
Số lượng
Epoch
RMSE
(m) NSE (%)
1 3 3 20 0.001 20000 0.027 99.9%
2 3 3 50 0.1 50000 0.043 99.7%
3 3 3 20 0.05 20000 0.107 98.0%
4 3 3 20 0.1 20000 0.121 97.5%
5 3 3 20 0.005 20000 0.185 94.1%
KHOA HC K THUT THuhoahoiY LI VÀ MÔI TRuchoaNG uhoahoiuhoahoiuhoahoi - S 62 (9/2018) 15
Việc thay đổi các thông số mô hình sẽ ảnh
hưởng tới kết quả dự báo, tuy nhiên ảnh hưởng
này là không đáng kể. Việc thay đổi chiều dài
dữ liệu đầu vào (tăng kích thước dữ liệu từ t-2
lên t-5) không ảnh hưởng nhiều tới độ chính xác
của kết quả dự báo, thậm chí trong một số
trường hợp còn giảm độ chính xác (trạm Cửa
Cấm). Điều này có thể giải thích được, vì ảnh
hưởng của sự thay đổi mực nước trong 3 bước
thời gian gần nhất là rõ rệt nhất. Ngoài ra, do
kích thước của tập dữ liệu chưa đủ lớn, nên khi
tăng các giá trị như số lượng lớp ẩn, số lượng
epoch hoặc chiều dài dữ liệu thì độ chính xác
của kết quả dự báo không thay đổi nhiều.
5. KẾT LUẬN
Bài báo này đã mô tả chi tiết quá trình xây
dựng mô hình mạng thần kinh LSTM để dự
báo mực nước sông trước 1 giờ, 2 giờ, 3 giờ, 4
giờ và 5 giờ tại trạm Quang Phục và Cửa Cấm
ở thành phố Hải Phòng. Mô hình mà các tác giả
đề xuất không sử dụng các dữ liệu dự báo mưa,
chỉ sử dụng thông tin về mực nước thực đo đã
có tại các trạm thủy văn ở thượng lưu và hạ lưu
để dự báo mực nước cho 1 trạm thủy văn ở
trung lưu. Các số liệu mực nước có ý nghĩa
như các biên của mô hình thủy lực. Đối với
vùng chịu ảnh hưởng của thủy triều, dòng chảy
êm, nên cần cả biên trên và biên dưới khi tính
toán. Kết quả kiểm định mô hình cho thấy sự
ổn định và độ chính xác cao trong dự báo. Kết
quả dự báo mực nước từ 1 đến 3 giờ có hệ số
NSE trên 97,8% đối với trạm Quang Phục và
trên 98% với trạm Cửa Cấm. Điều này thể hiện
sự tương quan rất lớn giữa giá trị dự báo và giá
trị thực đo.
Có thể thấy rằng, không có quy tắc cụ thể
nào cho việc lựa chọn các thông số của mô hình
như hệ số học, số lượng chuỗi, số lượng lớp ẩn,
số lượng Epoch cũng như cấu trúc của mô hình.
Việc lựa chọn các thông số này dựa vào quá
trình thử và đánh giá sai số. Các thông số tốt
nhất đã được chọn và đánh giá qua quá trình
hiệu chỉnh và kiểm định mô hình.
Mạng thần kinh sâu có ưu điểm là đơn giản
hơn so với các mô hình thủy văn, thủy lực, đặc
biệt nó có thể dự báo cho vùng bị ảnh hưởng
của thủy triều trong trường hợp thiếu số liệu
địa hình, khi mà không thể sử dụng các mô
hình thủy lực, thủy văn. Lúc đó, mô hình mạng
thần kinh LSTM là giải pháp tốt cho việc dự
báo mực nước theo thời gian thực, thay thế các
mô hình đã có. Vì vậy, có thể ứng dụng mô
hình này để cảnh báo lũ trên các sông suối của
Việt Nam.
TÀI LIỆU THAM KHẢO
Trương Xuân Nam và Nguyễn Thanh Tùng (2016). Deep learning: Ứng dụng cho dự báo lưu lượng
nước đến hồ chứa hòa bình. Hội nghị khoa học thường niên, Đại học Thủy lợi.
Viện Kỹ thuật tài nguyên nước (2011). Quy hoạch thủy lợi chống ngập úng thành phố Hải Phòng.
Trường Đại học Thủy lợi.
Chen, J.F., Hsieh, H.N., and Do, Q.H. (2014). Forecasting Hoabinh Reservoir’s Incoming Flow: An
Application of Neural Networks with the Cuckoo Search Algorithm. Information. 5, 570-586.
Kim, S. and Tachikawa, Y. (2017). Real-time river-stage prediction with artificial neural
network based on only upstream observation data. Annual Journal of Hydraulic Engineering,
JSCE, Vol. 61.
Nguyen , T.T. (2015). An l1-regression Random Forests Method For Forecasting of Hoa Binh
Reservoir’s Incoming Flow. International Conference on Intelligent Systems and Knowledge
Engineering.
Olah, C.(2015). Understanding LSTM Networks. GITHUB blog, Retrieved from
Posted on August
27, 2015.
KHOA HC K THUT THuhoahoiY LI VÀ MÔI TRuchoaNG uhoahoiuhoahoiuhoahoi - S 62 (9/2018) 16
Sung, J.Y., Lee, J., Chung, I.M., and Heo, J.H. (2017). Hourly Water Level Forecasting at
Tributary Affected by Main River Condition. KSCE Journal of Civil Engineering. 9, 644.
Wang, Y., Zhou, J., Chen. K., Wang, Y., and Liu. L. (2017). Water Quality Prediction Method
Based on LSTM Neural Network. International Conference on Intelligent Systems and
Knowledge Engineering.
Abstract:
USING LONG SHORT-TERM MEMORY NEURAL NETWORK TO FORECAST
WATER LEVEL AT THE QUANG PHUC AND THE CUA CAM STATIONS
IN HAI PHONG, VIETNAM
In this article, the LSTM (Long Short-Term Memory) model is applied to predict the river water
level without utilization of rainfall – forecast information and terrain data. The data required for
simulation are hourly water levels at hydrological stations in Hai Phong city. The model was
formulated to predict water level at the Quang Phuc station and the Cua Cam station, in Hai Phong
city for many cases from 1 to 5 hours of lead time. Although the model does not require many input
data such as climate, geography, land-use for rainfall-runoff simulation, the prediction results are
very stable and reliable: the Nash – Sutcliffe efficiency (NSE) is higher than 97.8% and the root
mean square error (RMSE) is lower than 0.10m for 3 hours of lead time prediction. The result
illustrated that the LSTM model is able to produce the river water level time series and useful for
the practical flood forecasting.
Keywords: Hai Phong, water level prediction, LSTM, DNN, Quang Phuc, Cua Cam.
Ngày nhận bài: 21/3/2018
Ngày chấp nhận đăng: 29/7/2018
Các file đính kèm theo tài liệu này:
- ung_dung_mang_long_short_term_memory_lstm_de_du_bao_muc_nuoc.pdf