MỤC LỤC
DANH MỤC CÁC TỪ VIẾT TẮT
DANH MỤC BẢNG BIỂU
DANH MỤC HÌNH
DANH MỤC PHỤ LỤC
LỜI MỞ ĐẦU
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ LẠM PHÁT
VÀ MÔ HÌNH MẠNG THẦN KINH NHÂN TẠO 3
1.1. Tổng quan lý thuyết và các nghiên cứu về lạm phát 3
1.1.1. Các quan điểm về lạm phát 3
1.1.2. Phân loại lạm phát 4
1.1.3. Tác động của lạm phát 4
1.1.3.1. Tác động phân phối lại thu nhập của lạm phát 5
1.1.3.2. Tác động của lạm phát đối với tăng trưởng kinh tế 5
1.1.3.3. Tác động của lạm phát lên tỷ giá hối đoái 6
1.1.3.4. Các tác động khác của lạm phát 7
1.2. Mô hình mạng thần kinh nhân tạo 7
1.2.1. Ý tưởng nền tảng của mô hình mạng thần kinh 8
1.2.2. Mô hình mạng thần kinh đơn giản 9
1.2.3. Cấu tạo của mô hình mạng thần kinh 11
1.2.3.1. Hàm kích hoạt 11
1.2.3.2. Cấu trúc mạng 13
1.2.3.3. Huấn luyện mạng 15
1.2.3.3.1. Học không giám sát (Unsupervised learning) 15
1.2.3.3.2. Học có giám sát (Supervised learning) 15
1.2.4. Xây dựng mô hình mạng thần kinh nhân tạo 16
1.2.4.1. Xác định biến số cho mô hình mạng thần kinh 17
1.2.4.2. Thu thập và xử lý dữ liệu 18
1.2.4.3. Sắp xếp lại bộ dữ liệu 19
1.2.4.4. Xây dựng cấu trúc mô hình mạng 21
1.2.4.4.1. Số lớp ẩn của mô hình mạng truyền thẳng đa lớp 21
1.2.4.4.2. Số nơ-ron của mỗi lớp ẩn trong mô hình mạng 21
1.2.4.5. Huấn luyện mạng và các tiêu chuẩn đánh giá mô hình 22
1.2.5. Bằng chứng thực nghiệm của mô hình mạng thần kinh 22
1.2.5.1. Ứng dụng trong dự báo tài chính 23
1.2.5.2. Ứng dụng trong xếp hạng tín dụng 23
1.2.5.3. Ứng dụng trong dự báo lạm phát 24
1.2.5.4. Một số ứng dụng khác của mô hình mạng thần kinh nhân tạo 25
CHƯƠNG 2: ỨNG DỤNG MÔ HÌNH MẠNG THẦN KINH
DỰ BÁO LẠM PHÁT VIỆT NAM 27
2.1. Xác định biến số đầu vào của mô hình 27
2.2. Thu thập và xử lý dữ liệu 32
2.3. Sắp xếp lại bộ dữ liệu 36
2.4. Xây dựng mô hình dự báo lạm phát 36
2.5. Kết quả thực nghiệm của mô hình và kết luận 39
CHƯƠNG 3: MỘT SỐ GỢI MỞ TỪ KẾT QUẢ MÔ HÌNH 48
3.1. Gợi ý về hướng nghiên cứu tiếp theo 48
3.2. Gợi ý chính sách 49
KẾT LUẬN
PHẦN PHỤ LỤC
TÀI LIỆU THAM KHẢO
74 trang |
Chia sẻ: maiphuongtl | Lượt xem: 2776 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Đề tài Ứng dụng mô hình mạng thần kinh dự báo lạm phát Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ồm mô hình mạng
truyền thẳng một lớp ẩn với lần lượt 3, 4, và 5 nơ-ron ở lớp ẩn. Tiếp đến, các mô hình
mạng phức tạp hơn bao gồm mạng thần kinh truyền thẳng với hai lớp ẩn với lần lượt
số nơ-ron ẩn ở các lớp ẩn là 4 với 3 và 5 với 4. Việc xác định số lớp ẩn cũng như số
nơ-ron phù hợp cho mỗi lớp ẩn, như đã được trình bày ở phần trên, cho đến nay, vẫn
chưa có các nghiên cứu thống nhất chỉ ra phương pháp tối ưu mà chủ yếu được thực
hiện qua quá trình thử vài sai với các cấu trúc mạng khác nhau. Tuy nhiên, một số gợi
ý về việc lựa chọn các nơ-ron ẩn phù hợp với quy mô bộ dữ liệu hoặc sắp xếp các nơ-
ron theo hướng lớp sau có số nơ-ron nhỏ hơn lớp trước cũng đã được vận dụng trong
quá trình thử nghiệm để xây dựng mô hình. Mặt khác, về lý thuyết, số lượng lớp ẩn
của mô hình vào khoảng 1 đến 3 lớp đã có khả năng mô hình hóa phần lớn các mối
tương quan phi tuyến giữa các biến số. Các nghiên cứu đã cho thấy, khi gia tăng hơn
nữa số lượng lớp ẩn hầu như không mang lại sự cải thiện trong kết quả dự báo của
- 37 -
mô hình mà ngược lại còn có khả năng dẫn đến tình trạng mô hình trở nên “quá phù
hợp” với dữ liệu quá khứ mà mất đi khả năng khái quát hóa và kéo theo đó là độ
chính xác trong dự báo không cao. Thực tế là với bộ dữ liệu và các biến số thu thập
được như trên, khi tiến hành thử nghiệm với các mô hình mạng phức tạp hơn từ 3 đến
5 lớp ẩn thì hầu như kết quả kiểm định ngoài mẫu mặc dù sau nhiều lần huấn luyện
đều không tốt hơn các mô hình mạng đơn giản ban đầu3.
Ngoài mô hình mạng truyền thẳng giản đơn, bài nghiên cứu còn sử dụng mô hình
mạng truyền thẳng được khái quát hóa (Generalized neural network - GNN). Tương
tự mô hình mạng truyền thẳng ban đầu, các thông tin trong mô hình này cũng chỉ
được truyền đi theo một chiều duy nhất từ biến đầu vào sang lần lượt các lớp ẩn và
cuối cùng là biến đầu ra. Tuy nhiên, điểm khác biệt là mô hình mạng thần kinh được
khái quát hóa sẽ có sự kết nối trực tiếp từ các biến đầu vào đến biến đầu ra. Một số
nghiên cứu về mô hình mạng thần kinh cho thấy GNN có khả năng giải quyết vấn đề
dự báo phần nào tốt hơn so với mô hình truyền thống. Do vậy chúng tôi quyết định sử
dụng thêm mô hình này, trước hết là để so sánh với mô hình mạng truyền thẳng giản
đơn vốn đã được sử dụng trong hầu hết các nghiên cứu về mô hình mạng, bên cạnh
đó là nhằm mục đích so sánh để xác định cấu trúc mạng phù hợp với đặc thù lạm phát
ở Việt Nam. Cụ thể các mô hình GNN được sử dụng bao gồm: Mạng GNN một lớp
ẩn với lần lượt 3 và 4 nơ-ron ẩn; mạng GNN với hai lớp ẩn có số nơ-ron ở hai lớp ẩn
là 3 và 2; 3 và 3; 4 và 4.
Trong khi đó, số nơ-ron ở lớp đầu vào và đầu ra sẽ tương ứng với số lượng biến hồi
quy và biến cần dự báo của mô hình mà trong trường hợp này lần lượt là 7 và 1 nơ-
ron.
3 Kết quả kiểm định ngoài mẫu của những mô hình này được trình bày trong phụ lục.
- 38 -
Bảng 2.3: Thống kê các mô hình mạng được sử dụng.
Mô tả mô hình mạng Ký hiệu
Mạng truyền thẳng giản đơn MLF
Mô hình mạng truyền thẳng một lớp ẩn với 3 nơ-ron ẩn MLF-7-3-1
Mô hình mạng truyền thẳng một lớp ẩn với 4 nơ-ron ẩn MLF-7-4-1
Mô hình mạng truyền thẳng một lớp ẩn với 5 nơ-ron ẩn MLF-7-5-1
Mô hình mạng truyền thẳng hai lớp ẩn với lần lượt 3 và 2
nơ-ron ẩn
MLF-7-3-2-1
Mô hình mạng truyền thẳng hai lớp ẩn với lần lượt 4 và 3
nơ-ron ẩn
MLF-7-4-3-1
Mô hình mạng truyền thẳng hai lớp ẩn với lần lượt 5 và 4
nơ-ron ẩn
MLF-7-5-4-1
Mạng truyền thẳng khái quát hóa GNN
Mô hình mạng truyền thẳng khái quát hóa với một lớp ẩn
3 nơ-ron ẩn
GNN-7-3-1
Mô hình mạng truyền thẳng khái quát hóa với một lớp ẩn
4 nơ-ron ẩn
GNN-7-4-1
Mô hình mạng truyền thẳng khái quát hóa với hai lớp ẩn
và 3 nơ-ron mỗi lớp
GNN-7-3-3-1
Mô hình mạng truyền thẳng khái quát hóa với hai lớp ẩn
và 4 nơ-ron mỗi lớp
GNN-7-4-4-1
Sau khi xác định được cấu trúc mạng thần kinh, một thông số khác của mô hình cần
được quan tâm chính là hàm kích hoạt (còn được gọi là hàm truyền hoặc hàm nén)
- 39 -
được sử dụng trong các nơ-ron để chuyển đổi các dữ liệu đầu vào. Hàm kích hoạt
được sử dụng phổ biến đã được nhắc đến trong chương 1 là hàm logsidmoid, chuyển
đổi các giá trị đầu vào thành giá trị tương ứng trong khoảng [0;1]. Tuy nhiên, bên
cạnh đó, hàm kích hoạt khác cũng được sử dụng trong các nghiên cứu là hàm tang-
sigmoid. Thay vì đưa các giá trị đầu vào về trong khoảng [0;1], hàm tang-sigmoid sẽ
đưa chúng về khoảng [-1;+1]. Chuỗi các mô hình mạng truyền thẳng (bao gồm:
MLF-7-3-1, MLF-7-4-1, MLF-7-5-1, MLF-7-4-31 và MLF-7-5-4-1) sẽ được sử dụng
để so sánh kết quả dự báo ngoài mẫu của hai chuỗi mô hình có sự tương đồng trong
tất cả các thông số ngoại trừ hàm kích hoạt là log-sigmoid và tang-sigmoid và tất cả
mô hình đều được “huấn luyện” trên cơ sở nguyên lý của thuật toán lan truyền ngược
và các phương pháp tối ưu hóa phi tuyến. Mỗi mô hình sẽ được huấn luyện nhiều lần
cho đến khi đạt được kết quả “tối ưu” ở mức chấp nhận được. Việc lựa chọn mô hình
sẽ được xác lập trên cơ sở các chỉ tiêu so sánh sau đây của tập các quan sát được
dùng để kiểm định ngoài mẫu (bao gồm 15 quan sát gần nhất – chiếm tỷ lệ 15% tổng
số quan sát).
MSE – Trung bình các bình phương sai số
NMSE – Trung bình các bình phương sai số được chuẩn hóa
MAE – Trung bình các sai số tuyện đối.
R – Tương quan tuyến tính giữa chuỗi giá trị lạm phát dự báo và thực tế.
Sau khi xác định tất cả các thông số cần thiết, quá trình huấn luyện mạng được tiến
hành với sự trợ giúp của phần mềm Neural Network Solution và kết quả kiểm định
ngoài mẫu của các mô hình được trình bày ở phần tiếp theo.
2.5. Kết quả thực nghiệm của mô hình và kết luận
Với các thông số về mô hình đã được xác định, quá trình huấn luyện mạng được tiến
hành. Với mỗi mô hình, quá trình “học hỏi” của hệ thống mạng được lặp lại 20 đến
30 lần tùy thuộc vào kết quả của mỗi lần huấn luyện và từ đó lựa chọn mô hình tương
đối phù hợp nhất. Trong mỗi lần huấn luyện, sự điều chỉnh của các tập trọng số sao
cho tối thiểu hóa giá trị MSE sẽ được xác lập là 1000 bước. Tuy nhiên, nếu như giá
trị MSE không được cải thiện đối với tập các quan sát kiểm định lại (cross validation)
- 40 -
sau liên tục 300 – 400 bước thì lần huấn luyện mạng đó sẽ được dừng lại và tập trọng
số tối ưu trong trường hợp này chính là tập trọng số có giá trị MSE của tập kiểm định
lại nhỏ nhất. Trên cơ sở đó, chúng tôi đưa ra kết quả của các mô hình như sau.
Bảng 2.4: Kết quả kiểm định ngoài mẫu chuỗi các mô hình MLF
sử dụng hàm kích hoạt log-sigmoid.
Mô hình MSE NMSE MAE R
MLF-7-4-1 3.6336E-05 1.31570701 0.00459459 48.59%
MLF-7-5-1 6.8072E-05 2.46485129 0.00628747 58.35%
MLF-7-3-1 2.5027E-05 0.90621763 0.00360985 36.27%
MLF-7-4-3-1 5.7961E-05 2.09874748 0.00568032 43.91%
MLF-7-5-4-1 3.5518E-05 1.28607939 0.00421856 22.59%
MLF-7-3-2-1- 3.3827E-05 1.22486165 0.00421062 40.39%
Nguồn: Tính toán từ số liệu nghiên cứu.
Bảng 2.5: Kết quả kiểm định ngoài mẫu chuỗi các mô hình MLF
sử dụng hàm kích hoạt tang-sigmoid.
Mô hình MSE NMSE MAE R
MLF-7-4-1 2.89927E-05 1.04980699 0.003811882 67.93%
MLF-7-5-1 3.56403E-05 1.29051453 0.005221159 67.96%
MLF-7-3-1 1.36223E-05 0.49325586 0.003106482 89.12%
MLF-7-4-3-1 2.58549E-05 0.93619137 0.004237882 72.22%
MLF-7-5-4-1 4.97327E-05 1.80078991 0.005839407 71.08%
MLF-7-3-2-1 3.61289E-05 1.30820475 0.004347311 77.36%
Nguồn: Tính toán từ số liệu nghiên cứu.
- 41 -
Trước hết, bảng kết quả trên cho thấy sự cải thiện trong hiệu quả dự báo của mô hình
khi sử dụng hàm kích hoạt tang-sigmoid thay vì hàm log-sigmoid. Nếu như chỉ tiêu
MSE bình quân của các mô hình khi sử dụng hàm log-sigmoid là 4.27.10-5 thì con số
này đối với hàm tang-sigmoid là 3.16.10-5 và tương tự vậy đối với chỉ tiêu NMSE với
lần lượt 1.55 và 1.14. Tuy nhiên, nếu như mức độ cải thiện khi sử dụng hàm tang-
sigmoid ở hai chỉ tiêu trên chưa thật sự đáng kể thì thông qua chỉ tiêu r, biểu thị mối
tương quan tuyến tính giữa chuỗi giá trị lạm phát được dự báo với chuỗi thực tế sẽ
cho thấy sự khác biệt trong việc sử dụng hai hàm kích hoạt này. Chỉ tiêu này đối với
hàm log-sigmoid bình quân khoảng 40% và tối đa là 58% ở mô hình MLF-7-5-1 thì
tương ứng là ở mức khoảng 75% và đặc biệt giá trị này đạt đến mức 89.12% ở mô
hình MLF-7-3-1. Qua đó có thể thấy rằng, trong trường hợp nguồn dữ liệu của Việt
Nam, hàm kích hoạt tang-sigmoid có đặt điểm chuyển đổi giá trị đầu vào về khoảng
giá trị rộng hơn là [-1;1] sẽ tốt hơn so với hàm log-sigmoid thông thường.
Mặt khác, bảng 2.5 cũng cho thấy hiệu quả của mô hình phi tuyến mạng thần kinh
trong việc dự báo tỷ lệ lạm phát hàng tháng của Việt Nam. Theo đó, mức sai lệch
tuyện đối chỉ ở mức 0.00427 tương ứng với đó là tỷ lệ tương quan khá cao giữa chuỗi
giá trị dự báo và chuỗi giá trị thực tế. Biểu đồ sau một lần nữa minh họa thực tế trên.
Hình 2.6: Kết quả kiểm định ngoài mẫu mô hình MLF-7-3-1
Nguồn: Tính toán từ số liệu nghiên cứu.
Desired Output and Actual Network Output
-0.01
-0.005
0
0.005
0.01
0.015
0.02
0.025
0.03
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Exemplar
O
ut
pu
t
INF
INF Output
- 42 -
Hình 2.7: Kết quả kiểm định ngoài mẫu mô hình MLF-7-4-1
Nguồn: Tính toán từ số liệu nghiên cứu.
Hình 2.8: Kết quả kiểm định ngoài mẫu mô hình MLF-7-5-1
Nguồn: Tính toán từ số liệu nghiên cứu.
Desired Output and Actual Network Output
-0.01
-0.005
0
0.005
0.01
0.015
0.02
0.025
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Exemplar
O
ut
pu
t
INF
INF Output
Desired Output and Actual Network Output
-0.005
0
0.005
0.01
0.015
0.02
0.025
0.03
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Exemplar
O
ut
pu
t
INF
INF Output
- 43 -
Hình 2.9: Kết quả kiểm định ngoài mẫu mô hình MLF-7-4-3-1
Nguồn: Tính toán từ số liệu nghiên cứu.
Hình 2.10: Kết quả kiểm định ngoài mẫu mô hình MLF-7-5-4-1
Nguồn: Tính toán từ số liệu nghiên cứu.
Desired Output and Actual Network Output
0
0.005
0.01
0.015
0.02
0.025
0.03
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Exemplar
O
ut
pu
t
INF
INF Output
Desired Output and Actual Network Output
-0.005
0
0.005
0.01
0.015
0.02
0.025
0.03
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Exemplar
O
ut
pu
t
INF
INF Output
- 44 -
Hình 2.11: Kết quả kiểm định ngoài mẫu mô hình MLF-7-3-2-1
Nguồn: Tính toán từ số liệu nghiên cứu.
Mặc dù số liệu từ kết quả kiểm định ngoài mẫu cho thấy mô hình mạng thần kinh
truyền thẳng có khả năng dự báo tương đối tốt trong trường hợp chuỗi giá trị lạm
phát hàng tháng của Việt Nam, bài nghiên cứu vẫn tiến hành xây dựng các mô hình
mạng GNN còn lại để có sự so sánh nhằm tìm ra mô hình phù hợp cho việc dự báo
lạm phát ở Việt Nam. Tiến hành tương tự với các mô hình trên, quá trình huấn luyện
mạng cho kết quả dự báo ngoài mẫu như sau:
Bảng 2.6: Kết quả kiểm định ngoài mẫu chuỗi các mô hình GNN
MSE NMSE MAE R
GNN-7-4-1 6.93058E-05 2.509518081 0.006038182 55.00%
GNN-7-3-1 0.000152486 5.521426791 0.009183104 69.06%
GNN-7-4-4-1 3.88811E-05 1.407860822 0.004007723 78.44%
GNN-7-3-3-1 2.95547E-05 1.070157435 0.004451876 72.83%
Nguồn: Tính toán từ số liệu nghiên cứu.
Desired Output and Actual Network Output
-0.015
-0.01
-0.005
0
0.005
0.01
0.015
0.02
0.025
0.03
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Exemplar
O
ut
pu
t
INF
INF Output
- 45 -
So với kết quả của bảng 2.5 thì số liệu của quá trình kiểm định ngoài mẫu đối với
chuỗi các mô hình GNN cho thấy, nhìn chung, cấu trúc mạng thần kinh truyền thẳng
được khái quát hóa không góp phần vào sự cải thiện trong kết quả dự báo như kết
luận của một số nghiên cứu.
Hình 2.12: Chuỗi giá trị INF dự báo từ các mô hình GNN
Nguồn: Tổng hợp từ số liệu nghiên cứu.
Mặt khác, tuy kết quả dự báo từ chuỗi các mô hình GNN không thật sự tốt hơn so với
chuỗi các mô hình MLF ban đầu nhưng kết quả trung bình của tất cả các mô hình dự
báo lại mang đến ý nghĩa khác. Điều này được gợi ý từ việc sử dụng “thick model”
của Paul McNelis và Peter MacAdam trong nghiên cứu năm 2004 về mô hình thần
kinh trong dự báo lạm phát của các nước châu Âu và Mỹ. Theo đó, kết quả dự báo
trung bình từ các cấu trúc mô hình khác nhau sẽ cho kết quả dự báo tốt hơn của các
mô hình đơn lẻ và kết quả thực nghiệm trong trường hợp này cho thấy lập luận trên
của các tác giả có phần đúng.
-3.00%
-2.00%
-1.00%
0.00%
1.00%
2.00%
3.00%
4.00%
5.00%
1 3 5 7 9 11 13 15
GNN-7-4-1
GNN-7-3-1
GNN-7-4-4-1
GNN-7-3-3-1
- 46 -
Hình 2.13: Chuỗi giá trị INF dự báo trung bình từ các
mô hình MLF-GNN và chuỗi thực tế
Nguồn: Tổng hợp từ số liệu nghiên cứu.
Với chuỗi giá trị lạm phát được lấy trung bình hàng tháng từ các mô hình đã xây
dựng, các chỉ tiêu MSE, RMSE, MAE và r lần lượt là 1.21145.10-5 ; 0.438657;
0.00254 và 88.31%. So với kết quả tốt nhất trong số các mô hình đã xây dựng là
MLF-7-3-1 thì xét về chỉ tiêu tương quan tuyến tính, chuỗi giá trị trung bình của các
dự báo có phần sụt giảm nhưng không đáng kể. Tuy nhiên, bù lại với đó là sự cải
thiện phần nào trong các chỉ tiêu còn lại. Mặc dù không thật sự có ý nghĩa như kết
luận trong nghiên cứu đã đề cập nhưng điều này có thể bắt nguồn từ những lý do
khác nhau mà một trong số đó có thể là do số lượng cấu trúc mô hình khác nhau được
xây dựng vẫn còn hạn chế.
Tóm lại, kết quả thực nghiệm từ các mô hình trên cho thấy tiềm năng của mô hình
phi tuyến mạng thần kinh trong việc dự báo tỷ lệ lạm phát hàng tháng ở Việt Nam
được thể hiện qua kết quả khả quan trong các kiểm định ngoài mẫu. Bên cạnh đó, kết
quả thực nghiệm cũng đã cho thấy việc lựa chọn hàm kích hoạt có sự tác động đến
kết quả dự báo và trong trường hợp này thì hàm truyền tang-sigmoid là sự lựa chọn
tốt hơn. Mặt khác, không giống các nghiên cứu trước khi kết luận về hiệu quả dự báo
tốt hơn của mô hình mạng thần kinh được khái quát hóa, thực tế cho thấy rằng mô
hình mạng truyền thẳng dường như chiếm ưu thế tuyện đối trong việc dự báo lạm
phát ở Việt Nam. Bên cạnh đó, những thử nghiệm bước đầu cũng cho thấy rằng
0.00%
0.50%
1.00%
1.50%
2.00%
2.50%
3.00%
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Average output
IFL
- 47 -
những mô hình mạng không quá phức tạp sẽ góp phần đưa đến kết quả dự báo tương
đối tốt hơn so với các mô hình phức tạp mà điều này vẫn còn cần phải đi sâu vào
nghiên cứu để làm rõ nhưng nhìn chung, các kết quả thực nghiệm ở trên đã bước đầu
định hình cho việc xây dựng một mô hình mạng thần kinh phi tuyến phù hợp để dự
báo tỷ lệ lạm phát ở Việt Nam vốn là mục tiêu chính của bài nghiên cứu.
Mặt khác, tuy tồn tại những hạn chế trong việc đưa ra các phương pháp thống kê để
phân tích rõ mối quan hệ giữa các biến đầu vào và đầu ra trong mô hình mạng nhưng
những kết quả kiểm định ngoài mẫu cũng đã góp phần vào việc khẳng định sự tồn tại
trong mối tương quan giữa các biến số bao gồm tín dụng, cung tiền, tỷ lệ lạm phát
quá khứ, giá dầu… Qua đó bài nghiên cứu cũng đã góp phần vào việc một lần nữa
khẳng định sự tác động của các biến số này đến tỷ lệ lạm phát ở Việt Nam và trên cơ
sở đó đưa ra những dự báo trong tương lai.
- 48 -
CHƯƠNG 3: MỘT SỐ GỢI MỞ TỪ KẾT QUẢ MÔ HÌNH
3.1. Gợi ý về hướng nghiên cứu tiếp theo.
Với những nguyên lý về thuận toán lan truyền ngược và các bước xây dựng mô hình
mạng được gợi ý từ các tác giả trước, bài nghiên cứu đã bước đầu xây dựng mô hình
mạng thần kinh để dự báo lạm phát hàng tháng ở Việt Nam trên cơ sở các biến tiền tệ
như tín dụng, cung tiền; chi phí đầu vào như lãi vay, giá dầu và yếu tố kỳ vọng là tỷ
lệ lạm phát trong quá khứ. Kết quả thực nghiệm đã cho thấy triển vọng ứng dụng mô
hình mạng thần kinh trong dự báo thực tế và đồng thời cũng gợi mở những hướng đi
mới cho các nghiên cứu tiếp theo nhằm hoàn thiện hơn mô hình mạng thần kinh cho
mục đích dự báo lạm phát ở Việt Nam.
Trước hết, về khía cạnh thuật toán huấn luyện mạng, nghiên cứu sử dụng thuận toán
lan truyền ngược cùng với các phương pháp tối ưu hóa phi tuyến thông thường được
sử dụng phổ biến trong hầu hết các nghiên cứu. Tuy nhiên, những nghiên cứu về
thuật toán phù hợp nhất cho bộ dữ liệu trong điều kiện thực tế của Việt Nam sẽ rất
hữu ích trong việc nâng cao hiệu quả dự báo tỷ lệ lạm phát. Đặc biệt là thuật toán di
truyền (genetic algorithm) được nhắc đến khá nhiều trong các nghiên cứu về mô hình
mạng thần kinh trong thời gian gần đây. Ứng dụng thuật toán di truyền trong huấn
luyện mạng nhằm xác định tập trọng số tối ưu để dự báo lạm phát sẽ là một hướng đi
khả dĩ đối với các nghiên cứu về mạng thần kinh phi tuyến trong thời gian tới. Bên
cạnh thuật toán di truyền thì sự kết hợp của mô hình mạng thần kinh với lý thuyết
logic mờ (Fuzzy-logic) trong việc trong việc hình thành các “mô hình lai tạp” để dự
báo lạm phát hứa hẹn sẽ góp phần nâng cao chất lượng của quá trình dự báo.
Mặt khác, trong khi các biến đầu vào của bài nghiên cứu được lựa chọn trên cơ sở gợi
ý từ các nghiên cứu thực nghiệm về lạm phát trong nước và so sánh mối tương quan
giữa các chuỗi số liệu thì việc ứng dụng mô hình mạng thần kinh, mà cụ thể trong
trường hợp này là mô hình “sơ đồ tự tổ chức” (self-organizing map) sẽ có thể góp
phần vào việc đưa ra những lựa chọn biến số đầu vào thích hợp hơn.
Về khía cạnh cấu trúc của mô hình mạng, bài nghiên cứu sử dụng mô hình mạng
truyền thẳng và mô hình mạng truyền thẳng được khái quát hóa và đã đạt được những
kết quả khả quan bước đầu. Tuy nhiên, một số cấu trúc mạng phức tạp hơn như mô
- 49 -
hình mạng tuần hóa (Recurrent neural network) mà trong đó các giá trị đầu ra của nơ-
ron sẽ được sẽ có tác động ngược trở lại đối với nơ-ron của các lớp trước. Thông qua
đó, hệ thống mạng sẽ tận dụng các thông tin từ bản thân cấu trúc của chuỗi dữ liệu để
góp phần đưa ra kết quả dự báo tốt hơn. So sánh hiệu quả dự báo của hai loại mô
hình sẽ đưa ra những kết luận có ý nghĩa cho việc hoàn thiện mô hình mạng.
Bên cạnh đó, lạm phát kỳ vọng là một trong những nhân tố ảnh hưởng lớn đến mức
lạm phát hiện tại tuy nhiên, thông tin về lạm phát kỳ vọng chỉ mới được phản ánh
thông qua mức lạm phát trong quá khứ. Điều này có thể phần nào chưa đầy đủ.
Những nghiên cứu sâu hơn về cách thức tác động của yếu tố kỳ vọng đến mức giá
chung của nền kinh tế, về cách thức đo lường…sẽ hết sức cần thiết để từ đó cung cấp
thêm thông tin đầu vào góp phần làm cho kết quả dự báo của mô hình mạng sát với
thực tế hơn.
3.2. Gợi ý chính sách.
Trước hết, kết quả kiểm định ngoài mẫu cho thấy khả năng ứng dụng của mô hình
mạng thần kinh trong dự báo thực tế mà đặc biệt là trong điều hành chính sách tiền tệ.
Kết quả dự báo về mức lạm phát trong tương lai trên cơ sở những thông tin hiện tại
và các giả định được xác lập sẽ cung cấp bức tranh chung về viễn cảnh trong tương
lai của mức giá chung trong nền kinh tế. Trên cơ sở đó, cơ quan điều hành chính sách
sẽ có những biện pháp chủ động để đối phó. Đây sẽ là một trong những tiền đề quan
trọng để thực hiện chính sách lạm phát mục tiêu (inflation-targeting) vốn đã được
ứng dụng khá thành công ở một số nước phát triển. Theo đó, với mức lạm phát dự
báo được, các chính sách tiền tệ chủ động sẽ được thực thi nhằm đưa lạm phát quay
về mức mục tiêu, mức lạm phát được cho là “tối ưu” đối với nền kinh tế. Việc xác lập
mức lạm phát “tối ưu” còn cần phải đi sâu vào nghiên cứu. Tuy nhiên, cần phải lưu ý
rằng, đây không phải là mức lạm phát được Quốc hội thông qua để làm mục tiêu điều
hành chính sách trong năm. Mức lạm phát này được đưa ra có phần chủ quan và vì
vậy mà không mang nhiều ý trong việc kiềm chế lạm phát.
Bên cạnh việc dự báo chiều hướng biến động của lạm phát thì hiệu quả của chính
sách “neo giữ” lạm phát còn đòi hỏi sự kết hợp với khả năng của Ngân hàng Trung
Ương trong việc “neo giữ” niềm tin và kỳ vọng của các chủ thể trong nền kinh tế. Ví
- 50 -
dụ, chính sách tăng lãi suất để kiềm chế lạm phát của NHNN có thể sẽ có tác động
không quá lớn. Tuy nhiên, điều quan trọng là những tín hiệu được phát đi từ sự thay
đổi trong chính sách đó sẽ góp phần vào việc hình thành nên dự đoán và mong đợi
của các chủ thể. Vì vậy mà sự định hướng dư luận của NHNN nói riêng và Chính phủ
nói chung là một trong những biện pháp quan trọng để duy trì sự ổn định của tỷ lệ
lạm phát và trong trường hợp đó, uy tín của NHNN trong điều hành chính sách là một
yếu tố không thể thiếu. Để xây dựng và duy trì niềm tin của công chúng vào sự điều
hành chính sách đòi hỏi sự minh bạch nhất quán của NHNN. NHNN nên thường
xuyên cung cấp các báo cáo chính sách tiền tệ, giải thích ý nghĩa của chúng cũng như
động lực phía sau các chính sách đó. Trong một số trường hợp, NHNN cũng có thể
đề ra các chính sách khả thi để thực hiện trong tương lai tới chủ thể trong nền kinh tế.
Ngược lại, một mức uy tín cao sẽ cho phép các NHNN được uyển chuyển hơn trong
việc thực hiện chính sách tiền tệ. Để góp phần cho chính sách tiền tệ phát huy tác
dụng tốt hơn thì việc kiểm soát, ngăn chặn tình trạng đô la hóa trong nền kinh tế là
hết sức cần thiết vì tình trạng này gây khó khăn trong việc dự đoán diễn biến tổng
phương tiện thanh toán, mục tiêu gián tiếp trong kiềm chế lạm phát.
Mặt khác, khi theo đuổi mục tiêu ổn định lạm phát đồng thời “neo” giữ mức cung
tiền và tín dụng cho nền kinh tế thì đồng thời NHNN sẽ có thể và nên linh hoạt hơn
trong điều hành tỷ giá. Thực tế cho thấy, trong năm 2007, vì phải giữ cho tỷ giá ổn
định mà NHNN đã phải cung ra thị trường một lượng tiền đồng lớn để mua vào đô la
Mỹ và góp phần không nhỏ vào mức lạm phát gần 20% của năm 2008. Qua đó có thể
thấy rằng, trong điều kiện ngày càng hội nhập sau rộng vào nền kinh tế toàn cầu, mục
tiêu theo đuổi sự ổn định của tỷ giá đã không những không giúp kiểm soát mà ngược
lại còn góp phần gây ra áp lực lạm phát. Do đó, cần phải nhận thức rằng khi chính
sách tiền tệ mà cụ thể là cung tiền và tín dụng được kiểm soát hợp lý khi theo đuổi
mục tiêu lạm phát thì việc điều chỉnh tỷ giá theo cung cầu thị trường mà thực tế là
“thả nổi có quản lý” hơn nữa đối với tỷ giá không nhất thiết sẽ gây ra lạm phát. Chính
sự lưỡng lự, không rõ ràng, nhất quán trong chính sách tỷ giá mới gây ra tâm lý kỳ
vọng lạm phát và lạm phát thực tế ở kỳ sau nếu các chính sách vĩ mô không đi theo
hướng kiểm soát lạm phát.
Mặt khác, chính sách tiền tệ cần sự hỗ trợ từ chính sách tài khóa. Do cấu trúc thể chế
trong thực thi chính sách tài chính và tiền tệ, việc thực hiện chính sách kiểm soát lạm
- 51 -
phát ở Việt Nam không thể thành công nếu không có sự cam kết chi tiêu từ chính
sách tài khóa. Việc này cho thấy tăng trưởng mức cầu từ chi tiêu của Chính phủ phải
hợp lý và rõ ràng. Khi chi tiêu Chính phủ tăng thì nguồn tài trợ sẽ gián tiếp chảy từ
Ngân hàng Nhà nước thông qua vòng chu chuyển của trái phiếu Chính phủ qua các
Ngân hàng thương mại. Điều này cho thấy chính sách tiền tệ có thể sẽ bị động do
chính sách tài khóa mở rộng và việc này làm giảm hiệu quả của chính sách tiền tệ. Do
vậy, cắt giảm chi tiêu công và tập trung chi tiêu vào các hạng mục đầu tư có hiệu quả
và các hạng mục mang lại lợi ích xã hội cao hơn là cố gắng chi tiêu để tăng trưởng
kinh tế nhờ vào sức cầu của chi tiêu Chính phủ.
Suy cho cùng, nguyên nhân sâu xa của lạm phát trong nền kinh tế Việt Nam bắt
nguồn từ mô hình tăng trưởng kinh tế dựa trên chiều rộng, gia tăng vốn đầu tư nhưng
không thật sự hiệu quả. Trong suốt một thời gian dài, các chính sách tài khóa và tiền
tệ nới lỏng được thực hiện để nhằm đạt mục tiêu tăng trưởng kinh tế. Điều này được
thể hiện rõ ràng hơn trong khoảng hai năm gần đây với sự thay đổi liên tục trong ưu
tiên điều hành chính sách của chính phủ. Ngay sau khi lạm phát phần nào dịu bớt thì
theo sau đó là chính sách nới lỏng tài khóa và tín dụng để thúc đẩy tăng trưởng và kết
quả là lạm phát lại tăng tốc và ưu tiên điều hành chính sách lại được chuyển từ mục
tiêu tăng trưởng sang kiềm chế lạm phát. Thiết nghĩ, cần có sự thay đổi triệt để trong
định hướng điều hành, cần thiết phải xem trọng hơn sự ổn định kinh tế vĩ mô. Có thể
tăng trưởng kinh tế không đạt mức cao nhưng bù lại tỷ lệ đó được duy trì ổn định qua
các năm cùng với mức lạm phát mục tiêu phù hợp sẽ góp phần cho sự phát triển bền
vững của nền kinh tế.
Tóm lại, với tình hình lạm phát gia tăng và những bất ổn trên thị trường ngoại hối
thời gian qua, Chính phủ cần truyền đi một thông điệp rõ ràng và nhất quán về sự
cam kết của chính phủ nhằm đạt được và duy trì ổn định kinh tế vĩ mô trong ngắn
hạn. Điều này đòi hỏi các giải pháp chính sách cần thiết kèm theo và thường xuyên
công bố các thông tin kinh tế vĩ mô, tài chính nhằm xây dựng uy tín và sự tin cậy
trong các đối tác thị trường. Mức độ hội nhập kinh tế ngày càng sâu rộng đòi hỏi
chính sách tiền tệ gắn với mục tiêu lạm phát. Điều quan trọng là phải đảm bảo sự
nhất quán xuyên suốt các mục tiêu của chính sách tiền tệ như lãi suất, tín dụng, tỷ
giá...
- 52 -
Với những định hướng chính sách như trên bên cạnh việc điều hành chính sách tỷ
giá theo hướng lạm phát mục tiêu trên cơ sở các dự báo được gợi ý từ mô hình cùng
với những bước đi đúng đắn của cơ quan điều hành chính sách thời gian qua, hy vọng
rằng mục tiêu “ổn định kinh tế vĩ mô, đảm bảo an sinh xã hội” sẽ sớm được thực
hiện.
- 53 -
LỜI KẾT
Kết thúc quý 1 năm 2011, lạm phát đang ở mức 6.2%. So với mục tiêu đề ra từ đầu
năm của Chính phủ là 7% thì dường như việc kiềm hãm lạm phát từ nay đến cuối
năm chỉ tăng chỉ tăng 0.8 điểm phần trăm là rất khó khả thi và nhiều khả năng lạm
phát năm nay sẽ tiếp tục duy trì ở mức hai chữ số. Do vậy, những biện pháp kiềm chế
lạm phát tức thời là hết sức cần thiết. Tuy nhiên, việc NHNN theo đuổi chính sách
lạm phát mục tiêu và kiểm soát cung tiền để đảm bảo sự ổn định vĩ mô mới là biện
pháp dài hạn.
Bài nghiên cứu đã đi sâu vào phân tích lạm phát trong nền kinh tế Việt Nam thời gian
qua và trên cơ sở đó chỉ ra những biến số đầu có khả năng tác động đến lạm phát.
Tiếp đến, những biến số này được đưa vào mô hình mạng thần kinh phi tuyến và tiến
hành các kiểm định ngoài mẫu. Kết quả thực nghiệm cho thấy, trước hết, tương tự
như các nghiên cứu trước, mô hình mạng thần kinh tỏ ra khá hiệu quả trong dự báo tỷ
lệ lạm phát hàng tháng của Việt Nam trong giai đoạn kiểm định. Bên cạnh đó, bài
nghiên cứu cũng đã bước đầu định hình cấu trúc mô hình mạng phù hợp với điều kiện
bộ dữ liệu Việt Nam dựa trên các chỉ tiêu so sánh. Đó là cấu trúc mạng truyền thẳng
với một lớp ẩn và ba nơ-ron ẩn duy nhất. Tuy nhiên, cấu trúc mạng này vẫn có thể
được điều chỉnh trong trường hợp có sự thay đổi trong các biến đầu vào và đây có thể
là một gợi ý cho hướng nghiên cứu sắp tới về vận dụng mô hình mạng thần kinh
trong dự báo lạm phát. Ngoài ra, kết quả kiểm định còn cho thấy mô hình mạng được
khái quát hóa không thật sự hoàn thiện hiệu quả dự báo so với mô hình mạng thần
kinh giản đơn như kết luận trong một số nghiên cứu khác. Cuối cùng, một số gợi ý về
chính sách cũng như hướng nghiên cứu xa hơn liên quan đến chủ đề này đã được đưa
ra trên cơ sở của kết quả thực nghiệm.
- 54 -
PHẦN PHỤ LỤC
Phụ lục 1: Các chỉ số đo lường lạm phát
Tỷ lệ lạm phát được đo lường nhờ các chỉ số giá. Dựa vào từng loại chỉ số giá mà ta
tính được tỷ lệ lạm phát trong từng thời kỳ khác nhau theo công thức:
ܶỷ ݈ệ ݈ạ݉ ℎáݐ = ܥℎỉ ݏố ݃݅á ݇ỳ ݊àݕ − ܥℎỉ ݏố ݃݅á ݇ỳ ݐݎướܿ
ܥℎỉ ݏố ݃݅á ݇ỳ ݐݎướܿ × 100%
Chỉ số giá tiêu dùng (Consumer Price Index - CPI):
Chỉ số giá tiêu dùng (CPI) đo lường giá cả các hàng hóa tiêu dùng được mua bởi
người tiêu dùng thông thường. Chỉ số này được tính toán theo phần trăm để phản ánh
mức thay đổi tương đối của giá hàng tiêu dùng theo thời gian. Sở dĩ thay đổi tương
đối là vì chỉ số này chỉ dựa vào một giỏ hàng hóa đại diện cho toàn bộ hàng tiêu
dùng.
Thông thường, chỉ số giá tiêu dùng được sử dụng để tính toán tỷ lệ lạm phát của phần
lớn các quốc gia trên thế giới. Ngoài ra, chỉ số này cho thấy mức tăng kỳ vọng trong
lương danh nghĩa của người lao động, đồng thời ngụ ý rằng các khoản chi định danh
sẽ tự động tăng lên theo mức tăng của CPI.
Chỉ số giá sản xuất (Producer Price Index – PPI):
Chỉ số giá cả sản xuất PPI đo mức giá mà các nhà sản xuất nhận được, không tính
đến giá bổ sung qua đại lý hoặc thuế doanh thu. Chỉ số này cũng được tính toán như
CPI, tức là sử dụng tỷ lệ phần trăm chi phí để mua một rổ hàng hóa nhất định. Tuy
nhiên, giá cả ở đây là giá do nhà sản xuất ấn định, được bán trong lần đầu tiên. Và
đây cũng là sự khác biệt lớn nhất giữa CPI và PPI.
Với cách tính như trên, đây là một chỉ tiêu tương đối, phản ánh xu hướng và đo lường
mức độ biến động giá bán của các nhà sản xuất trên thị trường sơ cấp vào một thời
kỳ. Mặt khác, giá cả sản xuất tăng sẽ dẫn đến giá tiêu dùng tăng, một phần chi phí
trong quá trình sản xuất kinh doanh được các doanh nghiệp chuyển sang cho người
tiêu dùng. Vì vậy, PPI là chỉ số hữu dụng về xu hướng đối với giá cả và cũng là một
chỉ số tốt để tính toán tỷ lệ lạm phát.
- 55 -
Chỉ số giảm phát tổng sản phẩm quốc nội (GDP deflator – DGDP):
Chỉ số giảm phát GDP, còn gọi là chỉ số điều chỉnh GDP, là chỉ số tính theo phần
trăm phản ánh mức giá chung của tất cả các loại hàng hoá, dịch vụ sản xuất trong
nước. Chỉ số điều chỉnh GDP cho biết một đơn vị GDP điển hình của kỳ t có mức giá
bằng bao nhiêu phần trăm so với mức giá của kỳ gốc.
Khác với chỉ số giá tiêu dùng CPI, DGDP được tính trên giỏ hàng hoá thay đổi, do vậy
nó phản ánh được sự thay thế giữa các hàng hoá, dịch vụ với nhau. Thêm vào đó,
DGDP phản ánh giá của cả hàng hoá do doanh nghiệp, chính phủ mua trong khi đó CPI
chỉ phản ánh mức giá của mặt hàng tiêu dùng. Vì thế DGDP được coi là phản ánh đúng
hơn mức giá chung. Tuy nhiên, DGDP chỉ phản ánh mức giá của những hàng hoá sản
xuất trong nước còn CPI phản ánh luôn cả mức giá của hàng hoá nhập khẩu nên được
xem là toàn diện hơn.
Dù có một số khác biệt kể trên thì trong thực tế, sự khác biệt giữa CPI và DGDP không
lớn. Và DGDP vẫn là một trong những chỉ số đánh giá tỷ lệ lạm phát vì nó phản ánh
được thay đổi trong GDP danh nghĩa khi giá cả các mặt hàng trong nước biến động.
Phụ lục 2: Mô hình hồi quy tuyến tính
Mô hình mạng thần kinh nhân tạo được sử dụng với mục đích dự báo biến phụ thuộc
y từ một tập hợp các biến đầu vào x; trong chuỗi thời gian, tập hợp của các biến đầu
vào x có thể bao gồm các biến trễ (lagged variables), biến hiện tại (current variables)
của x và các giá trị trễ (lagged values) của y. Mô hình hồi quy tuyến tính thường
được sử dụng trong bước đầu tiếp cận với công tác dự báo, được thể hiện qua hệ
phương trình sau:
࢚࢟ =ࢼ ࢞,࢚ + ࢿ࢚ ࢜ớ ࢿ࢚~ࡺ൫,࣌൯
ߝ௧: thành phần “nhiễu” ngẫu nhiên, thường được giả định là phân phối chuẩn với
trung bình bằng 0 và phương sai là không đổi ߪଶ {ߚ}: đại diện cho những hệ số sẽ được ước lượng. Tập hợp các hệ số ước lượng
được ký hiệu là ൛ߚൟ; trong khi đó, tập hợp các dự báo ݕ௧được tạo ra bởi mô hình và
các hệ số ước lượng ൛ߚൟ được ký hiệu là {ݕ௧ෝ }. Mục đích là chọn ൛ߚൟ sao cho tổng
- 56 -
bình phương chênh lệch giữa giá trị thực tế quan sát và giá trị được ước lượng
bởi mô hình tuyến tính là nhỏ nhất.
Một mô hình tuyến tính thường được sử dụng cho dự báo là mô hình tự hồi quy:
࢚࢟ = ࢼ∗
ୀ
࢚࢟ି + ࢽ
ୀ
࢞,࢚ + ࢿ࢚
trong đó có k biến độc lập ݔ với hệ số ߛ cho mỗi ݔ và k* thể hiện độ trễ cho biến
phụ thuộc . Tóm lại, mô hình có (k + k*) tham số cần ước lượng cho {β} và {γ}. Do
đó, độ trễ của mô hình càng lớn, mô hình càng cần nhiều hệ số ước lượng và vì thế
mà sự linh động của toàn bộ mô hình hồi quy giảm dần.
Số lượng các biến phụ thuộc ݕ có thể lớn hơn 1. Đối với mô hình tuyến tính chuẩn
mực (benchmark linear model) việc ước lượng và dự báo các biến phụ thuộc ݕ , ݆ =1,2, … , ݆∗ được thực hiện thông qua một chuỗi ܬ∗ gồm các mô hình tuyến tính độc
lập. Như vậy, mô hình có ݆∗ biến phụ thuộc sẽ phải ước lượng (ܬ∗.ܭ) hệ số.
Phương pháp hồi quy tuyến tính có ưu điểm là cho ra kết quả xác định (closed-form
solution) nhanh chóng sau quá trình ước lượng sử dụng cách thức bình phương nhỏ
nhất cho chênh lệch giữa ݕො và ݕ. Với tầm dự báo ngắn hạn, mô hình tuyến tính là một
khởi đầu hợp lý vì trong một số thị trường, nhà đầu tư chỉ quan sát thấy những sự
thay đổi không đáng kể (small symmetric changes) xung quanh xu hướng dài hạn của
biến cần được dự báo. Do có sự tồn tại của mối quan hệ phi tuyến trong chuỗi dữ
liệu, phương pháp hồi quy tuyến tính vì vậy cho ra kết quả kém chính xác hơn khi thị
trường tài chính có sự bất ổn (điển hình là thị trường thường xuyên diễn ra hiện
tượng bong bóng tài sản). Chính vì thế, việc sử dụng mô hình hồi quy tuyến tính
trong dự báo trong với chuỗi dữ liệu biến dộng lớn sẽ dẫn đến thất bại. Đây cũng là lý
do mà kỹ thuật dự báo phi tuyến được áp dụng.
Mô hình phi tuyến GARCH:
Hàm phi tuyến được sử dụng để thay thế mô hình tuyến tính cố gắng nắm bắt mối
tương quan phi tuyến thật sự trong chuỗi dữ liệu bằng cách xác lập các giả định cho
hệ số của từng dạng hàm phi tuyến cụ thể. Tiêu biểu cho cách tiếp cận này là mô hình
GARCH trung bình (GARCH-In-Mean) hay mô hình GARCH-M là mô hình mà
trong đó thành phần “nhiễu” ngẫu nhiên sẽ ảnh hưởng trực tiếp đến giá trị trung bình
- 57 -
của biến phụ thuộc và thành phần “nhiễu” này sẽ thay đổi theo thời gian, được xác
định bởi giá trị quá khứ của chính nó và bình phương sai số của các dự báo quá khứ.
Do đó, phương sai thay đổi theo thời gian này được gọi là phương sai có điều kiện
(conditional variance). Hệ phương trình sau sẽ minh họa cho một mô hình GARCH-
M cổ điển:
࢚࣌
= ࢾ + ࢾ࢚࣌ି + ࢾ࢚ࣕି
࢜ớ ࢿ࢚ ≈ ∅൫; ࢚࣌൯࢜à ࢚࢟ = ࢻ+ ࢼ࢚࣌ + ࢿ࢚
ݕ: tỷ suất sinh lợi trên tài sản
ߙ: tỷ lệ suất sinh lợi kỳ vọng trong điều kiện chuẩn
ߝ௧: thành phần nhiễu tuân theo phân phối chuẩn với trung bình bằng 0, phương sai có
điều kiện ߪ௧ଶ, được cho bởi Φ(0, ߪ௧ଶ)
ߚ: phần bù rủi ro đối với tỷ suất sinh lợi của tài sản, phản ánh trường hợp nhà đầu tư
yêu cầu tỷ suất sinh lợi cao hơn khi phải đố mặt với mức rủi ro tăng trên thị trường.
Do đó phải có điều kiện: ߚ > 0
ߜଵ, ߜଶଵ, ߜଶ: xác định sự thay đổi của phương sai có điều kiện
GARCH-M là mô hình hệ thống đệ quy ngẫu nhiên, với điều kiện ban đầu ߪଶ, ߝଶ
cũng như các ước lượng cho ߙ,ߚ, ߜ, ߜଵ ݒà ߜଶ. Khi tồn tại phương sai có điều kiện,
các cú sốc ngẫu nhiên sẽ có dạng phân phối chuẩn; tỷ suất sinh lợi lúc này là một
hàm số phụ thuộc và giá trị trung bình của chính nó, cú sốc ngẫu nhiên và hiệu ứng
phần bù rủi ro (ߚߪ௧)
Việc ước lượng giá trị cho ߙ, ߚ, ߜ, ߜଵ ݒà ߜଶ được thực hiện bằng phương pháp ước
lượng giá trị hợp lý cực đại do cú sốc ngẫu nhiên có phân phối chuẩn. Hàm hợp lý
(likelihood function) L là dạng hàm xác suất kết hợp (joint propability function) của
ݕ௧ = ݕො௧ ݒớ݅ ݐ = 1, 2 … ,ܶ. Trong mô hình GARCH-M, hàm hợp lý L có dạng:
ࡸ࢚ =ෑ ඨ ࣊࣌ෝ࢚ࢀ࢚ୀ ࢋ࢞ ቈ− (࢚࢟ − ࢟ෝ࢚)࣌ෝ࢚
࢟ෝ࢚ = ࢻෝ + ࢼ࣌ෝ࢚
- 58 -
ࢿො࢚ = ࢚࢟ − ࢟ෝ࢚
࣌ෝ࢚
= ࢾ + ࢾ࣌ෝ࢚ି + ࢾࢿො࢚ି
ߙ,ෝ ߚመ , ߜመ, ߜመଵ ݒà ߜመଶ: ước lượng của các hệ số
Để tìm các ước lượng hệ số, phương pháp được sử dụng là tìm cực đại tổng các log
của hàm hợp lý (hay hàm log hợp lý) trên toàn bộ mẫu ܶ, ݐ = 1,2, … ,ܶ và các ước
lượng hệ số đó phải thỏa điều kiện có phương sai lớn hơn 0 với ߪොଶ ݒà ߝ௧̂ିଵଶ cho trước
ࡹࢇ࢞ถ
ቄࢻ⏞,ࢼ,⏞ࢾฏ,ࢾฏ,ࢾฏቅ ܔܖ(ࡸ࢚) = ቆ−.(࣊)−. ܔܖ(࣌ෝ࢚)−. ቈ(࢚࢟ − ࢟ෝ࢚)࣌ෝ࢚ ቇࢀ࢚ୀࢀ࢚ୀ ࢙. ࢚: ࣌ෝ࢚ > 0, ݐ = 1,2, … ,ܶ
Mô hình GARCH-M có ưu điểm nắm bắt được bản chất của quá trình phi tuyến.
Phương sai có điều kiện phản ánh sự biến đổi phi tuyến các giá trị quá khứ và sự sai
lệch trong việc dự báo quá khứ. Phương sai điều kiện cũng đại diện cho yếu tố rủi ro
ảnh hưởng đến sự gia tăng trong tỷ suất sinh lợi đòi hỏi khi dự báo về sự biến động
giá của tài sản, vì thế nó được xem như nhân tố tác động đến biến phụ thuộc.
Trở ngại chính của phương pháp GARCH-M là sự khó khăn trong việc xác định giá
trị cực tiểu của hàm log-hợp lý (lo-likelihood function) và càng khó khăn hơn khi
đánh giá thêm ý nghĩa thống kê của các ước lượng ߙො,ߚመ , ߜመ, ߜመଵ ݒà ߜመଶ.
Việc sử dụng phương pháp GARCH-M để xác định mối tương quan phi tuyến là rất
hạn chế. Với tập hợp các hệ số cần ước lượng cụ thể, rõ ràng và các phương pháp ước
lượng hệ số sẵn có, mô hình GARCH-M có thể nắm bắt bản chất của chuỗi dữ liệu
thời gian trong tài chính mà theo đó các biến động lớn sẽ nối tiếp nhau và tương tự
thế cho các thời kỳ ổn định. Nhưng GARCH-M, lại bị giới hạn trong tập hợp các hệ
số đã được xác định một cách rõ ràng, trong một dạng hàm phi tuyến cụ thể và trong
phương pháp ước lượng không hẳn luôn luôn cho ra các giá trị có ý nghĩa. Vì thế,
việc tập trung sử dụng mô hình phi tuyến cụ thể như trên sẽ trở nên kém linh động và
vô hình chung bỏ qua các mối tương quan phi tuyến khác.
- 59 -
Phụ lục 3: Các phương pháp chuẩn hóa dữ liệu
Hai trong số nhiều phương pháp phổ biến được sử dụng trong quá trình chuẩn hóa dữ
liệu, là lấy chênh lệch giữa hai giá tri tại hai thời điểm (t; t-1) và lấy logarit tự nhiên
của các biến số đầu vào. Đầu tiên là phương pháp lấy chênh lệch, hay còn gọi là
phương pháp sử dụng sự thay đổi giữa các biến số qua thời gian, có thể được sử dụng
để loại bỏ xu hướng tuyến tính từ dữ liệu. Bên cạnh đó, phép biến đổi logarit hữu ích
đối với dữ liệu mà trong đó có thể xuất hiện đồng thời cả giá trị rất lớn và rất bé và
được đặc trưng bằng một phân phối xác suất có hình dạng lệch phải.
Một phương pháp chuyển đổi dữ liệu được sử dụng phổ biến khác là sử dụng tỷ số
của các biến đầu vào. Các tỷ số nhấn mạnh các mối quan hệ trọng yếu có thể có giữa
các biến đầu vào (ví dụ như các tỷ số của báo cáo tài chính) trong khi vẫn giữ nguyên
độ tự do của dữ liệu bởi lẽ một số lượng ít nơ-ron hơn có thể được sử dụng cho các
biến đầu vào. Trong thống kê học, hiện tượng mô hình hồi quy không hiệu quả khi
lượng dữ liệu đầu vào không đủ số lượng trong mối tương quan với số biến đầu vào
gọi là hiện tượng phù hợp quá mức. Tương tự, trong ứng dụng ANN, khi xảy ra hiện
tượng phù hợp quá mức, ANN chỉ có thể ghi nhận các mẫu hình của bản thân dữ liệu
đầu vào mà không phải là mẫu hình đại diện cho quan hệ bản chất giữa các biến số.
Chính vì vậy, kết quả trả ra của ANN hay mô hình dự báo truyền thống trước đây có
thể hoàn toàn chính xác ở hiện tại nhưng không có tác dụng trong dự báo tương lai.
Và do đó, vấn đề mà nhà nghiên cứu cần giải quyết là giảm bớt số biến đầu vào, và
phương pháp hiệu quả nhất, như đã đề cập, là lấy tỷ số giữa các biền đầu vào này.
Bên cạnh phương pháp lấy chênh lệch, lấy logarit và sử dụng các tỷ số, các nhà phân
tích kỹ thuật có thể cung cấp cho nhà nghiên cứu ứng dụng ANN vô số các chỉ báo
kỷ thuật để làm dữ liệu đầu vào bao gồm các trung bình di động, oscillators, đường
phương hướng (directional movement), và các bộ lọc dao động. Nhà nghiên cứu được
khuyến khích sử dụng kết hợp các chỉ số khác nhau để làm giảm việc dư thừa của các
biến số và cung cấp cho hệ thống ANN khả năng thích ứng với các thay đổi của thị
trường thông qua huấn luyện.
San bằng cả dữ liệu đầu vào và đầu ra bằng việc sử dụng cả trung bình di động đơn
giản hoặc hàm mũ cũng thường được sử dụng.
- 60 -
Phụ lục 4: Ba cách tiếp cận để lựa chọn số lượng nơ-ron ẩn phù hợp
Trong cách tiếp cận lựa chọn cố định, một nhóm gồm nhiều ANN khác nhau (với số
lượng nơ-ron ẩn khác nhau trong mỗi ANN) sẽ được huấn luyện và đánh giá hiệu quả
dự báo bằng cùng một tập hợp dữ liệu kiểm tra. Tất cả các ANN đều có cùng số nơ-
ron đầu phù hợp được lựa chọn trước đó. Số lượng các nơ-ron ẩn trên mỗi ANN có
thể tăng dần theo bước tăng +1, +2, ..,+n tùy theo khả năng tính toán của hệ thống
điện toán mà các ANN đang vận hành trên đó. Bình phương sai số của kết quả dự báo
mà các ANN này trả ra khi chạy trên tập hợp dữ liệu kiểm tra sẽ được ghi nhận và vẽ
ra trên đồ thị. Trong trường hợp vấn đề đang nghiên cứu thể hiện mối quan hệ giữa
hai biến số đầu vào, bình phương sai số sẽ được biểu diễn theo một paraboloic hướng
lên. Nếu có nhiều hơn 2 biến số đầu vào, bình phương sai số sẽ được biểu diễn theo
hình bát lật ngửa (với đáy bát hướng xuống). Hệ thống ANN nào trong số các ANN
đang được thử nghiệm cho ra kết quả có bình phương sai số nhỏ nhất (nằm gần khu
vực đáy bát) sẽ được lựa chọn để ứng dụng trong thực tế. Phương pháp tiếp cận này
tiêu thụ thời lượng khá lớn của các nhà nghiên cứu, tuy nhiên, đây lại là phương pháp
lựa chọn số lượng nơ-ron ẩn hiệu quả nhất.
Phương pháp tiếp cận xây dựng và triệt thoái, theo một cách khác, điều chỉnh số
lượng nơ-ron ẩn ngay trong quá trình huấn luyện một ANN thay vì xây dựng nhiều
ANN khác nhau (với số lượng nơ-ron ẩn khác nhau) như vừa nói đến ở trên. Tuy
nhiên, nhược điểm của cách tiếp cận này là trên thị trường hiện nay, có rất ít phần
mềm thương mại ứng dụng ANN cho phép người nghiên cứu điều chỉnh số lượng nơ-
ron ẩn ngay trong quá trình huấn luyện. Phương pháp tiếp cận xây dựng nói rằng nhà
nghiên cứu nên thêm vào từng nơ-ron ẩn cho đến khi nào độ phù hợp của dự báo sụt
giảm. Ngược lại, phương pháp tiếp cận triệt thoái cho rằng nhà nghiên cứu nên từ từ
loại bỏ từng nơ-ron ẩn một cho đến khi nào độ phù hợp của kết quả dự báo sụt giảm.
Phụ lục 5: Mô hình mạng truyền thẳng một lớp ẩn
Mô hình mạng truyền thẳng sử dụng hàm kích hoạt logsigmoid sẽ được mô tả qua hệ
thống phương trình sau. Đây là cách tiếp cận phổ thông nhất đối với mô hình dự báo
bằng mạng thần kinh, được sử dụng rộng rãi khi các nhà nghiên cứu muốn thay thế
các mô hình dư báo tuyến tính truyền thống.
- 61 -
,࢚ = ࣓, + ࣓,࢞,࢚∗
ୀ
ࡺ,࢚ = ࡸ൫,࢚൯ = + ࢋି,࢚
࢚࢟ = ࢽ +ࢽࡺ;࢚∗
ୀ
trong đó, ܮ൫݊,௧൯ đại diện cho hàm kích hoạt logsigmoid dưới dạng ଵଵାషೖ, . Trong
hệ thống này có ݅∗ biến đầu vào {x}, và ݇∗ nơ-ron. Một kết hợp tuyến tính của các
biến đầu vào tại thời điểm quan sát t, {ݔ;௧} ; i = 1, 2… i*, với vector hệ số (còn gọi là
tập hợp trọng số của biến đầu vào) ߱, ; i = 1, 2…, i* và hằng số ߱, hình thành nên
biến ݊,௧. Biến số này được “nén lại” bởi hàm số logistic, và trở thành nơ-ron ܰ,௧ tại
thời điểm quan sát t. Tập hợp k* nơ-ron tại thời điểm t được kết hợp một cách tuyến
tính với vector hệ số {ߛ}; k = 1, 2,…, k*, và hằng số ߛhình thành nên giá trị dự báo
ݕ௧ෝ tại thời điểm t.
Phụ lục 6: Mô hình mạng truyền thẳng đa lớp (Multi-layer feedforward neural
network)
Việc thiết lập nhiều lớp ẩn hơn sẽ làm cho cấu trúc của mô hình mạng trở nên phức
tạp hơn. Hình dưới minh họa một mạng lưới truyền thẳng với hai lớp ẩn và 2 nơ-ron
ở mỗi lớp.
Mô hình đó được diễn đạt dưới dạng hệ thống phương trình với ݅∗ biến đầu vào ; ݇∗
nơ-ron ở lớp ẩn đầu tiên và ݈∗ nơ-ron ở lớp ẩn thứ hai:
,࢚ = ࣓, + ∑ ࣓,࢞,࢚∗ୀ
ࡺ,࢚ = ାࢋష,࢚
;࢚ = ; + ∑ ;ࡺ;࢚∗ୀ
- 62 -
ࡼ,࢚ = ାࢋష,࢚
࢚࢟ = ࢽ + ∑ ࢽࡼ;࢚∗ୀ
Khi thêm một lớp ẩn thứ hai thì số hệ số cần phải ướng lượng sẽ tăng một lượng là (݇∗ + 1)(݈∗ − 1) + (݈∗ + 1); Vì với mạng truyền thẳng một lớp, ݅∗ biến đầu vào và
݇∗ nơ-ron, ta sẽ có (݅∗ + 1)݇∗ + (݇∗ + 1) hệ số, trong khi đó, khi thêm một lớp ẩn
với ݈∗ nơ-ron thì số hệ số bây giờ sẽ là (݅∗ + 1)݇∗ + (݇∗ + 1)݈∗ + (݈∗ + 1).
Hình: Mô hình mạng truyền thẳng với hai lớp ẩn.
Nguồn: Paul D. MaNelis (2005) “Neural Network in Finance”
Mạng truyền thẳng đa lớp ẩn khiến cho mô hình trở nên phức tạp hơn. Với mô hình
này, ta sẽ phải ước lượng nhiều hệ số hơn mà đến lượt nó sẽ khiến ta phải chịu nhiều
ràng buộc hơn trong điều kiện số mẫu quan sát có giới hạn. Bên cạnh đó, mô hình
này cũng đòi hỏi thời gian huấn luyện nhiều hơn. Càng nhiều hệ số thì khả năng các
ước lượng hệ số rơi vào các tối ưu cục bộ, thay vì các tối ưu toàn cục, sẽ càng lớn
(vấn đề này sẽ được bàn kỹ ở phần sau). Tuy vậy, ta cũng để tâm đến ưu điểm của
việc sử dụng nhiều lớp ẩn. Theo đó, mô hình mạng thần kinh nhân tạo hai lớp với các
trọng số được huấn luyện sẽ có khả năng ước lượng được hầu hết các hàm phi tuyến.
Đây là một đặc điểm rất quan trọng và là nền tảng cho việc ứng dụng mô hình mạng
thần kinh ở rất nhiều các lĩnh vực khác nhau. Mô hình mạng thần kinh có thể ước
- 63 -
lượng một hàm số đa biến bằng cách xây dựng nên hàm số đó đồng thời điều chỉnh
hàm số đó cho phù hợp. Trong khi đó, các mô hình hồi quy phi tuyến truyền thống
chỉ dừng lại ở việc cố gắng điều chỉnh cho thích hợp với một hàm số đã được định
sẵn. Chính lợi thế này đã giúp cho mô hình mạng thần kinh trở nên vượt trội so với
các công cụ hồi quy thống kê cổ điển khác.
Phụ lục 7: Mô hình mạng truyền thẳng kết hợp bước nhảy (Jump connection)
Một thay thế khác cho mô hình mạng truyền thẳng chính là mô hình mạng truyền
thẳng kết hợp với kết nối nhảy (jump connection). Theo đó, biến đầu vào ݔ không chỉ
có mối tương quan tuyến tính với các nơ-ron ở lớp ẩn mà còn với cả biến đầu ra ݕ.
Hình 1.5 minh họa mô hình mạng truyền thẳng kết hợp bước nhảy (Feedforward
jump connection network), mô hình này gồm ba biến đầu vào, một lớp ẩn với hai nơ-
ron (݅∗ = 3 ; ݇∗ = 2).
Hình : Mô hình mạng truyền thẳng và kết nối nhảy.
Nguồn: Paul D. MaNelis (2005) “Neural Network in Finance”
Mô hình trên được viết lại dưới dạng hệ thống phương trình toán học, sử dụng hàm
kích hoạt Logsigmoid như sau:
,࢚ = ࣓, + ∑ ࣓,࢞,࢚∗ୀ
ࡺ,࢚ = ࡸ൫,࢚൯ = ାࢋష,࢚
- 64 -
࢚࢟ = ࢽ + ∑ ࢽࡺ;࢚ ∗ୀ + ∑ ࢼ࢞;࢚∗ୀ
Lưu ý rằng mô hình mạng truyền thẳng có bước nhảy nhảy kết nối sẽ làm cho số hệ
số cần ước lượng trong mạng lưới gia tăng một lượng là ݆∗, bằng với số lượng biến
đầu vào. Ưu điểm của loại mô hình này chính là nó kết hợp cả mô hình tuyến tính với
mô hình mạng thần kinh truyền thẳng. Thông qua đó, mô hình sẽ cho phép một hàm
phi tuyến có thể đồng thời có thành phân tuyến tính và thành phần phi tuyến. Nếu
mối tương quan giữa biến đầu vào và biến đầu ra chỉ đơn thuần là tuyến tính thì khi
đó chỉ duy nhất phần “bước nhảy kết nối trực tiếp” (giữa biến đầu vào và biến đầu ra)
với tập hợp các hệ số {ߚ} ; ݅ = 1, … , ݅∗ là có ý nghĩa.. Ngược lại, nếu như mối tương
quan giữa x và y được kỳ vọng là mô quan hệ phi tuyến phức tạp thì kh đó, tập hợp
các hệ số {߱} và {ߛ} sẽ có ý trở nên có ý nghĩa và tất nhiên tập hợp hệ số {ߚ} sẽ có
mức ý nghĩa thống kê không cao. Và cuối cùng có thể xảy ra trường hợp là mối quan
hệ giữa tập hợp biến đầu vào {ݔ} và biến đầu ra {ݕ}bao gồm cả thành phần tuyến
tính và phi tuyến, kết quả là cả {ߚ}; {߱}; {ߛ} đều sẽ có ý nghĩa.
Phụ lục 8: Kết quả kiểm định ngoài mẫu mô hình GNN-7-4-1
Desired Output and Actual Network Output
-0.015
-0.01
-0.005
0
0.005
0.01
0.015
0.02
0.025
0.03
0.035
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Exemplar
O
ut
pu
t
INF
INF Output
- 65 -
Phụ lục 9: Kết quả kiểm định ngoài mẫu mô hình GNN-7-4-4-4-1
Desired Output and Actual Network Output
-0.005
0
0.005
0.01
0.015
0.02
0.025
0.03
0.035
0.04
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Exemplar
O
ut
pu
t
INF
INF Output
- 66 -
DANH MỤC TÀI LIỆU THAM KHẢO
1. Phạm Thế Anh (2009), “Xác định các nhân tố quyết định lạm phát ở Việt
Nam”, Tạp chí Kinh tế & Phát triển.
2. Nguyễn Ngọc Bảo (2011), “Điều hành chính sách tiền tệ năm 2010, định
hướng giải pháp 2011”, Tạp chí Ngân hàng số 2-3/2011.
3. Lê Xuân Đình (2010), “Cẩn trọng với sự đồng hành của lạm phát và thiểu
phát”, Tạp chí Cộng sản số 23 (215) năm 2010.
4. Nguyễn Trọng Hoài – Nguyễn Hoài Bảo (2009), “Lạm phát ở Việt Nam và
kiểm chứng thực nghiệm mô hình P-star”, NXB Thống Kê.
5. Trần Ngọc Thơ và các tác giả (2008), “Tài chính quốc tế”, NXB Thống Kê.
6. Khuất Duy Tuấn (2011), “Bài về sự phối hợp của chính sách tài khóa và
chính sách tiền tệ trong việc kiểm soát lạm phát ở Việt Nam”, Tạp chí
Ngân hàng số 4/2011.
7. Phạm Thị Thu Trang (2009), “Các yếu tố tác động tới lạm phát tại Việt
Nam – Phân tích chuỗi thời gian phi tuyến”, Tạm chí Kinh tế và Dự báo, số
12 năm 2009.
8. Đỗ Văn Thành – Trần Thị Kim Dung (2011), “Dự báo lạm phát năm 2011
và tác động của việc tăng giá điện, than, xăng đến hình thành mặt bằng
giá mới và lạm phát”, Trung tâm Thông tin và Dự báo Kinh tế - Xã hội quốc
gia.
9. Nguyễn Đức Thành và các tác giả (2010), “Lựa chọn để tăng trưởng bền
vững”, NXB Tri Thức.
10. Nguyễn Huy Vũ (2010), “Định hướng lạm phát, một chính sách tiền tệ
mới”, Tạp chí Tia Sáng tháng 7/2010.
11. Thời báo kinh tế Sài gòn (2008), “Đối mặt với lạm phát”, NXB Trẻ.
12. Iebeling Kaastra – Milton Boyd (1996) – “Designing a neural network for
forecasting financial and economic time series”, Elsevier Neurocomputing
- 67 -
13. Joarder Kamruzzaman et al (2006), “Artificial Neural Network in Finance
and Manufacturing”,Idea Group Publising
14. Jingtao – Chew Lim Tan (2000) – “Guidelines for financial forecasting with
Neural network”, International Conference on Neural Information
Processing.
15. Jingtao Yao et al. (1999) – “Neural Network for technical analysis: A study
on KLCI”, International Joural of Theoretical and Applied Finance, Vol 2,
No.2
16. Juthathip Jongwanich – Donghyun Park (2008), “Inflation in Devloping
Asia: Demand pull or cost push?”, Aisa Development Bank working paper
No.121
17. Kate Smith – JatInder Gupta (2002), “Neural Network in Business:
Techniques and Application”, Idea Group Publishing
18. Paul McNelis – Peter McAdam (2004), “Forecasting inflation with thick
model and neural network”, European Central Bank – Working paper
No.352
19. Yochanan Shachmurove – Dorota Witkowska (2000), “Utilizing artificial
neural network model to predict stock market”, CARESS working paper
No.00-11
20. Robert R. Trippi – Afrain Turban (1996), “Neural Network in Finance and
Investing” , IRWIN Professional Publishing.
21. World Bank (2008 – 2010), “Taking Stock – An update on Vietnam’s
recent economic development”.
Các file đính kèm theo tài liệu này:
- UNG DUNG MO HINH MANG THAN KINH DU BAO LAM PHAT VIET NAM.pdf