Đề tài Ứng dụng mô hình mạng thần kinh dự báo lạm phát Việt Nam

MỤC LỤC DANH MỤC CÁC TỪ VIẾT TẮT DANH MỤC BẢNG BIỂU DANH MỤC HÌNH DANH MỤC PHỤ LỤC LỜI MỞ ĐẦU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ LẠM PHÁT VÀ MÔ HÌNH MẠNG THẦN KINH NHÂN TẠO 3 1.1. Tổng quan lý thuyết và các nghiên cứu về lạm phát 3 1.1.1. Các quan điểm về lạm phát 3 1.1.2. Phân loại lạm phát 4 1.1.3. Tác động của lạm phát 4 1.1.3.1. Tác động phân phối lại thu nhập của lạm phát 5 1.1.3.2. Tác động của lạm phát đối với tăng trưởng kinh tế 5 1.1.3.3. Tác động của lạm phát lên tỷ giá hối đoái 6 1.1.3.4. Các tác động khác của lạm phát 7 1.2. Mô hình mạng thần kinh nhân tạo 7 1.2.1. Ý tưởng nền tảng của mô hình mạng thần kinh 8 1.2.2. Mô hình mạng thần kinh đơn giản 9 1.2.3. Cấu tạo của mô hình mạng thần kinh 11 1.2.3.1. Hàm kích hoạt 11 1.2.3.2. Cấu trúc mạng 13 1.2.3.3. Huấn luyện mạng 15 1.2.3.3.1. Học không giám sát (Unsupervised learning) 15 1.2.3.3.2. Học có giám sát (Supervised learning) 15 1.2.4. Xây dựng mô hình mạng thần kinh nhân tạo 16 1.2.4.1. Xác định biến số cho mô hình mạng thần kinh 17 1.2.4.2. Thu thập và xử lý dữ liệu 18 1.2.4.3. Sắp xếp lại bộ dữ liệu 19 1.2.4.4. Xây dựng cấu trúc mô hình mạng 21 1.2.4.4.1. Số lớp ẩn của mô hình mạng truyền thẳng đa lớp 21 1.2.4.4.2. Số nơ-ron của mỗi lớp ẩn trong mô hình mạng 21 1.2.4.5. Huấn luyện mạng và các tiêu chuẩn đánh giá mô hình 22 1.2.5. Bằng chứng thực nghiệm của mô hình mạng thần kinh 22 1.2.5.1. Ứng dụng trong dự báo tài chính 23 1.2.5.2. Ứng dụng trong xếp hạng tín dụng 23 1.2.5.3. Ứng dụng trong dự báo lạm phát 24 1.2.5.4. Một số ứng dụng khác của mô hình mạng thần kinh nhân tạo 25 CHƯƠNG 2: ỨNG DỤNG MÔ HÌNH MẠNG THẦN KINH DỰ BÁO LẠM PHÁT VIỆT NAM 27 2.1. Xác định biến số đầu vào của mô hình 27 2.2. Thu thập và xử lý dữ liệu 32 2.3. Sắp xếp lại bộ dữ liệu 36 2.4. Xây dựng mô hình dự báo lạm phát 36 2.5. Kết quả thực nghiệm của mô hình và kết luận 39 CHƯƠNG 3: MỘT SỐ GỢI MỞ TỪ KẾT QUẢ MÔ HÌNH 48 3.1. Gợi ý về hướng nghiên cứu tiếp theo 48 3.2. Gợi ý chính sách 49 KẾT LUẬN PHẦN PHỤ LỤC TÀI LIỆU THAM KHẢO

74 trang | Chia sẻ: maiphuongtl | Lượt xem: 3092 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Đề tài Ứng dụng mô hình mạng thần kinh dự báo lạm phát Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ồm mô hình mạng truyền thẳng một lớp ẩn với lần lượt 3, 4, và 5 nơ-ron ở lớp ẩn. Tiếp đến, các mô hình mạng phức tạp hơn bao gồm mạng thần kinh truyền thẳng với hai lớp ẩn với lần lượt số nơ-ron ẩn ở các lớp ẩn là 4 với 3 và 5 với 4. Việc xác định số lớp ẩn cũng như số nơ-ron phù hợp cho mỗi lớp ẩn, như đã được trình bày ở phần trên, cho đến nay, vẫn chưa có các nghiên cứu thống nhất chỉ ra phương pháp tối ưu mà chủ yếu được thực hiện qua quá trình thử vài sai với các cấu trúc mạng khác nhau. Tuy nhiên, một số gợi ý về việc lựa chọn các nơ-ron ẩn phù hợp với quy mô bộ dữ liệu hoặc sắp xếp các nơ- ron theo hướng lớp sau có số nơ-ron nhỏ hơn lớp trước cũng đã được vận dụng trong quá trình thử nghiệm để xây dựng mô hình. Mặt khác, về lý thuyết, số lượng lớp ẩn của mô hình vào khoảng 1 đến 3 lớp đã có khả năng mô hình hóa phần lớn các mối tương quan phi tuyến giữa các biến số. Các nghiên cứu đã cho thấy, khi gia tăng hơn nữa số lượng lớp ẩn hầu như không mang lại sự cải thiện trong kết quả dự báo của - 37 - mô hình mà ngược lại còn có khả năng dẫn đến tình trạng mô hình trở nên “quá phù hợp” với dữ liệu quá khứ mà mất đi khả năng khái quát hóa và kéo theo đó là độ chính xác trong dự báo không cao. Thực tế là với bộ dữ liệu và các biến số thu thập được như trên, khi tiến hành thử nghiệm với các mô hình mạng phức tạp hơn từ 3 đến 5 lớp ẩn thì hầu như kết quả kiểm định ngoài mẫu mặc dù sau nhiều lần huấn luyện đều không tốt hơn các mô hình mạng đơn giản ban đầu3. Ngoài mô hình mạng truyền thẳng giản đơn, bài nghiên cứu còn sử dụng mô hình mạng truyền thẳng được khái quát hóa (Generalized neural network - GNN). Tương tự mô hình mạng truyền thẳng ban đầu, các thông tin trong mô hình này cũng chỉ được truyền đi theo một chiều duy nhất từ biến đầu vào sang lần lượt các lớp ẩn và cuối cùng là biến đầu ra. Tuy nhiên, điểm khác biệt là mô hình mạng thần kinh được khái quát hóa sẽ có sự kết nối trực tiếp từ các biến đầu vào đến biến đầu ra. Một số nghiên cứu về mô hình mạng thần kinh cho thấy GNN có khả năng giải quyết vấn đề dự báo phần nào tốt hơn so với mô hình truyền thống. Do vậy chúng tôi quyết định sử dụng thêm mô hình này, trước hết là để so sánh với mô hình mạng truyền thẳng giản đơn vốn đã được sử dụng trong hầu hết các nghiên cứu về mô hình mạng, bên cạnh đó là nhằm mục đích so sánh để xác định cấu trúc mạng phù hợp với đặc thù lạm phát ở Việt Nam. Cụ thể các mô hình GNN được sử dụng bao gồm: Mạng GNN một lớp ẩn với lần lượt 3 và 4 nơ-ron ẩn; mạng GNN với hai lớp ẩn có số nơ-ron ở hai lớp ẩn là 3 và 2; 3 và 3; 4 và 4. Trong khi đó, số nơ-ron ở lớp đầu vào và đầu ra sẽ tương ứng với số lượng biến hồi quy và biến cần dự báo của mô hình mà trong trường hợp này lần lượt là 7 và 1 nơ- ron. 3 Kết quả kiểm định ngoài mẫu của những mô hình này được trình bày trong phụ lục. - 38 - Bảng 2.3: Thống kê các mô hình mạng được sử dụng. Mô tả mô hình mạng Ký hiệu Mạng truyền thẳng giản đơn MLF Mô hình mạng truyền thẳng một lớp ẩn với 3 nơ-ron ẩn MLF-7-3-1 Mô hình mạng truyền thẳng một lớp ẩn với 4 nơ-ron ẩn MLF-7-4-1 Mô hình mạng truyền thẳng một lớp ẩn với 5 nơ-ron ẩn MLF-7-5-1 Mô hình mạng truyền thẳng hai lớp ẩn với lần lượt 3 và 2 nơ-ron ẩn MLF-7-3-2-1 Mô hình mạng truyền thẳng hai lớp ẩn với lần lượt 4 và 3 nơ-ron ẩn MLF-7-4-3-1 Mô hình mạng truyền thẳng hai lớp ẩn với lần lượt 5 và 4 nơ-ron ẩn MLF-7-5-4-1 Mạng truyền thẳng khái quát hóa GNN Mô hình mạng truyền thẳng khái quát hóa với một lớp ẩn 3 nơ-ron ẩn GNN-7-3-1 Mô hình mạng truyền thẳng khái quát hóa với một lớp ẩn 4 nơ-ron ẩn GNN-7-4-1 Mô hình mạng truyền thẳng khái quát hóa với hai lớp ẩn và 3 nơ-ron mỗi lớp GNN-7-3-3-1 Mô hình mạng truyền thẳng khái quát hóa với hai lớp ẩn và 4 nơ-ron mỗi lớp GNN-7-4-4-1 Sau khi xác định được cấu trúc mạng thần kinh, một thông số khác của mô hình cần được quan tâm chính là hàm kích hoạt (còn được gọi là hàm truyền hoặc hàm nén) - 39 - được sử dụng trong các nơ-ron để chuyển đổi các dữ liệu đầu vào. Hàm kích hoạt được sử dụng phổ biến đã được nhắc đến trong chương 1 là hàm logsidmoid, chuyển đổi các giá trị đầu vào thành giá trị tương ứng trong khoảng [0;1]. Tuy nhiên, bên cạnh đó, hàm kích hoạt khác cũng được sử dụng trong các nghiên cứu là hàm tang- sigmoid. Thay vì đưa các giá trị đầu vào về trong khoảng [0;1], hàm tang-sigmoid sẽ đưa chúng về khoảng [-1;+1]. Chuỗi các mô hình mạng truyền thẳng (bao gồm: MLF-7-3-1, MLF-7-4-1, MLF-7-5-1, MLF-7-4-31 và MLF-7-5-4-1) sẽ được sử dụng để so sánh kết quả dự báo ngoài mẫu của hai chuỗi mô hình có sự tương đồng trong tất cả các thông số ngoại trừ hàm kích hoạt là log-sigmoid và tang-sigmoid và tất cả mô hình đều được “huấn luyện” trên cơ sở nguyên lý của thuật toán lan truyền ngược và các phương pháp tối ưu hóa phi tuyến. Mỗi mô hình sẽ được huấn luyện nhiều lần cho đến khi đạt được kết quả “tối ưu” ở mức chấp nhận được. Việc lựa chọn mô hình sẽ được xác lập trên cơ sở các chỉ tiêu so sánh sau đây của tập các quan sát được dùng để kiểm định ngoài mẫu (bao gồm 15 quan sát gần nhất – chiếm tỷ lệ 15% tổng số quan sát).  MSE – Trung bình các bình phương sai số  NMSE – Trung bình các bình phương sai số được chuẩn hóa  MAE – Trung bình các sai số tuyện đối.  R – Tương quan tuyến tính giữa chuỗi giá trị lạm phát dự báo và thực tế. Sau khi xác định tất cả các thông số cần thiết, quá trình huấn luyện mạng được tiến hành với sự trợ giúp của phần mềm Neural Network Solution và kết quả kiểm định ngoài mẫu của các mô hình được trình bày ở phần tiếp theo. 2.5. Kết quả thực nghiệm của mô hình và kết luận Với các thông số về mô hình đã được xác định, quá trình huấn luyện mạng được tiến hành. Với mỗi mô hình, quá trình “học hỏi” của hệ thống mạng được lặp lại 20 đến 30 lần tùy thuộc vào kết quả của mỗi lần huấn luyện và từ đó lựa chọn mô hình tương đối phù hợp nhất. Trong mỗi lần huấn luyện, sự điều chỉnh của các tập trọng số sao cho tối thiểu hóa giá trị MSE sẽ được xác lập là 1000 bước. Tuy nhiên, nếu như giá trị MSE không được cải thiện đối với tập các quan sát kiểm định lại (cross validation) - 40 - sau liên tục 300 – 400 bước thì lần huấn luyện mạng đó sẽ được dừng lại và tập trọng số tối ưu trong trường hợp này chính là tập trọng số có giá trị MSE của tập kiểm định lại nhỏ nhất. Trên cơ sở đó, chúng tôi đưa ra kết quả của các mô hình như sau. Bảng 2.4: Kết quả kiểm định ngoài mẫu chuỗi các mô hình MLF sử dụng hàm kích hoạt log-sigmoid. Mô hình MSE NMSE MAE R MLF-7-4-1 3.6336E-05 1.31570701 0.00459459 48.59% MLF-7-5-1 6.8072E-05 2.46485129 0.00628747 58.35% MLF-7-3-1 2.5027E-05 0.90621763 0.00360985 36.27% MLF-7-4-3-1 5.7961E-05 2.09874748 0.00568032 43.91% MLF-7-5-4-1 3.5518E-05 1.28607939 0.00421856 22.59% MLF-7-3-2-1- 3.3827E-05 1.22486165 0.00421062 40.39% Nguồn: Tính toán từ số liệu nghiên cứu. Bảng 2.5: Kết quả kiểm định ngoài mẫu chuỗi các mô hình MLF sử dụng hàm kích hoạt tang-sigmoid. Mô hình MSE NMSE MAE R MLF-7-4-1 2.89927E-05 1.04980699 0.003811882 67.93% MLF-7-5-1 3.56403E-05 1.29051453 0.005221159 67.96% MLF-7-3-1 1.36223E-05 0.49325586 0.003106482 89.12% MLF-7-4-3-1 2.58549E-05 0.93619137 0.004237882 72.22% MLF-7-5-4-1 4.97327E-05 1.80078991 0.005839407 71.08% MLF-7-3-2-1 3.61289E-05 1.30820475 0.004347311 77.36% Nguồn: Tính toán từ số liệu nghiên cứu. - 41 - Trước hết, bảng kết quả trên cho thấy sự cải thiện trong hiệu quả dự báo của mô hình khi sử dụng hàm kích hoạt tang-sigmoid thay vì hàm log-sigmoid. Nếu như chỉ tiêu MSE bình quân của các mô hình khi sử dụng hàm log-sigmoid là 4.27.10-5 thì con số này đối với hàm tang-sigmoid là 3.16.10-5 và tương tự vậy đối với chỉ tiêu NMSE với lần lượt 1.55 và 1.14. Tuy nhiên, nếu như mức độ cải thiện khi sử dụng hàm tang- sigmoid ở hai chỉ tiêu trên chưa thật sự đáng kể thì thông qua chỉ tiêu r, biểu thị mối tương quan tuyến tính giữa chuỗi giá trị lạm phát được dự báo với chuỗi thực tế sẽ cho thấy sự khác biệt trong việc sử dụng hai hàm kích hoạt này. Chỉ tiêu này đối với hàm log-sigmoid bình quân khoảng 40% và tối đa là 58% ở mô hình MLF-7-5-1 thì tương ứng là ở mức khoảng 75% và đặc biệt giá trị này đạt đến mức 89.12% ở mô hình MLF-7-3-1. Qua đó có thể thấy rằng, trong trường hợp nguồn dữ liệu của Việt Nam, hàm kích hoạt tang-sigmoid có đặt điểm chuyển đổi giá trị đầu vào về khoảng giá trị rộng hơn là [-1;1] sẽ tốt hơn so với hàm log-sigmoid thông thường. Mặt khác, bảng 2.5 cũng cho thấy hiệu quả của mô hình phi tuyến mạng thần kinh trong việc dự báo tỷ lệ lạm phát hàng tháng của Việt Nam. Theo đó, mức sai lệch tuyện đối chỉ ở mức 0.00427 tương ứng với đó là tỷ lệ tương quan khá cao giữa chuỗi giá trị dự báo và chuỗi giá trị thực tế. Biểu đồ sau một lần nữa minh họa thực tế trên. Hình 2.6: Kết quả kiểm định ngoài mẫu mô hình MLF-7-3-1 Nguồn: Tính toán từ số liệu nghiên cứu. Desired Output and Actual Network Output -0.01 -0.005 0 0.005 0.01 0.015 0.02 0.025 0.03 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Exemplar O ut pu t INF INF Output - 42 - Hình 2.7: Kết quả kiểm định ngoài mẫu mô hình MLF-7-4-1 Nguồn: Tính toán từ số liệu nghiên cứu. Hình 2.8: Kết quả kiểm định ngoài mẫu mô hình MLF-7-5-1 Nguồn: Tính toán từ số liệu nghiên cứu. Desired Output and Actual Network Output -0.01 -0.005 0 0.005 0.01 0.015 0.02 0.025 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Exemplar O ut pu t INF INF Output Desired Output and Actual Network Output -0.005 0 0.005 0.01 0.015 0.02 0.025 0.03 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Exemplar O ut pu t INF INF Output - 43 - Hình 2.9: Kết quả kiểm định ngoài mẫu mô hình MLF-7-4-3-1 Nguồn: Tính toán từ số liệu nghiên cứu. Hình 2.10: Kết quả kiểm định ngoài mẫu mô hình MLF-7-5-4-1 Nguồn: Tính toán từ số liệu nghiên cứu. Desired Output and Actual Network Output 0 0.005 0.01 0.015 0.02 0.025 0.03 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Exemplar O ut pu t INF INF Output Desired Output and Actual Network Output -0.005 0 0.005 0.01 0.015 0.02 0.025 0.03 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Exemplar O ut pu t INF INF Output - 44 - Hình 2.11: Kết quả kiểm định ngoài mẫu mô hình MLF-7-3-2-1 Nguồn: Tính toán từ số liệu nghiên cứu. Mặc dù số liệu từ kết quả kiểm định ngoài mẫu cho thấy mô hình mạng thần kinh truyền thẳng có khả năng dự báo tương đối tốt trong trường hợp chuỗi giá trị lạm phát hàng tháng của Việt Nam, bài nghiên cứu vẫn tiến hành xây dựng các mô hình mạng GNN còn lại để có sự so sánh nhằm tìm ra mô hình phù hợp cho việc dự báo lạm phát ở Việt Nam. Tiến hành tương tự với các mô hình trên, quá trình huấn luyện mạng cho kết quả dự báo ngoài mẫu như sau: Bảng 2.6: Kết quả kiểm định ngoài mẫu chuỗi các mô hình GNN MSE NMSE MAE R GNN-7-4-1 6.93058E-05 2.509518081 0.006038182 55.00% GNN-7-3-1 0.000152486 5.521426791 0.009183104 69.06% GNN-7-4-4-1 3.88811E-05 1.407860822 0.004007723 78.44% GNN-7-3-3-1 2.95547E-05 1.070157435 0.004451876 72.83% Nguồn: Tính toán từ số liệu nghiên cứu. Desired Output and Actual Network Output -0.015 -0.01 -0.005 0 0.005 0.01 0.015 0.02 0.025 0.03 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Exemplar O ut pu t INF INF Output - 45 - So với kết quả của bảng 2.5 thì số liệu của quá trình kiểm định ngoài mẫu đối với chuỗi các mô hình GNN cho thấy, nhìn chung, cấu trúc mạng thần kinh truyền thẳng được khái quát hóa không góp phần vào sự cải thiện trong kết quả dự báo như kết luận của một số nghiên cứu. Hình 2.12: Chuỗi giá trị INF dự báo từ các mô hình GNN Nguồn: Tổng hợp từ số liệu nghiên cứu. Mặt khác, tuy kết quả dự báo từ chuỗi các mô hình GNN không thật sự tốt hơn so với chuỗi các mô hình MLF ban đầu nhưng kết quả trung bình của tất cả các mô hình dự báo lại mang đến ý nghĩa khác. Điều này được gợi ý từ việc sử dụng “thick model” của Paul McNelis và Peter MacAdam trong nghiên cứu năm 2004 về mô hình thần kinh trong dự báo lạm phát của các nước châu Âu và Mỹ. Theo đó, kết quả dự báo trung bình từ các cấu trúc mô hình khác nhau sẽ cho kết quả dự báo tốt hơn của các mô hình đơn lẻ và kết quả thực nghiệm trong trường hợp này cho thấy lập luận trên của các tác giả có phần đúng. -3.00% -2.00% -1.00% 0.00% 1.00% 2.00% 3.00% 4.00% 5.00% 1 3 5 7 9 11 13 15 GNN-7-4-1 GNN-7-3-1 GNN-7-4-4-1 GNN-7-3-3-1 - 46 - Hình 2.13: Chuỗi giá trị INF dự báo trung bình từ các mô hình MLF-GNN và chuỗi thực tế Nguồn: Tổng hợp từ số liệu nghiên cứu. Với chuỗi giá trị lạm phát được lấy trung bình hàng tháng từ các mô hình đã xây dựng, các chỉ tiêu MSE, RMSE, MAE và r lần lượt là 1.21145.10-5 ; 0.438657; 0.00254 và 88.31%. So với kết quả tốt nhất trong số các mô hình đã xây dựng là MLF-7-3-1 thì xét về chỉ tiêu tương quan tuyến tính, chuỗi giá trị trung bình của các dự báo có phần sụt giảm nhưng không đáng kể. Tuy nhiên, bù lại với đó là sự cải thiện phần nào trong các chỉ tiêu còn lại. Mặc dù không thật sự có ý nghĩa như kết luận trong nghiên cứu đã đề cập nhưng điều này có thể bắt nguồn từ những lý do khác nhau mà một trong số đó có thể là do số lượng cấu trúc mô hình khác nhau được xây dựng vẫn còn hạn chế. Tóm lại, kết quả thực nghiệm từ các mô hình trên cho thấy tiềm năng của mô hình phi tuyến mạng thần kinh trong việc dự báo tỷ lệ lạm phát hàng tháng ở Việt Nam được thể hiện qua kết quả khả quan trong các kiểm định ngoài mẫu. Bên cạnh đó, kết quả thực nghiệm cũng đã cho thấy việc lựa chọn hàm kích hoạt có sự tác động đến kết quả dự báo và trong trường hợp này thì hàm truyền tang-sigmoid là sự lựa chọn tốt hơn. Mặt khác, không giống các nghiên cứu trước khi kết luận về hiệu quả dự báo tốt hơn của mô hình mạng thần kinh được khái quát hóa, thực tế cho thấy rằng mô hình mạng truyền thẳng dường như chiếm ưu thế tuyện đối trong việc dự báo lạm phát ở Việt Nam. Bên cạnh đó, những thử nghiệm bước đầu cũng cho thấy rằng 0.00% 0.50% 1.00% 1.50% 2.00% 2.50% 3.00% 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Average output IFL - 47 - những mô hình mạng không quá phức tạp sẽ góp phần đưa đến kết quả dự báo tương đối tốt hơn so với các mô hình phức tạp mà điều này vẫn còn cần phải đi sâu vào nghiên cứu để làm rõ nhưng nhìn chung, các kết quả thực nghiệm ở trên đã bước đầu định hình cho việc xây dựng một mô hình mạng thần kinh phi tuyến phù hợp để dự báo tỷ lệ lạm phát ở Việt Nam vốn là mục tiêu chính của bài nghiên cứu. Mặt khác, tuy tồn tại những hạn chế trong việc đưa ra các phương pháp thống kê để phân tích rõ mối quan hệ giữa các biến đầu vào và đầu ra trong mô hình mạng nhưng những kết quả kiểm định ngoài mẫu cũng đã góp phần vào việc khẳng định sự tồn tại trong mối tương quan giữa các biến số bao gồm tín dụng, cung tiền, tỷ lệ lạm phát quá khứ, giá dầu… Qua đó bài nghiên cứu cũng đã góp phần vào việc một lần nữa khẳng định sự tác động của các biến số này đến tỷ lệ lạm phát ở Việt Nam và trên cơ sở đó đưa ra những dự báo trong tương lai. - 48 - CHƯƠNG 3: MỘT SỐ GỢI MỞ TỪ KẾT QUẢ MÔ HÌNH 3.1. Gợi ý về hướng nghiên cứu tiếp theo. Với những nguyên lý về thuận toán lan truyền ngược và các bước xây dựng mô hình mạng được gợi ý từ các tác giả trước, bài nghiên cứu đã bước đầu xây dựng mô hình mạng thần kinh để dự báo lạm phát hàng tháng ở Việt Nam trên cơ sở các biến tiền tệ như tín dụng, cung tiền; chi phí đầu vào như lãi vay, giá dầu và yếu tố kỳ vọng là tỷ lệ lạm phát trong quá khứ. Kết quả thực nghiệm đã cho thấy triển vọng ứng dụng mô hình mạng thần kinh trong dự báo thực tế và đồng thời cũng gợi mở những hướng đi mới cho các nghiên cứu tiếp theo nhằm hoàn thiện hơn mô hình mạng thần kinh cho mục đích dự báo lạm phát ở Việt Nam. Trước hết, về khía cạnh thuật toán huấn luyện mạng, nghiên cứu sử dụng thuận toán lan truyền ngược cùng với các phương pháp tối ưu hóa phi tuyến thông thường được sử dụng phổ biến trong hầu hết các nghiên cứu. Tuy nhiên, những nghiên cứu về thuật toán phù hợp nhất cho bộ dữ liệu trong điều kiện thực tế của Việt Nam sẽ rất hữu ích trong việc nâng cao hiệu quả dự báo tỷ lệ lạm phát. Đặc biệt là thuật toán di truyền (genetic algorithm) được nhắc đến khá nhiều trong các nghiên cứu về mô hình mạng thần kinh trong thời gian gần đây. Ứng dụng thuật toán di truyền trong huấn luyện mạng nhằm xác định tập trọng số tối ưu để dự báo lạm phát sẽ là một hướng đi khả dĩ đối với các nghiên cứu về mạng thần kinh phi tuyến trong thời gian tới. Bên cạnh thuật toán di truyền thì sự kết hợp của mô hình mạng thần kinh với lý thuyết logic mờ (Fuzzy-logic) trong việc trong việc hình thành các “mô hình lai tạp” để dự báo lạm phát hứa hẹn sẽ góp phần nâng cao chất lượng của quá trình dự báo. Mặt khác, trong khi các biến đầu vào của bài nghiên cứu được lựa chọn trên cơ sở gợi ý từ các nghiên cứu thực nghiệm về lạm phát trong nước và so sánh mối tương quan giữa các chuỗi số liệu thì việc ứng dụng mô hình mạng thần kinh, mà cụ thể trong trường hợp này là mô hình “sơ đồ tự tổ chức” (self-organizing map) sẽ có thể góp phần vào việc đưa ra những lựa chọn biến số đầu vào thích hợp hơn. Về khía cạnh cấu trúc của mô hình mạng, bài nghiên cứu sử dụng mô hình mạng truyền thẳng và mô hình mạng truyền thẳng được khái quát hóa và đã đạt được những kết quả khả quan bước đầu. Tuy nhiên, một số cấu trúc mạng phức tạp hơn như mô - 49 - hình mạng tuần hóa (Recurrent neural network) mà trong đó các giá trị đầu ra của nơ- ron sẽ được sẽ có tác động ngược trở lại đối với nơ-ron của các lớp trước. Thông qua đó, hệ thống mạng sẽ tận dụng các thông tin từ bản thân cấu trúc của chuỗi dữ liệu để góp phần đưa ra kết quả dự báo tốt hơn. So sánh hiệu quả dự báo của hai loại mô hình sẽ đưa ra những kết luận có ý nghĩa cho việc hoàn thiện mô hình mạng. Bên cạnh đó, lạm phát kỳ vọng là một trong những nhân tố ảnh hưởng lớn đến mức lạm phát hiện tại tuy nhiên, thông tin về lạm phát kỳ vọng chỉ mới được phản ánh thông qua mức lạm phát trong quá khứ. Điều này có thể phần nào chưa đầy đủ. Những nghiên cứu sâu hơn về cách thức tác động của yếu tố kỳ vọng đến mức giá chung của nền kinh tế, về cách thức đo lường…sẽ hết sức cần thiết để từ đó cung cấp thêm thông tin đầu vào góp phần làm cho kết quả dự báo của mô hình mạng sát với thực tế hơn. 3.2. Gợi ý chính sách. Trước hết, kết quả kiểm định ngoài mẫu cho thấy khả năng ứng dụng của mô hình mạng thần kinh trong dự báo thực tế mà đặc biệt là trong điều hành chính sách tiền tệ. Kết quả dự báo về mức lạm phát trong tương lai trên cơ sở những thông tin hiện tại và các giả định được xác lập sẽ cung cấp bức tranh chung về viễn cảnh trong tương lai của mức giá chung trong nền kinh tế. Trên cơ sở đó, cơ quan điều hành chính sách sẽ có những biện pháp chủ động để đối phó. Đây sẽ là một trong những tiền đề quan trọng để thực hiện chính sách lạm phát mục tiêu (inflation-targeting) vốn đã được ứng dụng khá thành công ở một số nước phát triển. Theo đó, với mức lạm phát dự báo được, các chính sách tiền tệ chủ động sẽ được thực thi nhằm đưa lạm phát quay về mức mục tiêu, mức lạm phát được cho là “tối ưu” đối với nền kinh tế. Việc xác lập mức lạm phát “tối ưu” còn cần phải đi sâu vào nghiên cứu. Tuy nhiên, cần phải lưu ý rằng, đây không phải là mức lạm phát được Quốc hội thông qua để làm mục tiêu điều hành chính sách trong năm. Mức lạm phát này được đưa ra có phần chủ quan và vì vậy mà không mang nhiều ý trong việc kiềm chế lạm phát. Bên cạnh việc dự báo chiều hướng biến động của lạm phát thì hiệu quả của chính sách “neo giữ” lạm phát còn đòi hỏi sự kết hợp với khả năng của Ngân hàng Trung Ương trong việc “neo giữ” niềm tin và kỳ vọng của các chủ thể trong nền kinh tế. Ví - 50 - dụ, chính sách tăng lãi suất để kiềm chế lạm phát của NHNN có thể sẽ có tác động không quá lớn. Tuy nhiên, điều quan trọng là những tín hiệu được phát đi từ sự thay đổi trong chính sách đó sẽ góp phần vào việc hình thành nên dự đoán và mong đợi của các chủ thể. Vì vậy mà sự định hướng dư luận của NHNN nói riêng và Chính phủ nói chung là một trong những biện pháp quan trọng để duy trì sự ổn định của tỷ lệ lạm phát và trong trường hợp đó, uy tín của NHNN trong điều hành chính sách là một yếu tố không thể thiếu. Để xây dựng và duy trì niềm tin của công chúng vào sự điều hành chính sách đòi hỏi sự minh bạch nhất quán của NHNN. NHNN nên thường xuyên cung cấp các báo cáo chính sách tiền tệ, giải thích ý nghĩa của chúng cũng như động lực phía sau các chính sách đó. Trong một số trường hợp, NHNN cũng có thể đề ra các chính sách khả thi để thực hiện trong tương lai tới chủ thể trong nền kinh tế. Ngược lại, một mức uy tín cao sẽ cho phép các NHNN được uyển chuyển hơn trong việc thực hiện chính sách tiền tệ. Để góp phần cho chính sách tiền tệ phát huy tác dụng tốt hơn thì việc kiểm soát, ngăn chặn tình trạng đô la hóa trong nền kinh tế là hết sức cần thiết vì tình trạng này gây khó khăn trong việc dự đoán diễn biến tổng phương tiện thanh toán, mục tiêu gián tiếp trong kiềm chế lạm phát. Mặt khác, khi theo đuổi mục tiêu ổn định lạm phát đồng thời “neo” giữ mức cung tiền và tín dụng cho nền kinh tế thì đồng thời NHNN sẽ có thể và nên linh hoạt hơn trong điều hành tỷ giá. Thực tế cho thấy, trong năm 2007, vì phải giữ cho tỷ giá ổn định mà NHNN đã phải cung ra thị trường một lượng tiền đồng lớn để mua vào đô la Mỹ và góp phần không nhỏ vào mức lạm phát gần 20% của năm 2008. Qua đó có thể thấy rằng, trong điều kiện ngày càng hội nhập sau rộng vào nền kinh tế toàn cầu, mục tiêu theo đuổi sự ổn định của tỷ giá đã không những không giúp kiểm soát mà ngược lại còn góp phần gây ra áp lực lạm phát. Do đó, cần phải nhận thức rằng khi chính sách tiền tệ mà cụ thể là cung tiền và tín dụng được kiểm soát hợp lý khi theo đuổi mục tiêu lạm phát thì việc điều chỉnh tỷ giá theo cung cầu thị trường mà thực tế là “thả nổi có quản lý” hơn nữa đối với tỷ giá không nhất thiết sẽ gây ra lạm phát. Chính sự lưỡng lự, không rõ ràng, nhất quán trong chính sách tỷ giá mới gây ra tâm lý kỳ vọng lạm phát và lạm phát thực tế ở kỳ sau nếu các chính sách vĩ mô không đi theo hướng kiểm soát lạm phát. Mặt khác, chính sách tiền tệ cần sự hỗ trợ từ chính sách tài khóa. Do cấu trúc thể chế trong thực thi chính sách tài chính và tiền tệ, việc thực hiện chính sách kiểm soát lạm - 51 - phát ở Việt Nam không thể thành công nếu không có sự cam kết chi tiêu từ chính sách tài khóa. Việc này cho thấy tăng trưởng mức cầu từ chi tiêu của Chính phủ phải hợp lý và rõ ràng. Khi chi tiêu Chính phủ tăng thì nguồn tài trợ sẽ gián tiếp chảy từ Ngân hàng Nhà nước thông qua vòng chu chuyển của trái phiếu Chính phủ qua các Ngân hàng thương mại. Điều này cho thấy chính sách tiền tệ có thể sẽ bị động do chính sách tài khóa mở rộng và việc này làm giảm hiệu quả của chính sách tiền tệ. Do vậy, cắt giảm chi tiêu công và tập trung chi tiêu vào các hạng mục đầu tư có hiệu quả và các hạng mục mang lại lợi ích xã hội cao hơn là cố gắng chi tiêu để tăng trưởng kinh tế nhờ vào sức cầu của chi tiêu Chính phủ. Suy cho cùng, nguyên nhân sâu xa của lạm phát trong nền kinh tế Việt Nam bắt nguồn từ mô hình tăng trưởng kinh tế dựa trên chiều rộng, gia tăng vốn đầu tư nhưng không thật sự hiệu quả. Trong suốt một thời gian dài, các chính sách tài khóa và tiền tệ nới lỏng được thực hiện để nhằm đạt mục tiêu tăng trưởng kinh tế. Điều này được thể hiện rõ ràng hơn trong khoảng hai năm gần đây với sự thay đổi liên tục trong ưu tiên điều hành chính sách của chính phủ. Ngay sau khi lạm phát phần nào dịu bớt thì theo sau đó là chính sách nới lỏng tài khóa và tín dụng để thúc đẩy tăng trưởng và kết quả là lạm phát lại tăng tốc và ưu tiên điều hành chính sách lại được chuyển từ mục tiêu tăng trưởng sang kiềm chế lạm phát. Thiết nghĩ, cần có sự thay đổi triệt để trong định hướng điều hành, cần thiết phải xem trọng hơn sự ổn định kinh tế vĩ mô. Có thể tăng trưởng kinh tế không đạt mức cao nhưng bù lại tỷ lệ đó được duy trì ổn định qua các năm cùng với mức lạm phát mục tiêu phù hợp sẽ góp phần cho sự phát triển bền vững của nền kinh tế. Tóm lại, với tình hình lạm phát gia tăng và những bất ổn trên thị trường ngoại hối thời gian qua, Chính phủ cần truyền đi một thông điệp rõ ràng và nhất quán về sự cam kết của chính phủ nhằm đạt được và duy trì ổn định kinh tế vĩ mô trong ngắn hạn. Điều này đòi hỏi các giải pháp chính sách cần thiết kèm theo và thường xuyên công bố các thông tin kinh tế vĩ mô, tài chính nhằm xây dựng uy tín và sự tin cậy trong các đối tác thị trường. Mức độ hội nhập kinh tế ngày càng sâu rộng đòi hỏi chính sách tiền tệ gắn với mục tiêu lạm phát. Điều quan trọng là phải đảm bảo sự nhất quán xuyên suốt các mục tiêu của chính sách tiền tệ như lãi suất, tín dụng, tỷ giá... - 52 - Với những định hướng chính sách như trên bên cạnh việc điều hành chính sách tỷ giá theo hướng lạm phát mục tiêu trên cơ sở các dự báo được gợi ý từ mô hình cùng với những bước đi đúng đắn của cơ quan điều hành chính sách thời gian qua, hy vọng rằng mục tiêu “ổn định kinh tế vĩ mô, đảm bảo an sinh xã hội” sẽ sớm được thực hiện. - 53 - LỜI KẾT  Kết thúc quý 1 năm 2011, lạm phát đang ở mức 6.2%. So với mục tiêu đề ra từ đầu năm của Chính phủ là 7% thì dường như việc kiềm hãm lạm phát từ nay đến cuối năm chỉ tăng chỉ tăng 0.8 điểm phần trăm là rất khó khả thi và nhiều khả năng lạm phát năm nay sẽ tiếp tục duy trì ở mức hai chữ số. Do vậy, những biện pháp kiềm chế lạm phát tức thời là hết sức cần thiết. Tuy nhiên, việc NHNN theo đuổi chính sách lạm phát mục tiêu và kiểm soát cung tiền để đảm bảo sự ổn định vĩ mô mới là biện pháp dài hạn. Bài nghiên cứu đã đi sâu vào phân tích lạm phát trong nền kinh tế Việt Nam thời gian qua và trên cơ sở đó chỉ ra những biến số đầu có khả năng tác động đến lạm phát. Tiếp đến, những biến số này được đưa vào mô hình mạng thần kinh phi tuyến và tiến hành các kiểm định ngoài mẫu. Kết quả thực nghiệm cho thấy, trước hết, tương tự như các nghiên cứu trước, mô hình mạng thần kinh tỏ ra khá hiệu quả trong dự báo tỷ lệ lạm phát hàng tháng của Việt Nam trong giai đoạn kiểm định. Bên cạnh đó, bài nghiên cứu cũng đã bước đầu định hình cấu trúc mô hình mạng phù hợp với điều kiện bộ dữ liệu Việt Nam dựa trên các chỉ tiêu so sánh. Đó là cấu trúc mạng truyền thẳng với một lớp ẩn và ba nơ-ron ẩn duy nhất. Tuy nhiên, cấu trúc mạng này vẫn có thể được điều chỉnh trong trường hợp có sự thay đổi trong các biến đầu vào và đây có thể là một gợi ý cho hướng nghiên cứu sắp tới về vận dụng mô hình mạng thần kinh trong dự báo lạm phát. Ngoài ra, kết quả kiểm định còn cho thấy mô hình mạng được khái quát hóa không thật sự hoàn thiện hiệu quả dự báo so với mô hình mạng thần kinh giản đơn như kết luận trong một số nghiên cứu khác. Cuối cùng, một số gợi ý về chính sách cũng như hướng nghiên cứu xa hơn liên quan đến chủ đề này đã được đưa ra trên cơ sở của kết quả thực nghiệm. - 54 - PHẦN PHỤ LỤC  Phụ lục 1: Các chỉ số đo lường lạm phát Tỷ lệ lạm phát được đo lường nhờ các chỉ số giá. Dựa vào từng loại chỉ số giá mà ta tính được tỷ lệ lạm phát trong từng thời kỳ khác nhau theo công thức: ܶỷ ݈ệ ݈ạ݉ ݌ℎáݐ = ܥℎỉ ݏố ݃݅á ݇ỳ ݊àݕ − ܥℎỉ ݏố ݃݅á ݇ỳ ݐݎướܿ ܥℎỉ ݏố ݃݅á ݇ỳ ݐݎướܿ × 100% Chỉ số giá tiêu dùng (Consumer Price Index - CPI): Chỉ số giá tiêu dùng (CPI) đo lường giá cả các hàng hóa tiêu dùng được mua bởi người tiêu dùng thông thường. Chỉ số này được tính toán theo phần trăm để phản ánh mức thay đổi tương đối của giá hàng tiêu dùng theo thời gian. Sở dĩ thay đổi tương đối là vì chỉ số này chỉ dựa vào một giỏ hàng hóa đại diện cho toàn bộ hàng tiêu dùng. Thông thường, chỉ số giá tiêu dùng được sử dụng để tính toán tỷ lệ lạm phát của phần lớn các quốc gia trên thế giới. Ngoài ra, chỉ số này cho thấy mức tăng kỳ vọng trong lương danh nghĩa của người lao động, đồng thời ngụ ý rằng các khoản chi định danh sẽ tự động tăng lên theo mức tăng của CPI. Chỉ số giá sản xuất (Producer Price Index – PPI): Chỉ số giá cả sản xuất PPI đo mức giá mà các nhà sản xuất nhận được, không tính đến giá bổ sung qua đại lý hoặc thuế doanh thu. Chỉ số này cũng được tính toán như CPI, tức là sử dụng tỷ lệ phần trăm chi phí để mua một rổ hàng hóa nhất định. Tuy nhiên, giá cả ở đây là giá do nhà sản xuất ấn định, được bán trong lần đầu tiên. Và đây cũng là sự khác biệt lớn nhất giữa CPI và PPI. Với cách tính như trên, đây là một chỉ tiêu tương đối, phản ánh xu hướng và đo lường mức độ biến động giá bán của các nhà sản xuất trên thị trường sơ cấp vào một thời kỳ. Mặt khác, giá cả sản xuất tăng sẽ dẫn đến giá tiêu dùng tăng, một phần chi phí trong quá trình sản xuất kinh doanh được các doanh nghiệp chuyển sang cho người tiêu dùng. Vì vậy, PPI là chỉ số hữu dụng về xu hướng đối với giá cả và cũng là một chỉ số tốt để tính toán tỷ lệ lạm phát. - 55 - Chỉ số giảm phát tổng sản phẩm quốc nội (GDP deflator – DGDP): Chỉ số giảm phát GDP, còn gọi là chỉ số điều chỉnh GDP, là chỉ số tính theo phần trăm phản ánh mức giá chung của tất cả các loại hàng hoá, dịch vụ sản xuất trong nước. Chỉ số điều chỉnh GDP cho biết một đơn vị GDP điển hình của kỳ t có mức giá bằng bao nhiêu phần trăm so với mức giá của kỳ gốc. Khác với chỉ số giá tiêu dùng CPI, DGDP được tính trên giỏ hàng hoá thay đổi, do vậy nó phản ánh được sự thay thế giữa các hàng hoá, dịch vụ với nhau. Thêm vào đó, DGDP phản ánh giá của cả hàng hoá do doanh nghiệp, chính phủ mua trong khi đó CPI chỉ phản ánh mức giá của mặt hàng tiêu dùng. Vì thế DGDP được coi là phản ánh đúng hơn mức giá chung. Tuy nhiên, DGDP chỉ phản ánh mức giá của những hàng hoá sản xuất trong nước còn CPI phản ánh luôn cả mức giá của hàng hoá nhập khẩu nên được xem là toàn diện hơn. Dù có một số khác biệt kể trên thì trong thực tế, sự khác biệt giữa CPI và DGDP không lớn. Và DGDP vẫn là một trong những chỉ số đánh giá tỷ lệ lạm phát vì nó phản ánh được thay đổi trong GDP danh nghĩa khi giá cả các mặt hàng trong nước biến động. Phụ lục 2: Mô hình hồi quy tuyến tính Mô hình mạng thần kinh nhân tạo được sử dụng với mục đích dự báo biến phụ thuộc y từ một tập hợp các biến đầu vào x; trong chuỗi thời gian, tập hợp của các biến đầu vào x có thể bao gồm các biến trễ (lagged variables), biến hiện tại (current variables) của x và các giá trị trễ (lagged values) của y. Mô hình hồi quy tuyến tính thường được sử dụng trong bước đầu tiếp cận với công tác dự báo, được thể hiện qua hệ phương trình sau: ࢚࢟ =෍ࢼ࢑ ࢞࢑,࢚ + ࢿ࢚ ࢜ớ࢏ ࢿ࢚~ࡺ൫૙,࣌૛൯ ߝ௧: thành phần “nhiễu” ngẫu nhiên, thường được giả định là phân phối chuẩn với trung bình bằng 0 và phương sai là không đổi ߪଶ {ߚ௞}: đại diện cho những hệ số sẽ được ước lượng. Tập hợp các hệ số ước lượng được ký hiệu là ൛ߚ௞෢ൟ; trong khi đó, tập hợp các dự báo ݕ௧được tạo ra bởi mô hình và các hệ số ước lượng ൛ߚ௞෢ൟ được ký hiệu là {ݕ௧ෝ }. Mục đích là chọn ൛ߚ௞෢ൟ sao cho tổng - 56 - bình phương chênh lệch giữa giá trị thực tế quan sát và giá trị được ước lượng bởi mô hình tuyến tính là nhỏ nhất. Một mô hình tuyến tính thường được sử dụng cho dự báo là mô hình tự hồi quy: ࢚࢟ =෍ ࢼ࢏࢑∗ ࢏ୀ૚ ࢚࢟ି૚ +෍ ࢽ࢐࢑ ࢐ୀ૚ ࢞࢐,࢚ + ࢿ࢚ trong đó có k biến độc lập ݔ với hệ số ߛ௝ cho mỗi ݔ௝ và k* thể hiện độ trễ cho biến phụ thuộc . Tóm lại, mô hình có (k + k*) tham số cần ước lượng cho {β} và {γ}. Do đó, độ trễ của mô hình càng lớn, mô hình càng cần nhiều hệ số ước lượng và vì thế mà sự linh động của toàn bộ mô hình hồi quy giảm dần. Số lượng các biến phụ thuộc ݕ có thể lớn hơn 1. Đối với mô hình tuyến tính chuẩn mực (benchmark linear model) việc ước lượng và dự báo các biến phụ thuộc ݕ௝ , ݆ =1,2, … , ݆∗ được thực hiện thông qua một chuỗi ܬ∗ gồm các mô hình tuyến tính độc lập. Như vậy, mô hình có ݆∗ biến phụ thuộc sẽ phải ước lượng (ܬ∗.ܭ) hệ số. Phương pháp hồi quy tuyến tính có ưu điểm là cho ra kết quả xác định (closed-form solution) nhanh chóng sau quá trình ước lượng sử dụng cách thức bình phương nhỏ nhất cho chênh lệch giữa ݕො và ݕ. Với tầm dự báo ngắn hạn, mô hình tuyến tính là một khởi đầu hợp lý vì trong một số thị trường, nhà đầu tư chỉ quan sát thấy những sự thay đổi không đáng kể (small symmetric changes) xung quanh xu hướng dài hạn của biến cần được dự báo. Do có sự tồn tại của mối quan hệ phi tuyến trong chuỗi dữ liệu, phương pháp hồi quy tuyến tính vì vậy cho ra kết quả kém chính xác hơn khi thị trường tài chính có sự bất ổn (điển hình là thị trường thường xuyên diễn ra hiện tượng bong bóng tài sản). Chính vì thế, việc sử dụng mô hình hồi quy tuyến tính trong dự báo trong với chuỗi dữ liệu biến dộng lớn sẽ dẫn đến thất bại. Đây cũng là lý do mà kỹ thuật dự báo phi tuyến được áp dụng. Mô hình phi tuyến GARCH: Hàm phi tuyến được sử dụng để thay thế mô hình tuyến tính cố gắng nắm bắt mối tương quan phi tuyến thật sự trong chuỗi dữ liệu bằng cách xác lập các giả định cho hệ số của từng dạng hàm phi tuyến cụ thể. Tiêu biểu cho cách tiếp cận này là mô hình GARCH trung bình (GARCH-In-Mean) hay mô hình GARCH-M là mô hình mà trong đó thành phần “nhiễu” ngẫu nhiên sẽ ảnh hưởng trực tiếp đến giá trị trung bình - 57 - của biến phụ thuộc và thành phần “nhiễu” này sẽ thay đổi theo thời gian, được xác định bởi giá trị quá khứ của chính nó và bình phương sai số của các dự báo quá khứ. Do đó, phương sai thay đổi theo thời gian này được gọi là phương sai có điều kiện (conditional variance). Hệ phương trình sau sẽ minh họa cho một mô hình GARCH- M cổ điển: ࢚࣌ ૛ = ࢾ૙ + ࢾ૚࢚࣌ି૚૛ + ࢾ૛࢚ࣕି૚૛ ࢜ớ࢏ ࢿ࢚ ≈ ∅൫૙; ࢚࣌૛൯࢜à ࢚࢟ = ࢻ+ ࢼ࢚࣌ + ࢿ࢚ ݕ: tỷ suất sinh lợi trên tài sản ߙ: tỷ lệ suất sinh lợi kỳ vọng trong điều kiện chuẩn ߝ௧: thành phần nhiễu tuân theo phân phối chuẩn với trung bình bằng 0, phương sai có điều kiện ߪ௧ଶ, được cho bởi Φ(0, ߪ௧ଶ) ߚ: phần bù rủi ro đối với tỷ suất sinh lợi của tài sản, phản ánh trường hợp nhà đầu tư yêu cầu tỷ suất sinh lợi cao hơn khi phải đố mặt với mức rủi ro tăng trên thị trường. Do đó phải có điều kiện: ߚ > 0 ߜ଴ଵ, ߜଶଵ, ߜଶ: xác định sự thay đổi của phương sai có điều kiện GARCH-M là mô hình hệ thống đệ quy ngẫu nhiên, với điều kiện ban đầu ߪ଴ଶ, ߝ଴ଶ cũng như các ước lượng cho ߙ,ߚ, ߜ଴, ߜଵ ݒà ߜଶ. Khi tồn tại phương sai có điều kiện, các cú sốc ngẫu nhiên sẽ có dạng phân phối chuẩn; tỷ suất sinh lợi lúc này là một hàm số phụ thuộc và giá trị trung bình của chính nó, cú sốc ngẫu nhiên và hiệu ứng phần bù rủi ro (ߚߪ௧) Việc ước lượng giá trị cho ߙ, ߚ, ߜ଴, ߜଵ ݒà ߜଶ được thực hiện bằng phương pháp ước lượng giá trị hợp lý cực đại do cú sốc ngẫu nhiên có phân phối chuẩn. Hàm hợp lý (likelihood function) L là dạng hàm xác suất kết hợp (joint propability function) của ݕ௧ = ݕො௧ ݒớ݅ ݐ = 1, 2 … ,ܶ. Trong mô hình GARCH-M, hàm hợp lý L có dạng: ࡸ࢚ =ෑ ඨ ૚૛࣊࣌ෝ࢚૛ࢀ࢚ୀ૚ ࢋ࢞࢖ ቈ− (࢚࢟ − ࢟ෝ࢚)૛૛࣌ෝ࢚૛ ቉ ࢟ෝ࢚ = ࢻෝ + ࢼ෡࣌ෝ࢚ - 58 - ࢿො࢚ = ࢚࢟ − ࢟ෝ࢚ ࣌ෝ࢚ ૛ = ࢾ෡૙ + ࢾ෡૚࣌ෝ࢚ି૚૛ + ࢾ෡૛ࢿො࢚ି૚૛ ߙ,ෝ ߚመ , ߜመ଴, ߜመଵ ݒà ߜመଶ: ước lượng của các hệ số Để tìm các ước lượng hệ số, phương pháp được sử dụng là tìm cực đại tổng các log của hàm hợp lý (hay hàm log hợp lý) trên toàn bộ mẫu ܶ, ݐ = 1,2, … ,ܶ và các ước lượng hệ số đó phải thỏa điều kiện có phương sai lớn hơn 0 với ߪො଴ଶ ݒà ߝ௧̂ିଵଶ cho trước ࡹࢇ࢞ถ ቄࢻ⏞,ࢼ,⏞ࢾ૙ฏ,ࢾ૚ฏ,ࢾ૛ฏቅ෍ ܔܖ(ࡸ࢚) =෍ ቆ−.૞࢒࢔(૛࣊)−.૞ ܔܖ(࣌ෝ࢚)−. ૞ ቈ(࢚࢟ − ࢟ෝ࢚)૛࣌ෝ࢚૛ ቉ቇࢀ࢚ୀ૚ࢀ࢚ୀ૚ ࢙. ࢚: ࣌ෝ࢚૛ > 0, ݐ = 1,2, … ,ܶ Mô hình GARCH-M có ưu điểm nắm bắt được bản chất của quá trình phi tuyến. Phương sai có điều kiện phản ánh sự biến đổi phi tuyến các giá trị quá khứ và sự sai lệch trong việc dự báo quá khứ. Phương sai điều kiện cũng đại diện cho yếu tố rủi ro ảnh hưởng đến sự gia tăng trong tỷ suất sinh lợi đòi hỏi khi dự báo về sự biến động giá của tài sản, vì thế nó được xem như nhân tố tác động đến biến phụ thuộc. Trở ngại chính của phương pháp GARCH-M là sự khó khăn trong việc xác định giá trị cực tiểu của hàm log-hợp lý (lo-likelihood function) và càng khó khăn hơn khi đánh giá thêm ý nghĩa thống kê của các ước lượng ߙො,ߚመ , ߜመ଴, ߜመଵ ݒà ߜመଶ. Việc sử dụng phương pháp GARCH-M để xác định mối tương quan phi tuyến là rất hạn chế. Với tập hợp các hệ số cần ước lượng cụ thể, rõ ràng và các phương pháp ước lượng hệ số sẵn có, mô hình GARCH-M có thể nắm bắt bản chất của chuỗi dữ liệu thời gian trong tài chính mà theo đó các biến động lớn sẽ nối tiếp nhau và tương tự thế cho các thời kỳ ổn định. Nhưng GARCH-M, lại bị giới hạn trong tập hợp các hệ số đã được xác định một cách rõ ràng, trong một dạng hàm phi tuyến cụ thể và trong phương pháp ước lượng không hẳn luôn luôn cho ra các giá trị có ý nghĩa. Vì thế, việc tập trung sử dụng mô hình phi tuyến cụ thể như trên sẽ trở nên kém linh động và vô hình chung bỏ qua các mối tương quan phi tuyến khác. - 59 - Phụ lục 3: Các phương pháp chuẩn hóa dữ liệu Hai trong số nhiều phương pháp phổ biến được sử dụng trong quá trình chuẩn hóa dữ liệu, là lấy chênh lệch giữa hai giá tri tại hai thời điểm (t; t-1) và lấy logarit tự nhiên của các biến số đầu vào. Đầu tiên là phương pháp lấy chênh lệch, hay còn gọi là phương pháp sử dụng sự thay đổi giữa các biến số qua thời gian, có thể được sử dụng để loại bỏ xu hướng tuyến tính từ dữ liệu. Bên cạnh đó, phép biến đổi logarit hữu ích đối với dữ liệu mà trong đó có thể xuất hiện đồng thời cả giá trị rất lớn và rất bé và được đặc trưng bằng một phân phối xác suất có hình dạng lệch phải. Một phương pháp chuyển đổi dữ liệu được sử dụng phổ biến khác là sử dụng tỷ số của các biến đầu vào. Các tỷ số nhấn mạnh các mối quan hệ trọng yếu có thể có giữa các biến đầu vào (ví dụ như các tỷ số của báo cáo tài chính) trong khi vẫn giữ nguyên độ tự do của dữ liệu bởi lẽ một số lượng ít nơ-ron hơn có thể được sử dụng cho các biến đầu vào. Trong thống kê học, hiện tượng mô hình hồi quy không hiệu quả khi lượng dữ liệu đầu vào không đủ số lượng trong mối tương quan với số biến đầu vào gọi là hiện tượng phù hợp quá mức. Tương tự, trong ứng dụng ANN, khi xảy ra hiện tượng phù hợp quá mức, ANN chỉ có thể ghi nhận các mẫu hình của bản thân dữ liệu đầu vào mà không phải là mẫu hình đại diện cho quan hệ bản chất giữa các biến số. Chính vì vậy, kết quả trả ra của ANN hay mô hình dự báo truyền thống trước đây có thể hoàn toàn chính xác ở hiện tại nhưng không có tác dụng trong dự báo tương lai. Và do đó, vấn đề mà nhà nghiên cứu cần giải quyết là giảm bớt số biến đầu vào, và phương pháp hiệu quả nhất, như đã đề cập, là lấy tỷ số giữa các biền đầu vào này. Bên cạnh phương pháp lấy chênh lệch, lấy logarit và sử dụng các tỷ số, các nhà phân tích kỹ thuật có thể cung cấp cho nhà nghiên cứu ứng dụng ANN vô số các chỉ báo kỷ thuật để làm dữ liệu đầu vào bao gồm các trung bình di động, oscillators, đường phương hướng (directional movement), và các bộ lọc dao động. Nhà nghiên cứu được khuyến khích sử dụng kết hợp các chỉ số khác nhau để làm giảm việc dư thừa của các biến số và cung cấp cho hệ thống ANN khả năng thích ứng với các thay đổi của thị trường thông qua huấn luyện. San bằng cả dữ liệu đầu vào và đầu ra bằng việc sử dụng cả trung bình di động đơn giản hoặc hàm mũ cũng thường được sử dụng. - 60 - Phụ lục 4: Ba cách tiếp cận để lựa chọn số lượng nơ-ron ẩn phù hợp Trong cách tiếp cận lựa chọn cố định, một nhóm gồm nhiều ANN khác nhau (với số lượng nơ-ron ẩn khác nhau trong mỗi ANN) sẽ được huấn luyện và đánh giá hiệu quả dự báo bằng cùng một tập hợp dữ liệu kiểm tra. Tất cả các ANN đều có cùng số nơ- ron đầu phù hợp được lựa chọn trước đó. Số lượng các nơ-ron ẩn trên mỗi ANN có thể tăng dần theo bước tăng +1, +2, ..,+n tùy theo khả năng tính toán của hệ thống điện toán mà các ANN đang vận hành trên đó. Bình phương sai số của kết quả dự báo mà các ANN này trả ra khi chạy trên tập hợp dữ liệu kiểm tra sẽ được ghi nhận và vẽ ra trên đồ thị. Trong trường hợp vấn đề đang nghiên cứu thể hiện mối quan hệ giữa hai biến số đầu vào, bình phương sai số sẽ được biểu diễn theo một paraboloic hướng lên. Nếu có nhiều hơn 2 biến số đầu vào, bình phương sai số sẽ được biểu diễn theo hình bát lật ngửa (với đáy bát hướng xuống). Hệ thống ANN nào trong số các ANN đang được thử nghiệm cho ra kết quả có bình phương sai số nhỏ nhất (nằm gần khu vực đáy bát) sẽ được lựa chọn để ứng dụng trong thực tế. Phương pháp tiếp cận này tiêu thụ thời lượng khá lớn của các nhà nghiên cứu, tuy nhiên, đây lại là phương pháp lựa chọn số lượng nơ-ron ẩn hiệu quả nhất. Phương pháp tiếp cận xây dựng và triệt thoái, theo một cách khác, điều chỉnh số lượng nơ-ron ẩn ngay trong quá trình huấn luyện một ANN thay vì xây dựng nhiều ANN khác nhau (với số lượng nơ-ron ẩn khác nhau) như vừa nói đến ở trên. Tuy nhiên, nhược điểm của cách tiếp cận này là trên thị trường hiện nay, có rất ít phần mềm thương mại ứng dụng ANN cho phép người nghiên cứu điều chỉnh số lượng nơ- ron ẩn ngay trong quá trình huấn luyện. Phương pháp tiếp cận xây dựng nói rằng nhà nghiên cứu nên thêm vào từng nơ-ron ẩn cho đến khi nào độ phù hợp của dự báo sụt giảm. Ngược lại, phương pháp tiếp cận triệt thoái cho rằng nhà nghiên cứu nên từ từ loại bỏ từng nơ-ron ẩn một cho đến khi nào độ phù hợp của kết quả dự báo sụt giảm. Phụ lục 5: Mô hình mạng truyền thẳng một lớp ẩn Mô hình mạng truyền thẳng sử dụng hàm kích hoạt logsigmoid sẽ được mô tả qua hệ thống phương trình sau. Đây là cách tiếp cận phổ thông nhất đối với mô hình dự báo bằng mạng thần kinh, được sử dụng rộng rãi khi các nhà nghiên cứu muốn thay thế các mô hình dư báo tuyến tính truyền thống. - 61 - ࢔࢑,࢚ = ࣓࢑,૙ + ෍࣓࢑,࢏࢞࢏,࢚࢏∗ ࢏ୀ૚ ࡺ࢑,࢚ = ࡸ൫࢔࢑,࢚൯ = ૚૚ + ࢋି࢔࢑,࢚ ࢚࢟ = ࢽ૙ +෍ࢽ࢑ࡺ࢑;࢚࢑∗ ࢑ୀ૚ trong đó, ܮ൫݊௞,௧൯ đại diện cho hàm kích hoạt logsigmoid dưới dạng ଵଵା௘ష೙ೖ,೟ . Trong hệ thống này có ݅∗ biến đầu vào {x}, và ݇∗ nơ-ron. Một kết hợp tuyến tính của các biến đầu vào tại thời điểm quan sát t, {ݔ௜;௧} ; i = 1, 2… i*, với vector hệ số (còn gọi là tập hợp trọng số của biến đầu vào) ߱௞,௜ ; i = 1, 2…, i* và hằng số ߱௞,଴ hình thành nên biến ݊௞,௧. Biến số này được “nén lại” bởi hàm số logistic, và trở thành nơ-ron ௞ܰ,௧ tại thời điểm quan sát t. Tập hợp k* nơ-ron tại thời điểm t được kết hợp một cách tuyến tính với vector hệ số {ߛ௞}; k = 1, 2,…, k*, và hằng số ߛ଴hình thành nên giá trị dự báo ݕ௧ෝ tại thời điểm t. Phụ lục 6: Mô hình mạng truyền thẳng đa lớp (Multi-layer feedforward neural network) Việc thiết lập nhiều lớp ẩn hơn sẽ làm cho cấu trúc của mô hình mạng trở nên phức tạp hơn. Hình dưới minh họa một mạng lưới truyền thẳng với hai lớp ẩn và 2 nơ-ron ở mỗi lớp. Mô hình đó được diễn đạt dưới dạng hệ thống phương trình với ݅∗ biến đầu vào ; ݇∗ nơ-ron ở lớp ẩn đầu tiên và ݈∗ nơ-ron ở lớp ẩn thứ hai: ࢔࢑,࢚ = ࣓࢑,૙ + ∑ ࣓࢑,࢏࢞࢏,࢚࢏∗࢏ୀ૚ ࡺ࢑,࢚ = ૚૚ାࢋష࢔࢑,࢚ ࢖࢒;࢚ = ࢖࢒;૙ + ∑ ࢖࢒;࢑ࡺ࢑;࢚࢑∗࢑ୀ૚ - 62 - ࡼ࢒,࢚ = ૚૚ାࢋష࢒࢒,࢚ ࢚࢟ = ࢽ૙ + ∑ ࢽ࢒ࡼ࢒;࢚࢒∗࢒ୀ૚ Khi thêm một lớp ẩn thứ hai thì số hệ số cần phải ướng lượng sẽ tăng một lượng là (݇∗ + 1)(݈∗ − 1) + (݈∗ + 1); Vì với mạng truyền thẳng một lớp, ݅∗ biến đầu vào và ݇∗ nơ-ron, ta sẽ có (݅∗ + 1)݇∗ + (݇∗ + 1) hệ số, trong khi đó, khi thêm một lớp ẩn với ݈∗ nơ-ron thì số hệ số bây giờ sẽ là (݅∗ + 1)݇∗ + (݇∗ + 1)݈∗ + (݈∗ + 1). Hình: Mô hình mạng truyền thẳng với hai lớp ẩn. Nguồn: Paul D. MaNelis (2005) “Neural Network in Finance” Mạng truyền thẳng đa lớp ẩn khiến cho mô hình trở nên phức tạp hơn. Với mô hình này, ta sẽ phải ước lượng nhiều hệ số hơn mà đến lượt nó sẽ khiến ta phải chịu nhiều ràng buộc hơn trong điều kiện số mẫu quan sát có giới hạn. Bên cạnh đó, mô hình này cũng đòi hỏi thời gian huấn luyện nhiều hơn. Càng nhiều hệ số thì khả năng các ước lượng hệ số rơi vào các tối ưu cục bộ, thay vì các tối ưu toàn cục, sẽ càng lớn (vấn đề này sẽ được bàn kỹ ở phần sau). Tuy vậy, ta cũng để tâm đến ưu điểm của việc sử dụng nhiều lớp ẩn. Theo đó, mô hình mạng thần kinh nhân tạo hai lớp với các trọng số được huấn luyện sẽ có khả năng ước lượng được hầu hết các hàm phi tuyến. Đây là một đặc điểm rất quan trọng và là nền tảng cho việc ứng dụng mô hình mạng thần kinh ở rất nhiều các lĩnh vực khác nhau. Mô hình mạng thần kinh có thể ước - 63 - lượng một hàm số đa biến bằng cách xây dựng nên hàm số đó đồng thời điều chỉnh hàm số đó cho phù hợp. Trong khi đó, các mô hình hồi quy phi tuyến truyền thống chỉ dừng lại ở việc cố gắng điều chỉnh cho thích hợp với một hàm số đã được định sẵn. Chính lợi thế này đã giúp cho mô hình mạng thần kinh trở nên vượt trội so với các công cụ hồi quy thống kê cổ điển khác. Phụ lục 7: Mô hình mạng truyền thẳng kết hợp bước nhảy (Jump connection) Một thay thế khác cho mô hình mạng truyền thẳng chính là mô hình mạng truyền thẳng kết hợp với kết nối nhảy (jump connection). Theo đó, biến đầu vào ݔ không chỉ có mối tương quan tuyến tính với các nơ-ron ở lớp ẩn mà còn với cả biến đầu ra ݕ. Hình 1.5 minh họa mô hình mạng truyền thẳng kết hợp bước nhảy (Feedforward jump connection network), mô hình này gồm ba biến đầu vào, một lớp ẩn với hai nơ- ron (݅∗ = 3 ; ݇∗ = 2). Hình : Mô hình mạng truyền thẳng và kết nối nhảy. Nguồn: Paul D. MaNelis (2005) “Neural Network in Finance” Mô hình trên được viết lại dưới dạng hệ thống phương trình toán học, sử dụng hàm kích hoạt Logsigmoid như sau: ࢔࢑,࢚ = ࣓࢑,૙ + ∑ ࣓࢑,࢏࢞࢏,࢚࢏∗࢏ୀ૚ ࡺ࢑,࢚ = ࡸ൫࢔࢑,࢚൯ = ૚૚ାࢋష࢔࢑,࢚ - 64 - ࢚࢟ = ࢽ૙ + ∑ ࢽ࢑ࡺ࢑;࢚ ࢑∗࢑ୀ૚ + ∑ ࢼ࢏࢞࢏;࢚࢏∗࢏ୀ૚ Lưu ý rằng mô hình mạng truyền thẳng có bước nhảy nhảy kết nối sẽ làm cho số hệ số cần ước lượng trong mạng lưới gia tăng một lượng là ݆∗, bằng với số lượng biến đầu vào. Ưu điểm của loại mô hình này chính là nó kết hợp cả mô hình tuyến tính với mô hình mạng thần kinh truyền thẳng. Thông qua đó, mô hình sẽ cho phép một hàm phi tuyến có thể đồng thời có thành phân tuyến tính và thành phần phi tuyến. Nếu mối tương quan giữa biến đầu vào và biến đầu ra chỉ đơn thuần là tuyến tính thì khi đó chỉ duy nhất phần “bước nhảy kết nối trực tiếp” (giữa biến đầu vào và biến đầu ra) với tập hợp các hệ số {ߚ௜} ; ݅ = 1, … , ݅∗ là có ý nghĩa.. Ngược lại, nếu như mối tương quan giữa x và y được kỳ vọng là mô quan hệ phi tuyến phức tạp thì kh đó, tập hợp các hệ số {߱} và {ߛ} sẽ có ý trở nên có ý nghĩa và tất nhiên tập hợp hệ số {ߚ} sẽ có mức ý nghĩa thống kê không cao. Và cuối cùng có thể xảy ra trường hợp là mối quan hệ giữa tập hợp biến đầu vào {ݔ} và biến đầu ra {ݕ}bao gồm cả thành phần tuyến tính và phi tuyến, kết quả là cả {ߚ}; {߱}; {ߛ} đều sẽ có ý nghĩa. Phụ lục 8: Kết quả kiểm định ngoài mẫu mô hình GNN-7-4-1 Desired Output and Actual Network Output -0.015 -0.01 -0.005 0 0.005 0.01 0.015 0.02 0.025 0.03 0.035 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Exemplar O ut pu t INF INF Output - 65 - Phụ lục 9: Kết quả kiểm định ngoài mẫu mô hình GNN-7-4-4-4-1 Desired Output and Actual Network Output -0.005 0 0.005 0.01 0.015 0.02 0.025 0.03 0.035 0.04 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Exemplar O ut pu t INF INF Output - 66 - DANH MỤC TÀI LIỆU THAM KHẢO  1. Phạm Thế Anh (2009), “Xác định các nhân tố quyết định lạm phát ở Việt Nam”, Tạp chí Kinh tế & Phát triển. 2. Nguyễn Ngọc Bảo (2011), “Điều hành chính sách tiền tệ năm 2010, định hướng giải pháp 2011”, Tạp chí Ngân hàng số 2-3/2011. 3. Lê Xuân Đình (2010), “Cẩn trọng với sự đồng hành của lạm phát và thiểu phát”, Tạp chí Cộng sản số 23 (215) năm 2010. 4. Nguyễn Trọng Hoài – Nguyễn Hoài Bảo (2009), “Lạm phát ở Việt Nam và kiểm chứng thực nghiệm mô hình P-star”, NXB Thống Kê. 5. Trần Ngọc Thơ và các tác giả (2008), “Tài chính quốc tế”, NXB Thống Kê. 6. Khuất Duy Tuấn (2011), “Bài về sự phối hợp của chính sách tài khóa và chính sách tiền tệ trong việc kiểm soát lạm phát ở Việt Nam”, Tạp chí Ngân hàng số 4/2011. 7. Phạm Thị Thu Trang (2009), “Các yếu tố tác động tới lạm phát tại Việt Nam – Phân tích chuỗi thời gian phi tuyến”, Tạm chí Kinh tế và Dự báo, số 12 năm 2009. 8. Đỗ Văn Thành – Trần Thị Kim Dung (2011), “Dự báo lạm phát năm 2011 và tác động của việc tăng giá điện, than, xăng đến hình thành mặt bằng giá mới và lạm phát”, Trung tâm Thông tin và Dự báo Kinh tế - Xã hội quốc gia. 9. Nguyễn Đức Thành và các tác giả (2010), “Lựa chọn để tăng trưởng bền vững”, NXB Tri Thức. 10. Nguyễn Huy Vũ (2010), “Định hướng lạm phát, một chính sách tiền tệ mới”, Tạp chí Tia Sáng tháng 7/2010. 11. Thời báo kinh tế Sài gòn (2008), “Đối mặt với lạm phát”, NXB Trẻ. 12. Iebeling Kaastra – Milton Boyd (1996) – “Designing a neural network for forecasting financial and economic time series”, Elsevier Neurocomputing - 67 - 13. Joarder Kamruzzaman et al (2006), “Artificial Neural Network in Finance and Manufacturing”,Idea Group Publising 14. Jingtao – Chew Lim Tan (2000) – “Guidelines for financial forecasting with Neural network”, International Conference on Neural Information Processing. 15. Jingtao Yao et al. (1999) – “Neural Network for technical analysis: A study on KLCI”, International Joural of Theoretical and Applied Finance, Vol 2, No.2 16. Juthathip Jongwanich – Donghyun Park (2008), “Inflation in Devloping Asia: Demand pull or cost push?”, Aisa Development Bank working paper No.121 17. Kate Smith – JatInder Gupta (2002), “Neural Network in Business: Techniques and Application”, Idea Group Publishing 18. Paul McNelis – Peter McAdam (2004), “Forecasting inflation with thick model and neural network”, European Central Bank – Working paper No.352 19. Yochanan Shachmurove – Dorota Witkowska (2000), “Utilizing artificial neural network model to predict stock market”, CARESS working paper No.00-11 20. Robert R. Trippi – Afrain Turban (1996), “Neural Network in Finance and Investing” , IRWIN Professional Publishing. 21. World Bank (2008 – 2010), “Taking Stock – An update on Vietnam’s recent economic development”.

Các file đính kèm theo tài liệu này:

UNG DUNG MO HINH MANG THAN KINH DU BAO LAM PHAT VIET NAM.pdf