TÓM TẮT ĐỀ TÀI
Lý do chọn đề tài
Hiện nay trên thế giới, ở các thị trường chứng khoán phát triển, các nhà phân tích và dự báo đã
áp dụng và đưa ra nhiều công cụ giúp cho các nhà đầu tư trên thị trường dự báo được giá chứng
khoán một cách chính xác nhằm đưa ra các quyết định đầu tư của mình. Tuy nhiên, việc ứng
dụng các công cụ này trên các thị trường là khác nhau. Đối với các nước phát triển thì việc ứng
dụng trở nên đơn giản hơn vì thông tin minh bạch hơn và thị trường cũng trở nên ổn định hơn.
Đối với thị trường các nước đang phát triển, trong đó có Việt Nam, thì thật sự trở nên phức tạp
khi áp dụng các mô hình phân tích và dự báo giá chứng khoán.
Do đó, đề tài “Ứng dụng mô hình Neural Network trong việc dự báo thị trường chứng khoán
Việt Nam” là đề tài mà chúng tôi tập trung nghiên cứu vào nhằm giúp cho các nhà đầu tư có thể
dễ dàng dự báo giá chứng khoán một cách chính xác và từ đó có thể đưa ra quyết định đầu tư
của mình.
Mục tiêu nghiên cứu
Mục tiêu của nghiên cứu này nhằm nghiên cứu lý thuyết mô hình Neural Network và sau đó
phát triển mô hình này để có thể dự báo một cách chính xác giá đóng cửa trong tương lai của
VN Index bằng cách sử dụng các gói dữ liệu phần mềm có sẵn. Và một khi mô hình được thiết
lập, thì sẽ trở thành một công cụ có ích trong việc giúp cho các nhà đầu tư có thể dự báo một
cách chính xác giá của chứng khoán.
Phương pháp nghiên cứu – Các mô hình dự kiến – Nguồn số liệu dự kiến
Phương pháp nghiên cứu
Sử dụng phần mềm Neuro Solutions nhằm xây dựng các bước tiến hành để thiết kế một mô
hình Neural Network thích hợp cho việc dự báo thị trường chứng khoán Việt Nam.
Mô hình dự kiến
Mô hình Backpropagation Neural Network
Nguồn số liệu dự kiến
Dữ liệu của thị trường chứng khoán đã điều chỉnh sau khi chia cổ tức, chia cổ phiếu, phát hành
cổ phiếu.
Các dữ liệu thống kê về nền kinh tế Việt Nam như: CPI, lãi suất, GDP, giá vàng, tỷ giá hối đoái,
tỷ lệ lạm phát v.v .
Tất cả các dữ liệu thu thập trên đây đều được quy ước theo một chuẩn thời gian cố định.
Nội dung nghiên cứu
Trong đề tài này, chúng tôi muốn giới thiệu về mô hình Neural Network, một mô hình khá mới
mẻ với năng lực xử lý thông tin mạnh, chỉ mới áp dụng trong lĩnh vực tài chính trên Thế Giới
trong khoảng gần 10 năm trở lại đây. Mô hình này mô phỏng hoat động của bộ não con người
để tạo ra một mô hình trí tuệ nhân tạo, có thể giải quyết các vấn đề phức tạp, giải quyết các hàm
phi tuyến . Bên cạnh đó, để minh họa cho mô hình, nhóm chúng tôi có lấy một số biến kinh tế
Việt Nam để dự báo cho chỉ số VN-Index bằng phần mềm Neuro Solutions 5.0 được viết dựa
trên nguyên lý của mô hình Neural Network.
Đóng góp của đề tài
Thị trường chứng khoán Việt Nam từ khi hình thành cho đến nay, đã trải qua 7 năm thăng trầm
và phát triển. Mặc dù vẫn còn nhiều rủi ro và hạn chế, nhưng thị trường chứng khoán nói riêng
và ngành tài chính Việt Nam nói chung đã có nhiều bước tiến đáng kể. Sự tiến bộ này được biểu
hiện trong các lĩnh vực như: hành lang pháp lý, chế độ công bố thông tin, giáo dục, nâng cao
kiến thức tài chính, sự tham gia đầu tư đông đảo của các nhà đầu tư Việt Nam, và các nhà đầu
tư nước ngoài Trong tương lai, khi thị trường tài chính ngày càng phát triển, sẽ là sân chơi
giữa những nhà đầu tư có chuyên môn, các quỹ đầu tư cũng như các tổ chức đầu tư lớn. Trong
bối cảnh đó, đòi hỏi phải có các công cụ dự báo hiện đại, nhanh nhạy và tính chính xác cao. Vì
vậy, tôi muốn nghiên cứu về mô hình dự báo giá chứng khoán Neural Network nhằm tìm một
công cụ dự báo hữu ích cho các nhà đầu tư chứng khoán cá nhân và tổ chức.
Hướng phát trển của đề tài
Trong nội dung và phụ lục của đề tài, chúng tôi đã trình bày về khả năng dự báo của mô hình
Neural Network trong thị trường chứng khoán và tỷ lệ lạm phát của một quốc gia. Không chỉ
dừng ở đó, mô hình Neural Network còn có khả năng áp dụng trong mọi lĩnh vực của nền kinh
tế, từ dự báo doanh thu, chi phí cho đến khả năng dự báo tỷ giá, lãi suất, giá vàng v.v Để sử
dụng được mô hình này, nhà đầu tư cá nhân hoặc tổ chức chỉ cần thu thập đủ các dữ liệu liên
quan đến mục tiêu dự báo, và chọn phần mềm xử lý thích hợp.
65 trang |
Chia sẻ: maiphuongtl | Lượt xem: 2136 | Lượt tải: 4
Bạn đang xem trước 20 trang tài liệu Đề tài Ứng dụng mô hình Neural Network trong việc dự báo thị trường chứng khoán Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ền như hình sigma thì thường sử dụng phổ biến hơn cả cho dữ liệu chuỗi thời
gian vì chúng cũng phi tuyến và những đặc trưng tiếp diễn có thể là những tính
năng ao ước được dùng cho mô hình Neural Network.
Dữ liệu thô thường đều có cùng tỷ lệ và ở giữa 0 – 1 và -1 đến 1, vì thế nó thường
nhất quán với loại hàm truyền đang được sử dụng.
Tuyến tính và độ lệch chuẩn là hai trong các phương pháp phổ biến nhất được sử
dụng trong hệ thống Neural Network. Trong phương pháp tuyến tính, tât cả các
biến đều được đo với số lớn nhất và nhỏ nhất được xác định theo công thức sau:
Với SV là giá trị cần cân, TF là giá trị tương ứng của hàm truyền, D là giá trị của
mẫu, là giá trị lớn nhất và nhỏ nhất của mẫu.
2.7. XÁC ĐỊNH TIÊU CHUẨN ĐÁNH GIÁ KẾT QUẢ
Hầu hết các sai lệch thông thường đều được tối thiểu trong mô hình Neural
Network là tổng các sai lệch bình phương. Các hàm sai lệch khác được đưa ra nhờ
các phần mềm. Các hàm số sai lệch này có thể không phải là các tiêu chuẩn cuối
cùng từ khi các phương pháp dự báo thông thường khác như MAPE thường không
được tối thiểu trong mô hình này.
Trong trường hợp các hệ thống điều chỉnh thông thường, các dự báo của Neural
Network có thể chuyển thành tín hiệu mua bán tùy thuộc vào các tiêu chuẩn đã
quyết định trước. Ví dụ, tất cả các dự báo đều lớn hơn 0.8 hay 0.9 điều đó nghĩa là
đó là dấu hiệu mua, còn dự báo nhỏ hơn 0.2 hay 0.1 là dấu hiệu bán. Dấu hiệu mua
hay bán sau đó được đưa vào chương trình để tính xem các loại rủi ro và được
huấn luyện lại và Neural Network đưa ra kết quả được điều chỉnh rủi ro. Mức độ
sai sót thấp và lợi nhuận giao dịch đều cần thiết đối với nhà đầu tư.
Lọc lại chuỗi thời gian để loại bỏ nhiều sự thay đổi giá nhỏ có thể phần lớn ngăn
chặn được trường hợp mà Neural Network với những điểm dự báo cao nhưng lại
không mang đến lợi nhuận. Cũng vậy, giá trị của hệ thống giao dịch đơn lẻ nào
cũng chỉ có thể xác định đưa theo hệ thống danh mục đầu tư của người dùng. Theo
quan điểm này, mô hình Neural Network rất hữu ích nếu chúng hành động như là
hệ thống đếm xu hướng trái với những hệ thống theo sau xu hướng của các trái
phiếu thông thường
2.8. LỰA CHỌN KIỂU HUẤN LUYỆN MÔ HÌNH NEURAL
NETWORK
Quá trình huấn luyện một mạng lưới Neural nhằm học hỏi các mô hình dữ liệu có
liên quan đến việc giới thiệu mạng lưới Neural có tính lặp đi lặp lại với các ví dụ
nhằm nhận biết những câu trả lời nào là chính xác. Mục tiêu của việc huấn luyện
là tìm cách để bố trí các trọng số ở giữa các neural nhằm định rõ toàn bộ số lượng
tối thiểu của chức năng sai số. Nếu mô hình không được “khít quá mức”, điều này
bố trí các trọng số nhằm cung cấp một khái quát hóa tốt. Mạng lưới
Backpropagation sử dụng một thuật toán huấn luyện dốc xuống nhằm huấn luyện
các trọng số để di chuyển xuống một độ dốc nhất của bề mặt sai số. Việc tìm thấy
toàn bộ số lượng tối thiểu thì không được bảo đảm từ khi bề mặt sai số có thể chứa
đựng một lượng cực tiểu cục bộ mà trong thuật toán có thể trở nên bế tắc. Thuật
ngữ momentum và 5 cho tới 10 việc xếp đặt ngẫu nhiên của các trọng số ban đầu
có thể cải tiến các cơ hội của sự đạt đến một mức tối thiểu chung. Phần này sẽ
được thảo luận khi kết thúc việc huấn luyện một mạng lưới Neural và việc lựa
chọn tỷ lệ nghiên cứu và các giá trị momentum
2.8.1. Xác định thông số lặp lại quá trình huấn luyện
Có hai trường phái tư duy quan tâm về điểm mà việc huấn luyện nên được ngừng
lại. Các căng thẳng đầu tiên là sự nguy hiểm của việc đánh bẫy trong các mức cực
tiểu cục bộ và sự khó khăn của việc đạt đến một mức cực tiểu chung. Nhà nghiên
cứu nên chỉ dừng việc huấn luyện cho đến khi không có sự cải tiến nào trong công
thức sai số được dựa trên một số lượng hợp lý các trọng số ban đầu được lựa chọn
ngẫu nhiên. Điểm mà mạng lưới không cải tiến được gọi là sự hội tụ. Cách nhìn
thứ hai tán thành một chuỗi các gián đoạn mang tính huấn luyện. Việc huấn luyện
được dừng lại sau khi một số lượng các gián đoạn được định trước và khả năng
của mạng lưới là tổng quát hóa các quá trình kiểm tra đã được đánh giá và quá
trình huấn luyện được tiếp tục. Việc tổng quát hóa là ý kiến mà một mô hình dựa
trên vật mẫu của dữ liệu thì thích hợp cho việc dự báo tổng số lượng. Mạng lưới
mà trong đó việc xếp đặt huấn luyện lỗi sai được chọn từ khi nó được cho rằng để
khái quát hóa tốt nhất.
Sự phê bình các thủ tục huấn luyện – kiểm tra rằng là các gián đoạn của các quá
trình huấn luyện – kiểm tra thêm vào có thể gây ra lỗi sai trong việc xếp đặt huấn
luyện – kiểm tra để rời xa hơn trước khi tăng trở lại hoặc nó thậm chí có thể rơi
theo đường tiệm cận. Nói một cách khác, nhà nghiên cứu không có cách nào để
biết được nếu việc huấn luyện thêm có thể cải thiện khả năng khái quát hóa một
cách đặc biệt của mạng lưới khi mà các trọng số ban đầu được lựa chọn ngẫn
nhiên.
Cả hai trường phái đều đồng ý rằng khái quát hóa quá trình công nhận là mục tiêu
cuối cùng và cả hai trường phái này đều sử dụng các tập hợp kiểm tra để đánh giá
một số lượng lớn các mạng lưới. Điểm mà cả hai trường phái tiếp cận các trung
tâm khởi hành với ý niệm của việc huấn luyện quá nhiều chống lại với việc “học
quá mức”. Sự hội tụ tiếp cận đến các trạng thái không có huấn luyện quá mức mà
chỉ có “học quá mức”. “Học quá mức” chỉ đơn giản là dấu hiệu của một mạng lưới
mà có quá nhiều trọng số. Giải pháp nhằm để giảm thiểu số lượng các neural ẩn
(hoặc các lớp ẩn nếu có hơn 1) và (hoặc) gia tăng kích cỡ của tập hợp huấn luyện.
Việc huấn luyện – kiểm tra nhằm cố gắng để cảnh giác chống lại “học quá mức”
bằng cách dừng lại việc huấn luyện dựa trên khả năng khái quát hóa của mạng
lưới.
Ưu điểm của lối tiếp cận hội tụ là chúng có thể thêm tin cậy rằng mức tối thiểu
chung đã được đạt đến. Sự tái tạo thì dường như khó khăn cho việc huấn luyện
tiếp cận đến các trọng số ban đầu được đưa ra một cách ngẫu nhiên thường xuyên
và sự tương quan có thể dao động dữ dội như các tiến trình huấn luyện. Một ưu
điểm khác là nhà nghiên cứu có ít hơn hai thông số để lo lắng; cụ thể là điểm mà
tại đó để dừng việc huấn luyện và phương pháp để đánh giá những gì của các huấn
luyện của các mạng lưới là tối ưu. Một ưu điểm của việc tiếp cận các huấn luyện
có thể là các mạng lưới với ít cấp độ tự do có thể được thi hành với sự khái quát
hóa tốt hơn là sự hội tụ của việc huấn luyện mà đưa ra kết quả trong “học quá
mức”. Tuy nhiên, công việc mang tính kinh nghiệm không được nhằm vào kết quả
này một cách đặc biệt. Việc tiếp cận huấn luyện có thể cũng yêu cầu ít thời gian
huấn luyện hơn.
Mục tiêu của sự hội tụ huấn luyện là nhằm với tới một mức tối thiểu chung. Điều
đó yêu cầu việc huấn luyện cho đủ số lượng của các epoch sử dụng một số lượng
hợp lý các trọng số ban đầu được chọn lựa một cách ngẫu nhiên. Thậm chí không
có sự bảo đảm với một mạng lưới Backpropagation rằng mức tối thiểu chung được
đạt đến từ khi nó có thể trở nên bị mắc kẹt trong mức tối thiểu địa phương. Trong
thực tế, các nguồn lực có sử dụng tính toán thì bị giới hạn và các giao dịch nảy
sinh. Nhà nghiên cứu phải sắp đặt lại số lượng các kết nối bên trong có thể thay
đổi được để được huấn luyện, khoảng thời gian các neural ẩn nhiều hơn của mỗi
mạng lưới được huấn luyện, số lượng của các trọng số ban đầu được chọn lựa một
cách ngẫu nhiên, và số lượng tối đa của các cuộc hành trình ngắn. Ví dụ như, 50
kết nối có thể biến đổi bên trong được kiểm tra nhiều hơn 3 neural tiềm ẩn khác
nhau với 5 nhóm các trọng số ban đầu được chọn lựa một cách ngẫu nhiên và số
lượng tối đa của quãng đường đi ngắn của 4.000 kết quả trong 3.000.000 epoch.
Với cùng thời gian tính toán được yêu cầu cho 10 kết nối bên trong có thể biến đổi
được kiểm tra cho hơn 6 neural ẩn với 6 nhóm các trọng số ban đầu được chọn lựa
một cách ngẫu nhiên và 5.000 tỷ epoch.
Một phương pháp để xác định giá trị hợp lý cho số lượng tối đa các quãng đường
đi ngắn là để vẽ sơ đồ ra sự tương quan, tổng của các sai số ước lệ, hoặc một
phương pháp đo lường lỗi sai thích hợp khác cho mỗi epoch hoặc các khoảng thời
gian đã được xác định trước đến một điểm mà nơi đó sự cải tiến không đáng kể
(thường lên tới tối đa là 10,000 epoch). Mỗi epoch có thể được vẽ sơ đồ một cách
dễ dàng nếu phần mềm mạng lưới neural tạo ra một dữ liệu thống kê hoặc, nếu
như không đúng như thế, sự tương quan có thể được ghi nhận với khoảng thời
gian từ 100 đến 200 từ màn hình máy vi tính. Sau khi vẽ sơ đồ sự tương quan của
một số lượng các trọng số khởi đầu được chọn lựa một cách ngẫu nhiên, nhà
nghiên cứu có thể chọn số lượng tối đa xu hướng được dựa trên điểm mà sự tương
quan dừng việc gia tăng một cách nhanh chóng và dừng lại.
Nhiều nghiên cứu đã đề cập đến số lượng các epoch ghi nhận sự hội tụ từ 85 đến
5,000 epoch. Tuy nhiên, việc xếp loại thì rất rộng như 50,000 và 191,400 epoch và
thời gian huấn luyện của 60 giờ đã được ghi nhận. Việc huấn luyện bị ảnh hưởng
bởi nhiều tham số như là sự chọn lựa tỷ lệ tiếp thu kiến thức và mometum, các sự
cải tiến độc quyền sở hữu đến thuật toán Backpropagation, nằm trong những cái
khác nữa, mà khác nhau giữa các nghiên cứu và thật là khó khăn để xác định một
giá trị chung cho số lượng tối đa các xu hướng. Ngoài ra, sự chính xác bằng số của
phần mềm mạng lưới neural có thể ảnh hưởng đến việc huấn luyện bởi vì độ dốc
của các dẫn xuất sai số có thể trở nên rất nhỏ gây ra một vài chương trình mạng
lưới neural để di chuyển về hướng sai nhờ vào các sai số mà có thể được tạo ra
một cách nhanh chóng trong thuật toán huấn luyện có tính lặp đi lặp lại cao. Điều
đó yêu cầu rằng các nhà nghiên cứu xác định số lượng các epoch được yêu cầu để
đạt được sự cải tiến không đáng kể cho các vấn đề cụ thể của họ và kiểm tra càng
nhiều các trọng số khởi đầu được chọn lựa một cách ngẫu nhiên càng nhiều thúc
ép có sử dụng máy điện toán được cho phép
2.8.2. Lựa chọn learning rate và momentum
Một mạng lưới BP được huấn luyện để sử dụng một thuật toán dộ dốc xuống
nhằm tuân theo các diễn biến của bề mặt sai số bằng cách luôn luôn di chuyển
xuống một độ dốc nhất. Mục tiêu của việc huấn luyện này nhằm tối thiểu tổng các
sai số ước lệ, đuợc định nghĩa như sau:
E =
2
1
M
h
E h = 2
1
M
h
N
i
(thi – Ohi) 2
với E là tổng sai số của tất cả các mẫu hình, Eh là sai số trên mô hình h, chỉ số h
xếp hạng toàn bộ các mô hình đầu vào, và i ám chỉ i neural đầu ra. Giá trị thay đổi
thi là giá trị đầu ra được yêu cầu cho neural đầu ra ith khi mà mô hình h được trình
bày. Nguyên tắc nghiên cứu để huấn luyện trọng số giữa neural i và j được định
nghĩa như sau:
hi = (thi – Ohi) Ohi (1 – Ohi) (3)
hi = Ohi (1- Ohi)
N
k
hkwjk (4)
Δwij (n + 1) = ε ( δhiOhj) (5)
với:
n là số trình bày
δhi là sai số của neural i của mô hình h
€ là tỷ lệ nghiên cứu.
Tỷ lệ nghiên cứu thì mang tính cân xứng cố định nhằm xác định kích cỡ
của các thay đổi trọng số. Thay đổi trọng số của một neural thì cân xứng với tác
động của trọng số từ neural khác trên sai số đó. Sai số của neural bên ngoài và
neural ẩn được tính toán bởi Eq. (3) và (4), thường dùng.
Hình 2.3. Ví dụ đơn giản về bề mặt sai số của Neural Network
Như là một sự tương đồng đối với thuật toán kiểm nghiệm BP, một khi có thể xem
xét vấn đề trong việc cố gắng ném quả banh từ điểm A đến điểm C như trong hình
2.3, mặc dù trong thực tế bề mặt sai số là nhiều thứ nguyên của một đại lượng và
không thể được trình bày dưới dạng đồ thị. Lực đẩy vào trái banh thì tương tự như
tỷ lệ nghiên cứu. Việc áp dụng quá nhiều lực đẩy sẽ làm cho quả banh bắn xa hơn
ra ngoài mục tiêu của nó và nó có thể không bao giờ trở lại điểm A hoặc nó có thể
dao động chính giữa điểm A và diểm B. Trong suốt quá trình huấn luyện, tỷ lệ
nghiên cứu mà quá cao bị khám phá khi công thức sai số đang thay đổi một cách
dữ dội mà đang không chỉ ra một sự cải thiện tiếp tục. Quá ít lực đẩy vào quả banh
và nó không thể thoát ra khỏi điểm A như là bằng chứng trong suốt quá trình huấn
luyện khi có quá ít hoặc không có sự cải thiện nào trong công thức sai số. Một tỷ
lệ nghiên cứu rất nhỏ cũng yêu cầu thêm thời gian huấn luyện. Trong trường hợp
này, người nghiên cứu phải huấn luyện tỷ lệ nghiên cứu trong suốt quá trình huấn
luyện hoặc “ tẩy não” mạng lưới bằng cách lựa chọn ngẫu nhiên tất cả các trọng số
và thay đổi tỷ lệ nghiên cứu theo cách mới thông qua cài đặt việc huấn luyện.
Một phương pháp nhằm gia tăng tỷ lệ nghiên cứu và nhờ đó tốc độ làm gia tăng
thời gian huấn luyện mà không cần hướng đến sự dao dộng mà bao gồm lực đẩy
trong Backpropagation quy tắc huấn luyện. Thuật ngữ momentum chỉ ra rằng các
thay đổi trọng số trong quá khứ tác động như thế nào đến các thay đổi trọng số ở
hiện tại. Quy tắc huấn luyện được sửa đổi BP được định nghĩa như sau:
Δwij(n + 1) = ε( δhiOhi ) + α Δwij(n) (6)
với α là thuật ngữ động lượng, và các thuật ngữ khác đã được định nghĩa ở trên.
Thuật ngữ động lượng ngăn chặn sự dao động từ bên này sang bên kia bằng cách
lọc ra những thay đổi có tần số xuất hiện cao. Sự tìm kiếm sự hướng dẫn mới là
tổng trọng số hiện tại và độ dốc trước đó.
2.9. TIẾN HÀNH THỰC HIỆN MÔ HÌNH
Tiến hành thực hiện mô hình được đưa ra như là bước cuối, nhưng trong thực tế
đòi hỏi phải xem xét cẩn thận trước khi tập hợp dữ liệu. Dữ liệu có sẵn, tiêu chuẩn
định giá và các lần huấn luyện tất cả được sắp đặt bởi môi trường mà trong đó hệ
thống Neural Network sẽ được phát triển. Hầu hết các nhà bán phần mềm của mô
hình Neural Network cung cấp phương tiện bởi các mạng lưới được huấn luyện có
thể được bổ sung trong các chương trình của mô hình Neural Network hoặc như là
một tập tin thi hành. Nếu không một mạng lưới được huấn luyện có thể được tạo
ra một cách dễ dàng trong bảng tính bằng cách hiểu rõ cấu trúc của nó, các hàm
truyền, và trọng số. Sự thận trọng nên được đặt vào các dữ liệu biến đổi, việc chia
tỷ lệ, và các tham số để duy trì cùng lúc từ lúc huấn luyện cho đến khi sử dụng
thực tế.
Một ưu điểm của mô hình Neural Network là khả năng của nó có thể thích nghi
được với sự thay đổi các điều kiện của thị trường thông qua sự huấn luyện trước
đó. Trước khi triển khai, sự thể hiện của mô hình Neural Network sẽ giảm giá trị
theo thời gian nếu không có huấn luyện lại để thay thế. Tuy nhiên, với sự huấn
luyện lại trước đó cũng không có bất kỳ một sự bảo đảm nào là sự thể hiện của mô
hình có thể được duy trì như là các giá trị thay đổi độc lập được chọn có thể trở
nên ít quan trọng hơn.
Có đề nghị rằng độ thường xuyên của việc huấn luyện lại cho mạng lưới được
triển khai cùng lức với việc sử dụng trong suốt quá trình huấn luyện cuối cùng của
mô hình. Tuy nhiên, khi huấn luyện một số lượng lớn các mạng lưới để thu được
mô hình cuối cùng, độ thường xuyên của việc huấn luyện lại ít đi cũng được chấp
nhận để giữ cho số lần huấn luyện là hợp lý. Một mô hình tốt nên mạnh đối với độ
thường xuyên của việc huấn luyện lại và sẽ thường xuyên cải thiện bằng cách thay
thế việc huấn luyện lại thường xuyên.
KẾT LUẬN
Để thiết kế một mô hình Neural Network hoàn chỉnh cần thông qua qui trình tám
bước. Đầu tiên là lựa chọn yếu tố đầu vào có liên quan đến các yếu tố đầu ra, rồi
chúng ta tiến hành thu thập mọi dữ liệu. Dữ liệu có được sẽ trải qua quá trình xứ lý
và phân tích dữ liệu. Kế đó, chúng ta cần phân chia dữ liệu cho từng giai đoạn:
Huấn luyện, kiểm tra và công nhận. Bước tiếp theo là xây dựng các thông số quan
trọng cho Neural Network, đó là việc tính toán và xác định số lượng các lớp ẩn,
neuron ẩn, neuron đầu ra và loại hàm truyền. Sau đó cần phải xác định các tiêu
chuẩn đánh giá kết quả chúng ta mong đợi cũng như yêu cầu đặt ra đối với quá
trình huấn luyện. Cuối cùng ta thực hiện mô hình trên phần mềm vi tính phù hợp
để cho ra kết quả.
CHƯƠNG 3: ỨNG DỤNG NEURAL NETWORK VÀO THỊ
TRƯỜNG TÀI CHÍNH VIỆT NAM
3.1. DỰ BÁO KINH TẾ VIỆT NAM 2008
Cơ quan tình báo kinh tế Anh (EIU) dự báo kinh tế thế giới tăng trưởng 4,8%
trong giai đoạn 2008 – 2009 (tính theo ngang giá sức mua có trọng số), giảm so
với mức dự báo 5,1% cho năm 2007. Tăng trưởng kinh tế Mỹ, thị trường xuất
khẩu hàng đầu của Việt Nam, dự báo tăng lên mức 2,1% năm 2008 và 2,8% năm
2009, cao hơn mức 1,9% năm 2007. Tốc độ tăng trưởng khiêm tốn của kinh tế Mỹ
có thể sẽ làm tốc độ tăng trưởng xuất khẩu của Việt Nam chậm lại. Tuy nhiên việc
kinh tế Trung Quốc tăng trưởng cao sẽ bù đắp phần nào sự giảm sút đó. Giá dầu
thô thế giới dự báo giảm còn 69 USD/thùng năm 2008 và 63,3 USD/thùng năm
2009, theo đó sẽ tác động tiêu cực đối với nguồn thu từ xuất khẩu của Việt Nam
(dầu thô chiếm tỷ trọng lớn nhất trong xuất khẩu của Việt Nam), tuy nhiên nhập
khẩu các sản phẩm dầu mỏ sẽ rẻ hơn.
Trong giai đoạn 2008 – 2009, tốc độ tăng GDP thực tế dự báo có thể giảm nhẹ từ
8,4% năm 2007 xuống còn 8,1% năm 2008 và 8% năm 2009. Tăng trưởng GDP sẽ
tiếp tục bị chi phối bởi tăng trưởng của ngành công nghiệp, chi tiêu dùng và đầu tư
cố định. Mặc dù Ngân hàng Nhà nước có thể thắt chặt chính sách tiền tệ nhằm kìm
chế tăng trưởng tín dụng nội địa, nhưng điều này dự báo sẽ không làm giảm quá
mức niềm tin của các nhà đầu tư và người tiêu dùng. Trong năm 2008, tiêu dùng
tại khu vực nông thôn dự báo sẽ tăng mạnh do giá cà phê và gạo tăng cao. Tổng
cầu tiêu dùng tiếp tục tăng do việc làm tăng.
Đầu tư tư nhân trong nước sẽ vẫn phát triển trong giai đoạn 2008 – 2009 do Chính
phủ tạo lập sân chơi bình đẳng hơn cho thành phần kinh tế tư nhân và kinh tế nhà
nước. Việc Việt Nam gia nhập WTO cũng làm tăng niềm tin của các nhà đầu tư
trực tiếp nước ngoài. Năm 2007, tổng vốn FDI cam kết đối với các dự án mới dự
báo đạt 12 tỷ USD, gần gấp 3 lần số vốn cam kết năm 2005. Việc Việt Nam gia
nhập WTO giúp tăng kim ngạch xuất khẩu, tuy nhiên, việc cắt giảm hàng rào thuế
quan cũng khiến hàng nhập khẩu trở nên rẻ hơn. Dự báo trong giai đoạn 2008-
2009, xuất khẩu ròng sẽ đóng góp âm vào tăng trưởng kinh tế.
Về mặt cung, khu vực công nghiệp sẽ tiếp tục là nhân tố chính thúc đẩy tăng
trưởng kinh tế với tốc độ tăng trưởng khoảng 10%/năm (tính theo giá trị gia tăng).
Ngành công nghiệp đạt mức tăng trưởng cao là do sự mở rộng năng lực sản xuất.
Ngoài ra, ngành dệt may đã thích ứng tốt trong điều kiện tự do hóa thương mại
toàn cầu. Tuy nhiên, Mỹ có thể sẽ tiếp tục tăng cường giám sát đối với mặt hàng
may mặc nhập khẩu từ Việt Nam trong thời gian tới. Mỹ cũng có thể sẽ tiếp tục áp
dụng các biện pháp chống bán phá giá đối với hàng hóa Việt Nam. Lĩnh vực dệt
may đã tăng trưởng nhanh từ khi Việt Nam gia nhập WTO, tuy nhiên tính cạnh
tranh xuất khẩu trong dài hạn cũng là vấn đề cần lưu ý. Trong giai đoạn 2008 –
2009, lĩnh vực dịch vụ dự báo tiếp tục duy trì mức tăng cao, đặc biệt là các dịch vụ
tài chính và những dịch vụ liên quan đến du lịch.
3.1.1. Lạm phát
Trong những tháng vừa qua, tỷ lệ lạm phát có xu hướng tăng và duy trì ở mức cao
(8,6% trong tháng 8/2007 và 8,8% trong tháng 9/2007) do giá luơng thực thực
phẩm tăng mạnh. Trong thời gian tới, dự báo giá dầu thô thế giới giảm sẽ làm
giảm áp lực tăng giá nhiên liệu, từ đó giảm áp lực tăng giá đối với giá các loại
hình dịch vụ và hàng hóa khác. Chính phủ cũng cắt giảm thuế nhập khẩu đối với
một số sản phẩm nhằm ngăn chặn lạm phát. Tuy nhiên, dòng vốn vào trong nước
dự báo tiếp tục tăng, làm tăng cung tiền, từ đó làm tăng áp lực lạm phát. Dự báo
trong cả năm 2007, lạm phát ở mức khoảng 8,1% và sẽ giảm xuống 7,8% năm
2008 và 7,2% năm 2009.
3.1.2. Tỷ giá hối đoái
Đầu tháng 1/2007, Ngân hàng Nhà nước đã nới rộng biên độ dao động tỷ giá
VND/USD từ 0,25% lên 0,5%/ngày. Theo đó, tỷ giá có thể biến động mạnh hơn.
Trong năm 2008, VND dự báo tăng giá so với đồng USD, nhưng sẽ giảm giá vào
năm 2009. Đồng VND tăng nhẹ so với đồng USD là do luồng vốn vào tăng cao
cũng như thu từ hoạt động xuất nhập khẩu và lượng kiều hối tăng lên. Tỷ giá
VND/USD dự báo ở mức trung bình 16.059 trong năm 2008, sau đó tăng lên mức
16.150 năm 2009 khi đồng USD được củng cố trên thị trường ngoại hối quốc tế.
Tỷ giá VNĐ/JPY dự báo tăng trong giai đoạn 2008 – 2009. Trong xu thế hiện nay,
VNĐ sẽ tiếp tục giảm giá so với đồng euro trong năm 2008, nhưng sẽ tăng giá vào
năm 2009.
3.1.3. Kinh tế đối ngoại
Trong năm 2008 – 2009, tổng kim ngạch xuất khẩu hàng hóa dự báo tiếp tục tăng
tính theo giá USD (dự báo tăng 15,3%), tuy nhiên tốc độ tăng thấp hơn so với giai
đoạn 2005-2006. Việc Việt Nam trở thành thành viên của WTO tạo điều kiện cho
các nhà xuất khẩu của Việt Nam tiếp cận thị trường thế giới dễ dàng hơn, hạn chế
và hàng rào thuế đối với hàng hóa Việt Nam được cắt giảm. Theo đó, tốc độ tăng
kim ngạch xuất khẩu có thể đạt mức 2 con số. Tuy nhiên, Việt Nam vẫn được coi
là nền kinh tế “phi thị trường” trong vòng 12 năm sau khi gia nhập WTO, theo đó
dễ bị các nước thành viên khác của WTO kiện chống bán phá giá đối với hàng hóa
xuất khẩu. Nhập khẩu dự báo tiếp tục tăng nhanh trong giai đoạn 2008 – 2009 do
cầu nhập khẩu đối với hàng hóa trung gian, máy móc thiết bị và hàng hóa tiêu
dùng tăng khi Việt Nam tiếp tục cắt giảm thuế theo cam kết với ASEAN và WTO.
Cán cân thương mại hàng hóa dự báo tiếp tục thâm hụt trong giai đoạn 2008 –
2009. Thâm hụt tài khoản dịch vụ và thu nhập cũng tăng. Doanh thu từ du lịch
tăng nhưng việc nhập khẩu các các dịch vụ liên quan đến thương mại cũng tăng
mạnh. Cùng với việc mở rộng hoạt động của khu vực có vốn đầu tư nước ngoài,
việc chuyển lợi nhuận ra nước ngoài dự báo cũng tăng. Các dòng vốn chuyển giao
vãng lai sẽ tiếp tục tăng mạnh và khoản thặng dư trong chuyển giao vãng lai sẽ bù
đắp cho thâm hụt trong tài khoản dịch vụ và tài khoản thu nhập. Tuy nhiên, cùng
với việc thâm hụt thương mại hàng hóa tăng, tài khoản vãng lai sẽ thâm hụt 2,1%
GDP trong năm 2008 và 2,3% GDP trong năm 2009.
3.2. LỰA CHỌN PHẦN MỀM XỨ LÝ MÔ HÌNH
Ngày nay, do nhu cầu sử dụng mô hình Neural Network ngày càng tăng nên các
phần mềm thiết kế, xứ lý ra đời ngày càng nhiều bên cạnh chương trình truyền
thống thường sử dụng là MATLAB. Hiện nay, các phần mềm phổ biến được thiết
kế dùng cho mô hình Neural Network gồm có Alyuda NeuroIntelligence, Stuttgart
Neural Network Simulator, Emergen, JavaNNS và NeuroSolutions.
Mỗi phần mềm có những tính năng đặc biệt riêng, nhưng qua quá trình thử nghiệm
và tìm hiểu chúng tôi đã chọn phần mềm Neuro Solutions để thực hiện mô hình
Neural Network.
NeuroSolutions là một trong những chương trình mạnh nhất hiện nay mô phỏng
mô hình Neural Network. Để chạy mô hình, chương trình cung cấp hai chương
trinh con để thiết lập mô hình là Neuro Expert và Neuro Builder. Chương trình con
Neural Builder cần một sự am tường sâu sắc về các thuật toán cũng như cách vẽ
mô hình, đây là chương trình chuyên sâu dành cho những ai nghiên cứu sâu về
Neural Network. Do đề tài chỉ gói gọn trong việc ứng dụng mô hình nên tôi sử
dụng chương trình Neuro Expert để việc thực hiện được dễ dàng hơn nhờ vào cơ
chế tự động của chương trình.
Hình 3.1: Giới thiệu giao diện phần mềm NeuroSolutions
Hình 3.2: Lựa chọn NeuralExpert
Chương trình NeuroSolutions sau khi được đưa các dữ liệu đầu vào và đầu ra sẽ tự
động chọn các lớp ẩn cho phù hợp với dữ liệu, cũng như tự động điều chỉnh các hệ
số khác như Learning rate, Momemtum và epoch. Mặc định số epoch khi training
của chương trình là 1000. Ngoài ra chương trình còn cung cấp các tiện ích khác
như cửa sổ theo dõi dữ liệu training qua biểu đồ kết quả dự báo. Một điểm nổi bật
khác của chương trình này là nếu dữ liệu đầu vào có mối tương quan thấp với dữ
liệu đầu ra vẫn được sử dụng nhưng sẽ được tự điều chỉnh với trọng số nhỏ.
3.3. CÁCH THỨC THU THẬP VÀ XỬ LÝ DỮ LIỆU THÔ
3.3.1. Các nhân tố ảnh hưởng thị trường chứng khoán Việt Nam
Thị trường chứng khoán là một bộ phận của nền kinh tế vì vậy những thay đổi
trong nền kinh tế đều có tác động trực tiếp hoặc gián tiếp đến thị trường chứng
khoán. Theo nhận định của nhiều chuyên gia và nhà đầu tư chứng khoán thì thị
trường chứng khoán hiện nay thì tác động “tâm lý bầy đàn” vẫn là tác động lớn
nhất. Nhưng những tâm lý hình thành kỳ vọng của nhà đầu tư cũng có những yếu
tố khác tác động đến, hiện nay ở Việt Nam chính là do các chính sách kinh tế của
Chính Phủ. Chính những chính sách hay thay đổi của Chính phủ đã làm cho nhiều
nhà đầu tư chứng khoán hiện nay giảm bớt đầu tư vào thị trường và thay đổi danh
mục của mình vào những kênh sinh lời khác như: bất động sản, thị trường vàng,
kinh doanh ngoại tệ v.v….
Còn về các yếu tố tác động đến tâm lý của nhà đầu tư, ta có thể kể đến là: tỷ giá
USD/VND, lãi suất tiền gửi, GDP, CPI, giá trị giao dịch mua/bán của các nhà đầu
tư nước ngoài, khối lượng giao dịch trong ngày của VN-INDEX v.v… Đó là
những yếu tố trong nước, còn các yếu tố ngoài nước có thể từ sự cộng hưởng của
các thị trường chứng khoán bên ngoài phải kể đến chỉ số S&P500( Mỹ), SSE
(Trung Quốc). Những yếu tố này thể hiện trạng tình trạng của nền kinh tế nước ta,
nhất là sau khi gia nhập WTO nền kinh tế Thế Giới lại càng ảnh hưởng đến chúng
ta. Vì vậy, chúng tôi đưa ra các yếu tố sau ảnh hưởng đến VN-INDEX:
VNINDEX: Chỉ số VN-INDEX
KL_VNINDEX: Khối lượng giao dịch toàn thị trường của VN-INDEX
NNKLMUA: Tổng khối lượng mua vào của nhà đầu tư nước ngoài (bao gồm
giao dịch thỏa thuận)
NNKLBAN: Tổng khối lượng bán ra của nhà đầu tư nước ngoài (bao gồm giao
dịch thỏa thuận)
NNGTMUA: Tổng giá trị tiền mua vào của nhà đầu tư nước ngoài (bao gồm
giao dịch thỏa thuận)
NNGTBAN: Tổng giá trị tiền bán ra của nhà đầu tư nước ngoài (bao gồm giao
dịch thỏa thuận)
CPI: Chỉ số hàng tiêu dùng của cả nước
LAMPHAT: Tỷ số phần trăm lạm phát so với kỳ gốc năm 2005 là 100
USD/VND: Tỷ giá USD/VND
JPY/VND: Tỷ giá JPY/VND
EUR/VND: Tỷ giá EUR/VND
XKXANG: Khối lượng xuất khẩu dầu thô
NKXANG: Khói lượng nhập khẩu xăng
GIA_VANG: Giá vàng SJC ở thành phố Hồ Chí Minh
GDP_GIA_SS_1994: Tổng sản phẩm quốc nội tính so sánh với năm 1994
GDP_GTT: Tổng sản phẩm quốc nội tính theo giá thực tế
SP500: Chỉ số các công ty vừa và nhỏ ở Mỹ S&P 500
SSE B: Chỉ số chứng khoán thị trường Thượng Hải, Trung Quốc
LS3THANG: Lãi suất tiết kiệm có kỳ hạng 3 tháng
LS6THANG: Lãi suất tiết kiệm có kỳ hạng 6 tháng
LS12THANG: Lãi suất tiết kiệm có kỳ hạng 12 tháng
Cũng nhờ vào tính chất đặc biệt của mô hình Neural Network tự động nhận thấy
các mối tương quan giữa các biến với nhau, vì vậy chúng ta không cần phải quan
trọng về việc thống nhất đơn vị tính của từng biến. Các biến nhập trên đây có thể
để ở bất kỳ đơn vị tính nào, trong quá trình training mô hình sẽ tự động san bằng
các sai biệt về đơn vị tính và sau đó làm việc với dữ liệu sau điều chỉnh từ quá
trình training.
3.3.2. Cách thức thu thập và điều chỉnh dữ liệu đầu vào
Việc thu thập dữ liệu đều dựa trên những trang web có uy tín. Tuy nhiên về mặt
thời gian như đã trình bày ở phần trước cần phải nhất quán với nhau. Ở đây, chúng
tôi tổ chức dữ liệu mẫu theo tuần để có những số liệu dự báo kịp thời cho nhà đầu
tư. Do tính chất đặc thù của một số dữ liệu không có dữ liệu theo tháng, tôi lấy
trung bình cho các tuần trong tháng. Các yếu tố được sử dụng theo phương pháp
bình quân này là: CPI. XKXANG, NKXANG, GDP_SS_1994, GDP_TT,
LAMPHAT. Trong trường hợp đặc biệt của GDP thì dữ liệu được tổ chức theo
quý nên lấy bình quân cho các tuần trong quý đó.
Các dữ liệu trên đầy đều được lấy trong năm 2006, 2007 và ba tháng đầu năm
2008 để đảm bảo dữ liệu mẫu đủ lớn trong việc chạy mô hình, toàn bộ ta có được
111 mẫu được trình bày chi tiết trong phụ lục.
Nguồn dữ liệu được dùng để xây dựng mô hình Neural Network được lấy từ
những nguồn khác nhau phù hợp với từng loại biến như sau:
VNINDEX: Dữ liệu dùng cho MetaStock từ trang web Phân tích cổ phiếu
(www.phantichcophieu.com)
KL_VNINDEX: Dữ liệu dùng cho MetaStock từ trang web Phân tích cổ phiếu
(www.phantichcophieu.com)
NNKLMUA: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web
Phân tích cổ phiếu (www.phantichcophieu.com)
NNKLBAN: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web
Phân tích cổ phiếu (www.phantichcophieu.com)
NNGTMUA: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web
Phân tích cổ phiếu (www.phantichcophieu.com)
NNGTBAN: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web
Phân tích cổ phiếu (www.phantichcophieu.com)
CPI: Tổng cục thống kê
LAMPHAT: Tổng cục thống kê
USD/VND: Trang web của ngân hàng TMCP Xuất nhập khẩu
www.exim.com.vn
JPY/VND: Trang web của ngân hàng TMCP Xuất nhập khẩu
www.exim.com.vn
EUR/VND: Trang web của ngân hàng TMCP Xuất nhập khẩu
www.exim.com.vn
XKXANG: Tổng cục thống kê
NKXANG: Tổng cục thống kê
GIA_VANG: Trang web của ngân hàng TMCP Xuất nhập khẩu
www.exim.com.vn
GDP_SS_1994: Tổng cục thống kê
GDP_GTT: Tổng cục thống kê
SP500: Trang web Yahoo!Finance www.finance.yahoo.com
SSE B: Trang web Yahoo!Finance www.finance.yahoo.com
LS3THANG: Ngân hàng Đầu tư phát triển quốc tế
LS6THANG: Ngân hàng Đầu tư phát triển quốc tế
LS12THANG: Ngân hàng Đầu tư phát triển quốc tế
3.3.3. Tổ chức file dữ liệu
Tất cả các dữ liệu đầu vào đều được nhập vào một file excel, nhưng do chương
trình NeuroSulutions chỉ có thế đọc dữ liệu dưới dạng text ASCII nên chúng ta cần
phải chuyển đổi dữ liệu từ excel sang dạng text. Các thao tác bước sau đây chúng
tôi sử dụng Microsoft Office 2007.
Trước tiên, tạo một file access, sau đó thực hiện lệnh import file excel vào
Microsoft Access. Chọn các field trong access có tên chính là tên của các cột của
file excel. Sau đó chọn định dạng cho từng cột, các cột đều có định dạng kiểu số,
trừ ô NGAY là định dạng kiểu Date/Time, ta chọn khóa chính cho table này là cột
STT.
Sau khi có table dữ liệu từ excel chuyển qua ta xuất dữ liệu sang file text. Trong
quá trình xuất, chọn dấu phân cách các cột là dấu “,” và dòng đầu tiên là tiêu đề
của các cột.
Sau khi xuất ra thành file text, ta có thể dùng file này vào chương trình
NeuroSolutions để chạy mô hình Neural Network.
3.3.4. Phân tích các biến đầu vào bẳng Data Manager
Mở Data Manager, chọn file dữ liệu đầu vào, sau đó chọn biến mong muốn là VN-
INDEX. Sau đó ta thực hiện phân tích các dữ liệu đầu vào để đo lường mức độ
tương quan của các biến đầu vào với biến đầu ra. Ta có được biểu đồ sau thể hiện
mức độ tương quan theo biểu đồ hình 3.3.
Biểu đồ cho thấy sự tương quan của các biến đầu vào với biến đầu ra. Dù có nhiều
biến có tương quan thấp nhưng ta vẫn giữ lại trong mô hình để diễn tả phần nào
tác động của các yếu tố này đến nền kinh tế.
Hình 3.3: Biểu đồ thể hiện độ tương quan giữa các biến đầu vào và biến đầu
ra
3.4. QUÁ TRÌNH XỬ LÝ MÔ HÌNH VÀ PHÂN TÍCH KẾT QUẢ
3.4.1. Cách thực hiện chạy chương trình NeuroSolutions
Trước khi thực hiện chương trình, chúng tôi điểm qua lại các điều kiện ban đầu
được chúng tôi sử dụng để thực hiện mô hình Neural Network dự báo VN-INDEX
- Mô hình thu thập số liệu từ ngày 3/1/2006 đến ngày 25/3/2008
- Phần mềm sử dụng là phiên bản Demo
- Các số liệu, thông tin đầu vào được thu thập từ các nguồn đáng tin cậy nhất
có thể trong khả năng nhưng cũng không tránh khỏi những thiếu sót do
nguyên nhân khách quan.
Chọn chương trình Neuro Expert để chạy mô hình. Ta thực hiện lần lược các bước
sau:
Bước 1: Chọn kiểu mô hình là dự báo dựa trên những dữ liệu quá khứ và ước
lượng từ mô hình.
Bước 2: Chọn đường dẫn đến dữ liệu đầu vào đã được chuyển sang file text
Bước 3: Chọn các dữ liệu đầu vào có dữ liệu dưới dạng khác dạng số ( trong mô
hình này không có dữ liệu thiết kế theo dạng khác dạng số trừ biến NGAY)
Bước 4: Chọn file dùng làm biến output, ta chọn là dữ liệu giống dữ liệu ban đầu.
Bước 5: Chọn biến số đầu ra, ta chọn VN-INDEX
Bước 6: Chọn xem biến đầu ra có phải được trình bày dưới dạng số hay không
Bước 7: Chọn thời điểm cần mô hình dự đoán tiếp.
Bước 8: Chọn biến để thử dữ liệu trong suốt thời gian training của mô hình. Trong
trường hợp này, tôi chọn dùng 20% dữ liệu ban đầu để kiểm tra mô hình
Bước 9: Chọn out of sample, chương trình mặc định là 20%
Bước 10: Chọn cách so sánh giữa các mô hình với nhau, tính năng này bỏ qua
Bước 11: Chọn dạng thay đổi của phương sai. Ta chọn là Low, nghĩa là phương
sai sẽ theo mục tiêu là thấp nhất.
Trên đây là các bước để thiết kế một mô hình Neural Network. Tuy nhiên do số
lượng mẫu có hạn nên độ chính xác của mô hình không cao. Để mô hình cho ra
kết quả tốt nhất cần phải training dữ liệu nhiều lần, ít nhất là 3 lần. Và mỗi lần
training là mô hình tự động thiết kế 1000 lần chạy với các biến đầu vào dựa trên
các biến động trong quá khứ của VN-INDEX. Sau khi training nhiều lần, ta chạy
Tesing để có được kết quả đầu ra mong muốn.
3.4.2. Kết quả nhận được từ phần mềm NeuroSolutions
Sau quá trình Training dữ liệu, dữ liệu đầu ra và dự liệu dự báo của VN-INDEX
được thể hiện như hình 3.4. Hình 3.4 cho ta thấy dữ liệu dự báo cho kết quả gần
với kết quả lấy từ 20% dữ liệu dùng để kiểm tra tính chính xác của mô hình. Vì
vậy, nhìn vào hình 3.4 ta có thể nói quá trình huấn luyện nhận được rất thành công
và có thể tiếp tục quá trình testing để cho ra kết quả dự báo của VN-INDEX.
Hình 3.4. Chỉ số VN-INDEX đầu ra và mong đợi sau quá trình huấn luyện
3.4.3. Kết quả dự báo VN-INDEX từ tháng 4/2008 đến tháng 5/2008
Do hạn chế trong phiên bản Demo nên chúng ta không cho được kết quả tốt ở dự
báo tuần thứ 1 và thứ 2. Chúng tôi cho thực hiện mô hình với số dự báo trong
bước 7 chọn lần lượt từ 3 đến 8, ta có được kết quả dự báo cho tuần thứ 3 và thứ 8
kế tiếp cho mô hình như hình 3.5. Số liệu VN-INDEX thực tế được lấy từ trang
web của Sở giao dịch chứng khoán Thành phố Hồ Chí Minh để đối chiếu với kết
quả có được từ chạy phần mềm. Dùng hai cột số liệu trên ta vẽ được đồ thị như
hình 3.6.
Hình 3.5. Dữ liệu VN-INDEX dự báo từ mô hình và dữ liệu thực tế từ tuần
thứ 3 đến tuần thứ 8 tiếp theo của dữ liệu ban đầu
Tuần dự báo tiếp theo Kết quả Thực tế
3 525.92 530.9
4 510 530.62
5 537.17 522.36
6 548.19 518.35
7 537 483.92
8 485 449.24
Hình 3.6. Đồ thị so sánh VN-INDEX từ kết quả dự báo và VN-INDEX thực tế
3.4.4. Phân tích kết quả
Thật vậy với mô hình Neural Network thông qua một quá trình xử lý thông tin
phức tạp, cùng với quá trình training và testing đã cho ra kết quả dự báo khá chính
xác với độ tin cậy cao. Khác với các công cụ dự báo truyền thống, mô hình Neural
Network đã mô phỏng hoạt động của bộ não con người để tạo ra một mô hình trí
tuệ nhân tạo nhằm giải quyết các vấn đề phức tạp trong dự báo. Đây là một công
cụ dự báo thực sự hữu ích cho các nhà đầu tư trong tương lai nhằm giúp họ đưa ra
các quyết định đúng đắn trong quá trình đầu tư của mình.
Sự sai lệch giữa kết quả dự báo và thực tế có thể do các nguyên nhân chính sau:
- Do có sai số trong các dữ liệu đầu vào do bị hạn chế về thời gian và nguồn
thông tin.
- Do giới hạn trong việc tìm kiếm các biến số có liên quan đến Vn-Index, vì
một số yếu tố không thể lượng hóa vào mô hình được như tâm lý bầy đàn
của nhà đầu tư, tính chưa hiệu quả và phát triển của thị trường chứng khoán
Việt Nam.
3.5. CHỨNG CỨ ỨNG DỤNG MÔ HÌNH NEURAL NETWORK
3.5.1. Jason E.Kutsurelis ứng dụng mô hình Neural Network để dự báo S&P 500
Trong nhiều năm qua, việc sử dụng mô hình Neural Network ngày càng rộng rãi
và phổ biến trong lĩnh vực kinh tế - tài chính. Nhiều tổ chức, cũng như cá nhân
cũng đã công bố rộng rãi các kết quả nghiên cứu của mình, trong đó nổi bật nhất là
nghiên cứu dự báo tỷ lệ lạm phát của Chính Phủ Nhật và Hồng Kông (được trình
bày trong phần phụ lục) và dự báo chỉ số S&P 500 của Jason E.Kutsurelis. Vào
năm 1998, Jason E.Kutsurelis đã đưa ra kết quả nghiên cứu của mình trong việc
ứng dụng mô hình Neural Network để dự báo S&P 500. Ông sử dụng các biến đầu
vào được thu thập từ 1/3/1991 đến 18/8/1998 để dự báo cho chỉ số S&P 500 cho
10 ngày sau, bao gồm:
- Chỉ số S&P 500
- Chỉ số ngành vận tải Dow Jones
- Chỉ số ngành công nghiệp Dow Jones
- Chỉ số ngành dịch vụ công cộng Dow Jones
- Thông tin nghiên cứu về hàng hóa
- Chỉ số về dầu AMEX
- Chỉ số về vàng và bạc
Mô hình Neural Network được huấn luyện bằng việc sử dụng backpropagation
chuẩn cho cả hai trường hợp kiểm nghiệm. Hình 3.7 cho thấy sự thay đổi của chỉ
số S&P 500 và đuợc mô phỏng dưới đây nhằm để tham khảo sắp tới. Có thể thấy
rằng thị trường đã rơi xuống nhanh chóng 730 điểm (10/10/1986) và đầu cơ giá
lên 1110 điểm (21/1/1994). Thật sự bị hấp dẫn khi nhìn thấy mô hình hoạt động
như thế nào trong những trường hợp xấu nhất, từ đó nó có thể được hoạt động cực
kỳ tốt khi việc huấn luyện và thử nghiệm dữ liệu được xếp hạng như nhau.
Hình 3.7. Chỉ số S&P 500 từ năm 1972 đến 1996
Để thử nghiệm mô hình trong từng vùng then chốt này, mô hình được huấn luyện
để sử dụng dữ liệu trong khoảng thời gian 4 năm trước sự sụp đổ năm 1986 hoặc
là trước sự khởi đầu của cuộc đầu cơ giá lên năm 1994. Trong cả hai trường hợp
thử nghiệm này thì mô hình được sử dụng có một lớp ẩn với 7 neuron ẩn và 19
neuron đầu vào. Các giá trị của tham số ban đầu được cho vào một chương trình
máy tính để định giá trị một cách ngẫu nhiên [-1,1]. Các lớp ẩn và đầu ra sử dụng
chức năng kích hoạt sigmoid. Trong khi số lượng khoảng trống cho các lớp ẩn
được cung cấp bằng phần tử đơn vị đầu ra cố định của neuron đầu ra thứ 19,
không có số lượng khoảng trống nào cho các sigmoid trong lớp đầu ra. Những
trường hợp thử nghiệm này và các kết quả thu được được phân tích dưới đây.
3.5.2. Trường hợp 1: Đầu cơ giá lên từ tháng 1 năm 1994
Theo hình 3.8 cho thấy việc huấn luyện và thử nghiệm dữ liệu được bình thường
hóa cho chỉ số S&P 500, trong khi hình 3.9 cho thấy việc huấn luyện và thử
nghiệm dữ liệu được bình thường hóa cho lãi suất. Dữ liệu bắt đầu từ dữ liệu điểm
850 và việc huấn luyện dữ liệu với chiều dài là 275 tuần trong khi việc thử nghiệm
dữ liệu có chiều dài là 50 tuần. Có thể thấy rằng lãi suất trong dài hạn đang gia
tăng trong hầu hết các phần của việc đầu cơ giá lên (thử nghiệm dữ liệu) chấp
nhận vào lúc cuối, trong khi trong ngắn hạn lãi suất bị trì hoãn bởi 20 tuần đang
tăng lên vào lúc ban đầu và sau đó cố định. Sự thay đổi này từ việc gia tăng cho
đến khi cố định được trông đợi là sẽ có tác động đến thị trường. Tuy nhiên, trong
lĩnh vực này tác động chính được trông đợi lại đến từ động lực của chính thị
trường, được phân tích bởi các nhà kinh tế học ở những nơi khác.
Kết quả kiểm nghiệm
Hình 3.10 cho thấy kết quả kiểm nghiệm của trường hợp này. Việc thử nghiệm đã
đuợc hoàn thành bằng việc huấn luyện mạng lưới và đầu ra cho mỗi tuần được so
sánh với đầu ra kỳ vọng. Có thể nhìn thấy từ các số liệu là mô hình có thể dự đoán
chắc chắn việc đầu cơ giá lên trước 1 tuần. Nó dự báo chính xác xu hướng các chỉ
số của cổ phiếu đến mức 43 lần vượt ra ngoài phạm vi mẫu là 50 điểm. Phần trăm
sai số lớn nhất đạt được như là phần trăm của đầu ra mong muốn chỉ là 4.044%,
trong khi sai số trung bình chỉ là 0.95%. Vì vậy, các mô hình đã hoạt động rất tốt
và sự thể hiện này có thể được sử dụng một cách phù hợp để lực chọn thời điểm
cho thị trường.
Hình 3.8. Việc huấn luyện và thử nghiệm dữ liệu (chỉ số S&P 500) trong
trường hợp đầu cơ giá lên
Hình 3.9. Việc huấn luyện và thử nghiệm dữ liệu cho lãi suất trong trường
hợp đầu cơ giá lên
Thậm chí sau khi detrending và bình thường hóa, những việc chỉ dựa trên việc
huấn luyện dữ liệu, đầu ra mong muốn từ mô hình thì cao hơn những giá trị mà nó
được huấn luyện trong hình 3.8. Thật vậy, mô hình có khả năng dự báo một sự gia
tăng trong đầu ra ngay cả khi nó không được huấn luyện cho các giá trị chính xác
của việc xếp loại các giá trị đầu ra. Những tiên đoán tốt này cho thấy một viễn
cảnh tốt đẹp trong tương lai, nhằm chỉ ra rằng sự quan tâm được đưa ra nhằm
bình thường hóa dữ liệu để một sự gia tăng đột ngột trong giá trị các chỉ số sẽ
không bão hòa với giá trị được bình thường hóa.
Điều đó có thể được tiên đoán là mô hình có thể được huấn luyện mỗi tuần hơn là
cứ giữ nó dựa trên việc huấn luyện, điều đó sẽ trở nên cũ vào gần cuối tuần thứ 50.
Việc dịch chuyển cửa sổ huấn luyện mỗi tuần và huấn luyện lại mô hình là một
cách tiếp cận hợp lý, điều này là cần thiết trong thực tế. Tuy nhiên, có một sai lầm
lớn của việc huấn luyện mô hình đó là việc kế thừa những thay đổi theo tuần và
theo đó các hoạt động của mô hình sẽ tồi tệ hơn. Trong bất kỳ trường hợp nào, thủ
tục này có thể được sửa đổi cho thích hợp và cửa sổ dự báo có thể được giảm bớt
để phù hợp với các yêu cầu.
Hình 3.10. Chỉ số S&P 500 được dự báo và kỳ vọng trong trường hợp đầu cơ
giá lên
3.5.3. Trường hợp 2: Sự sụp đổ vào tháng 10 năm 1986
Hình 3.11 cho thấy các giá trị của chỉ số trong phần huấn luyện và thử nghiệm cho
trường hợp thứ hai, nơi mà việc huấn luyện dữ liệu bắt đầu từ dữ liệu điểm thứ
500 và dữ liệu điểm này dài 200 trong khi dữ liệu thử nghiệm vượt quá 75 tuần
ngay lập tức theo sau việc huấn luyện dữ liệu và bao gồm một sự sụp đổ mạnh.
Hình 3.12 cho thấy lãi suất cho việc huấn luyện và thử nghiệm được kết nối.
Trong trường hợp này, lãi suất trì hoãn trong dài hạn đang rơi xuống trong chu kỳ
huấn luyện khi chỉ số S&P 500 có xu hướng gia tăng, trong khi đó trong suốt chu
kỳ thử nghiệm lãi suất đang gia tăng rất nhanh, khi chỉ số đang rơi xuống. Lãi suất
trì hoãn trong ngắn hạn bởi 20 tuần cũng đang gia tăng lên nhưng với mức độ
chậm hơn trong thời kỳ thử nghiệm. Vì vậy, trong trường hợp này, nó được trông
đợi rằng tác động của việc gia tăng lãi suất sẽ dự báo được sự sụp đổ. Điều đó
không là động lực chính trong việc huấn luyện dữ liệu cho chỉ số, từ khi chỉ số gia
tăng và rơi xuống hoặc theo một hướng khác là sự thay đổi trong chỉ số dao động
giữa giá trị tốt nhất và xấu nhất. Mạng lưới có 7 neuron trong lớp ẩn được huấn
luyện cho 900 quá trình lặp đi lặp lại, với kích cỡ 1 bước cố định là 0.4 và các kết
quả thử nghiệm được giới thiệu chi tiết trong phần sau.
Hình 3.11. Việc huấn luyện và thử nghiệm dữ liệu (chỉ số S&P 500) trong
trường hợp giá xuống
Các kết quả kiểm nghiệm
Hình 3.13 cho thấy các kết quả kiểm nghiệm trong trường hợp này. Biểu đồ cho
thấy rằng mô hình có khả năng dự báo sự sụp đổ mạnh trước 1 tuần nó thật sự xảy
ra. Mặc dù vậy, đầu ra của mô hình thì thấp hơn các giá trị thực tế cho phần ban
đầu trong việc phân loại thử nghiệm, không có xu hướng cho chỉ số cổ phiếu, mà
có thể tác động lên mô hình để dự báo một vụ sụp đổ. Vì vậy, một mô hình chỉ sử
dụng các giá trị chỉ số trong quá khứ có thể không có khả năng dự báo sự sụp đổ,
mà nó được phân phối nhằm gia tăng lãi suất dài hạn. Trong trường hợp này, mô
hình dự đoán chính xác xu hướng của chỉ số cổ phiếu 65 lần vượt ra ngoài mẫu thử
nghiệm là 75 điểm. Phần trăm sai số lớn nhất đạt được như là phần trăm của đầu ra
kỳ vọng thì cao hơn nhiều so với với trường hợp 1 và đạt mức 13.7%, trong khi đó
sai số trung bình chỉ là 4.18%. Nguồn chính của sai số ở đây là mạng lưới không
thể dự báo tốt sự gia tăng ban đầu trong thị trường. Trong thực tế sự thận trọng
này, bất kỳ mô hình nào có thể dự báo tốt sự gia tăng ban đầu có thể nhận lấy một
sự không chính xác và hấp tấp đặt lệnh mua một cách nhanh chóng theo sau bởi
một lệnh bán. Như vậy những thay đổi nhanh chóng là điều không mong muốn kể
từ khi khối lượng giao dịch gia tăng cùng với các chi phí giao dịch thích hợp.
Hình 3.12. Việc huấn luyện và kiểm nghiệm dữ liệu cho lãi suất trong trường
hợp giá xuống
Hình 3.13. Chỉ số S&P 500 được dự báo và kỳ vọng trong trường hợp giá
xuống
3.5.4. Kết quả thử nghiệm cho cả hai trường hợp
Sau khi đưa ra dự báo kết quả được so sánh với thực tế theo như hình 3.14
Hình 3.14. Kết quả so sánh của S&P 500 thực tế và dự báo
Ta có kết quả thống kê kết quả đầu ra như sau:
R square 0.9935
Xác suất chính xác của mô hình :
Dự báo Xác suất
Thị trường lên 88.1335%
Thị trường xuống 84.21035%
So sánh với phương pháp thống kê truyền thống là mô hình hồi quy tuyến tính đa
biến ta có được kết quả sau:
Neural network
Mô hình hồi quy tuyến
tính đa biến
R square 0.9935 0.9671
Trung bình 0.1759 0.2914
Độ lệch chuẩn 11.50 24.95
Xác suất chính xác thị
trường lên
88.13% 84.21%
Xác suất chính xác thị
trường xuống
72.5% 57.71%
Từ xác suất chính xác của mô hình cho thấy mô hình neural network có thể dự
đoán chính xác thị trường tài chính nếu có dữ liệu đầu vào thích hợp . Khi so sánh
với phân tích hồi quy, neural network thì tốt hơn cho các nhà đầu tư vì một số lý
do:
Mean square error 130.975
Mean absolute error 8.821
Min. absolute error 0.039
Max. absolute error 31.792
Correlation coefficient r 0.9968
- Khi sử dụng hồi quy tuyến tính đa biến, các giả định hồi quy chủ yếu phải
đúng. Giả định tuyến tính tự bản thân nó không chứa đựng nhiều trường
hợp. Neural Network có thể xử lý cả tuyến tính và phi tuyến.
- Khi sử dụng phân tích hồi quy tuyến tính đa biến, nhà đầu tư cần có một
kiên thức sâu rộng về thống kê để đảm bảo các biến độc lập càn thiết cần sử
dụng.
- Sau khi nghiên cứu, kết quả cho thấy Neural Network chính xác hơn đáng
kể so với hồi quy tuyến tính đa biến.
KẾT LUẬN
Ngày nay, cùng với sự phát triển kinh tế của Thế giới, nền kinh tế Việt Nam được
dự báo là vẫn trên đà tăng trưởng, trong đó đầu tư tư nhân trong nước vẫn phát
triển, các khu vực công nghiệp vẫn tiếp tục là nhân tố để thúc đẩy tăng trưởng kinh
tế. Trước tình hình đó, nhu cầu sử dụng mô hình Neural Network ngày càng tăng
nên các phần mềm thiết kế, xử lý ra đời ngày càng nhiều bên cạnh chương trình
truyền thống thường sử dụng là MATLAB. Hiện nay, các phần mềm phổ biến
được thiết kế dùng cho mô hình Neural Network gồm có Alyuda
NeuroIntelligence, Stuttgart Neural Network Simulator, Emergen, JavaNNS và
NeuroSolutions nhưng qua quá trình thử nghiệm và tìm hiểu thì phần mềm
NeuroSolutions là phần mềm có nhiều tính năng ưu việt hơn cả và phù hợp để
thực hiện mô hình Neural Network. NeuroSolutions là một trong những chương
trình mạnh nhất hiện nay mô phỏng mô hình Neural Network cung cấp hai chương
trinh con để thiết lập mô hình là Neuro Expert và Neuro Builder. Với phần mềm
này, chúng ta bắt đầu tiến hành thu thập, xử lý dữ liệu thô và tiến hành điều chỉnh
dữ liệu đầu vào sao cho các dữ liệu về mặt thời gian phải nhất quán với nhau. Sau
đó tiến hành tổ chức file dữ liệu và phân tích các biến đầu vào bằng Data
Manager. Cuối cùng là quá trình xử lý mô hình và phân tích kết quả.
DANH MỤC CÁC HÌNH
Hình 1.1. Cấu trúc Neural Network ......................................................................... 3
Hình 1.2. Mô hình mạng Neural tổng quát............................................................... 3
Hình 1.3. Mô hình cấu trúc một Neuron .................................................................. 4
Hình 1.4. Mô hình neuron với vector nhập .............................................................. 5
Hình 1.5. Một lớp gồm nhiều Neuron ...................................................................... 5
Hình 1.6. Mô hình mạng một lớp Neuron ................................................................ 6
Hình 1.7. Mô hình mạng một lớp được vẽ gọn ........................................................ 6
Hình 1.8. Mô hình mạng nhiều lớp Neuron ............................................................ 7
Hình 2.1. Phép chuyển đổi logaric khối lượng giao dịch tương lai
hàng tháng của lúa mì ............................................................................................ 14
Hình 2.2. Phép thử Walk-forward trong chuỗi thời gian ........................................ 18
Hình 2.3. Ví dụ đơn giản về bề mặt sai số của Neural Network ............................. 26
Hình 3.1. Giới thiệu giao diện phần mềm NeuroSolutions ..................................... 32
Hình 3.2. Lựa chọn NeuralExpert .......................................................................... 32
Hình 3.3. Biểu đồ thể hiện mức độ tương quan
giữa các biến đầu vào và biến đầu ra ..................................................................... 37
Hình 3.4. Chỉ số VN-INDEX đầu ra và mong đợi sau quá trình huấn luyện .......... 38
Hình 3.5. Dữ liệu VN-INDEX dự báo từ mô hình và dữ liệu thực tế
từ tuần thứ 3 đến tuần thứ 8 tiếp theo của dữ liệu ban đầu ..................................... 39
Hình 3.6. Đồ thị so sánh VN-INDEX từ kết quả dự báo và VN-INDEX thực tế .... 39
Hình 3.7. Chỉ số S&P 500 từ năm 1972 đến 1996.................................................. 41
Hình 3.8. Việc huấn luyện và thử nghiệm dữ liệu (chỉ số S&P 500)
trong trường hợp đầu cơ giá lên ............................................................................. 42
Hình 3.9. Việc huấn luyện và thử nghiệm dữ liệu cho lãi suất
trong trường hợp đầu cơ giá lên ............................................................................. 43
Hình 3.10. Chỉ số S&P 500 được dự báo và kỳ vọng
trong trường hợp đầu cơ giá lên ............................................................................. 44
Hình 3.11. Việc huấn luyện và thử nghiệm dữ liệu (chỉ số S&P 500)
trong trường hợp giá xuống ................................................................................... 45
Hình 3.12. Việc huấn luyện và thử nghiệm dữ liệu cho lãi suất
trong trường hợp giá xuống ................................................................................... 46
Hình 3.13. Chỉ số S&P 500 được dự báo và kỳ vọng
trong trường hợp giá xuống ................................................................................... 46
Hình 3.14. Kết quả so sánh của S&P 500 thực tế và dự báo ................................... 47