Đề tài Ứng dụng mô hình Neural Network trong việc dự báo thị trường chứng khoán Việt Nam

TÓM TẮT ĐỀ TÀI  Lý do chọn đề tài Hiện nay trên thế giới, ở các thị trường chứng khoán phát triển, các nhà phân tích và dự báo đã áp dụng và đưa ra nhiều công cụ giúp cho các nhà đầu tư trên thị trường dự báo được giá chứng khoán một cách chính xác nhằm đưa ra các quyết định đầu tư của mình. Tuy nhiên, việc ứng dụng các công cụ này trên các thị trường là khác nhau. Đối với các nước phát triển thì việc ứng dụng trở nên đơn giản hơn vì thông tin minh bạch hơn và thị trường cũng trở nên ổn định hơn. Đối với thị trường các nước đang phát triển, trong đó có Việt Nam, thì thật sự trở nên phức tạp khi áp dụng các mô hình phân tích và dự báo giá chứng khoán. Do đó, đề tài “Ứng dụng mô hình Neural Network trong việc dự báo thị trường chứng khoán Việt Nam” là đề tài mà chúng tôi tập trung nghiên cứu vào nhằm giúp cho các nhà đầu tư có thể dễ dàng dự báo giá chứng khoán một cách chính xác và từ đó có thể đưa ra quyết định đầu tư của mình.  Mục tiêu nghiên cứu Mục tiêu của nghiên cứu này nhằm nghiên cứu lý thuyết mô hình Neural Network và sau đó phát triển mô hình này để có thể dự báo một cách chính xác giá đóng cửa trong tương lai của VN Index bằng cách sử dụng các gói dữ liệu phần mềm có sẵn. Và một khi mô hình được thiết lập, thì sẽ trở thành một công cụ có ích trong việc giúp cho các nhà đầu tư có thể dự báo một cách chính xác giá của chứng khoán.  Phương pháp nghiên cứu – Các mô hình dự kiến – Nguồn số liệu dự kiến Phương pháp nghiên cứu Sử dụng phần mềm Neuro Solutions nhằm xây dựng các bước tiến hành để thiết kế một mô hình Neural Network thích hợp cho việc dự báo thị trường chứng khoán Việt Nam. Mô hình dự kiến Mô hình Backpropagation Neural Network Nguồn số liệu dự kiến Dữ liệu của thị trường chứng khoán đã điều chỉnh sau khi chia cổ tức, chia cổ phiếu, phát hành cổ phiếu. Các dữ liệu thống kê về nền kinh tế Việt Nam như: CPI, lãi suất, GDP, giá vàng, tỷ giá hối đoái, tỷ lệ lạm phát v.v . Tất cả các dữ liệu thu thập trên đây đều được quy ước theo một chuẩn thời gian cố định.  Nội dung nghiên cứu Trong đề tài này, chúng tôi muốn giới thiệu về mô hình Neural Network, một mô hình khá mới mẻ với năng lực xử lý thông tin mạnh, chỉ mới áp dụng trong lĩnh vực tài chính trên Thế Giới trong khoảng gần 10 năm trở lại đây. Mô hình này mô phỏng hoat động của bộ não con người để tạo ra một mô hình trí tuệ nhân tạo, có thể giải quyết các vấn đề phức tạp, giải quyết các hàm phi tuyến . Bên cạnh đó, để minh họa cho mô hình, nhóm chúng tôi có lấy một số biến kinh tế Việt Nam để dự báo cho chỉ số VN-Index bằng phần mềm Neuro Solutions 5.0 được viết dựa trên nguyên lý của mô hình Neural Network.  Đóng góp của đề tài Thị trường chứng khoán Việt Nam từ khi hình thành cho đến nay, đã trải qua 7 năm thăng trầm và phát triển. Mặc dù vẫn còn nhiều rủi ro và hạn chế, nhưng thị trường chứng khoán nói riêng và ngành tài chính Việt Nam nói chung đã có nhiều bước tiến đáng kể. Sự tiến bộ này được biểu hiện trong các lĩnh vực như: hành lang pháp lý, chế độ công bố thông tin, giáo dục, nâng cao kiến thức tài chính, sự tham gia đầu tư đông đảo của các nhà đầu tư Việt Nam, và các nhà đầu tư nước ngoài Trong tương lai, khi thị trường tài chính ngày càng phát triển, sẽ là sân chơi giữa những nhà đầu tư có chuyên môn, các quỹ đầu tư cũng như các tổ chức đầu tư lớn. Trong bối cảnh đó, đòi hỏi phải có các công cụ dự báo hiện đại, nhanh nhạy và tính chính xác cao. Vì vậy, tôi muốn nghiên cứu về mô hình dự báo giá chứng khoán Neural Network nhằm tìm một công cụ dự báo hữu ích cho các nhà đầu tư chứng khoán cá nhân và tổ chức.  Hướng phát trển của đề tài Trong nội dung và phụ lục của đề tài, chúng tôi đã trình bày về khả năng dự báo của mô hình Neural Network trong thị trường chứng khoán và tỷ lệ lạm phát của một quốc gia. Không chỉ dừng ở đó, mô hình Neural Network còn có khả năng áp dụng trong mọi lĩnh vực của nền kinh tế, từ dự báo doanh thu, chi phí cho đến khả năng dự báo tỷ giá, lãi suất, giá vàng v.v Để sử dụng được mô hình này, nhà đầu tư cá nhân hoặc tổ chức chỉ cần thu thập đủ các dữ liệu liên quan đến mục tiêu dự báo, và chọn phần mềm xử lý thích hợp.

pdf65 trang | Chia sẻ: maiphuongtl | Lượt xem: 2118 | Lượt tải: 4download
Bạn đang xem trước 20 trang tài liệu Đề tài Ứng dụng mô hình Neural Network trong việc dự báo thị trường chứng khoán Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ền như hình sigma thì thường sử dụng phổ biến hơn cả cho dữ liệu chuỗi thời gian vì chúng cũng phi tuyến và những đặc trưng tiếp diễn có thể là những tính năng ao ước được dùng cho mô hình Neural Network. Dữ liệu thô thường đều có cùng tỷ lệ và ở giữa 0 – 1 và -1 đến 1, vì thế nó thường nhất quán với loại hàm truyền đang được sử dụng. Tuyến tính và độ lệch chuẩn là hai trong các phương pháp phổ biến nhất được sử dụng trong hệ thống Neural Network. Trong phương pháp tuyến tính, tât cả các biến đều được đo với số lớn nhất và nhỏ nhất được xác định theo công thức sau: Với SV là giá trị cần cân, TF là giá trị tương ứng của hàm truyền, D là giá trị của mẫu, là giá trị lớn nhất và nhỏ nhất của mẫu. 2.7. XÁC ĐỊNH TIÊU CHUẨN ĐÁNH GIÁ KẾT QUẢ Hầu hết các sai lệch thông thường đều được tối thiểu trong mô hình Neural Network là tổng các sai lệch bình phương. Các hàm sai lệch khác được đưa ra nhờ các phần mềm. Các hàm số sai lệch này có thể không phải là các tiêu chuẩn cuối cùng từ khi các phương pháp dự báo thông thường khác như MAPE thường không được tối thiểu trong mô hình này. Trong trường hợp các hệ thống điều chỉnh thông thường, các dự báo của Neural Network có thể chuyển thành tín hiệu mua bán tùy thuộc vào các tiêu chuẩn đã quyết định trước. Ví dụ, tất cả các dự báo đều lớn hơn 0.8 hay 0.9 điều đó nghĩa là đó là dấu hiệu mua, còn dự báo nhỏ hơn 0.2 hay 0.1 là dấu hiệu bán. Dấu hiệu mua hay bán sau đó được đưa vào chương trình để tính xem các loại rủi ro và được huấn luyện lại và Neural Network đưa ra kết quả được điều chỉnh rủi ro. Mức độ sai sót thấp và lợi nhuận giao dịch đều cần thiết đối với nhà đầu tư. Lọc lại chuỗi thời gian để loại bỏ nhiều sự thay đổi giá nhỏ có thể phần lớn ngăn chặn được trường hợp mà Neural Network với những điểm dự báo cao nhưng lại không mang đến lợi nhuận. Cũng vậy, giá trị của hệ thống giao dịch đơn lẻ nào cũng chỉ có thể xác định đưa theo hệ thống danh mục đầu tư của người dùng. Theo quan điểm này, mô hình Neural Network rất hữu ích nếu chúng hành động như là hệ thống đếm xu hướng trái với những hệ thống theo sau xu hướng của các trái phiếu thông thường 2.8. LỰA CHỌN KIỂU HUẤN LUYỆN MÔ HÌNH NEURAL NETWORK Quá trình huấn luyện một mạng lưới Neural nhằm học hỏi các mô hình dữ liệu có liên quan đến việc giới thiệu mạng lưới Neural có tính lặp đi lặp lại với các ví dụ nhằm nhận biết những câu trả lời nào là chính xác. Mục tiêu của việc huấn luyện là tìm cách để bố trí các trọng số ở giữa các neural nhằm định rõ toàn bộ số lượng tối thiểu của chức năng sai số. Nếu mô hình không được “khít quá mức”, điều này bố trí các trọng số nhằm cung cấp một khái quát hóa tốt. Mạng lưới Backpropagation sử dụng một thuật toán huấn luyện dốc xuống nhằm huấn luyện các trọng số để di chuyển xuống một độ dốc nhất của bề mặt sai số. Việc tìm thấy toàn bộ số lượng tối thiểu thì không được bảo đảm từ khi bề mặt sai số có thể chứa đựng một lượng cực tiểu cục bộ mà trong thuật toán có thể trở nên bế tắc. Thuật ngữ momentum và 5 cho tới 10 việc xếp đặt ngẫu nhiên của các trọng số ban đầu có thể cải tiến các cơ hội của sự đạt đến một mức tối thiểu chung. Phần này sẽ được thảo luận khi kết thúc việc huấn luyện một mạng lưới Neural và việc lựa chọn tỷ lệ nghiên cứu và các giá trị momentum 2.8.1. Xác định thông số lặp lại quá trình huấn luyện Có hai trường phái tư duy quan tâm về điểm mà việc huấn luyện nên được ngừng lại. Các căng thẳng đầu tiên là sự nguy hiểm của việc đánh bẫy trong các mức cực tiểu cục bộ và sự khó khăn của việc đạt đến một mức cực tiểu chung. Nhà nghiên cứu nên chỉ dừng việc huấn luyện cho đến khi không có sự cải tiến nào trong công thức sai số được dựa trên một số lượng hợp lý các trọng số ban đầu được lựa chọn ngẫu nhiên. Điểm mà mạng lưới không cải tiến được gọi là sự hội tụ. Cách nhìn thứ hai tán thành một chuỗi các gián đoạn mang tính huấn luyện. Việc huấn luyện được dừng lại sau khi một số lượng các gián đoạn được định trước và khả năng của mạng lưới là tổng quát hóa các quá trình kiểm tra đã được đánh giá và quá trình huấn luyện được tiếp tục. Việc tổng quát hóa là ý kiến mà một mô hình dựa trên vật mẫu của dữ liệu thì thích hợp cho việc dự báo tổng số lượng. Mạng lưới mà trong đó việc xếp đặt huấn luyện lỗi sai được chọn từ khi nó được cho rằng để khái quát hóa tốt nhất. Sự phê bình các thủ tục huấn luyện – kiểm tra rằng là các gián đoạn của các quá trình huấn luyện – kiểm tra thêm vào có thể gây ra lỗi sai trong việc xếp đặt huấn luyện – kiểm tra để rời xa hơn trước khi tăng trở lại hoặc nó thậm chí có thể rơi theo đường tiệm cận. Nói một cách khác, nhà nghiên cứu không có cách nào để biết được nếu việc huấn luyện thêm có thể cải thiện khả năng khái quát hóa một cách đặc biệt của mạng lưới khi mà các trọng số ban đầu được lựa chọn ngẫn nhiên. Cả hai trường phái đều đồng ý rằng khái quát hóa quá trình công nhận là mục tiêu cuối cùng và cả hai trường phái này đều sử dụng các tập hợp kiểm tra để đánh giá một số lượng lớn các mạng lưới. Điểm mà cả hai trường phái tiếp cận các trung tâm khởi hành với ý niệm của việc huấn luyện quá nhiều chống lại với việc “học quá mức”. Sự hội tụ tiếp cận đến các trạng thái không có huấn luyện quá mức mà chỉ có “học quá mức”. “Học quá mức” chỉ đơn giản là dấu hiệu của một mạng lưới mà có quá nhiều trọng số. Giải pháp nhằm để giảm thiểu số lượng các neural ẩn (hoặc các lớp ẩn nếu có hơn 1) và (hoặc) gia tăng kích cỡ của tập hợp huấn luyện. Việc huấn luyện – kiểm tra nhằm cố gắng để cảnh giác chống lại “học quá mức” bằng cách dừng lại việc huấn luyện dựa trên khả năng khái quát hóa của mạng lưới. Ưu điểm của lối tiếp cận hội tụ là chúng có thể thêm tin cậy rằng mức tối thiểu chung đã được đạt đến. Sự tái tạo thì dường như khó khăn cho việc huấn luyện tiếp cận đến các trọng số ban đầu được đưa ra một cách ngẫu nhiên thường xuyên và sự tương quan có thể dao động dữ dội như các tiến trình huấn luyện. Một ưu điểm khác là nhà nghiên cứu có ít hơn hai thông số để lo lắng; cụ thể là điểm mà tại đó để dừng việc huấn luyện và phương pháp để đánh giá những gì của các huấn luyện của các mạng lưới là tối ưu. Một ưu điểm của việc tiếp cận các huấn luyện có thể là các mạng lưới với ít cấp độ tự do có thể được thi hành với sự khái quát hóa tốt hơn là sự hội tụ của việc huấn luyện mà đưa ra kết quả trong “học quá mức”. Tuy nhiên, công việc mang tính kinh nghiệm không được nhằm vào kết quả này một cách đặc biệt. Việc tiếp cận huấn luyện có thể cũng yêu cầu ít thời gian huấn luyện hơn. Mục tiêu của sự hội tụ huấn luyện là nhằm với tới một mức tối thiểu chung. Điều đó yêu cầu việc huấn luyện cho đủ số lượng của các epoch sử dụng một số lượng hợp lý các trọng số ban đầu được chọn lựa một cách ngẫu nhiên. Thậm chí không có sự bảo đảm với một mạng lưới Backpropagation rằng mức tối thiểu chung được đạt đến từ khi nó có thể trở nên bị mắc kẹt trong mức tối thiểu địa phương. Trong thực tế, các nguồn lực có sử dụng tính toán thì bị giới hạn và các giao dịch nảy sinh. Nhà nghiên cứu phải sắp đặt lại số lượng các kết nối bên trong có thể thay đổi được để được huấn luyện, khoảng thời gian các neural ẩn nhiều hơn của mỗi mạng lưới được huấn luyện, số lượng của các trọng số ban đầu được chọn lựa một cách ngẫu nhiên, và số lượng tối đa của các cuộc hành trình ngắn. Ví dụ như, 50 kết nối có thể biến đổi bên trong được kiểm tra nhiều hơn 3 neural tiềm ẩn khác nhau với 5 nhóm các trọng số ban đầu được chọn lựa một cách ngẫu nhiên và số lượng tối đa của quãng đường đi ngắn của 4.000 kết quả trong 3.000.000 epoch. Với cùng thời gian tính toán được yêu cầu cho 10 kết nối bên trong có thể biến đổi được kiểm tra cho hơn 6 neural ẩn với 6 nhóm các trọng số ban đầu được chọn lựa một cách ngẫu nhiên và 5.000 tỷ epoch. Một phương pháp để xác định giá trị hợp lý cho số lượng tối đa các quãng đường đi ngắn là để vẽ sơ đồ ra sự tương quan, tổng của các sai số ước lệ, hoặc một phương pháp đo lường lỗi sai thích hợp khác cho mỗi epoch hoặc các khoảng thời gian đã được xác định trước đến một điểm mà nơi đó sự cải tiến không đáng kể (thường lên tới tối đa là 10,000 epoch). Mỗi epoch có thể được vẽ sơ đồ một cách dễ dàng nếu phần mềm mạng lưới neural tạo ra một dữ liệu thống kê hoặc, nếu như không đúng như thế, sự tương quan có thể được ghi nhận với khoảng thời gian từ 100 đến 200 từ màn hình máy vi tính. Sau khi vẽ sơ đồ sự tương quan của một số lượng các trọng số khởi đầu được chọn lựa một cách ngẫu nhiên, nhà nghiên cứu có thể chọn số lượng tối đa xu hướng được dựa trên điểm mà sự tương quan dừng việc gia tăng một cách nhanh chóng và dừng lại. Nhiều nghiên cứu đã đề cập đến số lượng các epoch ghi nhận sự hội tụ từ 85 đến 5,000 epoch. Tuy nhiên, việc xếp loại thì rất rộng như 50,000 và 191,400 epoch và thời gian huấn luyện của 60 giờ đã được ghi nhận. Việc huấn luyện bị ảnh hưởng bởi nhiều tham số như là sự chọn lựa tỷ lệ tiếp thu kiến thức và mometum, các sự cải tiến độc quyền sở hữu đến thuật toán Backpropagation, nằm trong những cái khác nữa, mà khác nhau giữa các nghiên cứu và thật là khó khăn để xác định một giá trị chung cho số lượng tối đa các xu hướng. Ngoài ra, sự chính xác bằng số của phần mềm mạng lưới neural có thể ảnh hưởng đến việc huấn luyện bởi vì độ dốc của các dẫn xuất sai số có thể trở nên rất nhỏ gây ra một vài chương trình mạng lưới neural để di chuyển về hướng sai nhờ vào các sai số mà có thể được tạo ra một cách nhanh chóng trong thuật toán huấn luyện có tính lặp đi lặp lại cao. Điều đó yêu cầu rằng các nhà nghiên cứu xác định số lượng các epoch được yêu cầu để đạt được sự cải tiến không đáng kể cho các vấn đề cụ thể của họ và kiểm tra càng nhiều các trọng số khởi đầu được chọn lựa một cách ngẫu nhiên càng nhiều thúc ép có sử dụng máy điện toán được cho phép 2.8.2. Lựa chọn learning rate và momentum Một mạng lưới BP được huấn luyện để sử dụng một thuật toán dộ dốc xuống nhằm tuân theo các diễn biến của bề mặt sai số bằng cách luôn luôn di chuyển xuống một độ dốc nhất. Mục tiêu của việc huấn luyện này nhằm tối thiểu tổng các sai số ước lệ, đuợc định nghĩa như sau: E = 2 1  M h E h = 2 1  M h  N i (thi – Ohi) 2 với E là tổng sai số của tất cả các mẫu hình, Eh là sai số trên mô hình h, chỉ số h xếp hạng toàn bộ các mô hình đầu vào, và i ám chỉ i neural đầu ra. Giá trị thay đổi thi là giá trị đầu ra được yêu cầu cho neural đầu ra ith khi mà mô hình h được trình bày. Nguyên tắc nghiên cứu để huấn luyện trọng số giữa neural i và j được định nghĩa như sau:  hi = (thi – Ohi) Ohi (1 – Ohi) (3)  hi = Ohi (1- Ohi)  N k  hkwjk (4) Δwij (n + 1) = ε ( δhiOhj) (5) với: n là số trình bày δhi là sai số của neural i của mô hình h € là tỷ lệ nghiên cứu. Tỷ lệ nghiên cứu thì mang tính cân xứng cố định nhằm xác định kích cỡ của các thay đổi trọng số. Thay đổi trọng số của một neural thì cân xứng với tác động của trọng số từ neural khác trên sai số đó. Sai số của neural bên ngoài và neural ẩn được tính toán bởi Eq. (3) và (4), thường dùng. Hình 2.3. Ví dụ đơn giản về bề mặt sai số của Neural Network Như là một sự tương đồng đối với thuật toán kiểm nghiệm BP, một khi có thể xem xét vấn đề trong việc cố gắng ném quả banh từ điểm A đến điểm C như trong hình 2.3, mặc dù trong thực tế bề mặt sai số là nhiều thứ nguyên của một đại lượng và không thể được trình bày dưới dạng đồ thị. Lực đẩy vào trái banh thì tương tự như tỷ lệ nghiên cứu. Việc áp dụng quá nhiều lực đẩy sẽ làm cho quả banh bắn xa hơn ra ngoài mục tiêu của nó và nó có thể không bao giờ trở lại điểm A hoặc nó có thể dao động chính giữa điểm A và diểm B. Trong suốt quá trình huấn luyện, tỷ lệ nghiên cứu mà quá cao bị khám phá khi công thức sai số đang thay đổi một cách dữ dội mà đang không chỉ ra một sự cải thiện tiếp tục. Quá ít lực đẩy vào quả banh và nó không thể thoát ra khỏi điểm A như là bằng chứng trong suốt quá trình huấn luyện khi có quá ít hoặc không có sự cải thiện nào trong công thức sai số. Một tỷ lệ nghiên cứu rất nhỏ cũng yêu cầu thêm thời gian huấn luyện. Trong trường hợp này, người nghiên cứu phải huấn luyện tỷ lệ nghiên cứu trong suốt quá trình huấn luyện hoặc “ tẩy não” mạng lưới bằng cách lựa chọn ngẫu nhiên tất cả các trọng số và thay đổi tỷ lệ nghiên cứu theo cách mới thông qua cài đặt việc huấn luyện. Một phương pháp nhằm gia tăng tỷ lệ nghiên cứu và nhờ đó tốc độ làm gia tăng thời gian huấn luyện mà không cần hướng đến sự dao dộng mà bao gồm lực đẩy trong Backpropagation quy tắc huấn luyện. Thuật ngữ momentum chỉ ra rằng các thay đổi trọng số trong quá khứ tác động như thế nào đến các thay đổi trọng số ở hiện tại. Quy tắc huấn luyện được sửa đổi BP được định nghĩa như sau: Δwij(n + 1) = ε( δhiOhi ) + α Δwij(n) (6) với α là thuật ngữ động lượng, và các thuật ngữ khác đã được định nghĩa ở trên. Thuật ngữ động lượng ngăn chặn sự dao động từ bên này sang bên kia bằng cách lọc ra những thay đổi có tần số xuất hiện cao. Sự tìm kiếm sự hướng dẫn mới là tổng trọng số hiện tại và độ dốc trước đó. 2.9. TIẾN HÀNH THỰC HIỆN MÔ HÌNH Tiến hành thực hiện mô hình được đưa ra như là bước cuối, nhưng trong thực tế đòi hỏi phải xem xét cẩn thận trước khi tập hợp dữ liệu. Dữ liệu có sẵn, tiêu chuẩn định giá và các lần huấn luyện tất cả được sắp đặt bởi môi trường mà trong đó hệ thống Neural Network sẽ được phát triển. Hầu hết các nhà bán phần mềm của mô hình Neural Network cung cấp phương tiện bởi các mạng lưới được huấn luyện có thể được bổ sung trong các chương trình của mô hình Neural Network hoặc như là một tập tin thi hành. Nếu không một mạng lưới được huấn luyện có thể được tạo ra một cách dễ dàng trong bảng tính bằng cách hiểu rõ cấu trúc của nó, các hàm truyền, và trọng số. Sự thận trọng nên được đặt vào các dữ liệu biến đổi, việc chia tỷ lệ, và các tham số để duy trì cùng lúc từ lúc huấn luyện cho đến khi sử dụng thực tế. Một ưu điểm của mô hình Neural Network là khả năng của nó có thể thích nghi được với sự thay đổi các điều kiện của thị trường thông qua sự huấn luyện trước đó. Trước khi triển khai, sự thể hiện của mô hình Neural Network sẽ giảm giá trị theo thời gian nếu không có huấn luyện lại để thay thế. Tuy nhiên, với sự huấn luyện lại trước đó cũng không có bất kỳ một sự bảo đảm nào là sự thể hiện của mô hình có thể được duy trì như là các giá trị thay đổi độc lập được chọn có thể trở nên ít quan trọng hơn. Có đề nghị rằng độ thường xuyên của việc huấn luyện lại cho mạng lưới được triển khai cùng lức với việc sử dụng trong suốt quá trình huấn luyện cuối cùng của mô hình. Tuy nhiên, khi huấn luyện một số lượng lớn các mạng lưới để thu được mô hình cuối cùng, độ thường xuyên của việc huấn luyện lại ít đi cũng được chấp nhận để giữ cho số lần huấn luyện là hợp lý. Một mô hình tốt nên mạnh đối với độ thường xuyên của việc huấn luyện lại và sẽ thường xuyên cải thiện bằng cách thay thế việc huấn luyện lại thường xuyên. KẾT LUẬN Để thiết kế một mô hình Neural Network hoàn chỉnh cần thông qua qui trình tám bước. Đầu tiên là lựa chọn yếu tố đầu vào có liên quan đến các yếu tố đầu ra, rồi chúng ta tiến hành thu thập mọi dữ liệu. Dữ liệu có được sẽ trải qua quá trình xứ lý và phân tích dữ liệu. Kế đó, chúng ta cần phân chia dữ liệu cho từng giai đoạn: Huấn luyện, kiểm tra và công nhận. Bước tiếp theo là xây dựng các thông số quan trọng cho Neural Network, đó là việc tính toán và xác định số lượng các lớp ẩn, neuron ẩn, neuron đầu ra và loại hàm truyền. Sau đó cần phải xác định các tiêu chuẩn đánh giá kết quả chúng ta mong đợi cũng như yêu cầu đặt ra đối với quá trình huấn luyện. Cuối cùng ta thực hiện mô hình trên phần mềm vi tính phù hợp để cho ra kết quả. CHƯƠNG 3: ỨNG DỤNG NEURAL NETWORK VÀO THỊ TRƯỜNG TÀI CHÍNH VIỆT NAM 3.1. DỰ BÁO KINH TẾ VIỆT NAM 2008 Cơ quan tình báo kinh tế Anh (EIU) dự báo kinh tế thế giới tăng trưởng 4,8% trong giai đoạn 2008 – 2009 (tính theo ngang giá sức mua có trọng số), giảm so với mức dự báo 5,1% cho năm 2007. Tăng trưởng kinh tế Mỹ, thị trường xuất khẩu hàng đầu của Việt Nam, dự báo tăng lên mức 2,1% năm 2008 và 2,8% năm 2009, cao hơn mức 1,9% năm 2007. Tốc độ tăng trưởng khiêm tốn của kinh tế Mỹ có thể sẽ làm tốc độ tăng trưởng xuất khẩu của Việt Nam chậm lại. Tuy nhiên việc kinh tế Trung Quốc tăng trưởng cao sẽ bù đắp phần nào sự giảm sút đó. Giá dầu thô thế giới dự báo giảm còn 69 USD/thùng năm 2008 và 63,3 USD/thùng năm 2009, theo đó sẽ tác động tiêu cực đối với nguồn thu từ xuất khẩu của Việt Nam (dầu thô chiếm tỷ trọng lớn nhất trong xuất khẩu của Việt Nam), tuy nhiên nhập khẩu các sản phẩm dầu mỏ sẽ rẻ hơn. Trong giai đoạn 2008 – 2009, tốc độ tăng GDP thực tế dự báo có thể giảm nhẹ từ 8,4% năm 2007 xuống còn 8,1% năm 2008 và 8% năm 2009. Tăng trưởng GDP sẽ tiếp tục bị chi phối bởi tăng trưởng của ngành công nghiệp, chi tiêu dùng và đầu tư cố định. Mặc dù Ngân hàng Nhà nước có thể thắt chặt chính sách tiền tệ nhằm kìm chế tăng trưởng tín dụng nội địa, nhưng điều này dự báo sẽ không làm giảm quá mức niềm tin của các nhà đầu tư và người tiêu dùng. Trong năm 2008, tiêu dùng tại khu vực nông thôn dự báo sẽ tăng mạnh do giá cà phê và gạo tăng cao. Tổng cầu tiêu dùng tiếp tục tăng do việc làm tăng. Đầu tư tư nhân trong nước sẽ vẫn phát triển trong giai đoạn 2008 – 2009 do Chính phủ tạo lập sân chơi bình đẳng hơn cho thành phần kinh tế tư nhân và kinh tế nhà nước. Việc Việt Nam gia nhập WTO cũng làm tăng niềm tin của các nhà đầu tư trực tiếp nước ngoài. Năm 2007, tổng vốn FDI cam kết đối với các dự án mới dự báo đạt 12 tỷ USD, gần gấp 3 lần số vốn cam kết năm 2005. Việc Việt Nam gia nhập WTO giúp tăng kim ngạch xuất khẩu, tuy nhiên, việc cắt giảm hàng rào thuế quan cũng khiến hàng nhập khẩu trở nên rẻ hơn. Dự báo trong giai đoạn 2008- 2009, xuất khẩu ròng sẽ đóng góp âm vào tăng trưởng kinh tế. Về mặt cung, khu vực công nghiệp sẽ tiếp tục là nhân tố chính thúc đẩy tăng trưởng kinh tế với tốc độ tăng trưởng khoảng 10%/năm (tính theo giá trị gia tăng). Ngành công nghiệp đạt mức tăng trưởng cao là do sự mở rộng năng lực sản xuất. Ngoài ra, ngành dệt may đã thích ứng tốt trong điều kiện tự do hóa thương mại toàn cầu. Tuy nhiên, Mỹ có thể sẽ tiếp tục tăng cường giám sát đối với mặt hàng may mặc nhập khẩu từ Việt Nam trong thời gian tới. Mỹ cũng có thể sẽ tiếp tục áp dụng các biện pháp chống bán phá giá đối với hàng hóa Việt Nam. Lĩnh vực dệt may đã tăng trưởng nhanh từ khi Việt Nam gia nhập WTO, tuy nhiên tính cạnh tranh xuất khẩu trong dài hạn cũng là vấn đề cần lưu ý. Trong giai đoạn 2008 – 2009, lĩnh vực dịch vụ dự báo tiếp tục duy trì mức tăng cao, đặc biệt là các dịch vụ tài chính và những dịch vụ liên quan đến du lịch. 3.1.1. Lạm phát Trong những tháng vừa qua, tỷ lệ lạm phát có xu hướng tăng và duy trì ở mức cao (8,6% trong tháng 8/2007 và 8,8% trong tháng 9/2007) do giá luơng thực thực phẩm tăng mạnh. Trong thời gian tới, dự báo giá dầu thô thế giới giảm sẽ làm giảm áp lực tăng giá nhiên liệu, từ đó giảm áp lực tăng giá đối với giá các loại hình dịch vụ và hàng hóa khác. Chính phủ cũng cắt giảm thuế nhập khẩu đối với một số sản phẩm nhằm ngăn chặn lạm phát. Tuy nhiên, dòng vốn vào trong nước dự báo tiếp tục tăng, làm tăng cung tiền, từ đó làm tăng áp lực lạm phát. Dự báo trong cả năm 2007, lạm phát ở mức khoảng 8,1% và sẽ giảm xuống 7,8% năm 2008 và 7,2% năm 2009. 3.1.2. Tỷ giá hối đoái Đầu tháng 1/2007, Ngân hàng Nhà nước đã nới rộng biên độ dao động tỷ giá VND/USD từ 0,25% lên 0,5%/ngày. Theo đó, tỷ giá có thể biến động mạnh hơn. Trong năm 2008, VND dự báo tăng giá so với đồng USD, nhưng sẽ giảm giá vào năm 2009. Đồng VND tăng nhẹ so với đồng USD là do luồng vốn vào tăng cao cũng như thu từ hoạt động xuất nhập khẩu và lượng kiều hối tăng lên. Tỷ giá VND/USD dự báo ở mức trung bình 16.059 trong năm 2008, sau đó tăng lên mức 16.150 năm 2009 khi đồng USD được củng cố trên thị trường ngoại hối quốc tế. Tỷ giá VNĐ/JPY dự báo tăng trong giai đoạn 2008 – 2009. Trong xu thế hiện nay, VNĐ sẽ tiếp tục giảm giá so với đồng euro trong năm 2008, nhưng sẽ tăng giá vào năm 2009. 3.1.3. Kinh tế đối ngoại Trong năm 2008 – 2009, tổng kim ngạch xuất khẩu hàng hóa dự báo tiếp tục tăng tính theo giá USD (dự báo tăng 15,3%), tuy nhiên tốc độ tăng thấp hơn so với giai đoạn 2005-2006. Việc Việt Nam trở thành thành viên của WTO tạo điều kiện cho các nhà xuất khẩu của Việt Nam tiếp cận thị trường thế giới dễ dàng hơn, hạn chế và hàng rào thuế đối với hàng hóa Việt Nam được cắt giảm. Theo đó, tốc độ tăng kim ngạch xuất khẩu có thể đạt mức 2 con số. Tuy nhiên, Việt Nam vẫn được coi là nền kinh tế “phi thị trường” trong vòng 12 năm sau khi gia nhập WTO, theo đó dễ bị các nước thành viên khác của WTO kiện chống bán phá giá đối với hàng hóa xuất khẩu. Nhập khẩu dự báo tiếp tục tăng nhanh trong giai đoạn 2008 – 2009 do cầu nhập khẩu đối với hàng hóa trung gian, máy móc thiết bị và hàng hóa tiêu dùng tăng khi Việt Nam tiếp tục cắt giảm thuế theo cam kết với ASEAN và WTO. Cán cân thương mại hàng hóa dự báo tiếp tục thâm hụt trong giai đoạn 2008 – 2009. Thâm hụt tài khoản dịch vụ và thu nhập cũng tăng. Doanh thu từ du lịch tăng nhưng việc nhập khẩu các các dịch vụ liên quan đến thương mại cũng tăng mạnh. Cùng với việc mở rộng hoạt động của khu vực có vốn đầu tư nước ngoài, việc chuyển lợi nhuận ra nước ngoài dự báo cũng tăng. Các dòng vốn chuyển giao vãng lai sẽ tiếp tục tăng mạnh và khoản thặng dư trong chuyển giao vãng lai sẽ bù đắp cho thâm hụt trong tài khoản dịch vụ và tài khoản thu nhập. Tuy nhiên, cùng với việc thâm hụt thương mại hàng hóa tăng, tài khoản vãng lai sẽ thâm hụt 2,1% GDP trong năm 2008 và 2,3% GDP trong năm 2009. 3.2. LỰA CHỌN PHẦN MỀM XỨ LÝ MÔ HÌNH Ngày nay, do nhu cầu sử dụng mô hình Neural Network ngày càng tăng nên các phần mềm thiết kế, xứ lý ra đời ngày càng nhiều bên cạnh chương trình truyền thống thường sử dụng là MATLAB. Hiện nay, các phần mềm phổ biến được thiết kế dùng cho mô hình Neural Network gồm có Alyuda NeuroIntelligence, Stuttgart Neural Network Simulator, Emergen, JavaNNS và NeuroSolutions. Mỗi phần mềm có những tính năng đặc biệt riêng, nhưng qua quá trình thử nghiệm và tìm hiểu chúng tôi đã chọn phần mềm Neuro Solutions để thực hiện mô hình Neural Network. NeuroSolutions là một trong những chương trình mạnh nhất hiện nay mô phỏng mô hình Neural Network. Để chạy mô hình, chương trình cung cấp hai chương trinh con để thiết lập mô hình là Neuro Expert và Neuro Builder. Chương trình con Neural Builder cần một sự am tường sâu sắc về các thuật toán cũng như cách vẽ mô hình, đây là chương trình chuyên sâu dành cho những ai nghiên cứu sâu về Neural Network. Do đề tài chỉ gói gọn trong việc ứng dụng mô hình nên tôi sử dụng chương trình Neuro Expert để việc thực hiện được dễ dàng hơn nhờ vào cơ chế tự động của chương trình. Hình 3.1: Giới thiệu giao diện phần mềm NeuroSolutions Hình 3.2: Lựa chọn NeuralExpert Chương trình NeuroSolutions sau khi được đưa các dữ liệu đầu vào và đầu ra sẽ tự động chọn các lớp ẩn cho phù hợp với dữ liệu, cũng như tự động điều chỉnh các hệ số khác như Learning rate, Momemtum và epoch. Mặc định số epoch khi training của chương trình là 1000. Ngoài ra chương trình còn cung cấp các tiện ích khác như cửa sổ theo dõi dữ liệu training qua biểu đồ kết quả dự báo. Một điểm nổi bật khác của chương trình này là nếu dữ liệu đầu vào có mối tương quan thấp với dữ liệu đầu ra vẫn được sử dụng nhưng sẽ được tự điều chỉnh với trọng số nhỏ. 3.3. CÁCH THỨC THU THẬP VÀ XỬ LÝ DỮ LIỆU THÔ 3.3.1. Các nhân tố ảnh hưởng thị trường chứng khoán Việt Nam Thị trường chứng khoán là một bộ phận của nền kinh tế vì vậy những thay đổi trong nền kinh tế đều có tác động trực tiếp hoặc gián tiếp đến thị trường chứng khoán. Theo nhận định của nhiều chuyên gia và nhà đầu tư chứng khoán thì thị trường chứng khoán hiện nay thì tác động “tâm lý bầy đàn” vẫn là tác động lớn nhất. Nhưng những tâm lý hình thành kỳ vọng của nhà đầu tư cũng có những yếu tố khác tác động đến, hiện nay ở Việt Nam chính là do các chính sách kinh tế của Chính Phủ. Chính những chính sách hay thay đổi của Chính phủ đã làm cho nhiều nhà đầu tư chứng khoán hiện nay giảm bớt đầu tư vào thị trường và thay đổi danh mục của mình vào những kênh sinh lời khác như: bất động sản, thị trường vàng, kinh doanh ngoại tệ v.v…. Còn về các yếu tố tác động đến tâm lý của nhà đầu tư, ta có thể kể đến là: tỷ giá USD/VND, lãi suất tiền gửi, GDP, CPI, giá trị giao dịch mua/bán của các nhà đầu tư nước ngoài, khối lượng giao dịch trong ngày của VN-INDEX v.v… Đó là những yếu tố trong nước, còn các yếu tố ngoài nước có thể từ sự cộng hưởng của các thị trường chứng khoán bên ngoài phải kể đến chỉ số S&P500( Mỹ), SSE (Trung Quốc). Những yếu tố này thể hiện trạng tình trạng của nền kinh tế nước ta, nhất là sau khi gia nhập WTO nền kinh tế Thế Giới lại càng ảnh hưởng đến chúng ta. Vì vậy, chúng tôi đưa ra các yếu tố sau ảnh hưởng đến VN-INDEX: VNINDEX: Chỉ số VN-INDEX KL_VNINDEX: Khối lượng giao dịch toàn thị trường của VN-INDEX NNKLMUA: Tổng khối lượng mua vào của nhà đầu tư nước ngoài (bao gồm giao dịch thỏa thuận) NNKLBAN: Tổng khối lượng bán ra của nhà đầu tư nước ngoài (bao gồm giao dịch thỏa thuận) NNGTMUA: Tổng giá trị tiền mua vào của nhà đầu tư nước ngoài (bao gồm giao dịch thỏa thuận) NNGTBAN: Tổng giá trị tiền bán ra của nhà đầu tư nước ngoài (bao gồm giao dịch thỏa thuận) CPI: Chỉ số hàng tiêu dùng của cả nước LAMPHAT: Tỷ số phần trăm lạm phát so với kỳ gốc năm 2005 là 100 USD/VND: Tỷ giá USD/VND JPY/VND: Tỷ giá JPY/VND EUR/VND: Tỷ giá EUR/VND XKXANG: Khối lượng xuất khẩu dầu thô NKXANG: Khói lượng nhập khẩu xăng GIA_VANG: Giá vàng SJC ở thành phố Hồ Chí Minh GDP_GIA_SS_1994: Tổng sản phẩm quốc nội tính so sánh với năm 1994 GDP_GTT: Tổng sản phẩm quốc nội tính theo giá thực tế SP500: Chỉ số các công ty vừa và nhỏ ở Mỹ S&P 500 SSE B: Chỉ số chứng khoán thị trường Thượng Hải, Trung Quốc LS3THANG: Lãi suất tiết kiệm có kỳ hạng 3 tháng LS6THANG: Lãi suất tiết kiệm có kỳ hạng 6 tháng LS12THANG: Lãi suất tiết kiệm có kỳ hạng 12 tháng Cũng nhờ vào tính chất đặc biệt của mô hình Neural Network tự động nhận thấy các mối tương quan giữa các biến với nhau, vì vậy chúng ta không cần phải quan trọng về việc thống nhất đơn vị tính của từng biến. Các biến nhập trên đây có thể để ở bất kỳ đơn vị tính nào, trong quá trình training mô hình sẽ tự động san bằng các sai biệt về đơn vị tính và sau đó làm việc với dữ liệu sau điều chỉnh từ quá trình training. 3.3.2. Cách thức thu thập và điều chỉnh dữ liệu đầu vào Việc thu thập dữ liệu đều dựa trên những trang web có uy tín. Tuy nhiên về mặt thời gian như đã trình bày ở phần trước cần phải nhất quán với nhau. Ở đây, chúng tôi tổ chức dữ liệu mẫu theo tuần để có những số liệu dự báo kịp thời cho nhà đầu tư. Do tính chất đặc thù của một số dữ liệu không có dữ liệu theo tháng, tôi lấy trung bình cho các tuần trong tháng. Các yếu tố được sử dụng theo phương pháp bình quân này là: CPI. XKXANG, NKXANG, GDP_SS_1994, GDP_TT, LAMPHAT. Trong trường hợp đặc biệt của GDP thì dữ liệu được tổ chức theo quý nên lấy bình quân cho các tuần trong quý đó. Các dữ liệu trên đầy đều được lấy trong năm 2006, 2007 và ba tháng đầu năm 2008 để đảm bảo dữ liệu mẫu đủ lớn trong việc chạy mô hình, toàn bộ ta có được 111 mẫu được trình bày chi tiết trong phụ lục. Nguồn dữ liệu được dùng để xây dựng mô hình Neural Network được lấy từ những nguồn khác nhau phù hợp với từng loại biến như sau: VNINDEX: Dữ liệu dùng cho MetaStock từ trang web Phân tích cổ phiếu (www.phantichcophieu.com) KL_VNINDEX: Dữ liệu dùng cho MetaStock từ trang web Phân tích cổ phiếu (www.phantichcophieu.com) NNKLMUA: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web Phân tích cổ phiếu (www.phantichcophieu.com) NNKLBAN: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web Phân tích cổ phiếu (www.phantichcophieu.com) NNGTMUA: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web Phân tích cổ phiếu (www.phantichcophieu.com) NNGTBAN: Phần mềm “Giao dịch nhà đầu tư nước ngoài” từ trang web Phân tích cổ phiếu (www.phantichcophieu.com) CPI: Tổng cục thống kê LAMPHAT: Tổng cục thống kê USD/VND: Trang web của ngân hàng TMCP Xuất nhập khẩu www.exim.com.vn JPY/VND: Trang web của ngân hàng TMCP Xuất nhập khẩu www.exim.com.vn EUR/VND: Trang web của ngân hàng TMCP Xuất nhập khẩu www.exim.com.vn XKXANG: Tổng cục thống kê NKXANG: Tổng cục thống kê GIA_VANG: Trang web của ngân hàng TMCP Xuất nhập khẩu www.exim.com.vn GDP_SS_1994: Tổng cục thống kê GDP_GTT: Tổng cục thống kê SP500: Trang web Yahoo!Finance www.finance.yahoo.com SSE B: Trang web Yahoo!Finance www.finance.yahoo.com LS3THANG: Ngân hàng Đầu tư phát triển quốc tế LS6THANG: Ngân hàng Đầu tư phát triển quốc tế LS12THANG: Ngân hàng Đầu tư phát triển quốc tế 3.3.3. Tổ chức file dữ liệu Tất cả các dữ liệu đầu vào đều được nhập vào một file excel, nhưng do chương trình NeuroSulutions chỉ có thế đọc dữ liệu dưới dạng text ASCII nên chúng ta cần phải chuyển đổi dữ liệu từ excel sang dạng text. Các thao tác bước sau đây chúng tôi sử dụng Microsoft Office 2007. Trước tiên, tạo một file access, sau đó thực hiện lệnh import file excel vào Microsoft Access. Chọn các field trong access có tên chính là tên của các cột của file excel. Sau đó chọn định dạng cho từng cột, các cột đều có định dạng kiểu số, trừ ô NGAY là định dạng kiểu Date/Time, ta chọn khóa chính cho table này là cột STT. Sau khi có table dữ liệu từ excel chuyển qua ta xuất dữ liệu sang file text. Trong quá trình xuất, chọn dấu phân cách các cột là dấu “,” và dòng đầu tiên là tiêu đề của các cột. Sau khi xuất ra thành file text, ta có thể dùng file này vào chương trình NeuroSolutions để chạy mô hình Neural Network. 3.3.4. Phân tích các biến đầu vào bẳng Data Manager Mở Data Manager, chọn file dữ liệu đầu vào, sau đó chọn biến mong muốn là VN- INDEX. Sau đó ta thực hiện phân tích các dữ liệu đầu vào để đo lường mức độ tương quan của các biến đầu vào với biến đầu ra. Ta có được biểu đồ sau thể hiện mức độ tương quan theo biểu đồ hình 3.3. Biểu đồ cho thấy sự tương quan của các biến đầu vào với biến đầu ra. Dù có nhiều biến có tương quan thấp nhưng ta vẫn giữ lại trong mô hình để diễn tả phần nào tác động của các yếu tố này đến nền kinh tế. Hình 3.3: Biểu đồ thể hiện độ tương quan giữa các biến đầu vào và biến đầu ra 3.4. QUÁ TRÌNH XỬ LÝ MÔ HÌNH VÀ PHÂN TÍCH KẾT QUẢ 3.4.1. Cách thực hiện chạy chương trình NeuroSolutions Trước khi thực hiện chương trình, chúng tôi điểm qua lại các điều kiện ban đầu được chúng tôi sử dụng để thực hiện mô hình Neural Network dự báo VN-INDEX - Mô hình thu thập số liệu từ ngày 3/1/2006 đến ngày 25/3/2008 - Phần mềm sử dụng là phiên bản Demo - Các số liệu, thông tin đầu vào được thu thập từ các nguồn đáng tin cậy nhất có thể trong khả năng nhưng cũng không tránh khỏi những thiếu sót do nguyên nhân khách quan. Chọn chương trình Neuro Expert để chạy mô hình. Ta thực hiện lần lược các bước sau: Bước 1: Chọn kiểu mô hình là dự báo dựa trên những dữ liệu quá khứ và ước lượng từ mô hình. Bước 2: Chọn đường dẫn đến dữ liệu đầu vào đã được chuyển sang file text Bước 3: Chọn các dữ liệu đầu vào có dữ liệu dưới dạng khác dạng số ( trong mô hình này không có dữ liệu thiết kế theo dạng khác dạng số trừ biến NGAY) Bước 4: Chọn file dùng làm biến output, ta chọn là dữ liệu giống dữ liệu ban đầu. Bước 5: Chọn biến số đầu ra, ta chọn VN-INDEX Bước 6: Chọn xem biến đầu ra có phải được trình bày dưới dạng số hay không Bước 7: Chọn thời điểm cần mô hình dự đoán tiếp. Bước 8: Chọn biến để thử dữ liệu trong suốt thời gian training của mô hình. Trong trường hợp này, tôi chọn dùng 20% dữ liệu ban đầu để kiểm tra mô hình Bước 9: Chọn out of sample, chương trình mặc định là 20% Bước 10: Chọn cách so sánh giữa các mô hình với nhau, tính năng này bỏ qua Bước 11: Chọn dạng thay đổi của phương sai. Ta chọn là Low, nghĩa là phương sai sẽ theo mục tiêu là thấp nhất. Trên đây là các bước để thiết kế một mô hình Neural Network. Tuy nhiên do số lượng mẫu có hạn nên độ chính xác của mô hình không cao. Để mô hình cho ra kết quả tốt nhất cần phải training dữ liệu nhiều lần, ít nhất là 3 lần. Và mỗi lần training là mô hình tự động thiết kế 1000 lần chạy với các biến đầu vào dựa trên các biến động trong quá khứ của VN-INDEX. Sau khi training nhiều lần, ta chạy Tesing để có được kết quả đầu ra mong muốn. 3.4.2. Kết quả nhận được từ phần mềm NeuroSolutions Sau quá trình Training dữ liệu, dữ liệu đầu ra và dự liệu dự báo của VN-INDEX được thể hiện như hình 3.4. Hình 3.4 cho ta thấy dữ liệu dự báo cho kết quả gần với kết quả lấy từ 20% dữ liệu dùng để kiểm tra tính chính xác của mô hình. Vì vậy, nhìn vào hình 3.4 ta có thể nói quá trình huấn luyện nhận được rất thành công và có thể tiếp tục quá trình testing để cho ra kết quả dự báo của VN-INDEX. Hình 3.4. Chỉ số VN-INDEX đầu ra và mong đợi sau quá trình huấn luyện 3.4.3. Kết quả dự báo VN-INDEX từ tháng 4/2008 đến tháng 5/2008 Do hạn chế trong phiên bản Demo nên chúng ta không cho được kết quả tốt ở dự báo tuần thứ 1 và thứ 2. Chúng tôi cho thực hiện mô hình với số dự báo trong bước 7 chọn lần lượt từ 3 đến 8, ta có được kết quả dự báo cho tuần thứ 3 và thứ 8 kế tiếp cho mô hình như hình 3.5. Số liệu VN-INDEX thực tế được lấy từ trang web của Sở giao dịch chứng khoán Thành phố Hồ Chí Minh để đối chiếu với kết quả có được từ chạy phần mềm. Dùng hai cột số liệu trên ta vẽ được đồ thị như hình 3.6. Hình 3.5. Dữ liệu VN-INDEX dự báo từ mô hình và dữ liệu thực tế từ tuần thứ 3 đến tuần thứ 8 tiếp theo của dữ liệu ban đầu Tuần dự báo tiếp theo Kết quả Thực tế 3 525.92 530.9 4 510 530.62 5 537.17 522.36 6 548.19 518.35 7 537 483.92 8 485 449.24 Hình 3.6. Đồ thị so sánh VN-INDEX từ kết quả dự báo và VN-INDEX thực tế 3.4.4. Phân tích kết quả Thật vậy với mô hình Neural Network thông qua một quá trình xử lý thông tin phức tạp, cùng với quá trình training và testing đã cho ra kết quả dự báo khá chính xác với độ tin cậy cao. Khác với các công cụ dự báo truyền thống, mô hình Neural Network đã mô phỏng hoạt động của bộ não con người để tạo ra một mô hình trí tuệ nhân tạo nhằm giải quyết các vấn đề phức tạp trong dự báo. Đây là một công cụ dự báo thực sự hữu ích cho các nhà đầu tư trong tương lai nhằm giúp họ đưa ra các quyết định đúng đắn trong quá trình đầu tư của mình. Sự sai lệch giữa kết quả dự báo và thực tế có thể do các nguyên nhân chính sau: - Do có sai số trong các dữ liệu đầu vào do bị hạn chế về thời gian và nguồn thông tin. - Do giới hạn trong việc tìm kiếm các biến số có liên quan đến Vn-Index, vì một số yếu tố không thể lượng hóa vào mô hình được như tâm lý bầy đàn của nhà đầu tư, tính chưa hiệu quả và phát triển của thị trường chứng khoán Việt Nam. 3.5. CHỨNG CỨ ỨNG DỤNG MÔ HÌNH NEURAL NETWORK 3.5.1. Jason E.Kutsurelis ứng dụng mô hình Neural Network để dự báo S&P 500 Trong nhiều năm qua, việc sử dụng mô hình Neural Network ngày càng rộng rãi và phổ biến trong lĩnh vực kinh tế - tài chính. Nhiều tổ chức, cũng như cá nhân cũng đã công bố rộng rãi các kết quả nghiên cứu của mình, trong đó nổi bật nhất là nghiên cứu dự báo tỷ lệ lạm phát của Chính Phủ Nhật và Hồng Kông (được trình bày trong phần phụ lục) và dự báo chỉ số S&P 500 của Jason E.Kutsurelis. Vào năm 1998, Jason E.Kutsurelis đã đưa ra kết quả nghiên cứu của mình trong việc ứng dụng mô hình Neural Network để dự báo S&P 500. Ông sử dụng các biến đầu vào được thu thập từ 1/3/1991 đến 18/8/1998 để dự báo cho chỉ số S&P 500 cho 10 ngày sau, bao gồm: - Chỉ số S&P 500 - Chỉ số ngành vận tải Dow Jones - Chỉ số ngành công nghiệp Dow Jones - Chỉ số ngành dịch vụ công cộng Dow Jones - Thông tin nghiên cứu về hàng hóa - Chỉ số về dầu AMEX - Chỉ số về vàng và bạc Mô hình Neural Network được huấn luyện bằng việc sử dụng backpropagation chuẩn cho cả hai trường hợp kiểm nghiệm. Hình 3.7 cho thấy sự thay đổi của chỉ số S&P 500 và đuợc mô phỏng dưới đây nhằm để tham khảo sắp tới. Có thể thấy rằng thị trường đã rơi xuống nhanh chóng 730 điểm (10/10/1986) và đầu cơ giá lên 1110 điểm (21/1/1994). Thật sự bị hấp dẫn khi nhìn thấy mô hình hoạt động như thế nào trong những trường hợp xấu nhất, từ đó nó có thể được hoạt động cực kỳ tốt khi việc huấn luyện và thử nghiệm dữ liệu được xếp hạng như nhau. Hình 3.7. Chỉ số S&P 500 từ năm 1972 đến 1996 Để thử nghiệm mô hình trong từng vùng then chốt này, mô hình được huấn luyện để sử dụng dữ liệu trong khoảng thời gian 4 năm trước sự sụp đổ năm 1986 hoặc là trước sự khởi đầu của cuộc đầu cơ giá lên năm 1994. Trong cả hai trường hợp thử nghiệm này thì mô hình được sử dụng có một lớp ẩn với 7 neuron ẩn và 19 neuron đầu vào. Các giá trị của tham số ban đầu được cho vào một chương trình máy tính để định giá trị một cách ngẫu nhiên [-1,1]. Các lớp ẩn và đầu ra sử dụng chức năng kích hoạt sigmoid. Trong khi số lượng khoảng trống cho các lớp ẩn được cung cấp bằng phần tử đơn vị đầu ra cố định của neuron đầu ra thứ 19, không có số lượng khoảng trống nào cho các sigmoid trong lớp đầu ra. Những trường hợp thử nghiệm này và các kết quả thu được được phân tích dưới đây. 3.5.2. Trường hợp 1: Đầu cơ giá lên từ tháng 1 năm 1994 Theo hình 3.8 cho thấy việc huấn luyện và thử nghiệm dữ liệu được bình thường hóa cho chỉ số S&P 500, trong khi hình 3.9 cho thấy việc huấn luyện và thử nghiệm dữ liệu được bình thường hóa cho lãi suất. Dữ liệu bắt đầu từ dữ liệu điểm 850 và việc huấn luyện dữ liệu với chiều dài là 275 tuần trong khi việc thử nghiệm dữ liệu có chiều dài là 50 tuần. Có thể thấy rằng lãi suất trong dài hạn đang gia tăng trong hầu hết các phần của việc đầu cơ giá lên (thử nghiệm dữ liệu) chấp nhận vào lúc cuối, trong khi trong ngắn hạn lãi suất bị trì hoãn bởi 20 tuần đang tăng lên vào lúc ban đầu và sau đó cố định. Sự thay đổi này từ việc gia tăng cho đến khi cố định được trông đợi là sẽ có tác động đến thị trường. Tuy nhiên, trong lĩnh vực này tác động chính được trông đợi lại đến từ động lực của chính thị trường, được phân tích bởi các nhà kinh tế học ở những nơi khác. Kết quả kiểm nghiệm Hình 3.10 cho thấy kết quả kiểm nghiệm của trường hợp này. Việc thử nghiệm đã đuợc hoàn thành bằng việc huấn luyện mạng lưới và đầu ra cho mỗi tuần được so sánh với đầu ra kỳ vọng. Có thể nhìn thấy từ các số liệu là mô hình có thể dự đoán chắc chắn việc đầu cơ giá lên trước 1 tuần. Nó dự báo chính xác xu hướng các chỉ số của cổ phiếu đến mức 43 lần vượt ra ngoài phạm vi mẫu là 50 điểm. Phần trăm sai số lớn nhất đạt được như là phần trăm của đầu ra mong muốn chỉ là 4.044%, trong khi sai số trung bình chỉ là 0.95%. Vì vậy, các mô hình đã hoạt động rất tốt và sự thể hiện này có thể được sử dụng một cách phù hợp để lực chọn thời điểm cho thị trường. Hình 3.8. Việc huấn luyện và thử nghiệm dữ liệu (chỉ số S&P 500) trong trường hợp đầu cơ giá lên Hình 3.9. Việc huấn luyện và thử nghiệm dữ liệu cho lãi suất trong trường hợp đầu cơ giá lên Thậm chí sau khi detrending và bình thường hóa, những việc chỉ dựa trên việc huấn luyện dữ liệu, đầu ra mong muốn từ mô hình thì cao hơn những giá trị mà nó được huấn luyện trong hình 3.8. Thật vậy, mô hình có khả năng dự báo một sự gia tăng trong đầu ra ngay cả khi nó không được huấn luyện cho các giá trị chính xác của việc xếp loại các giá trị đầu ra. Những tiên đoán tốt này cho thấy một viễn cảnh tốt đẹp trong tương lai, nhằm chỉ ra rằng sự quan tâm được đưa ra nhằm bình thường hóa dữ liệu để một sự gia tăng đột ngột trong giá trị các chỉ số sẽ không bão hòa với giá trị được bình thường hóa. Điều đó có thể được tiên đoán là mô hình có thể được huấn luyện mỗi tuần hơn là cứ giữ nó dựa trên việc huấn luyện, điều đó sẽ trở nên cũ vào gần cuối tuần thứ 50. Việc dịch chuyển cửa sổ huấn luyện mỗi tuần và huấn luyện lại mô hình là một cách tiếp cận hợp lý, điều này là cần thiết trong thực tế. Tuy nhiên, có một sai lầm lớn của việc huấn luyện mô hình đó là việc kế thừa những thay đổi theo tuần và theo đó các hoạt động của mô hình sẽ tồi tệ hơn. Trong bất kỳ trường hợp nào, thủ tục này có thể được sửa đổi cho thích hợp và cửa sổ dự báo có thể được giảm bớt để phù hợp với các yêu cầu. Hình 3.10. Chỉ số S&P 500 được dự báo và kỳ vọng trong trường hợp đầu cơ giá lên 3.5.3. Trường hợp 2: Sự sụp đổ vào tháng 10 năm 1986 Hình 3.11 cho thấy các giá trị của chỉ số trong phần huấn luyện và thử nghiệm cho trường hợp thứ hai, nơi mà việc huấn luyện dữ liệu bắt đầu từ dữ liệu điểm thứ 500 và dữ liệu điểm này dài 200 trong khi dữ liệu thử nghiệm vượt quá 75 tuần ngay lập tức theo sau việc huấn luyện dữ liệu và bao gồm một sự sụp đổ mạnh. Hình 3.12 cho thấy lãi suất cho việc huấn luyện và thử nghiệm được kết nối. Trong trường hợp này, lãi suất trì hoãn trong dài hạn đang rơi xuống trong chu kỳ huấn luyện khi chỉ số S&P 500 có xu hướng gia tăng, trong khi đó trong suốt chu kỳ thử nghiệm lãi suất đang gia tăng rất nhanh, khi chỉ số đang rơi xuống. Lãi suất trì hoãn trong ngắn hạn bởi 20 tuần cũng đang gia tăng lên nhưng với mức độ chậm hơn trong thời kỳ thử nghiệm. Vì vậy, trong trường hợp này, nó được trông đợi rằng tác động của việc gia tăng lãi suất sẽ dự báo được sự sụp đổ. Điều đó không là động lực chính trong việc huấn luyện dữ liệu cho chỉ số, từ khi chỉ số gia tăng và rơi xuống hoặc theo một hướng khác là sự thay đổi trong chỉ số dao động giữa giá trị tốt nhất và xấu nhất. Mạng lưới có 7 neuron trong lớp ẩn được huấn luyện cho 900 quá trình lặp đi lặp lại, với kích cỡ 1 bước cố định là 0.4 và các kết quả thử nghiệm được giới thiệu chi tiết trong phần sau. Hình 3.11. Việc huấn luyện và thử nghiệm dữ liệu (chỉ số S&P 500) trong trường hợp giá xuống Các kết quả kiểm nghiệm Hình 3.13 cho thấy các kết quả kiểm nghiệm trong trường hợp này. Biểu đồ cho thấy rằng mô hình có khả năng dự báo sự sụp đổ mạnh trước 1 tuần nó thật sự xảy ra. Mặc dù vậy, đầu ra của mô hình thì thấp hơn các giá trị thực tế cho phần ban đầu trong việc phân loại thử nghiệm, không có xu hướng cho chỉ số cổ phiếu, mà có thể tác động lên mô hình để dự báo một vụ sụp đổ. Vì vậy, một mô hình chỉ sử dụng các giá trị chỉ số trong quá khứ có thể không có khả năng dự báo sự sụp đổ, mà nó được phân phối nhằm gia tăng lãi suất dài hạn. Trong trường hợp này, mô hình dự đoán chính xác xu hướng của chỉ số cổ phiếu 65 lần vượt ra ngoài mẫu thử nghiệm là 75 điểm. Phần trăm sai số lớn nhất đạt được như là phần trăm của đầu ra kỳ vọng thì cao hơn nhiều so với với trường hợp 1 và đạt mức 13.7%, trong khi đó sai số trung bình chỉ là 4.18%. Nguồn chính của sai số ở đây là mạng lưới không thể dự báo tốt sự gia tăng ban đầu trong thị trường. Trong thực tế sự thận trọng này, bất kỳ mô hình nào có thể dự báo tốt sự gia tăng ban đầu có thể nhận lấy một sự không chính xác và hấp tấp đặt lệnh mua một cách nhanh chóng theo sau bởi một lệnh bán. Như vậy những thay đổi nhanh chóng là điều không mong muốn kể từ khi khối lượng giao dịch gia tăng cùng với các chi phí giao dịch thích hợp. Hình 3.12. Việc huấn luyện và kiểm nghiệm dữ liệu cho lãi suất trong trường hợp giá xuống Hình 3.13. Chỉ số S&P 500 được dự báo và kỳ vọng trong trường hợp giá xuống 3.5.4. Kết quả thử nghiệm cho cả hai trường hợp Sau khi đưa ra dự báo kết quả được so sánh với thực tế theo như hình 3.14 Hình 3.14. Kết quả so sánh của S&P 500 thực tế và dự báo Ta có kết quả thống kê kết quả đầu ra như sau: R square 0.9935 Xác suất chính xác của mô hình : Dự báo Xác suất Thị trường lên 88.1335% Thị trường xuống 84.21035% So sánh với phương pháp thống kê truyền thống là mô hình hồi quy tuyến tính đa biến ta có được kết quả sau: Neural network Mô hình hồi quy tuyến tính đa biến R square 0.9935 0.9671 Trung bình 0.1759 0.2914 Độ lệch chuẩn 11.50 24.95 Xác suất chính xác thị trường lên 88.13% 84.21% Xác suất chính xác thị trường xuống 72.5% 57.71% Từ xác suất chính xác của mô hình cho thấy mô hình neural network có thể dự đoán chính xác thị trường tài chính nếu có dữ liệu đầu vào thích hợp . Khi so sánh với phân tích hồi quy, neural network thì tốt hơn cho các nhà đầu tư vì một số lý do: Mean square error 130.975 Mean absolute error 8.821 Min. absolute error 0.039 Max. absolute error 31.792 Correlation coefficient r 0.9968 - Khi sử dụng hồi quy tuyến tính đa biến, các giả định hồi quy chủ yếu phải đúng. Giả định tuyến tính tự bản thân nó không chứa đựng nhiều trường hợp. Neural Network có thể xử lý cả tuyến tính và phi tuyến. - Khi sử dụng phân tích hồi quy tuyến tính đa biến, nhà đầu tư cần có một kiên thức sâu rộng về thống kê để đảm bảo các biến độc lập càn thiết cần sử dụng. - Sau khi nghiên cứu, kết quả cho thấy Neural Network chính xác hơn đáng kể so với hồi quy tuyến tính đa biến. KẾT LUẬN Ngày nay, cùng với sự phát triển kinh tế của Thế giới, nền kinh tế Việt Nam được dự báo là vẫn trên đà tăng trưởng, trong đó đầu tư tư nhân trong nước vẫn phát triển, các khu vực công nghiệp vẫn tiếp tục là nhân tố để thúc đẩy tăng trưởng kinh tế. Trước tình hình đó, nhu cầu sử dụng mô hình Neural Network ngày càng tăng nên các phần mềm thiết kế, xử lý ra đời ngày càng nhiều bên cạnh chương trình truyền thống thường sử dụng là MATLAB. Hiện nay, các phần mềm phổ biến được thiết kế dùng cho mô hình Neural Network gồm có Alyuda NeuroIntelligence, Stuttgart Neural Network Simulator, Emergen, JavaNNS và NeuroSolutions nhưng qua quá trình thử nghiệm và tìm hiểu thì phần mềm NeuroSolutions là phần mềm có nhiều tính năng ưu việt hơn cả và phù hợp để thực hiện mô hình Neural Network. NeuroSolutions là một trong những chương trình mạnh nhất hiện nay mô phỏng mô hình Neural Network cung cấp hai chương trinh con để thiết lập mô hình là Neuro Expert và Neuro Builder. Với phần mềm này, chúng ta bắt đầu tiến hành thu thập, xử lý dữ liệu thô và tiến hành điều chỉnh dữ liệu đầu vào sao cho các dữ liệu về mặt thời gian phải nhất quán với nhau. Sau đó tiến hành tổ chức file dữ liệu và phân tích các biến đầu vào bằng Data Manager. Cuối cùng là quá trình xử lý mô hình và phân tích kết quả. DANH MỤC CÁC HÌNH Hình 1.1. Cấu trúc Neural Network ......................................................................... 3 Hình 1.2. Mô hình mạng Neural tổng quát............................................................... 3 Hình 1.3. Mô hình cấu trúc một Neuron .................................................................. 4 Hình 1.4. Mô hình neuron với vector nhập .............................................................. 5 Hình 1.5. Một lớp gồm nhiều Neuron ...................................................................... 5 Hình 1.6. Mô hình mạng một lớp Neuron ................................................................ 6 Hình 1.7. Mô hình mạng một lớp được vẽ gọn ........................................................ 6 Hình 1.8. Mô hình mạng nhiều lớp Neuron ............................................................ 7 Hình 2.1. Phép chuyển đổi logaric khối lượng giao dịch tương lai hàng tháng của lúa mì ............................................................................................ 14 Hình 2.2. Phép thử Walk-forward trong chuỗi thời gian ........................................ 18 Hình 2.3. Ví dụ đơn giản về bề mặt sai số của Neural Network ............................. 26 Hình 3.1. Giới thiệu giao diện phần mềm NeuroSolutions ..................................... 32 Hình 3.2. Lựa chọn NeuralExpert .......................................................................... 32 Hình 3.3. Biểu đồ thể hiện mức độ tương quan giữa các biến đầu vào và biến đầu ra ..................................................................... 37 Hình 3.4. Chỉ số VN-INDEX đầu ra và mong đợi sau quá trình huấn luyện .......... 38 Hình 3.5. Dữ liệu VN-INDEX dự báo từ mô hình và dữ liệu thực tế từ tuần thứ 3 đến tuần thứ 8 tiếp theo của dữ liệu ban đầu ..................................... 39 Hình 3.6. Đồ thị so sánh VN-INDEX từ kết quả dự báo và VN-INDEX thực tế .... 39 Hình 3.7. Chỉ số S&P 500 từ năm 1972 đến 1996.................................................. 41 Hình 3.8. Việc huấn luyện và thử nghiệm dữ liệu (chỉ số S&P 500) trong trường hợp đầu cơ giá lên ............................................................................. 42 Hình 3.9. Việc huấn luyện và thử nghiệm dữ liệu cho lãi suất trong trường hợp đầu cơ giá lên ............................................................................. 43 Hình 3.10. Chỉ số S&P 500 được dự báo và kỳ vọng trong trường hợp đầu cơ giá lên ............................................................................. 44 Hình 3.11. Việc huấn luyện và thử nghiệm dữ liệu (chỉ số S&P 500) trong trường hợp giá xuống ................................................................................... 45 Hình 3.12. Việc huấn luyện và thử nghiệm dữ liệu cho lãi suất trong trường hợp giá xuống ................................................................................... 46 Hình 3.13. Chỉ số S&P 500 được dự báo và kỳ vọng trong trường hợp giá xuống ................................................................................... 46 Hình 3.14. Kết quả so sánh của S&P 500 thực tế và dự báo ................................... 47

Các file đính kèm theo tài liệu này:

  • pdfBai hoan chinh.pdf
  • pdfPhu luc 1.pdf
  • pdfPhu luc 2.pdf
  • pdftom tat de tai.pdf