Lênin đã từng nói: “ Nếu xét bất kỳ hiện tượng kinh tế- xã hội nào trong quá trình phát triển của nó thì bao giờ người ta cũng tìm thấy trong đó dấu vết của quá khứ, cơ sở của hiện tại và mầm sống của tương lai”. Đứng ở góc độ của nhà quản lý, nhà nghiên cứu muốn đưa ra quyết định, chính sách trong bất kỳ một lĩnh vực nào, đòi hỏi phải có tầm nhìn chiến lược, phải có kế hoạch cho tương lai. Do đó, sử dụng phương pháp dự đoán thống kê sẽ là công cụ, phương tiện hữu ích để nhà quản lý sử dụng để đưa ra quyết định hay là mục tiêu trong tương lai.
Trong những năm qua, Việt Nam đã đạt được những kết quả khả quan và khá toàn diện. Nền kinh tế đạt tốc độ tăng trưởng khá cao liên tục trong nhiều năm; cơ cấu kinh tế đã có bước chuyển dịch theo hướng tích cực theo hướng công nghiệp hóa hiện đại hóa.
Những thành quả đạt được trong giai đoạn 1990-2006 cho thấy nền kinh tế Việt Nam đang trên đà tăng trưởng ổn định, và là điểm thu hút của các nhà đầu tư. Cùng với việc gia nhập WTO, Việt Nam đang đứng trước nhiều cơ hội lớn. Đó là sự gia tăng lượng vốn đầu tư, tiếp cận công nghệ hiện đại của nền kinh tế tri thức và mở rộng thị trường ra thế giới, là những yếu tố thúc đẩy tăng trưởng kinh tế. Tuy nhiên thách thức đặt ra là làm thế nào để giữ vững tốc độ tăng trưởng cao theo hướng bền vững, tức là gắn với việc chuyển dịch cơ cấu, nâng cao hiệu quả đầu tư và chất lượng lao động,
47 trang |
Chia sẻ: aloso | Lượt xem: 1760 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Đề án Dự đoán GDP của Việt Nam đến năm 2010, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
LỜI MỞ ĐẦU
Sau hơn hai mươi năm đổi mới, chuyển từ nền kinh tế kế hoạch hóa tập trung sang nền kinh tế thị trường, Việt Nam đã đạt được những thành tựu to lớn về kinh tế- xã hội. Trong những năm gần đây tăng trưởng kinh tế của đất nước được xếp vào một trong những nước có tốc độ tăng lớn nhất Đông Á. Đời sống của nhân dân không ngừng được cải thiện. Việt Nam từ một nước nông nghiệp kém phát triển, đang từng bước xây dựng một nền kinh tế công nghiệp theo hướng hiện đại. Để đạt được những thành quả đó, một mặt do Nhà nước đã có những chính sách kinh tế đúng đắn, mặt khác phải không ngừng phân tích, đánh giá kết quả đạt được từ đó rút ra bài học kinh nghiệm và có điều chỉnh đúng đắn, từ đó có cái nhìn chiến lược cho tương lai . Với ý nghĩa đó, vai trò của thông tin thống kê ngày càng trở nên quan trọng, nhất là trong xu thế hội nhập và thị trường toàn cầu. Việc áp dụng các phương pháp thống kê vào phân tích tăng trưởng kinh tế của Việt Nam sẽ cho ta cái nhìn sâu sắc hơn, sát thực hơn về những gì đã đạt được và xu hướng phát triển trong tương lai. Do đó, em đã chọn đề tài: “Dự đoán GDP của Việt Nam đến năm 2010”
Đề án gồm 3 chương:
- Chương I : Lý luận chung dự đoán thống kê.
- Chương II : Vận dụng một số phương pháp dự đoán để dự đoán GDP Việt Nam đến năm 2010.
- Chương III : Kiến nghị việc sử dụng các phương pháp dự đoán GDP.
Với sự hiểu biết nhất định về lý thuyết cũng như thực tế nên đề án của em không tránh khỏi những sai sót. Em rất mong nhận được sự góp ý của các thầy cô để đề án được hoàn thành tốt nhất.
Em xin chân thành cảm ơn PGS.TS Bùi Huy Thảo đã giúp đỡ em hoàn thành đề án!
Chương 1: Lý luận chung dự đoán thống kê.
I- Dự đoán thống kê và ý nghĩa của dự đoán thống kê:
1. Dự đoán thống kê:
1.1. Dự đoán và phương pháp dự đoán:
Dự đoán được sử dụng rộng rãi trong nhiều lĩnh vực như khoa học- kỹ thuật, kinh tế chính trị, văn hóa- thể thao, và các lĩnh vực khác của xã hội. Dự đoán được hiểu là việc xác định mức độ, trạng thái của hiện tượng trong tương lai. Tham gia vào nhiều lĩnh vực, dự đoán có nhiều loại và phương pháp khác nhau.
Dựa vào độ dài thời gian dự đoán( tầm dự đoán) có thể phân loại dự đoán thành 3 loại:
Dự đoán ngắn hạn là dự đoán có tầm dự đoán dưới 3 năm. Người ta co thể dự đoán về hàng ngày, hàng tháng, hàng quý. Mục đích chủ yếu của loại dự đoán này là phục vụ kịp thời cho công tác quản lý.Ví dụ: nghiên cứu về nhu cầu thị trường, ….
Dự đoán trung hạn: là đoán có tầm dự đoán từ 3 đến 5 năm , dùng phục vụ các kế hoạch 3-5 năm.
Dự đoán dài hạn: là dự đoán có tầm dự đoán từ 5 năm trở lên, dùng trong việc dự đoán mục tiêu có tính chất chiến lược.
Tuỳ thuộc vào đối tượng và nhiệm vụ của dự đoán mà trong thực tế có nhiều phương pháp dự đoán được sử dụng. Có thể phân loại dự đoán thành 3 nhóm phương pháp
Phương pháp chuyên gia: được tiến hành trên cơ sở tổng hợp, xử lý những ý kiến của các chuyên gia. Phương pháp này có ưu thế trong trường hợp dự đoán những hiện tượng hay quá trình có tầm bao quát rộng lớn, phức tạp chịu sự chi phối của nhiều yếu tố. Ví dụ như dự đoán về sự phát triển của khoa học- kỹ thuật, sự thay đổi của môi trường trong 20 năm tới.
Dự đoán bằng mô hình hồi quy được thực hiện trên cơ sở xây dựng mô hình hồi quy phù hợp. Để xây dựng mô hình hồi quy, đòi hỏi phải có tài liệu về hiện tượng cần được dự đoán và các hiện tượng có liên quan. Dự đoán bằng mô hình hồi quy thường được sử dụng đối với dự đoán trung và dài hạn ở tầm dự đoán vĩ mô.
Dự đoán dựa vào dãy số thời gian là dựa vào dãy số thời gian phản ánh sự biến động của hiện tượng ở những thời gian đã qua để xác định mức độ của hiện tượng trong tương lai. Ưu điểm dãy số thời gian là khối lượng tài liệu không lớn, việc xác định mô hình dự đoán trên dãy số thời gian thuận tiện, dùng phần mềm cho kết quả tốt.
1.2. Dự đoán thống kê:
Dự đoán thống kê là dựa vào tài liệu thống kê và sử dụng những phương pháp phù hợp để xác định mức độ của hiện tượng trong tương lai.
Tài liệu thống kê thường được sử dụng trong dự đoán thống kê là dãy số thời gian. Việc sử dụng dãy số thời gian để tiến hành dự đoán thống kê có những ưu điểm cơ bản như sau:
Thứ nhất, chỉ cần có dãy số thời gian gồm một số lượng nhất định các mức độ của hiện tượng ở thời gian hiện tại trở về trước, đòi hỏi một khối lượng tài liệu lớn như dự đoán dựa vào mô hình hồi quy.
Thứ hai, việc xây dựng mô hình dự đoán dựa vào dãy số thời gian được tiến hành tương đối đơn giản, ít bị ràng buộc bởi các giả thiết như trong việc xây dựng mô hình hồi quy.
Thứ ba, dự đoán dựa vào dãy số thời gian rất thuận lợi trong việc ứng dụng tin học. Điều đó làm cho việc tính toán trở nên thuận tiện, đồng thời cho phép lựa chọn mô hình dự đoán phù hợp nhất.
Để kết quả dự đoán có độ tin cậy cao, đòi hỏi phải có các mức độ của dãy số thời gian phải chính xác, có thể so sánh được với nhau. Đảm bảo tính chất có thể so sánh được với nhau giữa các mức độ trong dãy số nhằm phản ánh một cách đúng đắn, khách quan sự biến động của hiện tượng qua thời gian. Cụ thể là:
Nội dung và phương pháp tính chỉ tiêu qua thời gian phải thống nhất.
Phạm vi hiện tượng nghiên cứu qua thời gian phải nhất trí.
Các khoảng cách thời gian trong dãy số nên bằng nhau, nhất là đối với dãy số thời kỳ.
Trong việc xác định số lượng các mức độ của dãy số thời gian để tiến hành dự đoán thì không thể đưa ra một nguyên tắc cứng nhắc mà phải dựa vào sự phân tích đặc tính biến động của hiện tượng qua thời gian để xác định nên sử dụng bao nhiêu mức độ để xây dựng mô hình dự đoán. Giả sự sự biến động của hiện tượng qua các năm có tính chất tương đối ổn định thì có thể sử dụng tài liệu của 7 hoặc 10 năm.
Nếu ở những thời gian cuối có những nhân tố mới xuất hiện làm thay đổi xu hướng phát triển của hiện tượng thì có thể sử dụng một số mức độ cuối của dãy số thời gian để xây dựng mô hình dự đoán.
Có nhiều phương pháp được sử dụng trong dự đoán thống kê. Có những phương pháp dựa trên sự mở rộng từ những công thức tính toán thống kê như dự đoán dựa vào phát triển trung bình, dự đoán dựa vào hàm xu thế, .v.v.. Có những phương pháp dự đoán thống kê được vận dụng trên cơ sở các kết quả của toán học như dự đoán bằng phương pháp san bằng mũ, dự đoán mô hình tuyến tính ngẫu nhiên, .v.v..
2. Ý nghĩa thực tiễn:
Dự đoán thống kê là dựa vào tài liệu thống kê và sử dụng những phương pháp phù hợp để xác định các mức độ của hiện tượng trong tương lai.
Nếu như trước đây thống kê thống kê chỉ dừng lại nghiên cứu những hiện tượng đã xảy ra thì ngày nay với phương pháp dự đoán thống kê giúp ta thấy rõ bản chất, quy luật phát triển của hiện tượng trong quá khứ, hiện tại , giúp ta dự đoán được các mức độ của hiện tượng trong tương lai. Trên cơ sở đó giúp ta có nhận thức đúng đắn về hiện tượng, tìm ra các biện pháp thích hợp thúc đẩy hiện tượng phát triển theo hướng tốt nhất, phù hợp với điều kiện, hoàn cảnh kinh tế- xã hội hiện tại.
II- Các phương pháp dự đoán thống kê:
1. Dự đoán dựa vào lượng tăng (hoặc giảm) tuyệt đối bình quân:
Lượng tăng giảm tuyệt đối được tính theo công thức
Trong đó:
: Là lượng tăng(hoặc giảm) liên hoàn ở thời gian i so với thời gian đứng liền trước là i-1. Phản ánh sự biến động về mức độ tuyệt đối giữa hai thời gian liền nhau.
( với i= 2,3….n)
Mức độ ở thời gian i
: Mức độ ở thời gian i-1
: Mức độ đầu tiên của dãy số.
: Mức độ cuối cùng của dãy số.
Lượng tăng giảm tuyệt đối phản ánh sự thay đổi về quy mô của hiện tượng qua thời gian.
Lượng tăng giảm tuyệt đối bình quân đại diện cho các lượng tăng (hoặc giảm) tuyệt đối từng kỳ.
Từ đó có mô hình dự đoán:
với l = 1,2,3…
Mô hình dự đoán này cho kết quả dự đoán tốt khi các lượng tăng (hoặc giảm) tuyệt đối liên hoàn xấp xỉ nhau.
2.Dự đoán dựa vào tốc độ phát triển bình quân:
Tốc độ phát triển bình quân được tính theo công thức:
Trong đó:
tốc độ phát triển liên hoàn ở thời gian i so với thời gian i-1 và có thể biểu hiện bằng lần hoặc %.
(với i= 2,3,….n)
Mức độ ở thời gian thứ i.
Mức độ ở thời gian thứ i-1
: Mức độ đầu tiên của dãy số.
: Mức độ cuối cùng của dãy số.
Tốc độ phát triển phản ánh qua thời gian hiện tượng nghiên cứu phát triển với tốc độ cụ thể là bao nhiêu ( nhanh hay chậm và có xu hướng như thế nào).
Tốc độ phát triển bình quân đại diện cho các tốc độ phát triển liên hoàn, phản ánh nhịp điệ phát triển điển hình của hiện tượng trong suốt thời gian nghiên cứu.
Từ công thức tính tốc độ phát triểm bình quân cho thấy chỉ nên tính chỉ tiêu này đối với những hiện tượng biến động qua thời gian theo những xu hướng nhất định.
Từ đó có mô hình dự đoán:
với l = 1, 2, 3…
Mô hình dự đoán cho kết quả tốt nhất khi các tốc độ phát triển liên hoàn xấp xỉ nhau.
3. Dự đoán dựa vào ngoại suy hàm xu thế:
Biểu hiện các mức độ của dãy số thời gian bằng một hàm số được gọi là hàm xu thế
Dạng tổng quát:
với t = 1, 2, 3…
: Mức độ dự đoán của hiện tượng ở thời gian t được tính từ hàm xu thế .
f(t): Là hàm xu thế.
t : Thứ tự thời gian của dãy số. t= 1,2,3……
-Từ đó có mô hình dự đoán là :
với l= 1,2,3….
-Tiêu chuẩn để chọn mô hình dự đoán tốt nhất :
+ Tổng bình phương sai số dự đoán:SSE = = min
+ Sai số chuẩn của mô hình dự đoán: SE = = min
n : số lượng các mức độ của dãy số
k : số lượng các hệ số (tham số của mô hình)
Dựa vào một trong hai tiêu chuẩn trên ta sẽ xác định được mô hình dự đoán tốt nhất ,tức là mức độ dự đoán sát với mức độ thực tế hơn.
Bước 1: Căn cứ để chọn hàm xu thế:
+Thăm dò dạng hàm xu thế bằng đồ thị
Trục hoành : thứ tự thời gian.
Trục tung : mức độ thực tế.
+Một vài căn cứ khác
- Dùng sai phân : - Sai phân bậc 1: ( i= 2,3,4,….n)
Với điều kiện là các xấp xỉ nhau. Dựa vào sai phân bậc 1 cho ta hàm xu thế tuyến tính: .
- Sai phân bậc 2:
Với điều kiện là các xấp xỉ nhau. Dựa vào sai phân bậc 2 cho ta hàm parabol :
- Sai phân bậc 3 :
Với điều kiện là các xấp xỉ nhau . Dựa vào sai phân bậc 3 cho ta hàm xu thế bậc 3 : +
Nói tóm lại sai phân bậc k cho tà hàm xu thế bậc k
Dùng tốc độ phát triển liên hoàn : (với i= 2,3,….n)
Với điều kiện các giá trị xấp xỉ nhau. Dựa vào tốc độ phát triển liên hoàn ta có hàm xu thế là hàm mũ : .
+ Thường sử dụng tiêu chuẩn: tính sai số chuẩn của hàm xu thế trùng với SE
SE= min
Trong đó: Mức độ thự tế của hiện tượng ở thời gian t.
: Mức độ của hiện tượng ở thời gian t được tính từ hàm xu thế.
n : số lượng mức độ của dãy số.
k: hệ số của hàm xu thế.
Bước 2: Đi tìm giá trị cụ thể của các hệ số hàm xu thế( , i= 0,1,2,….). Dùng phương pháp bình phương nhỏ nhất : SSE = = min
Một số dạng hàm xu thế thường sử dụng:
Hàm xu thế tuyến tính:
Hàm xu thế tuyến tính được sử dụng khi các lượng tăng(hoặc giảm) tuyệt đối liên hoàn xấp xỉ nhau.
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị của các hệ số và :
Hoặc có thể tính và theo các công thức sau đây:
Đồ thị biểu diễn phương trình đường thẳng ( ) có dạng:
y
t
0
b1 > 0
y
0
b1 < 0
t
Hàm xu thế parabol :
Hàm xu thế parabol được sử dụng trong trường hợp của dãy số tăng dần theo thời gian, đạt cực đại, sau đó lại giảm dần theo thời gian; hoặc giảm dần theo thời gian, đạt cực tiểu, sau đó lại tăng dần theo thời gian. Dạng tổng quát của hàm xu thế parabol như sau:
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị của các hệ số , và :
+
+
Đồ thị biểu diễn phương trình đường bậc 2 () có dạng:
0
t
y
y
0
t
Hàm bậc 3:
= b0 + b1t + b2t2 + b3t3
Các tham số b0, b1, b2 và b3 của phương trình bậc ba được xác định theo hệ phương trình chuẩn tắc sau:
Đồ thị biểu diễn phương trình đường bậc ba có dạng:
y
0
t
0
t
y
Hàm xu thế hàm mũ:
Hàm xu thế hàm mũ được sử dụng khi các tốc độ phát triển liên hoàn xấp xỉ nhau
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hẹ phương trình sau đây để tìm giá trị của các hệ số , :
Giải hệ phương trình trên sẽ được ln, ; tra đối ln sẽ được , .
Để xác định đúng đắn dạng cụ thể của hàm xu thế, đòi hỏi phải phân tích đặc điểm biến động của hiện tượng qua thời gian, dựa vào đồ thị và một số tiêu chuẩn khác như sai số chuẩn của mô hình- ký hiệu SE:
SE=
Đồ thị biểu diễn phương trình hàm số mũ có dạng:
y
0
t
Hàm xu thế hyperbol:
Hàm xu thế hyperbol được sử dụng khi các mức độ của hiện tượng giảm dần theo thời gian. Dạng tổng quát của hàm xu thế hyperbol như sau:
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị của các hệ số , :
Nếu trên đồ thị biểu hiện các mức độ thực tế của hiện tượng qua thời gian có thể xây dựng một số hàm xu thế thì chọn hàm xu thế nào có sai số chuẩn của mô hình nhỏ nhất.
4. Dự đoán dựa vào hàm xu thế và biến động thời vụ :
Biến động thời vụ là sự biến động của hiện tượng có tính chất lặp đi lặp lại trong từng thời gian nhất định của năm. Ví dụ: Sản xuất nông nghiệp phụ thuộc vào thời xụ. Trong các nghành khác như công nghiệp, giao thông vận tải, xây dựng, du lịch, dịch vụ .v.v...ít nhiều có biến động thời vụ.
Nguyên nhân gây ra biến động thời vụ là do ảnh hưởng của điều kiện tự nhiên và phong tục, tập quán sinh hoạt.
Biến động thời vụ làm cho hiện tượng lúc thì mở rộng, khẩn trương, khi thì thu hẹp, nhàn rỗi.
Nghiên cứu biến động thời vụ nhằm đề ra những biện pháp phù hợp, kịp thời hạn chế ảnh hưởng của biến động thời vụ đối với sản xuất và sinh hoạt của xã hội.
Phương pháp thường được sử dụng để biểu hiện biến động thời vụ là tính các chỉ số thời vụ. Tài liệu được sử dụng để tính các chỉ số thời vụ thường là tài liệu hàng tháng hoặc hàng quý của ít nhất ba năm.
Các mức độ của dãy số thời gian có thể được phân chia ra ba thành phần sau:
Xu thế, ký hiệu , phản ánh xu hướng phát triển cơ bản của hiện tượng kéo dài theo thời gian.
Thời vụ, ký hiệu , sự biến động có tính chất lặp đi lặp lại trong những khoảng thời gian nhất định của năm.
Ngẫu nhiên, ký hiệu , sự biến động do các yếu tố ngẫu nhiên xảy ra ở những thời gian khác nhau.
Ba thành phần trên có thể kết hợp được với nhau theo một trong hai dạng sau đây:
Kết hợp cộng:
Kết hợp nhân:
4.1 Dự đoán dựa vào hàm xu thế kết hợp cộng với biến động thời vụ :
Trường hợp đơn giản được giả thiết rằng xu thế là hàm tuyến tính:
( với t= 1,2,3,…. Là thứ tự thời gian trong dãy số)
Khi đó việc xác định xu thế và biến động thời vụ được dựa vào bảng Buys_Ballot.
Quý (j)
Năm (i)
1
2
….
j
…
m
Tổng năm Ti
i
1
2
3
…
i
…
n
T1
T2
T3
…
Ti
Tn
T1
2T2
3T3
…
iTi…
nTn
Tổng chung
T=
S=
Trong đó: Ti =
Chú ý: kết hợp cộng đơn vị tính là của yt
- Tìm b0, b1:
st với j=1,2,3,4.
Từ đó có thể dự đoán được các mức độ dựa vào hàm xu thế kết hợp cộng với biến động thời vụ.
Mô hình dự đoán:
4.2 Dự đoán dựa vào hàm xu thế kết hợp nhân với biến động thời vụ :
Để phân tích các thành phàn của dãy số thời gian yt theo kết hợp nhân, trước hết cần loại trừ thành phần thời vụ và thành phần ngẫu nhiên bằng cách xây dựng dãy số bình quân trượt , tính .
Từ đó, xác định thành phần thời vụ bằng cách tính số bình quân . Sau đó, tính hệ số hiệu chỉnh H: H=
- Với m= 4 đối với tài liệu quý, m= 12 đối với tài liệu tháng.
Từ đó tính:
- Sau khi đã xác định được st thì xác định dãy số y’t là dãy số đã loại bỏ thành phần thời vụ như sau: y’t=. Từ dãy số y’t đi xây dựng hàm xu thế.
-Từ đó có mô hình dự đoán là:
Trên đây đã trình bày các thành phần dãy số theo kết hợp cộng và kết hợp nhân. Vấn đề đặt ra là : Đối với dãy số thời gian như thế nào thì phân tích theo kết hợp cộng hoặc kết hợp nhân? Nhiều sự nghiên cứu cho thấy : nếu đồ thị biểu hiện sự biến động của hiện tượng qua thời gian có biên độ giao động thay đổi ít thì có thể phân tích theo kết hợp cộng, nếu có biên độ dao động thay đổi nhiều thì có thể phân tích theo kết hợp nhân.
5. Dự đoán theo phương pháp san bằng mũ:
Ở phần trên đã đề cập tới một số phương pháp dự đoán thống kê mà khi xây dựng các mô hình dự đoán thì các mức độ của dãy số thời gian được xem là như nhau, nghĩa là có cùng quyền số trong khi xây dựng mô hình.
Nhưng ở những thời gian khác nhau thì hiện tượng nghiên cứu chịu sự tác động của những nhân tố khác nhau và cường độ không giống nhau. Có những nhân tố mất đi và có những nhân tố mới xuất hiện; có những nhân tố yếu đi và cũng có nhân tố mạnh lên.
Vì vậy, để phản ánh sự biến động này, đòi hỏi khi xây dựng mô hình dự đoán các mức độ của dãy số thời gian phải được chú ý một cách khác nhau. Các mức độ càng mới( ở cuối dãy số thời gian) càng cần phải được chú ý nhiều hơn so với các mức độ càng cũ ( ở đầu dãy số). Như vậy mô hình dự đoán có khả năng thích nghi với sự biến động của hiện tượng qua thời gian. Một trong những phương pháp để xây dựng mô hình dự đoán như vậy là phương pháp san bằng mũ. Sau đây sẽ đề cập đến một số mô hình san bằng mũ.
5.1 Mô hình đơn giản:
Mô hình giản đơn được sử dụng đối với dãy số thời gian không có xu thế và không có biến động thời vụ rõ rệt. Giả sử ở thời gian t, có mức độ thực tế là yt và mức độ dự đoán là . Mức độ dự đoán của hiện tượng ở thời gian t+1 có thể viết
(1)
Đặt (1-= ta có:
(2)
được gọi là các tham số san bằng với và nhận giá trị trong khoảng [0;1]. Như vậy, mức độ dự đoán là trung bình cộng gia quyền của yt và .
Mức độ dự đoán của hiện tượng ở thời gian t là:
, thay vào (2) ta có:
Bằng cách này tiếp tục thay các mức độ dự đoán … vào công thức trên, sẽ có:
(3)
Vì <1 nên khi i thì và 1
Khi đó:
Như vậy: Mức độ dự đoán là tổng tất cả các mức độ của dãy số thời gian được tính theo quyền số mà trong đó các quyền số giảm dần theo dạng mũ tùy thuộc vào mức độ cũ của dãy số. Cũng chính vì vậy mà phương pháp này được gọi là phương pháp san bằng mũ.
Công thức (1) có thể viết:
Nếu đặt là sai số dự đoán ở thời gian t thì:
Từ các công thức trên cho ta thấy có hai vấn đề quan trọng trong phương pháp sang bằng mũ.
Thứ nhất, là việc lựa chọn , được ràng buộc với điều kiện 0và . Nếu được chọn càng lớn thì các mức độ càng mới sẽ càng được chú ý, ngược lại nếu được chọn càng nhỏ thì các mức độ cũ được chú ý một cáh thỏa đáng. Do đó, để lựa chọn đòi hỏi phải dựa vào đặc điểm biến động của hiện tượng qua thời gian và kinh nghiệm nghiên cứu. Nói chung giá trị tốt nhất là giá trị làm cho tổng bình phương sai số dự đoán nhỏ nhất.
Thứ hai, là san bằng mũ được thực hiện theo phép đệ quy, tức là để tính thù phải có , để có thì phải có …Do đó để tính toán cần phải xác định giá trị ban đầu ( điều kiện ban đầu)- ký hiệu yo. Có nhiều phương pháp khác nhau để xác định giá trị ban đầu như có thể lấy mức độ đầu tiên của dãy số, hoặc số trung bình của một số các mức độ đầu tiên của dãy số, …
Trên đây đã trình bày nội dung của phương pháp dự đoán bằng san bằng mũ với mô hình đơn giản. Mô hình này có thể viết:
Với a0(t)=
5.2 Mô hình xu thế tuyến tính và không có biến động thời vụ:
Trong trường hợp biến động của hiện tượng qua thời gian cso xu thế là tuyến tính và không có biến động thời vụ để dự đoán, ta sử dụng mô hình sau:
Trong đó:
là các tham số san bằng và nhận giá trị trong khoảng [0; 1]. Giá trị được chọn tốt nhất là các giá trị làm cho tổng bình phương của sai số dự đoán là bé nhất. Việc lựa chọn các giá trị ban đầu có thể được tiến hành như sau:
(0) có thể là mức độ đầu tiên trong dãy số.
(0) có thể là lượng tăng ( giảm) tuyệt đối trung bình.
(0) =
5.3 Mô hình xu thế tuyến tính và biến động thời vụ :
Mô hình này được sử dụng đối với dãy số thời gian mà các mức độ của nó là tài liệu tháng hoặc quý của một số năm- tức là sau một khoảng thời gian k( với k=4, đối với tài liệu quý, k=12 đối với tài liệu năm). Việc dự đoán có thể được thực hiện theo một trong hai mô hình sau đây:
+ Mô hình cộng:
Trong đó:
+ Mô hình nhân:
Trong đó:
Với là các tham số nhận giá trị trong khoảng [0;1]
Dự đoán bằng phương pháp san bằng mũ sẽ trở nên thuận tiện hơn khi sử dụng chương trình SPSS. Trong chương trình này sẽ cho phép lựa chọn các tham số san bằng, các giá trị ban đầu một cách tốt nhất và việc thực hiện dự đoán một cách thuận tiện.
6. Dự đoán bằng mô hình tuyến tính ngẫu nhiên(phương pháp Box-Jenkins):
Trong phương pháp này, dãy số thời gian xem như được sinh ra từ một quá trình ngẫu nhiên. Trên cơ sở đó, một số mô hình quan trọng được xây dựng tiến hành dự đoán.
6.1. Một số mô hình tuyến tính ngẫu nhiên :
6.1.1 Một số khái niệm khái quát về quá trình ngẫu nhiên:
+ Quá trình ngẫu nhiên : là một tập hợp các giá trị của biến ngẫu nhiên xuất hiện qua thời gian và tuân theo một quy luật phân phối xác suất nào đó.
+Quá trình ngẫu nhiên dừng: một quá trình ngẫu nghiên zt được gọi là dừng nếu như quy luật phân phối xác suất của cũng đồng thời là quy luật phân phối xác suất .
Trong quá trình ngẫu nhiên dừng không có xu thế và không có biến động thời vụ (k: độ trễ)
Kỳ vọng của quá trình dừng : E(Yt)=
Tự hiệp phương sai giữa zt và zt-k
Tự tương quan giữa zt , zt-k
với k=0,1,2…; và -1
là hàm số đối với các giá trị của k.
Gọi là : - Hàm tự hiệp phương sai
- Hàm tự tương quan.
- Trong thực tế có dãy số thời gian Yt, do đó sẽ được ước lượng qua ck và rk
Với
b với
Với
+ Các toán tử được dùng để xác định mô hình:
Toán tử lùi: kí hiệu: B
BYt= Yt-1
Toán tử sai phân: kí hiệu :
Sai phân bậc 1 của Yt :
Sai phân bậc d của Yt:
Quá trình tự hồi qui:
Dãy {Yt} được gọi là tuân theo quá trình tự hồi qui bậc p. Ký hiệu AR(p) nếu:
Trong đó:
là các tham số.
at là một quá trình đặc biệt đơn giản và được gọi là quá trình thuần khiết hay tạp âm trắng với:
E[at]= 0
Var[at]=
Cov[at,at-k] = 0
Biểu diễn qua toán tử B:
Hay:
Hàm tự tương quan:
Với k
Một vài quá trình AR đơn giản:
Quá trình bậc 1: AR(1)
Hàm tương tự quan:
Quá trình bậc 1: AR(2)
Hàm tự tương quan:
Với :
Quá trình bình quân trượt :
Dãy {Yt} được gọi là tuân theo quá trình bình quân trượt bậc q. Ký hiệu MA(q) nếu:
Trong đó: là các tham số.
Biểu diễn qua toán tử B:
Hay
Hàm tự tương quan :
Với
Một vài quá trình MA đơn giản :
Quá trình bậc 1: MA (1)
Hàm tự tương quan :
Với
Quá trình bậc 2: MA(2)
Hàm tự tương quan:
=0 với k
Quá trình tự hồi qui trung bình trượt bậc p,q. Ký hiệu ARMA(p,q)
Đó là sự kết hợp giữa AR(p) và MA(q) :
Hay
Hàm tự tương quan:
với k q+1
Trong thực tế, quá trình ARMA(1,1) thường được sử dụng:
6.1.2. Một số mô hình tuyến tính không dừng:
Mô hình tổng hợp tự hồi quy- bình quân trượt :
Trong thực tế, phần lớn các quá trình ngẫu nhiên là không dừng, để thích ứng với các quá trình ngẫu dừng thì cần phải chuyển quá trình không dừng thành quá trình dừng bằng cách sử dụng toán tử sai phân .
Từ quá trình ARMA(p,q) nếu thay Yt bằng ta sẽ có :
=
Quá trình bình quân trên được gọi là quá trình tổng hợp tự hồi qui- bình quân trượt. Ký hiệu ARIMA(p,d,q) trong đó:
p là bậc của tóan tử tự hồi qui;
d là bậc của toán tử sai phân;
q là bậc của toán tử bình quân trượt;
Một số mô hình ARIMA thường được sử dụng:
ARIMA(0,1,1):
ARIMA(0,2,2):
ARIMA(1,1,1):
Mô hình biến động thời vụ:
Trong thự tế, nhiều dãy số thời gian mà các mức độ của nó được lặp lại sau khoảng thời gian k (ví dụ : k= 12 đối với tài liệu tháng, k=4 đối với tài liệu quý). Khi đó phải khử biến động thời vụ bằng toán tử ( 1- rồi mới áp dụng các mô hình đã trình bày ở trên.
Mô hình biến động thời vụ ký hiệu là SARIMA(p,d,q)
Để đưa Yt về dãy dừng cần:
- Khử biến động thời vụ : dùng toán tử tử ( 1-
- Khử xu thế mà sử dụng toán tử sai phân. (Với d=1 xu thế tuyến tính; d=2 xu thế bậc 2; d=3 xu thế bậc 3)
Ví dụ : Xây dựng mô hình SARIMA(1,1,1) cho Yt trên cơ sở ARIMA(1,1,1) và ARMA(1,1)
6.2. Phương pháp Box-Jenkins:
E.R.Box và G.M.Jenkín đã đề ra phương pháp dự đoán dựa vào mô hình ngẫu nhiên mà nội dung gồm bốn bước chính sau đây:
Bước 1: Đi tìm mô hình ARIMA nó phù hợp với dãy số thời gian được nghiên cứu.
Bước này cho phép nhận biết trong họ tất cả các mô hình ARIMA thì mô hình nào có khả năng thích hợp nhất với dãy số thời gian được nghiên cứu.
Trong thực tế, nhiều dãy số thời gian có biến động thời vụ và xu thế . Do đó, phải khử biến động thời cụ và bậc của xu thế. Toán tử ( 1- được sử dụng để khử biến động thời vụ , toán tử ( d=1 đối với xu thế tuyến tính, d=2 đối với xu thế parabol…) được sử dụng để khử xu thế.
Sau khi đã khử biến động thời vụ và xu thế , dãy số thời gian trở thành dãy số dừng. Từ đó, đi xác định bậc p,q của mô hình ARMA có thể dựa vào đồ thị của hàm tự tương quan và hàm tự tương quan riêng phần:
Nếu đồ thị của hàm tự tương quan giảm từ từ và đồ thị của hàm tự tương quan riêng phần có p giá trị đầu tiên khác 0(p=3 là lớn nhất) thì có thể có một AR(p)
Nếu đồ thị của hàm tự tương quan chỉ có q giá trị đầu tiên khác 0( q=3 là lớn nhất ) và đồ thị của hàm tự tương quan riêng phần giảm từ từ thì có thể có một MA(q)
Nếu đồ thị của hàm tự tương quan và hàm tự tương quan riêng phần không có sự cắt ngắn như hai trường hợp trên thì sẽ có một ARMA.
Về phương diện thực hành, nếu áp dụng phần mềm thống kê, ví dụ SPSS, ta có thể cho p,q những giá trị khác nhau . Mô hình ARMA được lựa chọn để dự đoán là mô hình có sai số nhỏ nhất.
Bước 2: Ước lượng các tham số của mô hình:
Việc ước lượng các tham số của mô hình có thể được tiến hành bằng những phương pháp khác nhau. Phương pháp tương đối đơn giản là dựa vào hàm tự tương quan bằng cách thay bằng rk. Ví dụ:
Đối với AR: Nếu gọi là ước lượng của ta sẽ có :
Với AR(1) : vùng cho phép
Với AR(2):
Vùng cho phép:
Đối với MA: Nếu gọi là ước lượng của ,sẽ có :
Với MA(1) : vùng cho phép -1<
Với MA(2):
Vùng cho phép : :
Đối với ARMA(1,1):
Vùng cho phép :
Việc ước lượng các tham số như trên là ước lượng sơ bộ. Trên cơ sở đó, bằng phương pháp lặp- tức là cho hoặc những giá trị lhác nhau trong vùng cho phép, từ đó đi đến ước lượng tốt nhất, đó là giá trị của các tham số của mô hình làm cho sai số của mô hình đạt cực tiểu.
6.2.3. Bước 3: Kiểm tra xem mô hình có thích hợp không:
Sau khi các tham số của mô hình đã được xác định, cần kiểm tra xem mô hình có được chấp nhận hay không?
+ Các tham số của mô hình phải khác 0 . Nếu có tham số nào khổng thỏa mãn thì loại khỏi mô hình.
+ Phân tích phần dư là ước lượng của at.
Trung bình cộng triệt tiêu, trong trường hợp ngược lại thì nên thêm mọt hằng số vào mô hình. Việc thêm hằng số không ảnh hưởng đến tính chất ngẫu nhiên của quá trình.
Các phần dư là một tạp âm trắng. Có thể dùng tiêu chuẩn sau đây để kiểm định :
Q=n
Với là tự tương quan bậc k của các phần dư.
Q tuân theo gần như một phân phối với bậc tự do (k-p-q). Với mức ý nghĩa kiểm định , tra bảng . Nếu Q thì giả thiết H0 bị bác bỏ và như vậy mô hình được lựa chọn là không thích hợp, khi đó phải trở lại bước một.
Bước 4 : Dự đoán và nghiên cứu:
Nếu mô hình được chọn là thích hợp thì dựa vào nó để tiến hành dự đoán.
Gọi
Tức là dự đoán là kỳ vọng các mức độ đã biết.
Ví dụ : Có dãy số thời gian Yt(với t=1,2,…., T) là số liệu của T năm. Giả sử tồn tại xu thế tuyến tính và mô hình thích hợp là ARIMA(1,1,1):
Hay :
Ở thời gian t= T+1 thì mô hình ARIMA(1,1,1) sẽ là:
Lấy kỳ vọng hai vế, sẽ được :
Hay:
Các kỳ vọng ở hai vế phải được tính theo nguyên tắc sau đây:
[YT-j]=YT-j với j=0,1,2,…., (T-1)
Các mức độ của YT-j đến thời gian T đã biết. Đó chính là các mức độ của dãy số thời gian Yt
[YT+j]=với j=1.2.3…
Tức là các mức độ YT+j chưa biết sẽ được thay bằng các giá trị dự đoán
[aT-j]=aT-j= YT-j với j=1,2,3…., (T-1)
[aT+j]=0 với j =1,2….
Theo nguyên tắc trên,sẽ có:
Với l=1:
Với l=2:
v.v…
Nhiều sự nghiên cứ đã khẳng định rằng phương pháp dự đoán dựa vòa mô hình tuyến tính ngẫu nhiên cho kết quả với mức chính xác cao. Đây là phương pháp rất tổng quát. Để vận dụng phương pháp này có hiệu quả, đòi hỏi phải sử dụng các chương trình tính toán, ví dụ chương trình SPSS.
Trên đây đã trình bày một số phương pháp chủ yếu thường được sử dụng trong dự đoán thống kê. Tùy thuộc vào trình độ của cán bộ mà sử dụng các phương pháp đó. Nói chung, phương pháp nào đòi hỏi khối lượng tính toán càng lớn( và cần thiết phải sử dụng máy tính) thì thường cho kết quả dự đoán tốt hơn.
Chương 2: Vận dụng một số phương pháp dự đoán để dự đoán GDP Việt Nam đến năm 2010.
I. Nguồn số liệu:
Năm
1990
1991
1992
1993
1994
1995
1996
1997
1998
GDP(tỉ đồng)
131968
139634
151782
164043
178534
195567
213833
231264
244596
Năm
1999
2000
2001
2002
2003
2004
2005
2006
GDP(tỉ đồng)
256272
273666
292535
313247
336242
362435
393031
425135
Nguồn số liệu lấy từ trang web của tổng cục thống kê ( trong mục số liệu thống kê của phần tài khoản quốc gia. Hoặc là lấy từ niên giám thống kê năm 2006 của tổng cục thống kê Việt Nam.
Nguồn số liệu theo năm vì vậy có những đặc điểm như sau:
Không có biến động thời vụ.
Có biến động thành phần ngẫu nhiên
Có xu thế.
II- Vận dụng một số phương pháp dự đoán GDP Việt Nam đến năm 2010:
Lựa chọn phương pháp dự đoán:
Không thể sử dụng các phương pháp dự đoán có biến động thời vụ như:
Dự đoán dựa vào hàm xu thế có biến động thời vụ.
Mô hình san bằng mũ giản đơn( simple). Vì áp dụng cho những dãy số không có xu thế, không có biến động thời vụ.
Mô hình tuyến tính ngẫu nhiên có biến động thời vụ.
Các mô hình được lựa chọn:
Mô hình dự đoán dựa vào lượng tăng giảm tuyệt đối bình quân.
Mô hình dự đoán dựa vào tốc độ phát triển bình quân.
- Mô hình dự đoán dựa vào hàm xu thế.
Mô hình san bằng mũ có xu thế và không có biến động thời vụ (phương pháp Holt)
Mô hình tuyến tính không dừng.
Tiêu chuẩn để lựa chọn mô hình là SE min hoặc SSE min
Kết hợp với hệ số xác định R gần 1 nhất sẽ được lựa chọn.
1. Dự đoán dựa vào tốc độ tăng ( hoặc giảm) tuyệt đối bình quân:
Dựa vào nguồn số liệu ta có:
==17245.118 tỷ đồng.
Dự đoán GDP của các năm 2007,2008,2009,2010:
Năm
GDP (tỷ đồng)
2007
442380.118
2008
459625.236
2009
476870.354
2010
494115.472
Tiêu chuẩn lựa chọn mô hình:
Năm
yt
l
1990
131968
-16
2276228867
297393887.9
1991
139634
-15
2408429942
719539315.1
1992
151782
-14
2617923635
1018972458
1993
164043
-13
2829366027
1362013421
1994
178534
-12
3079265032
1572882603
1995
195567
-11
3373001127
1589752620
1996
213833
-10
3688000452
1509386215
1997
231264
-9
3988600104
1494977431
1998
244596
-8
4218512017
1812890853
1999
256272
-7
4419866015
2318150364
2000
273666
-6
4719827598
2303836035
2001
292535
-5
5045225729
2150585903
2002
313247
-4
5402406613
1841055959
2003
336242
-3
5798958102
1380690656
2004
362435
-2
6250659477
795790784.9
2005
393031
-1
6778291108
220786374.3
2006
425135
0
7331928376
0
SSE
1
22388704880
SE
38633.93
SE==38633.93
2. Dự đoán dựa vào tốc độ phát triển bình quân:
==1.076
Dự đoán GDP của các năm 2007,2008,2009,2010
Năm
GDP(tỷ đồng)
2007
457445.26
2008
492211.0998
2009
529619.1433
2010
569870.1982
Tiêu chuẩn lựa chọn mô hình:
Năm
yt
l
(
1990
131968
-16
131683.2447
81085.55916
1991
139634
-15
141691.1713
4231953.915
1992
151782
-14
152459.7004
459277.7779
1993
164043
-13
164046.6376
13.23204128
1994
178534
-12
176514.182
4079664.576
1995
195567
-11
189929.2599
31784113.67
1996
213833
-10
204363.8836
89664164.83
1997
231264
-9
219895.5388
129241910.4
1998
244596
-8
236607.5997
63814538.81
1999
256272
-7
254589.7773
2829873.167
2000
273666
-6
273938.6004
74310.97224
2001
292535
-5
294757.934
4941435.652
2002
313247
-4
317159.537
15307945.81
2003
336242
-3
341263.6618
25217087.4
2004
362435
-2
367199.7001
22702367.18
2005
393031
-1
395106.8773
4309266.662
2006
425135
0
425135
0
SSE
398739009.6
SE
5155.831712
SE==5155.831712
3. Dự đoán dựa vào hàm xu thế:
Dùng phần mềm SPSS để xác định đúng đắn hàm xu thế, từ đó có thể dựa vào đó để dự đoán các mức độ của hiện tượng trong tương lai.
Trước hết, ta sẽ thăm dò dạng hàm xu thế bằng đồ thị :
Đồ thị trên gợi ý cho ta xây dựng hàm xu thế tuyến tính, hàm parabol, hàm bậc 3, hàm mũ, trên cơ sở đó tiến hành dự đoán cho một số năm tiếp theo.
3.1. Hàm xu thế tuyến tính:
Dependent variable.. Y Method.. LINEAR
Listwise Deletion of Missing Data
Multiple R .98981
R Square .97972
Adjusted R Square .97837
Standard Error 13274.58281
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 1 127711117396.5 127711117396.5
Residuals 15 2643218230.6 176214548.7
F = 724.74786 Signif F = .0000
-------------------- Variables in the Equation ------
Variable B SE B Beta T Sig T
Time 17692.299020 657.189778 .989809 26.921 .0000
(Constant) 93933.073529 6734 .191294 13.949 .0000
Từ kết quả trên cho ta thấy hàm tuyến tính có dạng
93933.073529 +17692.299020 t
+ Dự đoán về GDP của các năm 2007, 2008, 2009, 2010.có kết quả như sau :
Năm
Dự đoán điểm
(tỷ đồng)
Dự đoán khoảng
(tỷ đồng)
Cận dưới(lcl)
Cận trên(ucl)
2007
412394.4559
380667.7824
444121.129
2008
430086.7549
397777.8921
462395.618
2009
447779.0539
414838.6878
480719.42
2010
465471.3529
431852.9485
499089.757
Ở đây cho kết quả của hai loại dự đoán:
- Dự đoán điểm: ký hiệu fit_1
- Dự đoán khoảng : Cận dưới, ký hiệu lcl_1; Cận trên, ký hiệu ucl_1.Ví dụ: Dự đoán GDP năm 2007 đạt 412394.4559 tỷ đồng.
Ví dụ: Với khoảng tin cậy 95% thì GDP năm 2007 ở trong khoảng 380667.7824 tỷ đồng đến 444121.129 tỷ đồng.
Hàm xu thế tuyến tính này có một số kết quả thông kê như sau :
Hệ số tương quan là 0,98981.
Hệ số xác định là 0,97972.
Hệ số hợp chuẩn là 0.97837.
Sai số chuẩn SE =13274.58281.
3.2. Hàm xu thế parabol:
Dependent variable.. Y Method.. QUADRATI
Listwise Deletion of Missing Data
Multiple R .99851
R Square .99703
Adjusted R Square .99661
Standard Error 5256.80520
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 2 129967459614.7 64983729807.3
Residuals 14 386876012.4 27634000.9
F = 2351.58601 Signif F = .0000
-------------------- Variables in the Equation ---
Variable B SE B Beta T Sig T
Time 7981.206140 1105.763020 .446515 7.218 .0000
Time**2 539.505160 59.705591 .558998 9.036 .0000
(Constant) 124684 .867647 4323.608312 28.838 .0000
Từ kết quả của phần trên cho ta thấy hàm xu thế có dạng :
=124684.867647+7981.206140 t+ 7981.206140
+ Dự đoán về GDP của các năm 2007, 2008, 2009, 2010.có kết quả như sau :
Năm
Dự đoán điểm
(tỷ đồng)
Dự đoán khoảng(tỷ đồng)
Cận dưới (lcl)
Cận trên (ucl)
2007
443146.25
428547.8937
457744.606
2008
471089.1471
454950.057
487228.237
2009
500111.0544
482039.3063
518182.803
2010
530211.9721
509825.7531
550598.191
Ở đây cho kết quả của hai loại dự đoán:
- Dự đoán điểm: ký hiệu fit_1
- Dự đoán khoảng : Cận dưới, ký hiệu lcl_1; Cận trên, ký hiệu ucl_1.Ví dụ: Dự đoán GDP năm 2007 đạt 443146.25 tỷ đồng.
Ví dụ: Với khoảng tin cậy 95% thì GDP năm 2007 ở trong khoảng 428547.8937 tỷ đồng đến 457744.606 tỷ đồng.
Hàm xu thế dạng parabol này có một số kết quả thông kê như sau :
Hệ số tương quan là 0,99851
Hệ số xác định là 0,99703.
Hệ số hợp chuẩn là 0,9961.
Sai số chuẩn SE = 5256,80520.
3.3. Hàm xu thế là hàm bậc 3:
Dependent variable.. Y Method.. CUBIC
Listwise Deletion of Missing Data
Multiple R .99932
R Square .99863
Adjusted R Square .99831
Standard Error 3705.39974
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 3 130175845793.3 43391948597.8
Residuals 13 178489833.8 13729987.2
F = 3160.37793 Signif F = .0000
-------------------- Variables in the Equation -----
Variable B SE B Beta T Sig T
Time 15710.170709 2131.526229 .878918 7.370 .0000
Time**2 -503.905057 271.114180 -.522111 -1.859 .0859
Time**3 38.644823 9.919549 .669837 3.896 .0018
(Constant 111468.338235 4560 .360994 24.443 .0000
Từ kết quả của phần trên cho ta thấy hàm xu thế có dạng :
= 111468.338235+ 15710.170709 t -503.905057 + 38.644823
+ Dự đoán về GDP của các năm 2007, 2008, 2009, 2010.có kết quả như sau :
Năm
Dự đoán điểm (tỷ đồng)
Dự đoán khoảng
(tỷ đồng)
Cận dưới (lcl)
Cận trên(ucl)
2007
456362.7794
443668.5444
469057.014
2008
493116.6961
476368.2862
509865.106
2009
533268.3124
510847.1649
555689.46
2010
577049.4974
547315.6912
606783.304
Ở đây cho kết quả của hai loại dự đoán:
- Dự đoán điểm: ký hiệu fit_1
- Dự đoán khoảng : Cận dưới, ký hiệu lcl_1; Cận trên, ký hiệu ucl_1.Ví dụ: Dự đoán GDP năm 2007 đạt 456362.7794 tỷ đồng.
Ví dụ: Với khoảng tin cậy 95% thì GDP năm 2007 ở trong khoảng 443668.5444 tỷ đồng đến 469057.014 tỷ đồng.
Hàm xu thế dang hàm bậc 3 này có một số kết quả thông kê như sau :
Hệ số tương quan là 0.99932
Hệ số xác định là 0.99863
Hệ số hợp chuẩn là 0.99831
Sai số chuẩn SE =3705.39974
3.4. Hàm xu thế dạng hàm mũ:
Dependent variable.. Y Method.. COMPOUND
Listwise Deletion of Missing Data
Multiple R .99847
R Square .99695
Adjusted R Square .99675
Standard Error .02084
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 1 2.1281585 2.1281585
Residuals 15 .0065119 .0004341
F = 4902.12600 Signif F = .0000
-------------------- Variables in the Equation ---------------
Variable B SE B Beta T Sig T
Time 1.074894 .001109 2.714136 969.439 .0000
(Constant) 124285.422507 1313 .694877
Từ kết quả của phần trên cho ta thấy hàm xu thế có dạng :
= 124285.422507x1.074894
+ Dự đoán về GDP của các năm 2007, 2008, 2009, 2010.có kết quả như sau :
Năm
Dự đoán điểm
(tỷ đồng)
Dự đoán khoảng(tỷ đồng)
Cận dưới(lcl)
Cận trên(ucl)
2007
456041.5219
433887.6762
479326.52
2008
490196.4648
465957.4322
515696.408
2009
526909.4206
500358.8158
554868.884
2010
566371.9701
537260.791
597060.522
Ở đây cho kết quả của hai loại dự đoán:
- Dự đoán điểm: ký hiệu fit_1
- Dự đoán khoảng : Cận dưới, ký hiệu lcl_1; Cận trên, ký hiệu ucl_1.Ví dụ: Dự đoán GDP năm 2007 đạt 456041.5219 tỷ đồng.
Ví dụ: Với khoảng tin cậy 95% thì GDP năm 2007 ở trong khoảng 433887.6762 tỷ đồng đến 479326.52 tỷ đồng.
Hàm xu thế dang hàm mũ này có một số kết quả thông kê như sau :
Hệ số tương quan là : 0.99847
Hệ số xác định là : 0.99695
Hệ số hợp chuẩn là : 0.99675
Sai số chuẩn SE’ =0.02084
Sai số chuẩn mà ta có được là của dạng hàm mũ, để có thể sử dụng SE để lựa chọn mô hình dự đoán tốt nhất thì ta phải chuyển đổi SE’ SE
Dựa vào công thức tính SE = ta có bảng sau :
yt
(yt -)
131968
133593.701
2642903.74
139634
143599.117
15722154.4
151782
154353.883
6614581.14
164043
165914.12
3501088.93
178534
178340.153
37576.5431
195567
191696.827
14978239.8
213833
206053.84
60515328.7
231264
221486.113
95607078.1
244596
238074.176
42534189.6
256272
255904.592
134989.006
273666
275070.405
1972353.12
292535
295671.63
9838446.5
313247
317815.771
20873663.9
336242
341618.383
28905490.9
362435
367203.677
22740275.6
393031
394705.165
2802827.78
425135
424266.36
754535.797
(yt -)
330175724
(yt -)/(n-k)
22011714.9
SE=
4691.66441
Như vậy SE của mô hình mũ là SE= 4691.66441
4. Dự đoán theo phương pháp san bằng mũ:
4.1. Mô hình xu thế tuyến tính và không có biến động thời vụ.
Sử dụng phần mềm SPSS để dự đoán mô hình xu thế tuyến tính và không có biến động thời vụ bằng mô hình Holt :
Trước hết ta cần tìm xem với bằng bao nhiêu thì tốt nhất để lựa chọn để dự đoán :
Ta có bảng sau:
The 10 smallest SSE's are:
Alpha Gamma SSE
1.000000 1.000000 214833908.44
1.000000 .8000000 246370342.31
.9000000 1.000000 249759461.80
.9000000 .8000000 291274035.89
.8000000 1.000000 299865036.12
1.000000 .6000000 300294681.47
.8000000 .8000000 355124437.00
.9000000 .6000000 359366200.71
.7000000 1.000000 374590011.34
1.000000 .4000000 397088460.61
Từ bảng trên cho ta thấy với , cho SSE= 214833908.44 min. Do đó tiến hành dự đoán theo mô hình Holt với .
Có kết quả dự đoán các năm 2007, 2008, 2009, 2010 như sau :
Năm
Dự đoán điểm
(tỷ đồng)
2007
457239
2008
489343
2009
521447
2010
553551
4.2. Mô hình tuyến tính không dừng.
Dự đoán bằng mô hình ARIMA(p,d,q) . Ta sẽ xét lần lượt các trường hợp kết hợp giá trị của p=0,1,2 với các giá trị của q=0,1,2. Từ đó, chọn ra kết hợp p,q nào có SE nhỏ nhất để tiến hành dự đoán.Ta có bảng SE của các kết hợp p,q
p
q
SE
0
0
6859.8615
0
1
4584.9512
0
2
3155.4713
1
0
3120.9166
1
1
2853.6083
1
2
2967.7985
2
0
2867.7833
2
1
2968.2918
2
2
2882.6057
Từ bảng trên thì với p=1,d=1,q=1, tức là mô hình ARIMA(1,1,1) có SE= 2853.6083 là nhỏ nhất.
Mô hình ARIMA(1,1,1):
Dự đoán GDP theo mô hình ARIMA(1,1,1)
Năm
Dự đoán điểm(tỷ đồng)
Dự đoán khoảng (tỷ đồng)
Cận dưới(lcl)
Cận trên(ucl)
2007
456509.3
450268.3
462750.2
2008
486871.8
470076.5
503667
2009
516301.7
486644.9
545958.5
2010
544872.1
500633.3
589111
Từ các phương pháp đã sử dụng ở trên, ta có thể so sánh xem SE của mô hình nào là tốt nhất, của phương pháp vận dụng nào là tốt nhất. Ta có bảng sau:
Các dạng mô hình sử dụng để dự đoán
SE
Mô hình dự đoán dựa vào lượng tăng (giảm) trung bình
38633.93
Mô hình dự đoán dựa vào tốc độ phát triển bình quân.
5155.831712
Hàm xu thế tuyến tính
13274.58281
Hàm bậc 2(parabol)
5256.80520
Hàm bậc 3
3705.39974
Hàm mũ
4691.66441
Mô hình xu thế và không có biến động thời vụ
214833908.4
Mô hình bình quân trượt kết hợp tự hồi quy ARIMA(1,1,1)
2853.6083
Như vậy dựa vào các kết quả thu được ở bảng trên cho ta thấy là mô hình dự đoán tốt nhất là mô hình bình quân trượt kết hợp tự hồi quy ARIMA( 1,1,1) có SE = 2853.6083.
Chương III: Nhận xét và kiến nghị
1. Xem xét trong các phương pháp và mô hình trên mô hình và phương pháp nào có thể mang lại dự đoán kết quả chính xác nhất, tốt nhất.
Thông qua phân tích ở trên cho ta một vài nhận xét như sau:
Nhìn chung các phương pháp dự đoán là rất đa dạng. Mỗi phương pháp dự đoán khác nhau có đặc thù riêng phù hợp với từng trường hợp cụ thể.
Việc sử dụng các phương pháp dự đoán cho ta có cái nhìn tổng quan qui mô của hiện tượng và xu hướng phát triển trong tương lai.
Việc dự đoán được sử dụng rất nhiều phần mềm, ví dụ SPSS. Cho ta kết quả dự đoán một cách có hiệu quả , chính xác, và tiết kiệm thời gian.
Trong các mô hình dự đoán thì phương pháp dự đoán Box-Jenkins là phương pháp dự đoán cho kết quả tốt nhất. Trong đó, mô hình dự đoán chính xác nhất là mô hình ARIMA(1,1,1) .
Đây là phương pháp thường được sử dụng với mức độ chính xác cao.
Đây là phương pháp rất tổng quát.
Kết quả dự đoán cho thấy GDP của các năm tới có xu hướng tăng, sự tăng này rất phù hợp với xu thế phát triển của nền kinh tế Việt Nam đang trong giai đoạn phát triển.
2. Kiến nghị.
Nhìn chung những trong năm qua, vai trò của thông tin thống kê ngày càng được chú trọng vì ý nghĩa lý luận và thực tiễn của các phương pháp thống kê. Đánh giá đúng xu hướng biến động của hiện tượng giúp nhà quản lý có những quyết định liên quan đến hiện tại và trong tương lai.
Dự đoán không chỉ dừng lại ở những con số, mà qua đó ta còn thấy được sự phát triển của hiện tượng hay quá trình kinh tế -xã hội trong khoảng thời gian nghiên cứu cũng như xu hướng vận động của nó. Để có cái nhìn tổng quan hơn ta nên kết hợp phương pháp dự đoán với phân tích dãy số thời gian, kết hợp với mô hình hồi quy.Trong đó phải đảm bảo tính hệ thống của các phương pháp và ý nghĩa thực tế của sự kết hợp đó.
Để dự đoán có kết quả tốt nhất nên chọn số liệu của hiện tượng cần nghiên cứu là dãy số thời gian có ít nhất từ 7 đến 10 mức độ nghiên cứu.
Về phương diện thực hành,ta nên áp dụng phần mềm SPSS để cho kết quả nhanh và chính xác nhất. Việc sử dụng phần mềm này đòi hỏi phải có trình độ chuyên môn về tin học thống kê để xử lý tài liệu thống kê theo một số phương pháp nghiên cứu thông dụng.
Sự biến động của các hiện tượng hay quá trình kinh tế đều có mối liên hệ và tác động lẫn nhau, vì vậy không chỉ dùng đơn lẻ một chỉ tiêu để dự đoán hiện tượng mà phải có sự kết hợp nhiều chỉ tiêu thống kê thích hợp.
KẾT LUẬN
Lênin đã từng nói: “ Nếu xét bất kỳ hiện tượng kinh tế- xã hội nào trong quá trình phát triển của nó thì bao giờ người ta cũng tìm thấy trong đó dấu vết của quá khứ, cơ sở của hiện tại và mầm sống của tương lai”. Đứng ở góc độ của nhà quản lý, nhà nghiên cứu muốn đưa ra quyết định, chính sách trong bất kỳ một lĩnh vực nào, đòi hỏi phải có tầm nhìn chiến lược, phải có kế hoạch cho tương lai. Do đó, sử dụng phương pháp dự đoán thống kê sẽ là công cụ, phương tiện hữu ích để nhà quản lý sử dụng để đưa ra quyết định hay là mục tiêu trong tương lai.
Trong những năm qua, Việt Nam đã đạt được những kết quả khả quan và khá toàn diện. Nền kinh tế đạt tốc độ tăng trưởng khá cao liên tục trong nhiều năm; cơ cấu kinh tế đã có bước chuyển dịch theo hướng tích cực theo hướng công nghiệp hóa hiện đại hóa.
Những thành quả đạt được trong giai đoạn 1990-2006 cho thấy nền kinh tế Việt Nam đang trên đà tăng trưởng ổn định, và là điểm thu hút của các nhà đầu tư. Cùng với việc gia nhập WTO, Việt Nam đang đứng trước nhiều cơ hội lớn. Đó là sự gia tăng lượng vốn đầu tư, tiếp cận công nghệ hiện đại của nền kinh tế tri thức và mở rộng thị trường ra thế giới,…là những yếu tố thúc đẩy tăng trưởng kinh tế. Tuy nhiên thách thức đặt ra là làm thế nào để giữ vững tốc độ tăng trưởng cao theo hướng bền vững, tức là gắn với việc chuyển dịch cơ cấu, nâng cao hiệu quả đầu tư và chất lượng lao động,…
Để đạt được mục tiêu đến năm 2020 nước ta cơ bản trở thành một nước công nghiệp hiện đại với tỷ trọng khu vực nông nghiệp chiếm 5 % cơ cấu GDP, đòi hỏi sự nỗ lực lớn và những chính sách điều chỉnh cơ cấu nền kinh tế một cách thích hợp của Nhà Nước. Đồng thời, nâng cao chất lượng nguồn nhân lực hiện có, là một trong những yếu tố tăng khả năng cạnh tranh của nền kinh tế so với các nước trên thế giới.
Danh mục tài liệu tham khảo
1. Giáo trình Lý thuyết thống kê
2. Niên giám thống kê năm 2006
3. Tạp chí kinh tế và phát triển
4. Thông tin khoa học thống kê
5. Trang web của Tổng cục thống kê (
MỤC LỤC
Trang
Các file đính kèm theo tài liệu này:
- 36091.doc