Giáo trình Phân tích dữ liệu và dự báo kinh tế (Phần 1)

Dự đoán bằng san bằng mũ * Mô hình đơn giản - Nhập tài liệu - Analyze/ Time Serier/ Exponential Smoothing - Save/ Do not create/ Continue/ OK - Đưa Y vào hình vuông bên phải - Simple/ Parameters/ Grid search (nằm trong hình vuông thứ nhất General)/ Continue/ OK * Mô hình xu thế tuyến tính không biến động thời vụ - Chọn Holt/ Parameters/ Grid Search (có chữ General hình vuông bên trái)/ Grid Search (hình vuông bên phải có chữ Trend) - Continue/ OK - Parameters - Nhấp chuột vào Value (trái) – đánh số 0.9 - Nhấp chuột vào Value (phải) – đánh số 0.0 - Continue/ Save/ Predict through/ đánh số năm cần dự báo vào ô Year/ Continue/ OK/ Đóng của màn hình Output sẽ có kết quả dự báo * Mô hình xu thế tuyến tính có biến động thời vụ - Nhập tài liệu - Define Dates/ Year Quarters/ đánh số năm đầu tiên trong dãy số vào hình chữ nhật thứ nhất. - Analyze/ Time Serier/ Exponental Smoothing/ Winters - Đưa Y vào hình vuông dưới chữ Variables - Đưa Quarters vào hình chữ nhật dưới chữ Seasonal - Parameters/ Grid Search ở trong các hình vuông của General (Alpha), Trend (Gramma), Seasonal (Delta)/ Continue/ OK./.

pdf51 trang | Chia sẻ: hachi492 | Ngày: 15/01/2022 | Lượt xem: 220 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Giáo trình Phân tích dữ liệu và dự báo kinh tế (Phần 1), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
3 10,7 12 95 90,7 4,3 94,8 0,2 97,5 2,5 13 115 91,1 23,9 94,8 20,2 96,8 18,2 14 120 93,5 26,5 98,8 21,2 102,3 17,7 15 80 96,2 16,2 103,0 23,0 107,6 27,8 16 95 94,6 0,4 98,4 3,4 99,3 4,3 17 100 94,6 5,4 97,7 2,3 98,0 2,0 Tổng độ lệch tuyệt đối 133,9 124,4 126,0 MAD 13,39 12,44 12,6 − Hệ số điều hòa α = 0,2 cho chúng ta độ chính xác cao hơn α = 0,1 và α = 0,3. Sử dụng α = 0,2 để tính dự báo cho tuần thứ 18 : F18 = F17 + α ( A17 - F17) = 97,7 + 0,2(100 - 97,7) = 98,2 hay 982 triệu đồng. * Phương pháp điều hòa mũ theo xu hướng Chúng ta thường xem xét kế hoạch ngắn hạn, thì mùa vụ và xu hướng là nhân tố không quan trọng. Khi chúng ta chuyển từ dự báo ngắn hạn sang dự báo trung hạn thì mùa vụ và xu hướng trở nên quan trọng hơn. Kết hợp nhân tố xu hướng vào dự báo điều hòa mũ được gọi là điều hòa mũ theo xu hướng hay điều hòa đôi. Vì ước lượng cho số trung bình và ước lượng cho xu hướng cho số trung bình và hệ số điều hòa  được điều hòa cả hai. Hệ số điều hòa cho xu hướng, được sử dụng trong mô hình này  Công thức tính toán như sau: FTt = St - 1 + T t - 1(At -FTt ) Với: St = FTt + (FTt - FTt - 1 - Tt - 1 )Tt = Tt - 1 13 Trong đó FTt - Dự báo theo xu hướng trong giai đoạn t St - Dự báo đã được điều hòa trong giai đoạn t Tt - Ước lượng xu hướng trong giai đoạn t At - Số liệu thực tế trong giai đoạn t t - Thời đoạn kế tiếp. t-1 - Thời đoạn trước.  - Hệ số điều hòa trung bình có giá trị từ 0  1  - Hệ số điều hòa theo xu hướng có giá trị từ 0  1 Ví dụ: Ông A muốn dự báo số lượng hàng bán ra của công ty để nhằm lên kế hoạch tiền mặt, nhân sự và nhu cầu năng lực cho tương lai. Ông tin rằng trong suốt giai đoạn 6 tháng qua, số liệu lượng hàng bán ra có thể đại diện cho tương lai. Ông xây dự báo điều hòa mũ theo xu hướng nếu cho số =0,3 và số liệu bán ra trong quá khứ  = 0,2 ;  lượng hàng bán ra ở tháng thứ 7 như sau (đơn vị: 10 Triệu đồng). Tháng (t) 1 2 136 3 4 5 6 Doanh số bán (At) 130 134 140 146 150 Kết quả bài toán: Chúng ta ước lượng dự báo bắt đầu vào tháng 1 bằng dự báo sơ bộ, tức là bằng số liệu thực tế. Ta có: FT1 = A1 = 130 Chúng ta ước lượng phần tử xu hướng bắt đầu. Phương pháp để ước lượng phần tử xu hướng là lấy số liệu thực tế của tháng cuối cùng trừ số liệu thực tế tháng đầu tiên, sau đó chia cho số giai đoạn trong kỳ đang xét. T1  A6  A1  150 130  4 5 5 Sử dụng dự báo sơ bộ và phần tử xu hướng bắt đầu để tính dự báo doanh số bán ra trong từng tháng cho đến tháng thứ 7. Dự báo theo xu hướng cho tháng thứ 2: FT2 = S1 + T1 14 (A1 - FT1 ) = 130 + 0,2( 130 - 130 ) =S1 = FT1 + 130 T1 = 4 FT2 = 130 + 4 = 134 Dự báo theo xu hướng cho tháng thứ 3: FT3 = S2 + T2 (A2 - FT2 ) = 134 + 0,2( 136 - 134 ) =S2 = FT2 + 134,4 (FT2 - FT1 - T1 ) = 4 + 0,3 (134 - 130 -T2 = T1 + 4) = 4 FT3 = S2 + T2 = 134,4 + 4 = 138,4 Dự báo tương tự cho các tháng 4, 5, 6, 7 ta được bảng sau: Tháng (t) Doanh số bán (At) St - 1 Tt - 1 FTt 1 130 - - 130,00 2 136 130,00 4,00 134,00 3 134 134,40 4,00 138,40 4 140 137,52 4,12 141,64 5 146 141,31 3,86 145,17 6 150 145,34 3,76 149,10 7 - 149,28 3,81 153,09 1.4.2.2. Dự báo dài hạn Dự báo dài hạn là ước lượng tương lai trong thời gian dài, thường hơn một năm. Dự báo dài hạn rất cần thiết trong quản trị sản xuất để trợ giúp các quyết định chiến lược về hoạch định sản phẩm, quy trình công nghệ và các phương tiện sản xuất. Ví dụ như: - Thiết kế sản phẩm mới. - Xác định năng lực sản xuất cần thiết là bao nhiêu? Máy móc, thiết bị nào cần sử dụng và chúng được đặt ở đâu ? - Lên lịch trình cho những nhà cung ứng theo các hợp đồng cung cấp nguyên vật liệu dài hạn Dự báo dài hạn có thể được xây dựng bằng cách vẽ một đường thẳng đi xuyên qua các số liệu quá khứ và kéo dài nó đến tương lai. Dự báo trong giai đoạn kế tiếp có thể được vẽ vượt ra khỏi đồ thị thông thường. Phương pháp tiếp cận theo kiểu đồ thị đối với dự báo 15 dài hạn có thể dùng trong thực tế, nhưng điểm không thuận lợi của nó là vấn đề vẽ một đường tương ứng hợp lý nhất đi qua các số liệu quá khứ này. Doanh số Đường xu hướng Thời gian Phân tích hồi qui sẽ cung cấp cho chúng ta một phương pháp làm việc chính xác để xây dựng đường dự báo theo xu hướng. * Phương pháp hồi qui tuyến tính. Phân tích hồi qui tuyến tính là một mô hình dự báo thiết lập mối quan hệ giữa biến phụ thuộc với hai hay nhiều biến độc lập. Trong phần này, chúng ta chỉ xét đến một biến độc lập duy nhất. Nếu số liệu là một chuỗi theo thời gian thì biến độc lập là giai đoạn thời gian và biến phụ thuộc thông thường là doanh số bán ra hay bất kỳ chỉ tiêu nào khác mà ta muốn dự báo. Mô hình này có công thức:Y = ax + b a = n∑ xy  ∑ x∑ y n∑ x2  (∑ x)2 ∑ x2 ∑ y  ∑ x∑ xy n∑ x 2  (∑ x)2 Trong đó : y - Biến phụ thuộc cần dự báo. x - Biến độc lập a - Độ dốc của đường xu hướng b - Tung độ gốc n - Số lượng quan sát b = 16 Trong trường hợp biến độc lập x được trình bày thông qua từng giai đoạn theo thời gian và chúng phải cách đều nhau ( như : x = 0 . Vì vậy ∑2002, 2003, 2004...) thì ta có thể điều chỉnh lại để sao cho việc tính toán sẽ trở nên đơn giản và dễ dàng hơn nhiều. Nếu có một số lẻ lượng mốc thời gian: chẳng hạn x = 0 ∑ là 5, thì giá trị của x được ấn định như sau : -2, -1, 0, 1, 2 và như thế giá trị của x được sử dụng cho dự báo trong năm tới là +3. Nếu có một số chẵn lượng mốc thời gian: chẳng hạn x = 0 và ∑ là 6 thì giá trị của x được ấn định là : -5, -3, -1, 1, 3, 5. Như thế giá trị của x được dùng cho dự báo trong năm tới là +7. Ví dụ: Một hãng sản xuất loại động cơ điện tử cho các van khởi động trong ngành công nghiệp, nhà máy hoạt động gần hết công suất suốt một năm nay. Ông J, người quản lý nhà máy nghĩ rằng sự tăng trưởng trong doanh số bán ra vẫn còn tiếp tục và ông ta muốn xây dựng một dự báo dài hạn để hoạch định nhu cầu về máy móc thiết bị trong 3 năm tới. Số lượng bán ra trong 10 năm qua được ghi lại như sau: Năm Số lượng bán Năm Số lượng bán 1 1.000 6 2.000 2 1.300 7 2.200 3 1.800 8 2.600 4 2.000 9 2.900 5 2.000 10 3.200 Kết quả bài toán: Ta xây dựng bảng tính để thiết lập các giá trị: 17 Năm Lượng bán (y) Thời gian (x) x2 xy 1 1.000 -9 81 -9.000 2 1.300 -7 49 -9.100 3 1.800 -5 25 -9.000 4 2.000 -3 9 -6.000 5 2.000 -1 1 -2.000 6 2.000 1 1 2.000 7 2.200 3 9 6.600 8 2.600 5 25 13.000 9 2.900 7 49 20.300 10 3.200 9 81 28.800 Tổng 21.000 0 330 35.600 n∑xy−∑x∑y ∑xy 3.5600 - a= == = 107,8 n∑x2−( ∑x)2 ∑x2 = 330 ∑x2∑y−∑x∑xy ∑y 21.000 b= = = n∑x2−( ∑x)2 n = 2.100 10 - Dùng phương trình hồi qui tuyến tính để dự báo hàng bán ra trong tương lai: Y = ax + b = 107,8x + 2.100 Để dự báo cho hàng bán ra trong 3 năm tới ta thay giá trị của x lần lượt là 11, 13, 15 vào phương trình. Y11 = 107,8 . 11 + 2.100 = 3.285  3.290 đơn vị 18 Y12 = 107,8 . 13 + 2.100 = 3.501 3.500 đơn vị Y13 = 107,8 . 15 + 2.100 = 3.717  3.720 đơn vị Trường hợp biến độc lập không phải là biến thời gian, hồi qui tuyến tính là một nhóm các mô hình dự báo được gọi là mô hình nhân quả. Mô hình này đưa ra các dự báo sau khi thiết lập và đo lường các biến phụ thuộc với một hay nhiều biến độc lập. Ví dụ: Ông B, nhà tổng quản lý của công ty kỹ nghệ chính xác nghĩ rằng các dịch vụ kỹ nghệ của công ty ông ta được cung ứng cho các công ty xây dựng thì có quan hệ trực tiếp đến số hợp đồng xây dựng trong vùng của ông ta. Ông B yêu cầu kỹ sư dưới quyền, tiến hành phân tích hồi qui tuyến tính dựa trên các số liệu quá khứ và vạch ra kế hoạch như sau : - Xây dựng một phương trình hồi qui cho dự báo mức độ nhu cầu về dịch vụ của công ty ông. - Sử dụng phương trình hồi qui để dự báo mức độ nhu cầu trong 4 quí tới. Ước lượng trị giá hợp đồng 4 quí tới là 260, 290, 300 và 270 (ĐVT:10 Triệu đồng). - Xác định mức độ chặt chẽ, các mối liên hệ giữa nhu cầu và hợp đồng xây dựng được đưa ra. Biết số liệu từng quí trong 2 năm qua cho trong bảng:(đơn vị: 10 Triệu đồng). Năm Qúi Nhu cầu của công ty Trị giá hợp đồng thực hiện 1 1 8 150 2 10 170 3 15 190 4 9 170 2 1 12 180 2 13 190 3 12 200 4 16 220 Kết quả bài toán: Xây dựng phương trình hồi qui. Ông A xây dựng bảng tính như sau: 19 Thời gian Nhu cầu (y) Trị giá hợp đồng (x) x2 xy y 2 1 8 150 22.500 1.200 64 2 10 170 28.900 1.700 100 3 15 190 36.100 2.850 225 4 9 170 28.900 1.530 81 5 12 180 32.400 2.160 144 6 13 190 36.100 2.470 169 7 12 200 40.000 2.400 144 8 16 220 48.400 3.520 256 Tổng 95 1.470 273.300 17.830 1.183 Sử dụng công thức ta tính toán được hệ số a = 0,1173 ; b = -9,671 Phương trình hồi qui tìm được là:Y = 0,1173x  9,671 Dự báo nhu cầu cho 4 quí tới: Ông A dự báo nhu cầu của công ty bằng cách sử dụng phương trình trên cho 4 quí tới như sau: Y1 = (0,1173 x 260) - 9,671 = 20,827;Y2 = (0,1173 x 290) - 9,671 = 24,346 Y3 = (0,1173 x 300 )- 9,671 = 25,519;Y4 = (0,1173 x 270) - 9,671 = 22,000 Dự báo tổng cộng cho năm tới là: Y = Y1+ Y2 +Y3 +Y4 = 20,827+ 24,346+25,519+22,000= 930triệu đồng. 92,7 Đánh giá mức độ chặt chẽ mối liên hệ của nhu cầu với số lượng hợp đồng xây dựng n∑xy−∑x∑y r = [n∑x2−( ∑x)2][n∑y2−( ∑y)2] 8x17.830−1.470x95 2.990 = =  0.894 (8x273.300−14702)(8x1.183−952) 3.345,8 r2 = 0,799;trong đó r là hệ số tương quan và r2 là hệ số xác định Rõ ràng là số lượng hợp đồng xây dựng có ảnh hưởng khoảng 80% ( r2 = 0,799 ) của biến số được quan sát về nhu cầu hàng quí của công ty. 20 0 Hệ số tương quan r giải thích tầm quan trọng tương đối của mối quan hệ giữa y và x; dấu của r cho biết hướng của mối quan hệ và giá +1. Dấutrị tuyệt đối của r chỉ cường độ của mối quan hệ, r có giá trị từ -1 của r luôn luôn cùng với dấu của hệ số a. Nếu r âm chỉ ra rằng giá trị của y và x có khuynh hướng đi ngược chiều nhau, nếu r dương cho thấy giá trị của y và x đi cùng chiều nhau. Dưới đây là vài giá trị của r: r = -1. Quan hệ ngược chiều hoàn toàn, khi y tăng lên thì x giảm xuống và ngược lại. r = +1. Quan hệ cùng chiều hoàn toàn, khi y tăng lên thì x cũng tăng và ngược lại. r = 0. Không có mối quan hệ giữa x và y. * Tính chất mùa vụ trong dự báo chuỗi thời gian. Loại mùa vụ thông thường là sự lên xuống xảy ra trong vòng một năm và có xu hướng lặp lại hàng năm. Những vụ mùa này xảy ra có thể do điều kiện thời tiết, địa lý hoặc do tập quán của người tiêu dùng khác nhau... Cách thức xây dựng dự báo với phân tích hồi qui tuyến tính khi vụ mùa hiện diện trong chuỗi số theo thời gian. Ta thực hiện các bước: - Chọn lựa chuỗi số liệu quá khứ đại diện. - Xây dựng chỉ số mùa vụ cho từng giai đoạn thời gian. Y I  i i Y 0 Y Với i - Số bình quân của các thời kỳ cùng tên Y - Số bình quân chung của tất cả các thời kỳ trong dãy số. Ii - Chỉ số mùa vụ kỳ thứ i. - Sử dụng các chỉ số mùa vụ để hóa giải tính chất mùa vụ của số liệu. - Phân tích hồi qui tuyến tính dựa trên số liệu đã phi mùa vụ. - Sử dụng phương trình hồi qui để dự báo cho tương lai. - Sử dụng chỉ số mùa vụ để tái ứng dụng tính chất mùa vụ cho dự báo. 21 Ví dụ: Ông J nhà quản lý nhà máy động cơ đặc biệt đang cố gắng lập kế hoạch tiền mặt và nhu cầu nguyên vật liệu cho từng quí của năm tới. Số liệu về lượng hàng bán ra trong vòng 3 năm qua phản ánh khá tốt kiểu sản lượng mùa vụ và có thể giống như trong tương lai. Số liệu cụ thể như sau: Năm Số lượng bán hàng quí (1.000 đơn vị) Q1 Q2 Q3 Q4 1 520 730 820 530 2 590 810 900 600 3 650 900 1 650 Kết quả bài toán: Đầu tiên ta tính toán các chỉ số mùa vụ. Năm Quí 1 Quí 2 Quí 3 Quí 4 Cả năm 1 520 730 820 530 2.600 2 590 810 900 600 2.900 3 650 900 1.000 650 3.200 Tổng 1.760 2.440 2.720 1.780 8.700 Trung bình quí 586,67 813,33 906,67 593,33 725 Chỉ số mùa vụ 0,809 1,122 1,251 0,818 - Kế tiếp, hóa giải tính chất mùa vụ của số liệu bằng cách chia giá trị của từng quí cho chỉ số mùa vụ tương ứng. Chẳng hạn : 520/0,809 = 642,8 ; 730/1,122 = 605,6 ... Ta được bảng số liệu như sau: Năm Số liệu hàng quí đã phi mùa vụ. Quí 1 Quí 2 Quí 3 Quí 4 1 642,8 650,6 655,5 647,9 2 729,2 721,9 719,4 733,5 3 803,5 802,1 799,4 794,6 Chúng ta phân tích hồi qui trên cơ sở số liệu phi mùa vụ (12 quí) và xác định phương trình hồi qui. 22 Qúi X y x 2 xy Q11 1 642,8 1 642,8 Q12 2 650,6 4 1.301,2 Q13 3 655,5 9 1.966,5 Q14 4 647,9 16 2.591,6 Q21 5 729,3 25 3.646,5 Q22 6 721,9 36 4.331,4 Q23 7 719,4 49 5.035,8 Q24 8 733,5 64 5.868,0 Q31 9 803,5 81 7.231,5 Q32 10 802,1 100 8.021,0 Q33 11 799,4 121 8.793,4 Q34 12 794,6 144 8.535,2 Tổng 78 8.700,5 650 58.964,9 Xác định được hệ số a = 16,865 và b = 615,421 . Phương trình có dạng: Y = 16,865x + 615,421 Bây giờ chúng ta thay thế giá trị của x cho 4 quí tới bằng 13, 14, 15, 16 vào phương trình. Đây là dự báo phi mùa vụ trong 4 quí tới. Y41 = (16,865 x 13) + 615,421 = 834,666 Y42 = (16,865 x 14) + 615,421 = 851,531 Y43 = (16,865 x 15) + 615,421 = 868,396 Y44 = (16,865 x 16) + 615,421 = 885,261 Tiếp theo, ta sử dụng chỉ số mùa vụ để mùa vụ hóa các số liệu. Quí Chỉ số mùa vụ (I) Dự báo phi mùa vụ (Yi) Dự báo mùa vụ hóa (Ymv) 1 0,809 834,666 675 2 1,122 851,531 955 3 1,251 868,396 1.086 4 0,818 885,261 724 23 1.5. Quy trình dự báo Quy trình dự báo được chia thành 9 bước. Các bước này bắt đầu và kết thúc với sự trao đổi (communication), hợp tác (cooperation) và cộng tác (collaboration) giữa những người sử dụng và những người làm dự báo Bước 1: Xác định mục tiêu - Các mục tiêu liên quan đến các quyết định cần đến dự báo phải được nói rõ. Nếu quyết định vẫn không thay đổi bất kể có dự báo hay không thì mọi nỗ lực thực hiện dự báo cũng vô ích. - Nếu người sử dụng và người làm dự báo có cơ hội thảo luận các mục tiêu và kết quả dự báo sẽ được sử dụng như thế nào, thì kết quả dự báo sẽ có ý nghĩa quan trọng. Bước 2: Xác định dự báo cái gì - Khi các mục tiêu tổng quát đã rõ ta phải xác định chính xác là dự báo cái gì (cần có sự trao đổi) + Ví dụ: Chỉ nói dư báo doanh số không thì chưa đủ, mà cần phải hỏi rõ hơn là: Dự báo doanh thu bán hàng (sales revenue) hay số đơn vị doanh số (unit sales). Dự báo theo năm, quý, tháng hay tuần. + Nên dự báo theo đơn vị để tránh những thay đổi của giá cả. Bước 3: Xác định khía cạnh thời gian Có 2 loại khía cạnh thời gian cần xem xét: - Thứ nhất: Độ dài dự báo, cần lưu ý: + Đối với dự báo theo năm: từ 1 đến 5 năm + Đối với dự báo quý: từ 1 hoặc 2 năm + Đối với dự báo tháng: từ 12 đến 18 tháng - Thứ hai: Người sử dụng và người làm dự báo phải thống nhất tính cấp thiết của dự báo Bước 4: Xem xét dữ liệu - Dữ liệu cần để dự báo có thể từ 2 nguồn: bên trong và bên ngoài - Cần phải lưu ý dạng dữ liệu sẵn có ( thời gian, đơn vị tính,) 24 - Dữ liệu thường được tổng hợp theo cả biến và thời gian, nhưng tốt nhất là thu thập dữ liệu chưa được tổng hợp - Cần trao đổi giữa người sử dụng và người làm dự báo Bước 5: Lựa chọn mô hình - Làm sao để quyết định được phương pháp thích hợp nhất cho một tình huống nhất định? + Loại và lượng dữ liệu sẵn có + Mô hình (bản chất) dữ liệu quá khứ + Tính cấp thiết của dự báo + Độ dài dự báo + Kiến thức chuyên môn của người làm dự báo Bước 6: Đánh giá mô hình - Đối với các phương pháp định tính thì bước này ít phù hợp hơn so với phương pháp định lượng - Đối với các phương pháp định lượng, cần phải đánh giá mức độ phù hợp của mô hình (trong phạm vi mẫu dữ liệu) - Đánh giá mức độ chính xác của dự báo (ngoài phạm vi mẫu dữ liệu) - Nếu mô hình không phù hợp, quay lại bước 5 Bước 7: Chuẩn bị dự báo - Nếu có thể nên sử dụng hơn một phương pháp dự báo, và nên là những loại phương pháp khác nhau (ví dụ mô hình hồi quy và san mũ Holt, thay vì cả 2 mô hình hồi quy khác nhau) - Các phương pháp được chọn nên được sử dụng để chuẩn bị cho một số các dự báo (ví vụ trường hợp xấu nhất, tốt nhất và có thể nhất) Bước 8: Trình bày kết quả dự báo - Kết quả dự báo phải được trình bày rõ ràng cho ban quản lý sao cho họ hiểu các con số được tính toán như thế nào và chỉ ra sự tin cậy trong kết quả dự báo - Người dự báo phải có khả năng trao đổi các kết quả dự báo theo ngôn ngữ mà các nhà quản lý hiểu được 25 - Trình bày cả ở dạng viết và dạng nói - Bảng biểu phải ngắn gọn, rõ ràng - Chỉ cần trình bày các quan sát và dự báo gần đây thôi - Chuỗi dữ liệu dài có thể được trình bày dưới dạng đồ thị (cả giá trị thực và dự báo) - Trình bày thuyết trình nên theo cùng hình thức và cùng mức độ với phần trình bày viết Bước 9: Theo dõi kết quả dự báo - Lệch giữa giá trị dự báo và giá trị thực phải được thảo luận một cách tích cực, khách quan và cởi mở - Mục tiêu của việc thảo luận là để hiểu tại sao có các sai số, để xác định độ lớn của sai số - Trao đổi và hợp tác giữa người sử dụng và người làm dự báo có vai trò rất quan trọng trong việc xây dựng và duy trì quy trình dự báo thành công. 26 Chương 2: CÁC PHƯƠNG PHÁP PHÂN TÍCH VÀ DỰ BÁO Có nhiều phương pháp dự báo thống kê khác nhau ( phương pháp lấy ý kiến chuyên gia, dự báo từng mức độ bình quân, ngoại suy hàm xu thế, nhưng không phải phương pháp nào cũng được sử dụng phổ biến như nhau. Vì vậy, trong phần này chỉ trình bày một số phương pháp thông dụng nhất và giới thiệu một số phương pháp đang có xu hướng sử dụng nhiều trong thực tế hiện nay. 2.1. Dự báo từ các mức độ bình quân 2.1.1. Dự báo từ số bình quân trượt (di động) Phương pháp số bình quân di động là một trong những phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nghiên cứu, hay nói cách khác, mô hình hoá sự phát triển thực tế của hiện tượng nghiên cứu dưới dạng dãy các số bình quân di động. Phương pháp bình quân di động còn được sử dụng trong dự báo thống kê. Trên cơ sở xây dựng một dãy số bình quân di động, người ta xây dựng mô hình dự báo. Ví dụ, có dãy số thời gian về sản lượng thép của doanh nghiệp A trong 12 tháng theo bảng sau: Thời gian Sản lượng (triệu tấn) (yi) Doanh số trung bình di động (triệu tấn) (Mi) 1 79 - 2 82 - 3 85 82 4 82 83 5 88 85 6 86 85,3 7 98 90,6 8 105 96,3 9 110 104,3 10 115 110 11 120 115 12 118 117,6 27 ( y  M ) k 1 (85  82)2  (82  83)2  (88  85)2  (86  85, 3)2  (98  90, 6)2  (105  96, 3)2 (110 104, 3)2  (115 110)2  (120 115)2  (118 117, 6)2 3 1 1 1 Như vậy, ứng với tháng 3 ta có số bình quân di động là 82 triệu tấn, tháng 4 là 83 triệu tấn, v.v và cuối cùng tháng 12 là 117,6 triệu tấn. Ta gọi các số bình quân di động mới này là Mi (i = k, k + 1, k + 2,n), trong đó k là khoảng cách thời gian san bằng ( ở đây k = 3, bình quân từ 3 mức độ thực tế). Mô hình dự báo là: ŷn+1 = Mn Khoảng dự báo sẽ được xác định theo công thức sau: ŷn+L ± t S (2.1) Trong đó t là giá trị tra trong bảng tiêu chuẩn t- Student với (k-1) bậc tự do và xác suất tin cậy (1-α). Độ lệch tiêu chuẩn mẫu điều chỉnh được tính theo công thức sau: S = (2.2) Theo ví dụ trên ta tính được: S = = 10,78 Trong ví dụ trên, dự đoán sản lượng thép cho tháng 1 năm sau là: Y13 = 117,6 triệu tấn Theo công thức trên ta tính được S = 10,78 nghìn tấn và t = 2,92 với xác suất tin cậy (1-α) = 0,95 ( xác suất đạt 95%) và số bậc tự do bằng 2. Do đó khoảng dự đoán về sản lượng thép tháng 1 năm sau sẽ nằm trong khoảng: 117,6 ± (2,92 x 10,78) = 117,6 ± 36,35 2.1.2. Mô hình dự báo dựa vào lượng tăng (giảm) tuyệt đối bình quân - Phương pháp này được sử dụng trong trường hợp lượng tăng ( giảm) tuyệt đối liên hoàn xấp xỉ nhau qua các năm (dãy số thời gian có dạng gần giống như cấp số công):  y  y  y xấp xỉ nhau (i= z  n). i i1 Mô hình dự báo theo phương trình:   Y nL = y n +  y .L Trong đó: (2.3) 1 1 28  Y nL : Mức độ dự đoán ở thời gian (n+L) y n : Mức độ cuối cùng của dãy số thời gian  y : Lượng tăng, giảm tuyệt đối bình quân L: Tầm xa của dự đoán ( L=1,2,3,năm) Trong đó:   ∑( yi  yi1 ) (i  2, n) y n  1 = yn  y1 n  1 Ví dụ: Giá trị sản xuất (GO)của một doanh nghiệp A qua các năm như sau: Thời gian Chỉ tiêu 2001 2002 2003 2004 2005 2006 Giá trị sản xuất (GO) (tỷ đồng 32 36 39 41 43 45 Ta có:  y = 45  32 6 1 = 2,6 tỷ Dự báo GO của doanh nghiệp cho năm 2007 L=1. Ta có phương trình:  Y 20061  Y2006  2, 6 *1  Y 2007 = 45+ 2,6= 47,6 (tỷ) Dự báo GO của doanh nghiệp năm 2008  Y 2008 = 45+ 2,6x2= 50,2(tỷ) Tương tự, dự báo cho GO năm 2011 ( tầm xa xủa dự báo là 5)  Y 2011 = 45+ 2,6x5= 58 (tỷ) 2.1.3. Mô hình dự báo dựa vào tốc độ phát triển bình quân Thường áp dụng trong trường hợp các mức độ của dãy số biến động theo thời gian có tộc độ phát triển ( hoặc tốc độ tăng, giảm) từng kỳ gần nhau (dãy số thời gian có dạng gần như cấp số nhân). Có hai mô hình dự đoán: 29 n 1 2 5 * Dự doán mức độ hàng năm: (có thể dùng để dự báo trong dài hạn). - Phương pháp này được áp dụng khi tốc độ phát triển hoàn toàn xấp xỉ nhau. - Mô hình dự đoán:  Y nL = y . t  L (2.4)  Y nL : Mức độ dự đoán ở thời gian (n+L) y n : Mức độ được dùng làm kỳ gốc để ngoại suy L: Tầm xa của dự đoán ( L=1,2,3,năm) t : Tốc độ phát triển bình quân hàng năm t  n1 yn y1 45 Với ví dụ trên ta có: t  61  1, 071 32 Dự đoán cho năm 2007 ( Ta chọn năm gốc là năm cuối cùng trong dãy số -2006) Theo công thức trên, GO của doanh nghiệp là: Năm 2007: Năm 2008:  Y 2007 = 45x (1,071) = 48,18 (tỷ)  Y 2008 = 45x (1,071) = 51,5 (tỷ) Tương tự GO của năm 2011 là:  Y 2011 = 45x (1,071) = 63,4 (tỷ) * Dự đoán mức độ của khoảng thời gian dưới 1 năm (quý, tháng- dự báo ngắn hạn)  Y ij  y j t  S i1 (2.5) r Trong đó:  Y ij : Là mức độ của hiện tượng ở thời gian j (j=1,m) của năm i n y j  ∑ Yij - Tổng các mức độ của thời gian j của năm i (i=1n) i1 yn t  n1 y1 : Tốc độ phát triển bình quân hàng Sr= 1 + ( t ) +( t )2 + ( t )3 ++ ( t )n-1 30   n: có thể là số năm hoặc số lượng mức độ của từng năm. Ví dụ: Có tài liệu về tình hình sản xuất một loại sản phẩm của xí nghiệp A như sau: Quý j Năm j I II III IV n y j  ∑ Yij i1 2004 20 21,5 22 23,5 86,55 2005 20,04 20,63 21,7 24,28 86,65 2006 21,04 22,83 23,5 25,63 93,03 yj 61,11 64,96 667,2 72,46 266,23 Từ bảng số liệu trên ta có: t  31 93, 03 86,55  1, 075 Sr= 1 + ( t ) +( t )2 = 1+ 1,075 +(1,075)2 = 3,231 - Dự đoán sản lượng cho các quý của năm 2007 ( i=4) 41 t = Sr 1, 075 3 3, 231 = 0,384 Tỷ lệ này dùng để điều tiết các khoảng thời gian của năm.  t  Y 4.I =yI. = 61,11. 0,384= 23,466 ( nghìn tấn) Sr  t  Y 4.II =yII. = 64,98. 0,384= 24,952 ( nghìn tấn) Sr  t  Y 4.III =yIII. = 67,2. 0,384= 25,805 ( nghìn tấn) Sr  t  Y 4.IV =yIV. = 72,46. 0,384= 27,825 ( nghìn tấn) Sr 3 3 3 3 31 2.2. Mô hình dự báo theo phương trình hồi quy (dự báo dựa vào xu thế) Từ xu hướng phát triển của hiện tượng nghiên cứu ta xác định được phương trình hồi quy lý thuyết, đó là phương trình phù hợp với xu hướng và đặc điểm biến động của hiện tượng nghiên cứu, từ đó có thể ngoại suy hàm xu thế để xác định mức độ phát triển trong tương lai. 2.2.1. Mô hình hồi quy theo thời gian - Ví dụ: Mô hình dự báo theo phương trình hồi quy đường thẳng:  Y = a+ bt (2.6) Trong đó: a,b là những tham số quy định vị trí của đường hồi quy Từ phương trình này, bằng phương pháp bình phương nhỏ nhất hoặc thông qua việc đặt thứ tự thời gian (t) trong dãy số để tính các tham số a,b. số sau: Nếu đặt thứ tự thời gian t sao cho ∑ t khác 0 ( ∑ t  0), ta có các công thức tính tham a  yt  y.t t 2  t2 b= y  a.t số sau: Nếu đặt thứ tự thời gian t sao cho ∑ t khác 0 ( ∑ t =0), ta có các công thức tính tham a  ∑ y  y n b  ∑ y.t t 2 Ví dụ: Hãy dự báo về doanh thu tiêu thụ của cửa hàng thương mại B trong những năm tiếp theo trên cơ sở bảng số liệu sau: Thời gian Chỉ tiêu 2001 2002 2003 2004 2005 2006 Doanh thu tiêu thụ (tỷ đồng) 70 98 115 120 136 180 Từ nguồn tài liệu, ta có bảng số liệu sau (đặt thứ tự thời gian cho ( ∑ t =0) 32 Năm (n) Doanh thu (tỷ đồng) yi Điều kiện đặt ∑ t =0 T t 2 y.t  Y 2001 70 -5 25 -350 72,045 2002 98 -3 9 -294 91,159 2003 115 -1 1 -115 120,27 2003 120 1 1 120 129,387 2005 136 3 9 408 148,58 2006 180 5 25 900 167,61 N= 6 719 ∑ t =0 ∑ t 2 = 70 ∑ yt = 669 Tính các tham số a và b theo điều kiện đặt ∑ t =0: a  ∑ y  y  719  119,83 b  ∑ y.t  669  9,557 n 6 t2 70  Hàm xu thế có dạng: Y = 119,83 +9,55t Từ hàm xu thế này ta có thể dự báo doanh thu của cửa hàng B trong những năm tiếp theo như sau:  Doanh thu của năm 2007 (t=7): Y 2007  119,83  9,557x7  186, 729  Doanh thu của năm 2008 (t=9): Y 2008  119,83  9,557x9  205,843  Doanh thu của năm 2009 (t=11): Y 2009  119,83  9,557x11  224,957  Doanh thu của năm 2010 (t=13): Y 2010  119,83  9,557x13  244, 071  Số liệu dự báo (Y ) và số liệu thực tế yi có sự chênh lệch là do có sai số trong dự đoán. + Sai số dự báo là sự chênh lệch giữa mức độ thực tế và mức độ tính toán theo mô hình dự báo. + Sai số dự báo phụ thuộc vào 03 yếu tố: độ biến thiên của tiêu thức trong thời kỳ trước, độ dài của thời gian của thời kỳ trước và độ dài của thời kỳ dự đoán. 33  (120 129,387)2  (136 148)2  (180 167, 61)2 6  2 + Vấn đề quan trọng nhất trong dự báo bằng ngoại suy hàm xu thế là lựa chọn hàm xu thế, xác định sai số dự đoán và khoảng dự đoán: - Công thức tính sai số chuẩn ( y )  y   Trong đó:  Y - Giá trị tính toán theo hàm xu thế n- Số các mức độ trong dãy số p- Số các tham số cần tìm trong mô hình xu thế n-p- Số bậc tự do Công thức này được dùng để lựa chọn dạng hàm xu thế (so sánh các sai số chuẩn tính được) sai số nào nhỏ nhất chứng tỏ rằng hàm tương ứng với sai số sẽ xấp xỉ tốt nhất và được lựa chọn làm hàm xu thế để dự đoán. Thông thường để việc dự đoán được tiến hành đơn giản ta vẫn chọn hàm xu thế làm hàm tuyến tính. - Công thức tính sai số dự báo: S□ p   y Trong đó: N: Số lương các mức độ L: Tầm xa của dự báo Sau đó xác định khoảng dự đoán theo công thức sau; ynL  t S$ p t - là giá trị theo bảng của tiêu chuẩn t- Student với (n-2) bậc tự do và xác suất tin cậy (t- ). Trở lại ví dụ trên ta đi tính  y  y   10,876 n  p ∑ yi  y 1   n 1 3(n  2L 1)2 n(n2  1) 34 Sai số dự báo: + Đối với năm 2007 (L=1): + Đối với năm 2008 (L=2): S□p 2007  10,876 S□p 2008  10,876  14,856  16,93 Với xác suất tin cậy là 0,95 và số bậc tự do (n)= 4 khi đó t =2,132 Ta có dự báo của năm 2007 là:186,729  2,132 x14,856= 186,729  31,67 Ta có dự báo của năm 2007 là:205,843  2,132 x16,93= 205,843  36... Như vậy ta đã chuyển từ dự báo điểm sang dự báo khoảng. 2.2.2. Mô hình hồi quy giữa các tiêu thức - Mô hình hồi quy tuyến tính giữa hai tiêu thức Từ việc xây dựng phương trình hồi quy tuyến tính giữa các tiêu thức đã nêu ở phần trên, ta có thể dự đoán các giá trị của Y trong tương lai khi các biến trong hàm hồi quy thay đổi, cụ thể: Đối với phương trình tuyến tính giản đơn: Yx= a+ bx Trong đó: a, b là những tham số quy định vị trí của đường hồi quy. Hằng số a là điểm cắt trục tung (biểu hiện của tiêu thức kết quả ) khi tiêu thức nguyên nhân x bằng 0. Độ dốc b chính là lượng tăng giảm của tiêu thức kết quả khi tiêu thức nguyên nhân thay đổi. Từ phương trình này, ta sẽ dự đoán được giá trị của tiêu thức kết quả trong tương lai khi có sự thay đổi của tiêu thức nguyên nhân. Tương tự như trong hồi quy giản đơn, trong hồi quy bội, giá trị dự đoán của Y có được tương ứng với các giá trị cho trước của k biến X bằng các thay các giá trị của k biến X vào phương trình hồi quy bội. Các giá trị cho trước của biến X lần lượt là x1,n+1,x2,n+1,,xk,n+1 thì giá trị dự đoán Yn+1 sẽ là: Yn+1= a+ b1. x1,n+1 + b2 x2,n+1++ bkxk,n+1 2.3. Dự báo dựa vào hàm xu thế và biến động thời vụ Phương pháp dự báo này áp dụng đối với hiện tượng nghiên cứu chịu tác động của nhiều nhân tố biến động. Như biến động thời vụ, biến động xu hướng và biến động bất thường. - Mô hình dự báo sẽ có thể dựa vào hàm xu thế kết hợp với biến động thời vụ: 1   1 3(6  21 1)2 6 6(62  1) 1   1 3(6  22 1)2 6(62  1) 35 Yt= Y□ +tv+bt (2.7) - Hoặc dự báo dựa vào hàm xu thế kết hợp nhân tố với biến động thời vụ: Yt= Y□ x tv xbt (2.8) Trong đó: Y□ : Mức độ lý thuyết xác định từ hàm xu thế ( hoặc các phương pháp nêu trên) tv: Ảnh hưởng của nhân tố thời vụ bt: Ảnh hưởng của nhân tố bất thường Nhìn chung, hàm xu thế, chỉ số thời vụ được xác định từng mô hình còn những nhân tố biến động bất thường thường không dự báo được, do vậy mô hình chỉ còn lại hai nhân tố: biến động xu hướng và biến động thời vụ. 2.3.1. Dự báo vào mô hình cộng Ví dụ: Có tài liệu về sản lượng của doanh nghiệp A như sau: Năm (t) Quý Sản lượng ( nghìn tấn) Công theo cùng quý ∑ y j Mức độ bình quân từng quý yi Chỉ số thời vụ I  yi tv y 2002 2003 2004 2005 2006 I 20 25 27 31 29 132 26,4 0,678 II 25 32 30 37 36 160 32 0,82 II 38 38 45 44 47 212 42,4 1,14 IV 40 60 55 62 58 275 55 1,41 Công theo cùng năm ∑ y j 123 155 157 174 170 779 38,95 ∑ t.y 123 310 471 696 850 - Trước tiên xác định hàm xu thế tuyến tính sản lượng doanh nghiệp có dạng là: Y□ = a+ bt 36 Trong đó: a, b là các tham số quy định vị trí của hàm xu thế tuyến tình, được tính theo công thức sau: b  12 ∑ t.y  n  1 ∑ y = m  1 12 2450  5  1 .779  0, 706 m.n(n2 1) m 2m j 2 4.5(52 1) 4 2.4 a  ∑ y j  b m.n 1 = 779  0, 706 4.5 1  31,537 m.n 2 4.5 2 Trong đó: n: Số năm m: Khoảng cách thời gian trong một năm ( m= 4 đối với quý, m=12 đối với năm) t: Thứ tự thời gian trong dãy số (năm) Do vậy, hàm xu thế có dạng: Y□ = 31,537 + 0,706t Mức độ bình quân một quý tính chung chi 5 năm: yi = 38,95 - Tính các mức độ mang tính thời vụ theo công thức sau: tv= yi - y j - b(i- m 1 ) với i= 1,2,3,4 2 Do vậy, mức độ dự báo về thời vụ cho các quý của năm 2007 như sau: - Quý I: (26,4- 38,95) – 0,706.(1- 4 1 )= - 11,49 2 - Quý II: (32- 38,95) – 0,706.(2- 4 1 )= - 6,597 2 - Quý III: (42,4- 38,95) – 0,706.(3- 4 1 )= 3,097 2 - Quý IV: (55- 38,95) – 0,706.(4- 4 1 )= 14,99 2 Sau khi xác định xong hàm xu thế và biến động thời vụ thì mô hình dự báo kết hợp cộng giữa xu thế biến động và tính thời vụ có dạng: Yt  Y □  tv 37 Dự báo sản lượng quý I năm 2007 ( t= 21) Y□1 = 31,537 + 0,706 x 21 – 11,49= 34,837 Quý II ( t=22): Y□2 = 31,537 + 0,706 x 22 – 6,597= 40,472 Cư tiếp tục như vậy cho đến các quý tiếp theo 2.3.2. Dự báo dựa vào mô hình nhân Mô hình dự báo theo kết hợp nhân có dạng: Yt= Y□ x tv (2.9) Để dự báo theo mô hình này, trước hết phải tính được hàm xu thế, hàm xu thế trong trường hợp này phải được loại trừ biến động thời vụ bằng cách xây dựng dãy số bình quân trượt ( yt ) với số lượng mức độ bằng 4 với tài liệu quý và 12 với tài liệu tháng. Từ đó ta tính được yt , từ đó xác định thành phần thời vụ (tvt) bằng cách tính các số y t bình quân tvt sau đó tính hệ số điều chỉnh H: H= m ∑ tvt ( với m= 4) đối với tài liệu quý, 12 đối với tài liệu tháng ) Từ đó tính chỉ số thời vụ Itv= tvt x H Sau khi xác định được tvt thì xác định dãy số ft là dãy số đã loại bỏ thành phần thời vụ như sau: ft  yt tvt Theo ví dụ trên ta có thể lập bảng tính toán sau đây: 38 yt yt STT Yt yt y tvt ft  tv t t 1 20 - - 0,7 28,57 2 25 - - 0,838 29,83 3 38 30,75 1,236 1,08 35,19 4 40 32 1,25 1,376 29,07 5 25 33,75 0,74 0,7 35,71 6 32 33,75 0,948 0,838 38,19 7 38 38,75 0,98 1,08 35,19 8 60 39,25 1,529 1,376 43,6 9 27 38,75 0,697 0,7 38,57 10 30 40,5 0,74 0,838 35,8 11 45 39,25 1,146 1,08 41,67 12 55 40,25 1,366 1,376 39,97 13 31 42 0,738 0,7 44,28 14 37 41,75 0,866 0,838 44,15 15 44 43,5 1,011 1,08 40,74 16 62 43 1,441 1,376 45,06 17 29 42,75 678 0,7 41,13 18 36 43,5 827 0,838 42,96 19 47 42,5 1,105 1,08 43,5 20 58 - - 1,376 42,15 Từ ft ta lập bảng sau: Quý Năm I II III IV 2002 - - 1,236 1,25 2003 0,74 0,948 0,98 1,529 2004 0,697 0,74 1,146 1,366 2005 0,738 0,886 1,011 1,441 2006 0,678 0,827 1,105 - Bình quân quý ( tvt ) 0,713 0,85 1,096 1,396 Với tài liệu trong bảng tính ta tính được các đại lượng trên như sau: 39 Quý II III IV Tổng năm (N) t.y 2002 2003 28,57 35,71 29,83 38,19 35,19 35,19 29,07 43,6 122,66 152,69 122,66 305,38 2004 38,57 35,8 41,67 39,97 156,01 468,03 2005 44,28 44,15 40,74 45,06 174,23 696,92 2006 41,43 42,96 43,5 42,15 170,04 Tổng quý (Q) 188,56 190,93 196,29 199,85 755,66 850,2 ∑ t.y = Bình quân quý 37,71 38,186 39,26 39,97 H= m ∑ tvt = 4 0, 713  0,85 1, 096 1, 036  0,986 * Trước tiên, tính các chỉ số thời vụ: Itv= tvt .H Quý I= 0,713 x 0,986 = 0,7 Quý II= 0,85 x 0,986 = 0,838 Quý I= 1,906 x 0,986 = 1,08 Quý I= 1,396 x 0,986 = 1,376 * Xây dựng hàm xu thế: Y□ = a+ bt Để tiện theo dõi, từ (ft) ta lập bảng sau: Các tham số của hàm xu thế được tính như sau: b  12 ∑ t.y  n 1 N = 12 2443,19  5 1 .775, 63  0, 727 m.n(n2 1) m 2m 4.5(52 1) 4 2.4 a  N  b m.n 1 = 775, 63  0, 727 4.5 1  29, 7 m.n 2 4.5 2 40 Hàm xu thế có dạng: Y□ = 29,7+ 0,727t Do đó mô hình nhân có dạng: yt= (29,7+0,727t).Itv Dự báo sản lượng của doanh nghiệp năm 2007 theo các quý là: - Quý I (t=21): Yt1= (29,7+ 0,727 x 21)x 0.7= 31,476 - Quý I (t=22): Yt2= (29,7+ 0,727 x 22)x 0.838= 38,29 - Quý I (t=23): Yt3= (29,7+ 0,727 x 23)x 1,08= 50,13 - Quý I (t=24): Yt4= (29,7+ 0,727 x 24)x 1,376= 64,875 Với hàm kết hợp nhân ta có thể dự báo cho những năm tiếp theo 2.4. Dự báo theo phương pháp san bằng mũ Phương pháp san bằng mũ ( hay còn gọi là phương pháp dự đoán bình quân mũ) là một phương pháp dự đoán thống kê ngắn hạn hiện được sử dụng nhiều trong công tác dự đoán thực tế trên thế giới. Nếu như một số phương pháp dự đoán thống kê đã đề cập ở trên coi giá trị thông tin của các mức độ trong dãy số thời gian là như nhau, phương pháp san bằng mũ lại coi giá trị thông tin của mỗi mức độ là tăng dần kể từ đầu dãy số cho đến cuối dãy số. Vì trên thực tế ở những thời gian khác nhau thì hiện tượng nghiên cứu chịu sự tác động của những nhân tố khác nhau và cường độ không giống nhau. Các mức độ ngày càng mới (ở cuối dãy số thời gian) càng cần phải được chú ý đến nhiều hơn so với các mức độ cũ ( ở đầu dãy số). Hay nói cách khác, mức độ càng xa so với thời điểm hiện tại thì càng ít giá trị thông tin, do đó càng ít ảnh hưởng đến mức độ dự đoán. Tuỳ thuộc vào đặc điểm dãy số thời gian ( chuỗi thời gian) có biến động xu thế, biến động thời vụ hay không mà phương pháp san bằng mũ có thể sử dụng một trong các phương pháp cơ bản sau: 2.4.1. Mô hình đơn giản ( phương pháp san bằng mũ đơn giản) Điều kiện áp dụng: đối với dãy số thời gian không có xu thế và không có biến động thời vụ rõ rệt. Trước hết, dãy số thời gian được san bằng nhờ có sự tham gia của các số bình quân mũ, tức là các số bình quân di động gia quyền theo quy luật hàm số mũ. Theo phương pháp này, ở thời gian t nào đó dựa vào các giá trị thực tế đã biết để ước lượng giá trị hiện tại ( thời 41 gian t) của hiện tượng và giá trị hiện tại này để dự toán giá trị tương lai (thời gian t+1). Mô hình san bằng mũ giản đơn được Brown xây dựng năm 1954 dựa trên 2 nguyên tắc: - Trọng số của các quan sát trong dãy số thời gian càng giảm đi khi nó càng cách xa hiện tại. - Sai số dự báo hiện tai ( ký hiệu et = yt- □yt ) Phải được tính đến trong những dự báo kế tiếp Giả sử ở thời gian t, có mức độ thực tế là yt, mức độ dự đoán là Y□t . Mức độ dự đoán của hiện tượng ở thời gian (t+1) có thể viết: Y□t 1   yt  (1   )Yt Đặt 1     , ta có: Y□t 1   yt  Yt ( 2.10) (2.11)  và  được gọi là các tham số san bằng với  +  =1 và  ,  0;1. Như vậy mức độ dự đoán Y□ t 1 là trung bình cộng gia quyền của yt và Y□t tương ứng là  và  - Mức độ dự đoán của hiện tượng ở thời gian t là: với quyền số Y□t  Yt 1  Y □ t 1 thay vào (2.12) ta có: Y□ t 1   y  Y   2Y□ t 1 (2.11) t t 1 - Mức độ dự đoán của hiện tượng ở thời gian (t-1) là: Y□ t 1  Yt 2  Y □ t 2 thay vào ( 2.12) Ta có: Y□ t 1   y  Y   2Y  3Y□ t 2 (2.13) t t 1 t 2 - Mức độ dự đoán của hiện tượng ở thời gian (t-2) là: vào (2.13) Y□ t 2  Yt 3  Y □ t 3 thay Ta có: Y□ t 1   y  Y   2Y  3Y   4Y□ t 4 ( 2.14) t t 1 t 2 t 3 Bằng cách tiếp tục tương tự thay vào các mức độ dự đoán thức tổng quát. Y□ t 3 ,Y□ t 4.... ta sẽ có công Y□  n i i1 □ t 1  ∑  i1 yt i   Y ti (*) Trong đó: 42 i Y□ t 1 : Số bình quân mũ tại thời điểm t+1 yt-i: Các mức độ thực tế của của hiện tượng tại thời điểm (t-i) (i=0€ n) Y□ t 1 : Số bình quân mũ tại thời điểm (t-i) ( i=0€n)  và  được gọi là các tham số san bằng ( và  là hằng số với  +  =1 và  ,  0;1.) n: Số lượng các mức độ của dãy số thời gian Vì  0;1nên khi i€  i1  0 ⇒ i1Y  0 Thì  t i  ∑   1 i1 Khi đó công thức (*) trở thành: Y□  n i y t 1  ∑  i1 t i Như vậy: mức độ dự đoán Y □ t 1 là trung bình cộng gia quyền cảu các mức độ của dãy số thời gian mà trong đó quyền số giảm dần theo dạng mũ ( khi i=0€ n) tuỳ thuộc vào mức độ cũ của dãy số. Vì thế, phương pháp này được gọi là phương pháp san bằng mũ. Có 2 vấn đề quan trọng nhất trong phương pháp san bằng mũ. - Thứ nhất: hệ số san bằng mũ   là hệ số san để điều chỉnh trong số của các quan sát riêng biệt của dãy số thời gian. Vì vậy, khi lựa chọn  phải vừa đảm bảo kết quả dự báo sẽ gần với quan sát thực tế, vừa phải đảm bảo tính linh hoạt ( nhanh nhạy với các thay đổi ở gần hiện tại). Với  =1 thì theo phương trình dự báo (1). Giá trị dự báo Y□ t 1 bằng giá trị thực tế ở thời kỳ ngay liền trước (Yt+1) và các mức độ trước đó không được tính đến. Với  =0 theo phương trình dự báo (1). Giá trị dự báo Y□ t 1 bằng giá trị dự báo ở thời kỳ trước (Y□t ) và giá trị thực tế ở thời kỳ ngay liền trước không được tính đến. Nếu  được chọn càng lớn thì các mức độ càng mới sẽ càng được chú ý, thích hợp với chuỗi thời gian không có tính ổn định cao. Ngược lại, nếu  được chọn càng nhỏ thì các mức độ càng cũ sẽ càng được chú ý, thích hợp với chuỗi thời gian có tính ổn định cao. 43 Do đó, phải dựa vào đặc điểm biến động của hiện tượng qua thời gian và kinh nghiệm nghiên cứu để lựa chon  cho phù hợp. Nói chung, giá trị  tốt nhất là giá trị làm cho tổng bình phương sai số dự đoán nhỏ nhất. SSE= ∑( yt  $yt ) min Đặt et = yt- □yt là các sai số dự đoán ở thời gian t hay còn gọi là phần dư ở thời gian t. Theo kinh nghiệm của các nhà dự báo thì  thích hợp cho vận phương pháp san mũ có thể được chọn bằng.   2 n  1 n : độ dài chuỗi thời gian - Thứ hai: Xác định giá trị ban đầu ( điều kiện ban đầu ) ký hiệu y0 Phương pháp san bằng mũ được thực hiện theo phép đệ quy, để tính Y □ t 1 thì phải có Y□ t , để có Y□ t thì phải có Y□ t 1 . Do đó để tính toán cần phải phải xác định giá trị ban đầu (y0) dựa vào một số phương pháp. + Có thể lấy mức độ đầu tiên của dãy số. + Trung bình của một số các mức độ của dãy số Ví dụ: Có hai tài liệu về doanh thu ở một của hàng thương mại X qua một số năm như sau: Năm Chỉ tiêu 2002 2003 2004 2005 2006 Doanh thu ( tỷ đồng) 15 y1 15,3 y2 14,8 y3 15,5 y4 15,2 y5 Yêu cầu: Dự đoán doanh thu cho năm 2007 của cửa hàng. Với n= 5€ = 2  2  0,3 y0= 1 5 ∑ yi n  1 5  1 15  15,3  15,8  15,5  15, 2  = 15,16 ( tỷ đồng) 5 i1 5 Công thức tổng quát với n= 5 44 6 i=0€5 $y   5 (1   )i y  (1   )i1 $y t 1  =1- ⇒ $y   ( y ∑ i1   y t i   2 y t i  3 y   4 y  5 y )   6 $y t 1 t t 1 t 2 t 3 t 4 t 5 t 5 Với t=5 dự báo doanh thu 2007 là: $y   ( y   y   2 y  3 y   4 y  5 y )   6 $y 6 5 4 3 2 1 0 0 $y  DT 2007  0,3(15, 2  0, 7.15,5  0, 72.14,8  0, 73.15,3 0, 74.15  0, 75.15,16)  0, 76.15,16  15,19 * Hoặc thay vào công thức (1) ta có thể sự báo doanh thu hàng năm ( tỷ đồng) như sau: Với t=0, ta có: $y1   y0  (1   ) y0 = 0,3 x 15,16+(1-0,3).15,16= 15,16 Với t=1, ta có: $y2   y1  (1   ) $y1 = 0,3 x15 +(1-0,3).15,16= 15,112 Với t=2, ta có: $y3   y2  (1   ) $y2 = 0,3 x 15,3 +(1-0,3).15,112= 15,1684 Với t=3 ta có: $y4   y3  (1   ) $y3 = 0,3 x 14,8 + (1-0,3).15.1684= 15,05788 Với t=4 ta có: $y5   y4  (1   ) $y4 = 0,3 x 15,5 + (1-0,3).15,05788= 15,19 Với t=5, ta có: $y6   y5  (1   ) $y5 = 0,3 x 15,2 + (1-0,3). 15,19= 15,193 Đây là giá trị dự đoán cho doanh thu của Công ty năm 2007 2.4.2. Mô hình xu thế tuyến tính và không có biến động thời vụ ( Mô hình san mũ Holt – Winters) Mô hình này thường áp dụng đối với sự biến động của hiện tượng qua thời gian có xu thế là tuyến tính và không có biến động thời vụ. - Giả sử chúng ta có dãy số thời gian y1, y2, y3,, yn với biến động có tính xu thế. Bước 1: Chọn các hệ số  ,  ( 0 <  ,  < 1) Nếu chọn hằng số san nhỏ tức là chúng ta coi các mức độ hiện thời của dãy số ít ảnh hưởng đến mức độ dự báo. Ngược lại nếu chọn hằng số san lớn tức là chúng ta muốn dãy số san số mũ phản ứng mạnh với những thay đổi hiện tại. Bước 2: Tiến hành san mũ cho giá trị ước lượng và xu thế của dãy số: 45 Coi giá trị của dãy số thời gian là tổng của 2 thành phần: Thành phần trung bình có trọng số của các giá trị thực tế (ký hiệu là St – giá trị ước lượng của hiện tượng ở thời điểm t) và thành phần xu thế (ký hiệu là Tt). Ta có mô hình san số mũ: $y t 1  St  Tt (2.15) Trong đó: St   yt  (1  ) St 1  T(t 1)   yt  (1  )St Tt   (St  St 1 )  (1  ).T(t 1) Đặt S2 = Y2 T2 = Y2 – Y1 Tiến hành san số mũ từ thời điểm thứ 3 trở đi, ta có: S3  Y3  (1  )(S2  T2 ) T3   (S3  S2 )  (1  )T2 S4  Y4  (1  )(S3  T3 ) T4   (S4  S3 )  (1  )T3 ... (2.16) (2.17) Bước 3: Sử dụng mức và xu thế đã được san số mũ tại thời điểm để dự đoán cho các thời điểm trong tương lai để dự đoán giá trị của hiện tượng ở thời điểm tương lai t + 1: $y t 1  St  Tt Ở thời điểm tương lai (t + h) (h=2, 3 ) $y t h  St  hTt (2.18) (2.19) Ví dụ: Theo số liệu của tổng cục thống kê về GDP theo giá thực tế của Việt Nam qua thời gian như sau: Năm Chỉ tiêu 2002 2003 2004 2005 2006 GDP (tỷ đồng) 421295 535762 613443 715307 839211 Áp dụng san mũ Holt – Winters để dự đoán cho 5 năm tới Bước 1: Chọn hệ số san:  = 0,7;  = 0,6 Bước 2: Tiến hành san số mũ cho mức và cho xu thế của dãy số thời gian 46 S2 = y2 = 535762 T2 = Y2 – Y1 = 535762 – 421295 = 114467 S3 =  Y3 + (1 -  )(S2 + T2) = 0,7.613443 + (1-0,7)(535.762 + 114467) = 624478,8 T3 =  (S3 – S2) + (1-  )T2 = 0,6(624478,8 – 535762) + (1-0,6).114467 = 99016,88 S4 =  Y4 + (1- )(S3 + T3) = 0,7.715307 + (1-0,7)(624478,8 + 99016,88) = 717763,6 T4 =  (S4 – S3) + (1-  )T3 = 0,6(717763,6 – 24478,8) + 0,4.99016,88 = 95577,63 S5 =  Y5 + (1 -  )(S4 + T4) = 0,7.839211 + 0,3(717763,6 + 95577,63) = 831450,07 T5 =  (S5 – S4) + (1 -  )T4 = 0,6(831450,07 – 717763,6) + 0,4.95577,63 = 106442,93 Như vậy, mức độ dự báo GDP của những năm tiếp theo sẽ là: $y 6 $y 7 $y 8 = S5 + T5 = 831450,07 + 106442,93 = 937893 = S5 + 2T5 = 831450,07 + 2.106442,93 = 1044335,93 (tỷ đồng) = S5 + 3T5 = 831450,07 + 3.106442,93 = 1150778,86 (tỷ đồng) $y9 = S5 + 4T5 = 831450,07 + 4.106442,93 = 1257221,7 (tỷ đồng) $y10 = S5 + 5T5 = 831450,07 + 5.106442,93 = 1363664,63 (tỷ đồng) 2.4.3. Mô hình xu thế tuyến tính và biến động thời vụ Mô hình này thường áp dụng đối với dự báo thời gian mà các mức độ của nó là tài liệu tháng hoặc quý của một số năm mà các mức độ trong dãy số được lập lại sau 1 khoảng thời gian h (h = 4 đối với quý, h = 12 đối với năm). Việc dự đoán có thể được thực hiện theo một trong hai mô hình sau: + Mô hình cộng $y t 1  St  Tt  Vt 1 (2.19) 47 t t S j Trong đó: St    yt V (t  h)  (1  ) St 1  T(t 1) (2.20) Tt   (St  St 1 )  (1  )T(t 1) Vt  ( yt  St )  (1 )V(t h) + Mô hình nhân: $y t 1  (St  Tt ).Vt 1 Trong đó (2.21) (2.22) (2.23) St   yt V (t  h)  (1  )(S t 1  T(t 1) ) Tt   (S1  St 1 )  (1  )Tt 1 V   yt  (1 ).V t (t h) t Với  ,  ,  là các tham số san bằng nhận giá trị trong đoạn [0;1].  ,  ,  nhận giá trị tốt nhất khi tổng bình phương sai số là nhỏ nhất. SSE  ∑ ( y  $y )2 ⇒ min - Tham số  ,  ,  không được xét một cách khách quan mà ít nhiều thông qua trực giác chủ quan, kết quả dự báo sẽ phụ thuộc vào sự lựa chọn các tham số này. - Với a0 (0) có thể là mức độ đầu tiên trong dãy số. - a1(0) có thể là lượng tăng (giảm) tuyệt đối trung bình. Sj(0): Là các chỉ số thời vụ ban đầu (j=1,2,3,k); k = 4 đối với quý; k = 12 đối với tháng. Nếu t = 1, 2, 3, 4, 5,, n. Là thứ tự thời gian hay tương ứng với thứ tự các mức độ theo thời ký trong chuỗi thời gian thì yếu tố thời vụ Vj(0) của các mức độ trong chuỗi thời gian được tính sẽ tương ứng với các giá trị t ≤ k. k Vj Vj (0)  Vj xH ; Vj  ∑ j 1 Vj chỉ số bình quân thời vụ cho một quý hay một tháng của mỗi năm trong chuỗi thời gian. V  y t yt Yt mức độ trong chuỗi thời gian ở thời gian t. k 48 Vj chỉ số thời vụ của từng quý hoặc tháng trong từng năm nay ở thời gian t: yt Số bình quân trượt để loại trừ thành phần thời vụ và thành phần ngẫu nhiên với số lượng mức độ bằng 4 đối với tài liệu quý và bằng 12 đối với tài liệu tháng. H  k ∑V j Ví dụ: Trở lại ví dụ ở mục (3.3.1), dự đoán doanh thu của các quý theo mô hình nhân như sau: Ví dụ: Có tài liệu về sản lượng của Doanh nghiệp (A) như sau: Năm (t) Quý Sản lượng (nghìn tấn) Cộng theo cùng quý (∑ y j ) 2002 2003 2004 2005 2006 I 20 25 27 31 29 132 II 25 32 30 37 36 160 III 38 38 45 44 47 212 IV 40 60 55 62 58 275 Cộng theo cùng năm (∑ y j ) 123 155 157 174 170 779 Mức độ bình quân năm 30,75 38,75 39,25 43,5 42,5 S(0): Bình quân của 4 mức độ đầu tiên (bình quân năm) S(0) 20  25  38  40   30, 75 4 T0: Lượng tăng tuyệt đối bình quân của quý 58  20 T   2 0 20 1 Các chỉ số thời vụ Itv: ( Đã tính trong phần 3.2.2.) Quý I = 0,713 x 0,986 = 0,7 Quý II = 0,85 x 0,986 = 0,838 49 Quý III = 1,096 x 0,986 = 1,08 Quý IV = 1,396 x 0,986 = 1,376 Với các tham số đã cho  ,  ,  lần lượt là: 0,4; 0,4; 0,8 Nếu phải lựa chọn một trong hai mô hình để dự đoán thì tuỳ thuộc vào đặc điểm biến động của hiện tượng. Đối với hiện tượng ít biến đổi qua thời gian thì dùng mô hình cộng. Đối với hiện tượng biến đổi nhiều qua thời gian thì dùng mô hình nhân. * Ưu, nhược điểm của phương pháp san bằng mũ: Ưu điểm: Đơn giản và có kết quả tương đối chính xác phù hợp với dự đoán ngắn hạn cho các nhà kinh doanh cũng như lập kế hoạch ngắn hạn ở cấp vĩ mô. - Hệ thống dự báo có thể được điều chỉnh thông qua 1 tham số duy nhất (tham số san bằng mũ) - Dễ dàng chương trình hoá vì chỉ phải thực hiện một số phép toán sơ cấp để xác định giá trị dự báo. Hạn chế: - Phương pháp san mũ chỉ bó hẹp trong phạm vi dự báo ngắn hạn vì không tính đến sự thay đổi cấu trúc của chuỗi thời gian mà phải tuân thủ tính ổn định theo thời gian của các quý trình kinh tế - xác hội. 2.5. Sử dụng chương trình SPSS để dự báo theo các mô hình 2.5.1. Dự đoán bằng hàm xu thế * Nhập tài liệu + Một cột là biến theo thứ tự các năm, một cột là thời gian (Years – năm; Years, quarters – năm, quý; Years, months (năm, tháng) (nếu là năm ta nhấp chuột vào years, ô nhỏ sẽ hiện số 1900, ta xoá đi và đánh số năm đầu tiên trong dãy số). * Thăm dò bằng đồ thị * Analyze/ Regression/ curve Estimation - Đưa y vào (Dependent) và Years vào Variable - Time/ Linear/ Display ANOVA table/ Save/ Predicted values/ Predict throug/ đánh số năm cần dự báo vào hình chữ nhật đứng sau year/ continue/ OK * Một số kết quả Constant – tham số a 50 Time – tham số b 2.5.2. Dự đoán bằng san bằng mũ * Mô hình đơn giản - Nhập tài liệu - Analyze/ Time Serier/ Exponential Smoothing - Save/ Do not create/ Continue/ OK - Đưa Y vào hình vuông bên phải - Simple/ Parameters/ Grid search (nằm trong hình vuông thứ nhất General)/ Continue/ OK * Mô hình xu thế tuyến tính không biến động thời vụ - Chọn Holt/ Parameters/ Grid Search (có chữ General hình vuông bên trái)/ Grid Search (hình vuông bên phải có chữ Trend) - Continue/ OK - Parameters - Nhấp chuột vào Value (trái) – đánh số 0.9 - Nhấp chuột vào Value (phải) – đánh số 0.0 - Continue/ Save/ Predict through/ đánh số năm cần dự báo vào ô Year/ Continue/ OK/ Đóng của màn hình Output sẽ có kết quả dự báo * Mô hình xu thế tuyến tính có biến động thời vụ - Nhập tài liệu - Define Dates/ Year Quarters/ đánh số năm đầu tiên trong dãy số vào hình chữ nhật thứ nhất. - Analyze/ Time Serier/ Exponental Smoothing/ Winters - Đưa Y vào hình vuông dưới chữ Variables - Đưa Quarters vào hình chữ nhật dưới chữ Seasonal - Parameters/ Grid Search ở trong các hình vuông của General (Alpha), Trend (Gramma), Seasonal (Delta)/ Continue/ OK./.

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_phan_tich_du_lieu_va_du_bao_kinh_te.pdf
Tài liệu liên quan