Bài giảng môn Kinh tế lượng - Chương 6: Hiện tượng đa cộng tuyến
Ví dụ 1
Khảo sát chi tiêu tiêu dùng, thu nhập và sự giàu có, ta có bảng số liệu sau.
Gọi Y: chi tiêu tiêu dùng (USD) X2: thu nhập (USD) X3: sự giàu có (USD)
Yêu cầu:
Ước lượng mô hình hồi quy Y= β1 + β2. X2 + β3.X3 +U
Mô hình có xảy ra đa cộng tuyến không? Vì sao?
Nếu xảy ra đa cộng tuyến, hãy tìm cách khắc phục.
Ước lượng mô hình hồi quy Y= β1 + β2. X2 + β3.X3 +U
Nhận xét ban đầu: Theo lý thuyết kinh tế thì chi tiêu cho tiêu dùng (Y) có xu hướng tăng theo thu nhập (X2) và sự giàu có (X3) nên dấu của các hệ số hồi quy riêng là dương.
Kết quả hồi quy trên Eviews như sau:
42 trang |
Chia sẻ: hachi492 | Ngày: 14/01/2022 | Lượt xem: 547 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng môn Kinh tế lượng - Chương 6: Hiện tượng đa cộng tuyến, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 6
HIỆN TƯỢNG ĐA CỘNG TUYẾN(MULTICOLLINEARITY)
2
Hiểu bản chất và hậu quả của đa cộng tuyến
Biết cách phát hiện đa cộng tuyến và biện pháp khắc phục
MỤC TIÊU
ĐA CỘNG TUYẾN
NỘI DUNG
3
Bản chất, nguyên nhân của đa cộng tuyến
1
Ước lượng các tham số
2
3
Phát hiện đa cộng tuyến
4
Khắc phục đa cộng tuyến
5
Hậu quả
4
Thu nhập
Sự giàu có
Chi tiêu
80
810
70
100
1009
65
120
1273
90
140
1425
95
160
1633
110
180
1876
115
200
2052
120
220
2201
140
240
2435
155
260
2686
150
Nguồn: Ramu Ramanathan
5
6
7
8
Khi lập mô hình hồi quy bội
Có sự phụ thuộc tuyến tính cao giữa các biến giải thích gọi là đa cộng tuyến.
a . Đa cộng tuyến hoàn hảo
Tồn tại 2 , 3 , k không đồng thời bằng 0 sao cho
2 X 2 + 3 X 3 + + k X k = 0
N ó i c á ch kh á c l à xảy ra trường hợp một biến giải th í ch n à o đ ó được biểu diễn dưới dạng một tổ hợp tuyến t í nh của c á c biến c ò n lại.
6.1 Bản chất của đa cộng tuyến
9
b. Đa cộng tuyến không hoàn hảo
2 X 2 + 3 X 3 + + k X k + v i = 0
Với v i l à sai số ngẫu nhi ê n th ì ta c ó hiện tượng đa cộng tuyến kh ô ng ho à n hảo giữa c á c biến giải th í ch.
N ó i c á ch kh á c l à một biến giải th í ch n à o đ ó c ó tương quan với một số biến giải th í ch kh á c .
6.1 Bản chất của đa cộng tuyến
10
X 3i = 5X 2i , v ì vậy c ó cộng tuyến ho à n hảo giữa X 2 v à X 3 ; r 23 = 1
X 2 v à X 3 * kh ô ng c ó cộng tuyến ho à n hảo, nh ưng hai biến n à y c ó tương quan chặt chẽ.
X 2
10
15
18
24
30
X 3
50
75
90
120
150
X * 3
V
52
2
75
0
97
7
129
9
152
2
6.1 Bản chất của đa cộng tuyến
VD
11
6.1 Bản chất của đa cộng tuyến
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
12
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
6.1 Bản chất của đa cộng tuyến
13
Một số nguyên nhân gây ra hiện tượng đa cộng tuyến
- Khi chọn các biến độc lập mối quan có quan hệ nhân quả hay có tương quan cao vì đồng phụ thuộc vào một điều kiện khác.
- Khi số quan sát nhỏ hơn số biến độc lập.
- Cách thu thập mẫu: mẫu không đặc trưng cho tổng thể
- Chọn biến X i có độ biến thiên nhỏ.
6.1 Nguyên nhân của đa cộng tuyến
6.2 Ước lượng khi có đa cộng tuyến
Trường hợp c ó đa cộng tuyến ho à n hảo
X é t m ô h ì nh hồi qui 3 biến dưới dạng sau:
Y i = 2 X 2i + 3 X 3i + e i
giả sử X 3i = X 2i , m ô h ì nh được biến đổi th à nh:
Y i = ( 2 + 3 )X 2i + e i = 0 X 2i + e i
Phương ph á p OLS
14
Không thể tìm được lời giải duy nhất cho
6.2 Ước lượng khi có đa cộng tuyến
Các hệ số ước lượng không xác định
Phương sai v à sai số chuẩn của 2 v à 3 l à v ô hạn
15
6.2 Ước lượng các tham số khi có đa cộng tuyến
Các hệ số ước lượng không xác định: chúng ta không tách rời tác động của từng biến X i lên Y do không thể giả định X 2 thay đổi trong khi X 3 không đổi.
16
6.2 Ước lượng các tham số khi có đa cộng tuyến
2. Trường hợp c ó đa cộng tuyến kh ô ng ho à n hảo
Đa cộng tuyến hoàn hảo thường không xảy ra trong thực tế.
X é t m ô h ì nh hồi qui 3 biến dưới dạng sau:
y i = 2 x 2i + 3 x 3i + e i
Giả định x 3i = x 2i + v i
Với 0 v à v i l à sai số ngẫu nhi ê n.
Trong trường hợp n à y, c á c hệ số hồi qui 2 v à 3 c ó thể ước lượng được:
17
Ta c ó thể ước lượng được c á c n à y nhưng s.e. sẽ rất lớn.
6.2 Ước lượng các tham số khi có đa cộng tuyến
18
6.3 Hậu quả của đa cộng tuyến
Nếu c ó cộng tuyến gần ho à n hảo:
C á c ước lượng vẫn BLUE, nhưng:
1. Phương sai v à hiệp phương sai của c á c ước lượng OLS lớn .
19
r 23 l à hệ số tương quan giữa X 2 v à X 3 .
Khi r 23 1, c á c gi á trị tr ê n
6.3 Hậu quả của đa cộng tuyến
Nếu c ó cộng tuyến gần ho à n hảo:
2. Kho ảng tin cậy rộng hơn.
Khoảng tin cậy của 2 v à 3 (với độ tin cậy 1 – ) l à :
2 = t /2 se ( );
3 = t /2 se ( );
trong đ ó :
se ( ) = se ( ) =
20
21
Giá trị của r23
Khoảng tin cậy 95% của B2
0
0.5
0.95
0.995
0.999
6.3 Hậu quả của đa cộng tuyến
Nếu c ó cộng tuyến gần ho à n hảo:
T ỉ số t "kh ô ng c ó ý nghĩa".
Khi kiểm định giả thuyết H0: 2 = 0, ch ú ng ta sử dụng tỷ số t.
v à so s á nh gi á trị ước lượng của t với gi á trị tra bảng (tới hạn) của t.
Trong trường hợp cộng tuyến cao th ì sai số chuẩn sẽ rất lớn v à do đ ó l à m cho gi á trị t sẽ nhỏ đi, kết quả l à sẽ l à m tăng chấp nhận giả thuyết H0.
22
6.3 Hậu quả của đa cộng tuyến
Nếu c ó cộng tuyến gần ho à n hảo:
4. R 2 cao nhưng t ỉ số t í t c ó ý nghĩa.
Đa cộng tuyến cao:
- một hoặc một số tham số tương quan (hệ số g ó c ri ê ng) kh ô ng c ó ý nghĩa về mặt thống k ê
- R 2 trong những trường hợp n à y lại rất cao (tr ê n 0,9).
- kiểm định F th ì c ó thể b á c bỏ giả thuyết cho rằng 2 = 3 = = k = 0.
23
6.3 Hậu quả của đa cộng tuyến
Nếu c ó cộng tuyến gần ho à n hảo:
5. C á c ước lượng OLS v à sai số chuẩn của ch ú ng trở n ê n rất nhạy với những thay đổi nhỏ trong dữ liệu.
6. Dấu của c á c ước lượng của c á c hệ số hồi qui c ó thể sai
7. Th ê m v à o hay bớt đi c á c biến cộng tuyến với c á c biến kh á c, m ô h ì nh sẽ thay đổi về dấu hoặc thay đổi về độ lớn của c á c ước lượng.
24
Ví dụ: Bảng 2 do nhập sai số liệu nên xảy ra đa cộng tuyến
25
Bảng 1
Y
X2
X3
1
2
4
2
0
2
3
4
12
4
6
0
5
8
16
Bảng 2
Y
X2
X3
1
2
4
2
0
2
3
4
0
4
6
12
5
8
16
Se (0.7736) (0.1848) (0.0850)
t (1.543) (2.415) (0.0358)
Se (0.7480) (0.2720) (0.1252)
t (1.618) (1.4752) (0.2152)
26
Đa cộng tuyến là một hiện tượng theo mẫu, nghĩa là cho dù các biến độc lập X i không tương quan tuyến tính trong tổng thể nhưng chúng có thể tương quan tuyến tính trong một mẫu cụ thể nào đó. Do đó cỡ mẫu lớn thì hiện tượng đa cộng tuyến ít nghiêm trọng hơn cỡ mẫu nhỏ
27
1. Hệ số R 2 lớn nhưng tỷ số t nhỏ
2. Tương quan cặp giữa các biến giải thích cao
3. Sử dụng mô hình hồi qui phụ
4. Sử dụng yếu tố phóng đại phương sai (VIF)
6.4 Cách phát hiện đa cộng tuyến
28
R 2 lớn nhưng tỷ số t nhỏ
Nếu R 2 cao, chẳng hạn, >0,8 và F test bác bỏ giả thuyết 2 = 3 = = k = 0, nhưng t test cho từng i lại chấp nhận H 0 .
2. Tương quan cặp giữa các biến giải thích cao
Trong đó X, Z là 2 biến giải thích trong mô hình
6.4 Cách phát hiện đa cộng tuyến
29
3. Sử dụng mô hình hồi quy phụ
Hồi qui một biến giải thích X nào đó theo các biến còn lại.
Tính R 2 và F cho mỗi mô hình theo công thức:
Lập giả thiết H 0 : R 2 = 0 ~ H 0: không có đa cộng tuyến
Nếu F > F (m-1,n-m): bác bỏ H 0 => có đa cộng tuyến
Nếu F không có đa cộng tuyến
6.4 Cách phát hiện đa cộng tuyến
30
VD: Cho doanh số bán (Y), chi phí chào hàng (X 2 ) và chi phí quảng cáo (X 3 ) trong năm 2001 ở 12 khu vực bán hàng của 1 công ty. Có hiện tượng đa cộng tuyến không?
Hồi quy biến chi phí chào hàng với chi phí quảng cáo, ta có kết quả
X 2 =42,012 + 0,387 *X 3
R 2 = 0,22922 F= 2,9738
Với mức ý nghĩa α =5%, tra bảng F 0.05 (1,10)= 4,96. Ta thấy F < F 0.05 (1,10) nên chấp nhận Ho hay không có đa cộng tuyến.
6.4 Cách phát hiện đa cộng tuyến
31
4. Sử dụng nhân tử phóng đại phương sai (VIF)
Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa như sau:
Đối với trường hợp tổng quát, có (k-1) biến giải thích thì:
R 2 j : là giá trị R 2 trong hàm hồi quy của X j theo (k-1) biến giải thích còn lại. Thông thường khi VIF > 10, thì biến này được coi là có cộng tuyến cao
6.4 Cách phát hiện đa cộng tuyến
32
Giá trị của r23
VIF
0
1
1A
0
0.5
1.33
1.33A
0.67B
0.7
1.96
1.96A
1.37B
0.8
2.78
2.78A
2.22B
0.9
5.76
5.76A
4.73B
0.95
10.26
10.26A
9.74B
0.97
16.26
16.92A
16.4B
0.99
50.25
50.25A
49.75B
0.995
100
100A
99.5B
0.999
500
500A
499.5B
33
1. Dùng thông tin tiên nghiệm
Ví dụ khi hồi quy mô hình sản xuất Cobb-Douglas
Ln(Y i )= b 1 + b 2 ln(K i )+ b 3 ln(L i ) + u i
Có thể gặp hiện tượng đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu ta biết là hiệu suất không đổi theo quy mô tức là b 2 + b 3 =1.
Ln(Y i )= b 1 + b 2 ln(K i )+ (1- b 2 )ln(L i ) + u i Ln(Y i ) – Ln(L i ) = b 1 + b 2 [ln(K i ) - ln(L i )] + u i
Ln(Y i /L i ) = b 1 + b 2 ln(K i /L i ) + u i
=> mất đa cộng tuyến (vì đây là mô hình hồi quy đơn).
6.5 Cách khắc phục
34
1. Dùng thông tin tiên nghiệm
Ví dụ
Y i = b 1 + b 2 X 2i + b 3 X 3i + u i
Biết b 3 = 0.1b 2
Biến đổi Y i = b 1 + b 2 X 2i + 0.1b 2 X 3i + u i
Y i = b 1 + b 2 X i + u i
Với X i =X 2i+ 0.1 X 3i
6.5 Cách khắc phục
35
2. Loại trừ một biến giải thích ra khỏi mô hình
B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ. Giả sử X 2 , X 3 X k l à c á c biến độc lập, Y l à biến phụ thuộc v à X 2 , X 3 c ó tương quan chặt chẽ với nhau.
B2: Tính R 2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt một trong 2 biến
B3: Loại biến mà giá trị R 2 tính được khi không có mặt biến đó là lớn hơn.
6.5 Cách khắc phục
36
6.5 Cách khắc phục
3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới
37
4. Dùng sai phân cấp 1
V í dụ từ h à m hồi qui: y t = 1 + 1 x 1t + 2 x 2t + u t
ta suy ra
y t-1 = 1 + 1 x 1,t-1 + 2 x 2,t-1 + u t-1
Tr ừ hai vế cho nhau, ta được:
y t – y t – 1 = 1 (x 1,t – x 1,t – 1 ) + 2 (x 2,t – x 2,t – 1 ) + (u t – u t – 1 )
Hay:
y t = 1 x 1,t + 2 x 2,t + e t ,
M ặc d ù , x 1 v à x 2 c ó quan hệ tuyến t í nh, nhưng không c ó nghĩa sai phân của ch ú ng cũng như vậy.
6.5 Cách khắc phục
38
5. Đổi biến
V í dụ : y t = 1 + 1 x 1t + 2 x 2t + u t
Với Y: tiêu dùng
X1: GDP
X2: dân số
Vì GDP và dân số theo thời gian có xu hướng tăng nên có thể cộng tuyến.
Biện pháp: chia các biến cho dân số
6.5 Cách khắc phục
39
Khảo sát chi tiêu tiêu dùng, thu nhập và sự giàu có, ta có bảng số liệu sau.
Gọi Y: chi tiêu tiêu dùng (USD) X2: thu nhập (USD) X3: sự giàu có (USD)
Yêu cầu:
Ước lượng mô hình hồi quy Y= β1 + β2. X2 + β3. X3 +U
Mô hình có xảy ra đa cộng tuyến không? Vì sao?
Nếu xảy ra đa cộng tuyến, hãy tìm cách khắc phục.
Ví dụ 1
40
X2
X3
Y
80
810
70
100
1009
65
120
1273
90
140
1425
95
160
1633
110
180
1876
115
200
2052
120
220
2201
140
240
2435
155
260
2686
150
Nguồn: Ramu Ramanathan
41
Ước lượng mô hình hồi quy Y= β1 + β2. X2 + β3. X3 +U
Nhận xét ban đầu: Theo lý thuyết kinh tế thì chi tiêu cho tiêu dùng (Y) có xu hướng tăng theo thu nhập (X2) và sự giàu có (X3) nên dấu của các hệ số hồi quy riêng là dương.
Kết quả hồi quy trên Eviews như sau:
42
Các file đính kèm theo tài liệu này:
- bai_giang_mon_kinh_te_luong_chuong_6_hien_tuong_da_cong_tuye.ppt