Bài giảng môn Kinh tế lượng - Chương 5: Biến giả trong phân tích hồi quy
          
        
            
            
              
            
 
            
                
                    Ứng dụng sử dụng biến giả
Kết quả hồi quy theo mô hình như sau
Nhận xét
Tung độ gốc chênh lệch và hệ số góc chênh lệch có ý nghĩa thống kê
Các hồi quy trong hai thời kỳ là khác nhau
Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng sẽ khác với khi doanh thu trên X*.
Hàm hồi quy có dạng
Kiểm định giả thiết H0: 3=0
Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc
Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng sẽ khác với khi sản lượng trên X*.
Hàm hồi quy sẽ có dạng:
Y: Chi phí; X: sản lượng;
X*=5.500 tấn: giá trị ngưỡng sản lượng
                
              
                                            
                                
            
 
            
                 49 trang
49 trang | 
Chia sẻ: hachi492 | Lượt xem: 540 | Lượt tải: 0 
              
            Bạn đang xem trước 20 trang tài liệu Bài giảng môn Kinh tế lượng - Chương 5: Biến giả trong phân tích hồi quy, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 5 
BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY 
2 
1. Biết cách đặt biến giả 
2. Nắm phương pháp sử dụng biến giả trong phân tích hồi quy 
MỤC TIÊU 
BIẾN GIẢ 
NỘI DUNG 
Khái niệm biến giả 
1 
Sử dụng biến giả trong mô hình hồi quy 
2 
3 
 Kỹ thuật sử dụng biến giả 
Biến định lượng : các giá trị quan sát được thể hệ bằng con số 
Biến định tính : thể hiện một số tính chất nào đó 
Để đưa những thuộc tính của biến định tính vào mô hình hồi quy, cần lượng hóa chúng => sử dụng biến giả (dummy variables) 
4 
5.1 KHÁI NIỆM 
Chi tiêu của hộ = α + β 1 * quy mô hộ + β 2 *trình độ văn hóa của chủ hộ+ β 3 * tuổi của chủ hộ + β 4 * giới tính của chủ hộ β 5 * nơi sinh sống của hộ 
Mã hộ 
Quy mô hộ 
Chi tiêu của hộ 
Trình độ văn hóa của chủ hộ 
Tuổi của chủ hộ 
Giới tính chủ hộ 
Nơi sinh sống 
38820 
4 
10097.37 
3 
48 
Nam 
Nông thôn 
38818 
6 
14695.2 
8 
42 
Nữ 
Nông thôn 
38817 
8 
11733.34 
4 
37 
Nữ 
Nông thôn 
38816 
3 
7087.489 
0 
21 
Nữ 
Nông thôn 
38815 
9 
22809.3 
6 
48 
Nữ 
Nông thôn 
38813 
4 
9554.563 
2 
76 
Nữ 
Nông thôn 
11212 
7 
69258.09 
9 
42 
Nữ 
Thành thị 
11211 
3 
13680.91 
0 
77 
Nữ 
Thành thị 
11209 
3 
27651.65 
13 
32 
Nữ 
Thành thị 
11208 
4 
32102.67 
8 
47 
Nữ 
Thành thị 
11207 
2 
11464.6 
7 
38 
Nam 
Thành thị 
11206 
4 
17199.63 
5 
93 
Nam 
Thành thị 
5 
Ví dụ 
Có hai biến độc lập định tính là giới tính của chủ hộ và nơi sinh sống của hộ. Để phân tích hồi quy cần phải lượng hóa hai biến định tính này. 
Thực hiện: Giới tính gồm hai biểu hiện là nam và nữ và mã hóa như sau: Nam=1, Nữ=0. 
Nơi sinh sống của hộ gồm thành thị và nông thôn nên mã hóa như sau: Thành thị=1, Nông thôn=0. (Việc chọn số mã hóa tùy nhà phân tích). 
6 
Dữ liệu đã mã hóa 
Mã hộ 
Quy mô hộ 
Chi tiêu của hộ 
Trình độ văn hóa của chủ hộ 
Tuổi của chủ hộ 
Giới tính chủ hộ 
Nơi sinh sống 
38820 
4 
10097.37 
3 
48 
1 
0 
38818 
6 
14695.2 
8 
42 
0 
0 
38817 
8 
11733.34 
4 
37 
0 
0 
38816 
3 
7087.489 
0 
21 
0 
0 
38815 
9 
22809.3 
6 
48 
0 
0 
38813 
4 
9554.563 
2 
76 
0 
0 
11212 
7 
69258.09 
9 
42 
0 
1 
11211 
3 
13680.91 
0 
77 
0 
1 
11209 
3 
27651.65 
13 
32 
0 
1 
11208 
4 
32102.67 
8 
47 
0 
1 
11207 
2 
11464.6 
7 
38 
1 
1 
11206 
4 
17199.63 
5 
93 
1 
1 
7 
Ví dụ 
Mã hộ 
Quy mô hộ 
Chi tiêu của hộ 
Trình độ văn hóa của chủ hộ 
Tuổi của chủ hộ 
Nghề nghiệp chủ hộ 
38820 
4 
10097.37 
3 
48 
Bác sĩ 
38818 
6 
14695.2 
8 
42 
Giáo viên 
38817 
8 
11733.34 
4 
37 
Nông dân 
38816 
3 
7087.489 
0 
21 
Bác sĩ 
38815 
9 
22809.3 
6 
48 
Giáo viên 
38813 
4 
9554.563 
2 
76 
Nông dân 
11212 
7 
69258.09 
9 
42 
Bác sĩ 
11211 
3 
13680.91 
0 
77 
Giáo viên 
11209 
3 
27651.65 
13 
32 
Nông dân 
11208 
4 
32102.67 
8 
47 
Bác sĩ 
11207 
2 
11464.6 
7 
38 
Giáo viên 
11206 
4 
17199.63 
5 
93 
Nông dân 
8 
Ví dụ 
Nghề nghiệp có 3 nghề (3 phạm trù) 
Chọn 1 nghề làm phạm trù cơ sở 
Ví dụ: chọn bác sĩ 
3. Hai nghề còn lại là hai biến mới 
	 Vậy số biến mới = số phạm trù -1 
4. Biến Giáo viên nhận 2 giá trị: 1 nếu là giáo viên; 0 nếu không phải là giáo viên 
5. Biến Nông dân nhận 2 giá trị: 1 nếu là nông dân; 0 nếu không phải là nông dân 
9 
Mã hộ 
Quy mô hộ 
Chi tiêu của hộ 
Trình độ văn hóa của chủ hộ 
Tuổi của chủ hộ 
Nghề nghiệp chủ hộ 
Giáo viên 
Nông dân 
### 
4 
### 
3 
48 
Bác sĩ 
  0 
  0 
### 
6 
### 
8 
42 
Giáo viên 
  1 
  0 
### 
8 
### 
4 
37 
Nông dân 
  0 
  1 
### 
3 
### 
0 
21 
Bác sĩ 
  0 
  0 
### 
9 
### 
6 
48 
Giáo viên 
  1 
  0 
### 
4 
### 
2 
76 
Nông dân 
### 
7 
### 
9 
42 
Bác sĩ 
### 
3 
### 
0 
77 
Giáo viên 
### 
3 
### 
13 
32 
Nông dân 
### 
4 
### 
8 
47 
Bác sĩ 
### 
2 
### 
7 
38 
Giáo viên 
### 
4 
### 
5 
93 
Nông dân 
10 
Câu hỏi 
Nếu có thêm nghề kế toán thì sao? 
11 
HỒI QUY VỚI BiẾN ĐỊNH TÍNH 
Quy tắc: Nếu biến định tính có m biểu hiện thì sử dụng m-1 biến. 
Ví dụ: Tổng chi tiêu của hộ phụ thuộc vào 
Giới tính của chủ hộ 
Số thành viên trong hộ 
Vùng nơi hộ sinh sống (có 8 vùng) 
Biến định tính là biến nào? 
12 
13 
Ví dụ 5.1 : Xét mô hình Y i =  1 +  2 X i +  3 D i + U i 
 với 
Y 	Tiền lương (triệu đồng/tháng) 
X 	Bậc thợ 
D=1 	nếu công nhân làm trong khu vực tư nhân 
D=0 	 nếu công nhân làm trong khu vực nhà nước 
D được gọi là biến giả trong mô hình 
5.2 Sử dụng biến giả trong mô hình hồi quy 
14 
Y (thu nhập) 
X (số năm) 
D (nơi làm việc) 
4 
3 
1 
5 
5 
0 
3 
3 
0 
6 
4 
1 
7 
5 
1 
5.2 Sử dụng biến giả trong mô hình hồi quy 
15 
E(Y/X,D) =  1 +  2 X i +  3 D i (5.1) 
E(Y/X,D=0) =  1 +  2 X i 	 (5.2) 
E(Y/X,D=1) =  1 +  2 X i +  3 	 (5.3) 
(5.2): tiền lương trung bình của công nhân làm việc trong khu vực quốc doanh với bậc thợ là X 
(5.3): tiền lương trung bình của công nhân làm việc trong khu vực tư nhân với bậc thợ là X 
5.2 Sử dụng biến giả trong mô hình hồi quy 
16 
 2 	 tốc độ tăng lương theo bậc thợ 
 3 	 chênh lệch tiền lương trung bình của công nhân làm việc ở hai khu vực và cùng bậc thợ 
(Giả thiết của mô hình: tốc độ tăng lương theo bậc thợ ở hai khu vực giống nhau) 
5.2 Sử dụng biến giả trong mô hình hồi quy 
17 
E(Y/X,Z) =  1 +  2 X i +  3 D i 
Y 
Hình 5.1 mức thu nhập bình quân tháng của người lao động tại KVQD và KVTN khi có bậc thợ là X 
X 
18 
Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào thời gian công tác (X) (năm) và nơi làm việc của người lao động (DNNN, DNTN và DNLD) 
Dùng 2 biến giả Z 1 và Z 2 với 
Z 1i =1 	 nơi làm việc tại DNNN 
Z 1i =0 	 nơi làm việc tại nơi khác 
Z 2i =1 	 nơi làm việc tại DNTN 
Z 2i =0 	 nơi làm việc tại nơi khác 
Z 1i = 0 và Z 2i = 0 phạm trù cơ sở 
5.2 Sử dụng biến giả trong mô hình hồi quy 
19 
Y (thu nhập) 
X (số năm) 
Nơi làm việc 
Z 1 
Z 2 
4 
3 
DNNN 
1 
0 
5 
5 
DNTN 
0 
1 
3 
3 
DNLD 
0 
0 
6 
4 
DNTN 
1 
7 
5 
DNNN 
1 
5.2 Sử dụng biến giả trong mô hình hồi quy 
20 
E(Y/X,Z1,Z2) =  1 +  2 X i +  3 Z 1i +  4 Z 2i 
E(Y/X,Z1=0,Z2=0) =  1 +  2 X i 	 
E(Y/X,Z1=1,Z2=0) =  1 +  2 X i +  3 	 
E(Y/X,Z1=0,Z2=1) =  1 +  2 X i +  4 	 
  3 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNNN và DNLD khi có cùng thời gian làm việc X năm 
  4 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNTN và DNLD khi có cùng thời gian làm việc X năm 
5.2 Sử dụng biến giả trong mô hình hồi quy 
21 
Ví dụ 5.3 . thu nhập còn phụ thuộc vào trình độ người lao động (từ đại học trở lên, cao đẳng và khác) 
D 1i 
= 
1: nếu trình độ từ đại học trở lên 
0: trường hợp khác 
D 2i 
= 
1: nếu trình độ cao đẳng 
0: trường hợp khác 
5.2 Sử dụng biến giả trong mô hình hồi quy 
Một chỉ tiêu chất lượng có n phạm trù (thuộc tính) khác nhau thì dùng n-1 biến giả 
22 
5.2 Sử dụng biến giả trong mô hình hồi quy 
Giả sử Y, X là biến định lượng, Z là biến giả (định tính) 
TH1: Y=  1 +  2 Z +  3 X + U 
TH2: Y=  1 +  2 X +  3 (ZX) + U 
TH3: Y=  1 +  2 Z +  3 X +  4 (ZX)+ U 
23 
VD 5.4 : Khảo sát lương của nhân viên theo số năm kinh nghiệm và giới tính 
TH1: Y=  1 +  2 Z +  3 X + U 
TH2: Y=  1 +  2 X +  3 (ZX) + U 
TH3: Y=  1 +  2 Z +  3 X +  4 (ZX)+ U 
Trong đó 
Y 	lương 
X	số năm kinh nghiệm 
Z	giới tính 	với	 Z=1: nam; Z=0: nữ	 
5.2 Sử dụng biến giả trong mô hình hồi quy 
24 
TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc độ tăng lương theo số năm kinh nghiệm như nhau 
TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác nhau 
TH3: Lương khởi điểm và tốc độ tăng lương khác nhau 
5.2 Sử dụng biến giả trong mô hình hồi quy 
25 
TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc độ tăng lương theo số năm kinh nghiệm như nhau 
Hàm PRF: Y =  1 +  2 Z +  3 X + U 
Hàm SRF ứng với nữ (Z=0) : 
Hàm SRF ứng với nam (Z=1) : 
5.2 Sử dụng biến giả trong mô hình hồi quy 
26 
Hình 5.2 Lương khởi điểm của nv nam và nữ khác nhau 
5.2 Sử dụng biến giả trong mô hình hồi quy 
27 
TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác nhau 
Hàm PRF: 
	 Y =  1 +  2 X +  3 (ZX) + U 
Với ZX gọi là biến tương tác 
Hàm SRF ứng với nữ (Z=0) : 
Hàm SRF ứng với nam (Z=1) : 
5.2 Sử dụng biến giả trong mô hình hồi quy 
28 
Hình 5.3 Mức tăng lương theo số năm kinh nghiệm của nv nam và nữ khác nhau 
5.2 Sử dụng biến giả trong mô hình hồi quy 
29 
TH3: Lương khởi điểm và tốc độ tăng lương khác nhau 
Hàm PRF: Y =  1 +  2 Z +  3 X +  4 (ZX)+ U 
Hàm SRF ứng với nữ (Z=0) : 
Hàm SRF ứng với nam (Z=1) : 
5.2 Sử dụng biến giả trong mô hình hồi quy 
30 
Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau 
5.2 Sử dụng biến giả trong mô hình hồi quy 
31 
5.3.1 Sử dụng biến giả trong phân tích mùa 
Y	chi tiêu cho tiêu dùng 
X	thu nhập 
Z = 1 nếu quan sát trong mùa (tháng 1-6) 
Z = 0	nếu quan sát không nằm trong mùa (tháng 7-12) 
5.3 Ứng dụng sử dụng biến giả 
TH1: Nếu yếu tố mùa chỉ ảnh hưởng đến hệ số chặn 
TH2: Nếu yếu tố mùa có ảnh hưởng đến hệ số góc 
Mô hình * có tính tổng quát hơn. Qua việc kiểm định giả thiết để biết được hệ số góc nào có ý nghĩa. 
32 
Ví dụ 
Có bảng số liệu sau về doanh số bán từng quý (triệu đồng). Hãy sắp xếp lại số liệu, sử dụng biến giả và viết mô hình hồi quy. 
Năm 
Quý 
Doanh số 
Năm 
Quý 
Doanh số 
1970 
1 
992.7 
1971 
4 
1918.3 
1970 
2 
1077.6 
1972 
1 
2163.9 
1970 
3 
1185.9 
1972 
2 
2417.8 
1970 
4 
1326.4 
1972 
3 
2631.7 
1971 
1 
1434.2 
1972 
4 
2957.8 
1971 
2 
1549.2 
1973 
1 
3069.3 
1971 
3 
1718 
1973 
2 
3304.8 
33 
Năm 
Quý 
Doanh số 
D2 
D3 
D4 
1970 
1 
992.7 
0 
0 
0 
1970 
2 
1077.6 
1 
0 
0 
1970 
3 
1185.9 
0 
1 
0 
1970 
4 
1326.4 
0 
0 
1 
1971 
1 
1434.2 
0 
0 
0 
1971 
2 
1549.2 
1 
0 
0 
1971 
3 
1718 
0 
1 
0 
1971 
4 
1918.3 
0 
0 
1 
1972 
1 
2163.9 
0 
0 
0 
1972 
2 
2417.8 
1 
0 
0 
1972 
3 
2631.7 
0 
1 
0 
1972 
4 
2957.8 
0 
0 
1 
1973 
1 
3069.3 
0 
0 
0 
1973 
2 
3304.8 
1 
0 
0 
Ví dụ 
34 
Viết mô hình hồi quy mẫu và ý nghĩa các hệ số 
35 
5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy 
Ví dụ 5.5. Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước Anh từ 1946-63 (triệu pounds) 
5.3 Ứng dụng sử dụng biến giả 
36 
Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ 
Thời kỳ tái thiết: 1946-54	 
	 (5.3.1) 
Thời kỳ hậu tái thiết: 1955-63 
	 (5.3.2) 
Và kiểm định các trường hợp sau 
5.3 Ứng dụng sử dụng biến giả 
Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu trúc giữa 2 thời kỳ hay không. 
37 
Kiểm định Chow 
Giả thiết: H 0 : Hai hàm (5.3.1) và (5.3.2) giống nhau 
B1 : Gộp hai nhóm quan sát n=n1+n2 và tính RSS có bậc tự do df= n1+n2-k từ mô hình hồi quy 
B2 : Ước lượng (5.3.1) và (5.3.2) và thu được RSS1 có df = n1-k, RSS2 có df = n2-k. Đặt RSS*=RSS1+RSS2 
B3 : Tính 
B4: Nếu F > F α (k, n1+n2-2k): bác bỏ H 0 
38 
39 
40 
41 
Với n = n 1 + n 2 
Z = 1	quan sát thuộc thời kỳ tái thiết 
Z = 0 	quan sát thuộc thời kỳ hậu tái thiết 
B2 . Kiểm định giả thiết H 0 :  3 =0 
Nếu chấp nhận H 0 : loại bỏ Z ra khỏi mô hình 
B3 . Kiểm định giả thiết H 0 :  4 =0 
Nếu chấp nhận H 0 : loại bỏ Z i X i ra khỏi mô hình 
5.3 Ứng dụng sử dụng biến giả 
Cách 2 Sử dụng biến giả 
B1 . Lập hàm tiết kiệm tổng quát của cả 2 thời kỳ 
42 
43 
Kết quả hồi quy theo mô hình như sau 
t =	(-5,27) (9,238) (3,155) (-3,109) 
p =	(0,000) (0,000) (0,007) (0,008) 
5.3 Ứng dụng sử dụng biến giả 
Nhận xét 
Tung độ gốc chênh lệch và hệ số góc chênh lệch có ý nghĩa thống kê 
Các hồi quy trong hai thời kỳ là khác nhau 
44 
Thời kỳ tái thiết: Z = 1 
Thời kỳ hậu tái thiết: Z = 0 
5.3 Ứng dụng sử dụng biến giả 
45 
-0.27 
-1.75 
Thu nhập 
Tiết kiệm 
Hình 5.6 Mô hình hồi quy cho 2 thời kỳ 
5.3 Ứng dụng sử dụng biến giả 
Thời kỳ tái thiết 
Thời kỳ hậu tái thiết 
46 
5.3.3. Hàm tuyến tính từng khúc 
Ví dụ 5.6 : Doanh thu dưới X* thì tiền hoa hồng sẽ khác với khi doanh thu trên X*. 
Hàm hồi quy có dạng 
Y	Tiền hoa hồng 
X	Doanh thu X*	Giá trị ngưỡng sản lượng 
Z i 	=1 nếu X i > X* 
Z i 	=0 nếu X i ≤ X* 
5.3 Ứng dụng sử dụng biến giả 
47 
Y 
X 
Hình 5.7 Hàm tuyến tính từng khúc 
5.3 Ứng dụng sử dụng biến giả 
Kiểm định giả thiết H 0 :  3 =0 
Nếu bác bỏ H 0 : hàm hồi quy thay đổi cấu trúc 
48 
Ví dụ : Sản lượng dưới X*, thì chi phí hoa hồng sẽ khác với khi sản lượng trên X*. 
Hàm hồi quy sẽ có dạng: 
Y: Chi phí; X: sản lượng;X*=5.500 tấn: giá trị ngưỡng sản lượng 
5.3 Ứng dụng sử dụng biến giả 
49 
t = (-0,824) (6,607) (1,145) 
R 2 = 0,9737 	X* = 5500 
Ta có kết quả hồi quy như sau: 
5.3 Ứng dụng sử dụng biến giả 
            Các file đính kèm theo tài liệu này:
 bai_giang_mon_kinh_te_luong_chuong_5_bien_gia_trong_phan_tic.ppt bai_giang_mon_kinh_te_luong_chuong_5_bien_gia_trong_phan_tic.ppt