Bài giảng Kinh tế lượng - Chương 5: Biến giả trong phân tích hồi quy - Trần Quang Cảnh

Khảo sát lương của nhân viên theo số năm kinh nghiệm và giới tính TH1: Y= 1 + 2Z + 3X + U TH2: Y= 1 + 2X + 3(ZX) + U TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U Trong đó Y lương X số năm kinh nghiệm Z giới tính với Z=1: nam; Z=0: nữ Sử dụng biến giả trong phân tích mùa Y chi tiêu cho tiêu dùng X thu nhập Z = 1 nếu quan sát trong mùa (tháng 1-6) Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12) 5.3 Ứng dụng sử dụng biến giả TH1: Nếu yếu tố mùa chỉ ảnh hưởng đến hệ số chặn TH2: Nếu yếu tố mùa có ảnh hưởng đến hệ số góc Mô hình * có tính tổng quát hơn. Qua việc kiểm định giả thiết để biết được hệ số góc nào có ý nghĩa.

pdf13 trang | Chia sẻ: hachi492 | Ngày: 15/01/2022 | Lượt xem: 154 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Kinh tế lượng - Chương 5: Biến giả trong phân tích hồi quy - Trần Quang Cảnh, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1CHƯƠNG 5 BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY 2 1. Biết cách đặt biến giả 2. Nắm phương pháp sử dụng biến giả trong phân tích hồi quy MỤC TIÊU BIẾN GIẢ NỘI DUNG Khái niệm biến giả1 Sử dụng biến giả trong mô hình hồi quy2 3 Kỹ thuật sử dụng biến giả • Biến định lượng: các giá trị quan sát được thể hệ bằng con số • Biến định tính: thể hiện một số tính chất nào đó • Để đưa những thuộc tính của biến định tính vào mô hình hồi quy, cần lượng hóa chúng => sử dụng biến giả (dummy variables) 4 5.1 KHÁI NIỆM • Ví dụ: khảo sát năng suất của 2 công nghệ, người ta thu được các số liệu cho ở bảng sau: Trong đó Yi : năng suất Zi: công nghệ tương ứng 5 5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ Zi B A A B B A B A A B Yi 28 32 35 27 25 37 29 34 33 30 Di: là biến giả Di = 1 nếu là công nghệ A Di = 0 nếu là công nghệ B Ta có bảng số liệu như sau 6 5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ Di 0 1 1 0 0 1 0 1 1 0 Yi 28 32 35 27 25 37 29 34 33 30 1 2 3 4 5 6 2Sử dụng mô hình hồi quy Yi = β1 + β2Di + Ui (hãy tìm hàm hồi quy mẫu ?) •Như vậy β1 + β2 biểu hiện năng suất trung bình của công nghệ A •β2 phản ánh chênh lệch năng suất trung bình giữa công nghệ B và công nghệ A •β2 = 0 chính là giả thiết cho rằng giũa công nghệ A và công nghệ B không có sự khác biệt 7 5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ Sử dụng số liệu ở bảng trên, tìm hàm hồi quy tuyến tính mẫu Y theo D: Ŷi = 27,8 + 6,4Di Năng suất trung bình của công nghệ A ? Năng suất trung bình của công nghệ B ? 8 5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ Chú ý: để phân biệt m mức độ người ta dùng m-1 biến giả để tránh hiện tượng đa cộng tuyến. f 9 5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ • Ví dụ: khảo sát lượng hàng bán được ở một cửa hàng, người ta thu được các số liệu cho ở bảng sau: Trong đó Yi : Lượng hàng bán được (tấn/tháng) Xi: giá bán Di: Khu vực khảo sát: Di = 0 nếu khu vực khảo sát ở nông thôn, Di = 1 nếu khu vực khảo sát ở thành phố 10 5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH TÍNH Yi 20 19 18 18 17 17 16 16 15 15 14 14 13 12 12 15 16 12 10 11 xi 2 3 3 4 4 3 4 4 5 5 5 6 6 7 7 5 4 7 8 8 Di 1 0 1 0 1 1 0 1 1 1 0 1 0 1 0 1 0 1 0 1 Sử dụng mô hình hồi quy Yi = β1 + β2Xi + β3Di + Ui Yi = β1 + β2Xi (mô hình 1) lượng bán ở khu vực nông thôn Yi = β1 + β2Xi + β3 (mô hình 2) lượng bán ở khu vực thành thị β3 biểu thị mức chênh lệch về lượng bán ở khu vực nông và thành thị Ý nghĩa của β2 ? Β3 = 0 ? 11 5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH TÍNH 12 7 8 9 10 11 12 3Với ví dụ trên: giả sử khu vực khảo sát được chia làm ba vùng khác nhau gồm thành thị, nông thôn, miền núi. Chúng ta sử dụng mấy biến giả? Chúng ta sử dụng mô hình sau Yi = β1 + β2Xi + β3D1i + β4D2i + Ui Trong đó Yi : Lượng hàng bán được (tấn/tháng) Xi: giá bán; Di: Khu vực khảo sát: với 2 biến giả D1i và D2i D1i = 1 nếu khu vực khảo sát ở nông thôn, D1i = 0 nếu khu vực khảo sát ở nơi khác, D2i = 1 nếu khu vực khảo sát ở thành phố, D2i = 0 nếu khu vực khảo sát ở nơi khác 13 5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH TÍNH Như vậy Lượng bán trung bình của một cửa hàng ở miền núi là phạm trù cơ sở (D1i = D2i = 0) ta có Yi = β1 + β2Xi + Ui Lượng bán trung bình của một cửa hàng ở nông thôn là (D1i= ?; D2i= ?) ta có Yi = β1 + β2Xi + β3 + Ui Lượng bán trung bình của một cửa hàng ở thành phố là (D1i= ?; D2i= ?) ta có Yi = β1 + β2Xi + β4 + Ui 14 5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH TÍNH Giả sử chúng ta muốn ước lượng mức thu nhập của nhân viên bán hàng được quyết định bởi số năm kinh nghiệm, trình độ học vấn (dưới đại học, đại học, trên đại học) và giới tính nam hay nữ (để xem giới tính có ảnh hưởng thu nhập hay không). Mấy phạm trù, đặt máy biến giả ? 15 5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH TÍNH Ta đặt Yi: thu nhập Xi: số năm kinh nghiệm, D1i = 1: nhân viên có trình độ đại học, D2i = 1 nhân viên có trình độ trên đại học, D3i = 1: nhân viên nam. (D1i = 0, D2i = 0, D3i = 0): Nữ dưới đại học – phạm trù cơ sở nam dưới đại học, nữ đại học, nam đại học, nữ sau đại học, nam sau đại học? (D1i = 0, D2i = 0, D3i = 1): Nam dưới đại học (D1i = 1, D2i = 0, D3i = 0): Nữ đại học; (D1i = 1, D2i = 0, D3i = 1): Nam đại học; (D1i = 0, D2i = 1, D3i = 0 ): Nữ sau đại học (D1i = 0, D2i = 1, D3i = 1): Nam sau đại học; 16 5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH TÍNH Mô hình hồi quy tổng quát như sau: Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + Ui Thu nhập của nữ có trình độ dưới đại học: E(Y/X, D1i = 0, D2i = 0, D3i = 0) = β1 + β2Xi + Ui Thu nhập của nam có trình độ dưới đại học: ? E(Y/X, D1i = 0, D2i = 0, D3i = 1) = β1 + β2Xi + β5 + Ui Thu nhập của nữ có trình độ đại học: E(Y/X, D1i = 1, D2i = 0, D3i = 0) = β1 + β2Xi + β3+ Ui 17 5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH TÍNH Thu nhập của nam có trình độ đại học: E(Y/X, D1i = 1, D2i = 0, D3i = 1) = β1 + β2Xi + β3+ β5+ Ui Thu nhập của nữ có trình độ sau đại học: E(Y/X, D1i = 0, D2i = 1, D3i = 0) = β1 + β2Xi + β4 + Ui Thu nhập của nam có trình độ sau đại học: E(Y/X, D1i = 0, D2i = 1, D3i = 1) = β1 + β2Xi + β4 + β5+ Ui 18 5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH TÍNH 13 14 15 16 17 18 4Từ mô hình trên ta có thể so sánh mức thu nhập với nhiều trường hợp khác nhau -Giữa nhân viên nữ có bằng đại học với nhân viên nữ không có bằng đại học. -Giữa nhân viên nữ có bằng đại học với nhân viên nữ có bằng trên đại học. -Giữa nhân viên nữ có bằng đại học với nhân viên nam có bằng đại học. -Giữa nhân viên nam có bằng đại học với nhân viên nam không có bằng đại học 19 5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH TÍNH Giả sử ta hồi quy thu nhập (biến Y) của nhân viên nam và nữ, có mức lương khởi điểm (β1) và thâm niên công tác (Biến X). Trong đó thâm niên công tác như nhau nhưng tốc độ tăng lương giữa nam và nữ có thể khác nhau. Giả sử đặt hệ số tăng lương của nhân viên nữ là β2 , hệ số tăng lương của nhân viên nam khác nhân viên nữ một khoảng α2 tức hệ số tăng lương của nhân viên nam là (β2 + α2) 20 5.5. BIẾN GiẢ VỚI HỆ SỐ GÓC KHÁC NHAU Thu nhập của nhân viên nữ: Yi = β1 + β2Xi + Ui Thu nhập của nhân viên nam: Yi = β1 + (β2 + α2) Xi + Ui Nếu đặt Di là biến giới tính với Di = 1 nếu là nam, Di = 0 nếu là nữ, Mô hình tổng quát trở thành: Yi = β1 + (β2 + α2 Di )Xi + Ui (Hay: Yi = β1 + β2 Xi + α2 Di Xi + Ui) α2 > 0 tốc độ tăng thu nhập của nhân viên nam nhanh hơn nhân viên nữ, α2 < 0 tốc độ tăng thu nhập của nhân viên nam chậm hơn nhân viên nữ. 21 5.5. BIẾN GiẢ VỚI HỆ SỐ GÓC KHÁC NHAU Tiếp tục với ví dụ trên. Giả sử lương khới điểm của nhân viên nữ (chưa có thâm niên hay X = 0); là β1; Lương khởi điểm của nhân viên nam (chưa có thâm niên hay X = 0) khác lương khởi điểm của nhân viên nữ một khoản là α1 tức lương khởi điểm của nhân viên nam là (β1 + α1 ) Mô hình tổng quát trở thành: Yi = (β1 + α1Di )+ (β2 + α2 Di )Xi + Ui (Hay: Yi = β1 + α1Di + β2 Xi + α2 Di Xi + Ui) 22 5.6. BIẾN GiẢ VỚI TUNG ĐỘ GỐC VÀ HỆ SỐ GÓC KHÁC NHAU 23 Bài tập: Mã hóa bảng số liệu dưới đây và tìm hàm hồi quy mẫu Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Giới tính chủ hộ Nơi sinh sống Yi 38820 4 10097.37 3 48 Nam Nông thôn 38818 6 14695.2 8 42 Nữ Nông thôn 38817 8 11733.34 4 37 Nữ Nông thôn 38816 3 7087.489 0 21 Nữ Nông thôn 38815 9 22809.3 6 48 Nữ Nông thôn 38813 4 9554.563 2 76 Nữ Nông thôn 11212 7 69258.09 9 42 Nữ Thành thị 11211 3 13680.91 0 77 Nữ Thành thị 11209 3 27651.65 13 32 Nữ Thành thị 11208 4 32102.67 8 47 Nữ Thành thị 11207 2 11464.6 7 38 Nam Thành thị 11206 4 17199.63 5 93 Nam Thành thị 24 19 20 21 22 23 24 5Bài tập: Mã hóa bảng số liệu dưới đậy và tìm hàm hồi quy mẫu Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Giới tính chủ hộ Nơi sinh sống X1i Yi X2i X3i D1i D2i 38820 4 10097.37 3 48 1 0 38818 6 14695.2 8 42 0 0 38817 8 11733.34 4 37 0 0 38816 3 7087.489 0 21 0 0 38815 9 22809.3 6 48 0 0 38813 4 9554.563 2 76 0 0 11212 7 69258.09 9 42 0 1 11211 3 13680.91 0 77 0 1 11209 3 27651.65 13 32 0 1 11208 4 32102.67 8 47 0 1 11207 2 11464.6 7 38 1 1 11206 4 17199.63 5 93 1 1 25 26 5.7. BIẾN GiẢ TRONG PHÂN TÍCH THỜI VỤ 27 5.8. KiỂM ĐỊNH TÍNH ĐỊNH CẤU TRÚC CỦA CÁC MÔ HÌNH 28 5.9. HỒI QUY TUYẾN TÍNH TỪNG KHÚC 29 5.10. HỒI QUY BiẾN PHỤ THUỘC LÀ BiẾN GiẢ 30 25 26 27 28 29 30 6Chi tiêu của hộ = α + β1* quy mô hộ + β2*trình độ văn hóa của chủ hộ+ β3* tuổi của chủ hộ + β4* giới tính của chủ hộ β5* nơi sinh sống của hộ Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Giới tính chủ hộ Nơi sinh sống 38820 4 10097.37 3 48 Nam Nông thôn 38818 6 14695.2 8 42 Nữ Nông thôn 38817 8 11733.34 4 37 Nữ Nông thôn 38816 3 7087.489 0 21 Nữ Nông thôn 38815 9 22809.3 6 48 Nữ Nông thôn 38813 4 9554.563 2 76 Nữ Nông thôn 11212 7 69258.09 9 42 Nữ Thành thị 11211 3 13680.91 0 77 Nữ Thành thị 11209 3 27651.65 13 32 Nữ Thành thị 11208 4 32102.67 8 47 Nữ Thành thị 11207 2 11464.6 7 38 Nam Thành thị 11206 4 17199.63 5 93 Nam Thành thị 31 Ví dụ • Có hai biến độc lập định tính là giới tính của chủ hộ và nơi sinh sống của hộ. Để phân tích hồi quy cần phải lượng hóa hai biến định tính này. • Thực hiện: Giới tính gồm hai biểu hiện là nam và nữ và mã hóa như sau: Nam=1, Nữ=0. • Nơi sinh sống của hộ gồm thành thị và nông thôn nên mã hóa như sau: Thành thị=1, Nông thôn=0. (Việc chọn số mã hóa tùy nhà phân tích). 32 Dữ liệu đã mã hóa Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Giới tính chủ hộ Nơi sinh sống 38820 4 10097.37 3 48 1 0 38818 6 14695.2 8 42 0 0 38817 8 11733.34 4 37 0 0 38816 3 7087.489 0 21 0 0 38815 9 22809.3 6 48 0 0 38813 4 9554.563 2 76 0 0 11212 7 69258.09 9 42 0 1 11211 3 13680.91 0 77 0 1 11209 3 27651.65 13 32 0 1 11208 4 32102.67 8 47 0 1 11207 2 11464.6 7 38 1 1 11206 4 17199.63 5 93 1 1 33 Ví dụ Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Nghề nghiệp chủ hộ 38820 4 10097.37 3 48 Bác sĩ 38818 6 14695.2 8 42 Giáo viên 38817 8 11733.34 4 37 Nông dân 38816 3 7087.489 0 21 Bác sĩ 38815 9 22809.3 6 48 Giáo viên 38813 4 9554.563 2 76 Nông dân 11212 7 69258.09 9 42 Bác sĩ 11211 3 13680.91 0 77 Giáo viên 11209 3 27651.65 13 32 Nông dân 11208 4 32102.67 8 47 Bác sĩ 11207 2 11464.6 7 38 Giáo viên 11206 4 17199.63 5 93 Nông dân 34 Ví dụ 1. Nghề nghiệp có 3 nghề (3 phạm trù) 2. Chọn 1 nghề làm phạm trù cơ sở Ví dụ: chọn bác sĩ 3. Hai nghề còn lại là hai biến mới Vậy số biến mới = số phạm trù -1 4. Biến Giáo viên nhận 2 giá trị: 1 nếu là giáo viên; 0 nếu không phải là giáo viên 5. Biến Nông dân nhận 2 giá trị: 1 nếu là nông dân; 0 nếu không phải là nông dân 35 Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Nghề nghiệp chủ hộ Giáo viên Nông dân ### 4 ### 3 48 Bác sĩ 0 0 ### 6 ### 8 42 Giáo viên 1 0 ### 8 ### 4 37 Nông dân 0 1 ### 3 ### 0 21 Bác sĩ 0 0 ### 9 ### 6 48 Giáo viên 1 0 ### 4 ### 2 76 Nông dân ### 7 ### 9 42 Bác sĩ ### 3 ### 0 77 Giáo viên ### 3 ### 13 32 Nông dân ### 4 ### 8 47 Bác sĩ ### 2 ### 7 38 Giáo viên ### 4 ### 5 93 Nông dân 36 31 32 33 34 35 36 7Câu hỏi • Nếu có thêm nghề kế toán thì sao? 37 HỒI QUY VỚI BiẾN ĐỊNH TÍNH Quy tắc: Nếu biến định tính có m biểu hiện thì sử dụng m-1 biến. Ví dụ: Tổng chi tiêu của hộ phụ thuộc vào (1) Giới tính của chủ hộ (2) Số thành viên trong hộ (3) Vùng nơi hộ sinh sống (có 8 vùng) Biến định tính là biến nào? 38 39 Ví dụ 5.1: Xét mô hình Yi = 1 + 2Xi + 3Di + Ui với Y Tiền lương (triệu đồng/tháng) X Bậc thợ D=1 nếu công nhân làm trong khu vực tư nhân D=0 nếu công nhân làm trong khu vực nhà nước D được gọi là biến giả trong mô hình 5.2 Sử dụng biến giả trong mô hình hồi quy 40 Y (thu nhập) X (số năm) D (nơi làm việc) 4 3 1 5 5 0 3 3 0 6 4 1 7 5 1 5.2 Sử dụng biến giả trong mô hình hồi quy 41 E(Y/X,D) = 1 + 2Xi + 3Di (5.1) E(Y/X,D=0) = 1 + 2Xi (5.2) E(Y/X,D=1) = 1 + 2Xi + 3 (5.3) (5.2): tiền lương trung bình của công nhân làm việc trong khu vực quốc doanh với bậc thợ là X (5.3): tiền lương trung bình của công nhân làm việc trong khu vực tư nhân với bậc thợ là X 5.2 Sử dụng biến giả trong mô hình hồi quy 42 2 tốc độ tăng lương theo bậc thợ 3 chênh lệch tiền lương trung bình của công nhân làm việc ở hai khu vực và cùng bậc thợ (Giả thiết của mô hình: tốc độ tăng lương theo bậc thợ ở hai khu vực giống nhau) 5.2 Sử dụng biến giả trong mô hình hồi quy 37 38 39 40 41 42 843 E(Y/X,Z) = 1 + 2Xi + 3Di Y 1ˆ 3ˆ 31 ˆˆ   Hình 5.1 mức thu nhập bình quân tháng của người lao động tại KVQD và KVTN khi có bậc thợ là X X 44 Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào thời gian công tác (X) (năm) và nơi làm việc của người lao động (DNNN, DNTN và DNLD) Dùng 2 biến giả Z1 và Z2 với Z1i =1 nơi làm việc tại DNNN Z1i =0 nơi làm việc tại nơi khác Z2i =1 nơi làm việc tại DNTN Z2i =0 nơi làm việc tại nơi khác Z1i = 0 và Z2i = 0 phạm trù cơ sở 5.2 Sử dụng biến giả trong mô hình hồi quy 45 Y (thu nhập) X (số năm) Nơi làm việc Z1 Z2 4 3 DNNN 1 0 5 5 DNTN 0 1 3 3 DNLD 0 0 6 4 DNTN 0 1 7 5 DNNN 1 0 5.2 Sử dụng biến giả trong mô hình hồi quy 46 E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i E(Y/X,Z1=0,Z2=0) = 1 + 2Xi E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3 E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4 • 3 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNNN và DNLD khi có cùng thời gian làm việc X năm • 4 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNTN và DNLD khi có cùng thời gian làm việc X năm 5.2 Sử dụng biến giả trong mô hình hồi quy 47 Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ người lao động (từ đại học trở lên, cao đẳng và khác) D1i = 1: nếu trình độ từ đại học trở lên 0: trường hợp khác D2i = 1: nếu trình độ cao đẳng 0: trường hợp khác 5.2 Sử dụng biến giả trong mô hình hồi quy Một chỉ tiêu chất lượng có n phạm trù (thuộc tính) khác nhau thì dùng n-1 biến giả 48 5.2 Sử dụng biến giả trong mô hình hồi quy Giả sử Y, X là biến định lượng, Z là biến giả (định tính) TH1: Y= 1 + 2Z + 3X + U TH2: Y= 1 + 2X + 3(ZX) + U TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U 43 44 45 46 47 48 949 VD 5.4: Khảo sát lương của nhân viên theo số năm kinh nghiệm và giới tính TH1: Y= 1 + 2Z + 3X + U TH2: Y= 1 + 2X + 3(ZX) + U TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U Trong đó Y lương X số năm kinh nghiệm Z giới tính với Z=1: nam; Z=0: nữ 5.2 Sử dụng biến giả trong mô hình hồi quy 50 TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc độ tăng lương theo số năm kinh nghiệm như nhau TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác nhau TH3: Lương khởi điểm và tốc độ tăng lương khác nhau 5.2 Sử dụng biến giả trong mô hình hồi quy 51 TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc độ tăng lương theo số năm kinh nghiệm như nhau Hàm PRF: Y= 1 + 2Z + 3X + U Hàm SRF ứng với nữ (Z=0) : Hàm SRF ứng với nam (Z=1) : XY 31 ˆˆˆ   XY 321 ˆˆˆˆ   5.2 Sử dụng biến giả trong mô hình hồi quy 52 Hình 5.2 Lương khởi điểm của nv nam và nữ khác nhau 21 ˆˆ   0ˆ,ˆ,ˆ 321  1ˆ 0 X Y XY 31 ˆˆˆ   XY 321 ˆˆˆˆ   5.2 Sử dụng biến giả trong mô hình hồi quy 53 TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác nhau Hàm PRF: Y= 1 + 2X + 3(ZX) + U Với ZX gọi là biến tương tác Hàm SRF ứng với nữ (Z=0) : Hàm SRF ứng với nam (Z=1) : XY 21 ˆˆˆ   XXXY )ˆˆ(ˆˆˆˆˆ 321321   5.2 Sử dụng biến giả trong mô hình hồi quy 54 Hình 5.3 Mức tăng lương theo số năm kinh nghiệm của nv nam và nữ khác nhau XY 21 ˆˆˆ   0ˆ,ˆ,ˆ 321  1ˆ 0 X Y XY )ˆˆ(ˆˆ 321   5.2 Sử dụng biến giả trong mô hình hồi quy 49 50 51 52 53 54 10 55 TH3: Lương khởi điểm và tốc độ tăng lương khác nhau Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U Hàm SRF ứng với nữ (Z=0) : Hàm SRF ứng với nam (Z=1) : XY 31 ˆˆˆ   XXXY )ˆˆ()ˆˆ(ˆˆˆˆˆ 43214321   5.2 Sử dụng biến giả trong mô hình hồi quy 56 Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau XY 31 ˆˆˆ   21 ˆˆ   0ˆ,ˆ,ˆ,ˆ 4321  1ˆ 0 X Y XY )ˆˆ()ˆˆ(ˆ 4321   5.2 Sử dụng biến giả trong mô hình hồi quy 57 58 5.3.1 Sử dụng biến giả trong phân tích mùa Y chi tiêu cho tiêu dùng X thu nhập Z = 1 nếu quan sát trong mùa (tháng 1-6) Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12) iii ZXY 321 ˆˆˆˆ   (*)ˆˆˆˆˆ 4321 iiiii ZXZXY   5.3 Ứng dụng sử dụng biến giả TH1: Nếu yếu tố mùa chỉ ảnh hưởng đến hệ số chặn TH2: Nếu yếu tố mùa có ảnh hưởng đến hệ số góc Mô hình * có tính tổng quát hơn. Qua việc kiểm định giả thiết để biết được hệ số góc nào có ý nghĩa. 59 Ví dụ Có bảng số liệu sau về doanh số bán từng quý (triệu đồng). Hãy sắp xếp lại số liệu, sử dụng biến giả và viết mô hình hồi quy. Năm Quý Doanh số Năm Quý Doanh số 1970 1 992.7 1971 4 1918.3 1970 2 1077.6 1972 1 2163.9 1970 3 1185.9 1972 2 2417.8 1970 4 1326.4 1972 3 2631.7 1971 1 1434.2 1972 4 2957.8 1971 2 1549.2 1973 1 3069.3 1971 3 1718 1973 2 3304.8 60 Năm Quý Doanh số D2 D3 D4 1970 1 992.7 0 0 0 1970 2 1077.6 1 0 0 1970 3 1185.9 0 1 0 1970 4 1326.4 0 0 1 1971 1 1434.2 0 0 0 1971 2 1549.2 1 0 0 1971 3 1718 0 1 0 1971 4 1918.3 0 0 1 1972 1 2163.9 0 0 0 1972 2 2417.8 1 0 0 1972 3 2631.7 0 1 0 1972 4 2957.8 0 0 1 1973 1 3069.3 0 0 0 1973 2 3304.8 1 0 0 Ví dụ 55 56 57 58 59 60 11 61Viết mô hình hồi quy mẫu và ý nghĩa các hệ số 62 5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy Ví dụ 5.5. Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước Anh từ 1946-63 (triệu pounds) TK I Tiết kiệm Thu nhập TK II Tiết kiệm Thu nhập 1946 0.36 8.8 1955 0.59 15.5 1947 0.21 9.4 1956 0.9 16.7 1948 0.08 10 1957 0.95 17.7 1949 0.2 10.6 1958 0.82 18.6 1950 0.1 11 1959 1.04 19.7 1951 0.12 11.9 1960 1.53 21.1 1952 0.41 12.7 1961 1.94 22.8 1953 0.5 13.5 1962 1.75 23.9 1954 0.43 14.3 1963 1.99 25.2 5.3 Ứng dụng sử dụng biến giả 63 Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ Thời kỳ tái thiết: 1946-54 (5.3.1) Thời kỳ hậu tái thiết: 1955-63 (5.3.2) Và kiểm định các trường hợp sau 11   22   11   22   11   22   11   22   iii UXY 121   iii UXY 221   5.3 Ứng dụng sử dụng biến giả Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu trúc giữa 2 thời kỳ hay không. 64 Kiểm định Chow iii UXY 221   Giả thiết: H0: Hai hàm (5.3.1) và (5.3.2) giống nhau B1: Gộp hai nhóm quan sát n=n1+n2 và tính RSS có bậc tự do df= n1+n2-k từ mô hình hồi quy B2: Ước lượng (5.3.1) và (5.3.2) và thu được RSS1 có df = n1-k, RSS2 có df = n2-k. Đặt RSS*=RSS1+RSS2 B3: Tính B4: Nếu F > Fα(k, n1+n2-2k): bác bỏ H0   )2/( / 21 * * knnRSS kRSSRSS F    65 66 61 62 63 64 65 66 12 67 68 iiiiii eZXZXY  4321 ˆˆˆˆ  Với n = n1 + n2 Z = 1 quan sát thuộc thời kỳ tái thiết Z = 0 quan sát thuộc thời kỳ hậu tái thiết B2. Kiểm định giả thiết H0: 3=0 Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình B3. Kiểm định giả thiết H0: 4=0 Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình 5.3 Ứng dụng sử dụng biến giả Cách 2 Sử dụng biến giả B1. Lập hàm tiết kiệm tổng quát của cả 2 thời kỳ 69 70 Kết quả hồi quy theo mô hình như sau t = (-5,27) (9,238) (3,155) (-3,109) p = (0,000) (0,000) (0,007) (0,008) iiiiii eZXZXY  1034,04839,115045,075,1 5.3 Ứng dụng sử dụng biến giả Nhận xét •Tung độ gốc chênh lệch và hệ số góc chênh lệch có ý nghĩa thống kê •Các hồi quy trong hai thời kỳ là khác nhau 71 Thời kỳ tái thiết: Z = 1 Thời kỳ hậu tái thiết: Z = 0 ii iii XY XXY 0475,02661,0ˆ 1034,04839,115045,075,1ˆ   ii XY 15045,075,1 ˆ  5.3 Ứng dụng sử dụng biến giả 72 -0.27 -1.75 ii XY 15045,075,1 ˆ  ii XY 0475,02661,0 ˆ  Thu nhập Tiết kiệm Hình 5.6 Mô hình hồi quy cho 2 thời kỳ 5.3 Ứng dụng sử dụng biến giả Thời kỳ tái thiết Thời kỳ hậu tái thiết 67 68 69 70 71 72 13 73 5.3.3. Hàm tuyến tính từng khúc Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng sẽ khác với khi doanh thu trên X*. Hàm hồi quy có dạng Y Tiền hoa hồng X Doanh thu X* Giá trị ngưỡng sản lượng Zi =1 nếu Xi > X* Zi =0 nếu Xi ≤ X* iiiii uZXXXY  )( * 321  5.3 Ứng dụng sử dụng biến giả 74 Y X*X Hình 5.7 Hàm tuyến tính từng khúc 5.3 Ứng dụng sử dụng biến giả •Kiểm định giả thiết H0: 3=0 Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc 75 Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng sẽ khác với khi sản lượng trên X*. Hàm hồi quy sẽ có dạng: Y: Chi phí; X: sản lượng; X*=5.500 tấn: giá trị ngưỡng sản lượng iiiii uZXXXY  )( * 321         * * 1 :0 :1 XX XX Z i i i 5.3 Ứng dụng sử dụng biến giả 76 iiiii eZXXXY  )(095,0279,0717,145 * t = (-0,824) (6,607) (1,145) R2 = 0,9737 X* = 5500 CP 256 414 634 778 1003 SL 1000 2000 3000 4000 5000 CP 1839 2081 2423 2734 2914 SL 6000 7000 8000 9000 10000 Ta có kết quả hồi quy như sau: 5.3 Ứng dụng sử dụng biến giả 73 74 75 76

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_kinh_te_luong_chuong_5_bien_gia_trong_phan_tich_ho.pdf
Tài liệu liên quan