Bài giảng Nhập môn kinh tế lượng - Chương 6: Phân tích hồi quy bội. Một số vấn đề mở rộng
Kiểm soát việc có quá nhiều yếu tố trong phân tích hồi quy
Trong một số trường hợp, một số biến không nên kiểm soát trong mô hình
Trong hồi quy của tử vong do giao thông (fatalities) theo thuế bia của bang
(tax) (và các yếu tố khác như miles, percmale,.) không nên kiểm soát trực tiếp
(đưa biến vào mô hình) lượng bia tiêu thụ trên đầu người (beercons)
Trong hồi quy của chi phí y tế gia đình theo việc sử dụng thuốc trừ sâu của
nông dân không nên kiểm soát số lần đi khám bác sĩ
Các hồi quy khác nhau có thể phục vụ các mục đích khác nhau
Trong hồi quy giá nhà theo các đặc điểm của ngôi nhà, chúng ta cần thêm biến
định giá của giá nhà nếu mục đích của hồi quy là nghiên cứu sự hợp lý của của
việc định giá; nếu không thì ta sẽ không thêm biến định giá vào
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Thêm biến độc lập để giảm phương sai của nhiễu
Việc thêm biến độc lập có thể làm trầm trọng thêm vấn đề đa cộng tuyến
Mặt khác, việc thêm biến độc lập làm giảm phương sai của nhiễu
Các biến không tương quan với biến độc lập đã có nên được thêm vào bởi vì chúng
làm giảm phương sai nhiễu mà không làm tăng tính đa cộng tuyến
Tuy nhiên, các biến không tương quan như vậy rất khó tìm thấy
Ví dụ: lượng bia tiêu thụ của mỗi cá nhân và giá bia
Việc bao gồm các đặc điểm cá nhân trong hồi quy lượng bia tiêu thụ theo giá bia
dẫn đến ước lượng hệ số co giãn của lượng cầu bia theo giá bia “chính xác” hơn
9 trang |
Chia sẻ: hachi492 | Ngày: 15/01/2022 | Lượt xem: 336 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Nhập môn kinh tế lượng - Chương 6: Phân tích hồi quy bội. Một số vấn đề mở rộng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017
https://sites.google.com/a/ueh.edu.vn/phamtricao/ 1
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Chương 6
Phân tích hồi quy bội: Một số vấn đề mở rộng
Wooldridge: Introductory Econometrics: A Modern Approach, 5e
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLSbwght : cân nặng của trẻ sơ sinh, đơn vị tính là ouncecigs : số điếu thuốc mà người mẹ hút hàng ngày trong thời gian mang thaifaminc : thu nhập của gia đình, đơn vị nghìn đôla
• Tập tin bwght.wf1
2
Dependent Variable: BWGHT (MH1) Method: Least Squares Included observations: 1388 Variable Coefficient Std. Error t-Statistic Prob. C 116.9741 1.048984 111.5118 0.0000 CIGS -0.463408 0.091577 -5.060315 0.0000 FAMINC 0.092765 0.029188 3.178195 0.0015 R-squared 0.029805 Mean dependent var 118.6996 Adjusted R-squared 0.028404 S.D. dependent var 20.35396 S.E. of regression 20.06282 Akaike info criterion 8.837772 Sum squared resid 557485.5 Schwarz criterion 8.849089 Log likelihood -6130.414 Hannan-Quinn criter. 8.842005 F-statistic 21.27392 Durbin-Watson stat 1.921690 Prob(F-statistic) 0.000000
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
• bwghtlbs = bwght/16 ; bwghtlbs là cân nặng của em bé với đơn vị pound
• 1 pound = 16 ounce
•
3
Dependent Variable: BWGHTLBS (MH2) Method: Least Squares Included observations: 1388 Variable Coefficient Std. Error t-Statistic Prob. C 7.310883 0.065562 111.5118 0.0000 CIGS -0.028963 0.005724 -5.060315 0.0000 FAMINC 0.005798 0.001824 3.178195 0.0015 R-squared 0.029805 Mean dependent var 7.418723 Adjusted R-squared 0.028404 S.D. dependent var 1.272123 S.E. of regression 1.253926 Akaike info criterion 3.292595 Sum squared resid 2177.678 Schwarz criterion 3.303911 Log likelihood -2282.061 Hannan-Quinn criter. 3.296827 F-statistic 21.27392 Durbin-Watson stat 1.921690 Prob(F-statistic) 0.000000
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
• packs = cigs/20 ; packs là số gói thuốc người mẹ hút trong một ngày ; 1 packs = 20 cigs
4
Dependent Variable: BWGHT (MH3) Method: Least Squares Included observations: 1388 Variable Coefficient Std. Error t-Statistic Prob. C 116.9741 1.048984 111.5118 0.0000 PACKS -9.268151 1.831536 -5.060315 0.0000 FAMINC 0.092765 0.029188 3.178195 0.0015 R-squared 0.029805 Mean dependent var 118.6996 Adjusted R-squared 0.028404 S.D. dependent var 20.35396 S.E. of regression 20.06282 Akaike info criterion 8.837772 Sum squared resid 557485.5 Schwarz criterion 8.849089 Log likelihood -6130.414 Hannan-Quinn criter. 8.842005 F-statistic 21.27392 Durbin-Watson stat 1.921690 Prob(F-statistic) 0.000000
Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017
https://sites.google.com/a/ueh.edu.vn/phamtricao/ 2
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
5
Dependent Variable: BWGHTLBS (MH4) Method: Least Squares Included observations: 1388 Variable Coefficient Std. Error t-Statistic Prob. C 7.310883 0.065562 111.5118 0.0000 PACKS -0.579259 0.114471 -5.060315 0.0000 FAMINC 0.005798 0.001824 3.178195 0.0015 R-squared 0.029805 Mean dependent var 7.418723 Adjusted R-squared 0.028404 S.D. dependent var 1.272123 S.E. of regression 1.253926 Akaike info criterion 3.292595 Sum squared resid 2177.678 Schwarz criterion 3.303911 Log likelihood -2282.061 Hannan-Quinn criter. 3.296827 F-statistic 21.27392 Durbin-Watson stat 1.921690 Prob(F-statistic) 0.000000
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
• fincdol = 1000 faminc ; fincdol là thu nhập của gia đình (usd)faminc là thu nhập của gia đình (ngàn usd)
6
Dependent Variable: BWGHTLBS (MH5) Method: Least Squares Included observations: 1388 Variable Coefficient Std. Error t-Statistic Prob. C 7.310883 0.065562 111.5118 0.0000 PACKS -0.579259 0.114471 -5.060315 0.0000 FINCDOL 5.80E-06 1.82E-06 3.178195 0.0015 R-squared 0.029805 Mean dependent var 7.418723 Adjusted R-squared 0.028404 S.D. dependent var 1.272123 S.E. of regression 1.253926 Akaike info criterion 3.292595 Sum squared resid 2177.678 Schwarz criterion 3.303911 Log likelihood -2282.061 Hannan-Quinn criter. 3.296827 F-statistic 21.27392 Durbin-Watson stat 1.921690 Prob(F-statistic) 0.000000
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
7
Công thức
Hàm hồi quy mẫu theo đơn vị đo cũ
0 1 1 2 2ˆ ˆ ˆyˆ x x
Hàm hồi quy mẫu theo đơn vị đo mới
* * * * * *0 1 1 2 2ˆ ˆ ˆyˆ x x
Với * *0 1 1 1 2 2 2* ; ;y k y x k x x k x
*0 0 0ˆ ˆk ; * 01 1
1
ˆ ˆkk ; * 02 22ˆ ˆ
k
k
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
8
Nhận xétKhi thay đổi đơn vị đo của biến phụ thuộc và các biến độc lập, ta thấy:Không bị thay đổi: Cột t-Statistic, cột Prob, R-squared, F-statistic,Prob(F-statistic)Bị thay đổi: Cột Coefficient, cột Std. Error, S.E. of regression, Sumsquared resid
Các mục còn lại tự nghiên cứu tiếp.
Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017
https://sites.google.com/a/ueh.edu.vn/phamtricao/ 3
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
6.2 Bàn thêm về dạng hàm hồi quy
Bàn thêm về dạng hàm logarit
Thuận lợi khi giải thích bằng tỷ lệ phần trăm/ hệ số co giãn
Hệ số góc của các biến lấy log là bất biến đối với thay đổi tỷ lệ
Lấy log thường loại bỏ / giảm nhẹ vấn đề các giá trị bất thường
Lấy log thường giúp bảo đảm tính chuẩn và phương sai không đổi
Các biến sử dụng đơn vị đo lường như năm thì không nên lấy log
Các biến sử dụng đơn vị đo lường tỷ lệ phần trăm cũng không nên lấy log
Log không được sử dụng nếu biến có giá trị 0 hoặc âm
Có khó khăn khi lấy toán tử ngược của log trong dự đoán
Phân tích hồi quy bội: Một số vấn đề mở rộng
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Bàn thêm về dạng hàm logarit (Tập tin bwght.wf1)
10
Dependent Variable: BWGHT Variable Coefficient Std. Error t-Statistic Prob. C 113.9907 1.943920 58.63960 0.0000 CIGS -0.467228 0.091441 -5.109595 0.0000 LOG(FAMINC) 1.850716 0.594893 3.111008 0.0019
Dependent Variable: BWGHTLBS Variable Coefficient Std. Error t-Statistic Prob. C 6.325401 0.374681 16.88212 0.0000 PACKS -0.584034 0.114302 -5.109595 0.0000 LOG(FINCDOL) 0.115670 0.037181 3.111008 0.0019
Dependent Variable: LOG(BWGHT) Variable Coefficient Std. Error t-Statistic Prob. C 4.718594 0.018244 258.6311 0.0000 CIGS -0.004082 0.000858 -4.755904 0.0000 LOG(FAMINC) 0.016266 0.005583 2.913266 0.0036
Dependent Variable: LOG(BWGHTLBS) Variable Coefficient Std. Error t-Statistic Prob. C 1.833646 0.056265 32.58974 0.0000 PACKS -0.081632 0.017164 -4.755904 0.0000 LOG(FINCDOL) 0.016266 0.005583 2.913266 0.0036
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Bàn thêm về dạng hàm logarit
11
Cố định x1 , ta có:
Suy ra:
thì
Cố định x1 , khi x2 tăng 1 đơn vị thì y tăng 100*β2^ (%)
Cách khác:
Cố định x1 , khi x2 tăng 1 đơn vị thì y tăng 100*[exp(β2^)-1] (%)
giả sử β2^ >0
6.8
6.9
2.43
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Sử dụng dạng hàm bậc 2
Ví dụ: Phương trình lương
Tác động biên
Có 1 năm kinh nghiệm (từ 0 lên 1) thì lương tăng là 0,298 $, có 2 năm kinh nghiệm (từ 1 lên 2) thì lương tăng là 0,298-2(0,0061)(1) = 0,286 $ ...
Dạng hàm lõm
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.12
6.10 6.11
Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017
https://sites.google.com/a/ueh.edu.vn/phamtricao/ 4
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Cực đại của lương tương ứng với số năm kinh nghiệm
Liệu điều này có nghĩa là số năm kinh nghiệm nhiều hơn 24,4 năm trở nên tiêu cực?
Không nhất thiết là như vậy. Điều đó phụ thuộc vào có bao nhiêu quan sát trong mẫu nằm bên phải điểm cực đại.
Trong ví dụ trên, có khoảng 28% các quan sát
nằm bên phải. Có thể có một vấn đề lỗi chỉ định
mô hình (ví dụ biến bị bỏ sót, dạng hàm sai...).
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.13
Không hợp lý
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ 6.2: Ảnh hưởng của ô nhiễm tới giá nhà đất
Điều này có nghĩa rằng, ở một số ít các phòng, nhiều phòng có liên quan với giá thấp hơn?
Nitơ oxit trong không khí, khoảng cách từ trung tâm việc làm, tỷ lệ sinh viên/giáo viên
Phân tích hồi quy bội: Một số vấn đề mở rộng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Tính toán điểm cực tiểu
Diện tích này có thể bỏ qua vì nó liên quan đến chỉ có 1% các quan sát.
Gia tăng số phòng từ 5 lên 6:
Gia tăng số phòng từ 6 lên 7:
Điểm cực tiểu:
Phân tích hồi quy bội: Một số vấn đề mở rộng
Không hợp lý
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Khả năng khác
Đa thức bậc cao hơn
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.15
6.16
Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017
https://sites.google.com/a/ueh.edu.vn/phamtricao/ 5
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Mô hình với các số hạng tương tác
Việc giải thích các tham số khá phức tạp khi có tác động tương tác
Số hạng tương tác
Tác động của số phòng ngủ phụ thuộc vào diện tích
Tác động của số phòng ngủ, nhưng ứng với diện tích là 0
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.17
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Trung bình tổng thể; có thể được thay thế bởi trung bình mẫuXác định lại tham số của tác động tương tác
Lợi ích của việc xác định lại các tham số
Dễ dàng giải thích tất cả các tham số
Sai số chuẩn được tính cho các tác động riêng phần tại giá trị trung bình.
Nếu cần thiết, giá trị μ1 và μ2 có thể được thay thế bằng một giá trị kháccần quan tâm
Tác động của x2 nếu tất cả các biến cố định tại giá trị trung bình
Phân tích hồi quy bội: Một số vấn đề mở rộng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
6.3 Bàn thêm về độ phù hợp và vấn đề lựa chọn biến độc lập
Nhận xét chung về R2
Một R2 cao không ngụ ý rằng có một quan hệ nhân quả
Một R2 thấp không loại trừ tính hiệu quả của các tác động riêng phần
R2 hiệu chỉnh (Adjusted R-squared):
R2 thông thường được định nghĩa là gì?
là 1 ước lượng của
R2 tổng thể
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.20
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
R2 hiệu chỉnh (tt)
Một ước lượng tốt hơn có xét đến bậc tự do sẽ là
R2 hiệu chỉnh có tính đến hệ quả của việc thêm các biến độc lập mớiR2 hiệu chỉnh tăng nếu và chỉ nếu thống kê t (F) của một (một số ) biến độc lập mới được thêm vào có trị tuyệt đối lớn hơn 1
Mối liên hệ giữa R2 và R2 hiệu chỉnh
Bậc tự do đúng của tử số và mẫu số là
R2 hiệu chỉnhcó thể lấy giá trị âm
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.21
6.22
Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017
https://sites.google.com/a/ueh.edu.vn/phamtricao/ 6
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Sử dụng R2 hiệu chỉnh để chọn lựa giữa các mô hình không lồng nhau
Các mô hình được gọi là không lồng nhau nếu cái này không phải là trường
hợp đặc biệt của cái kia
Việc so sánh R2 của hai mô hình sẽ là không công bằng với mô hình đầu
tiên bởi vì mô hình đầu tiên chứa ít tham số hơn
Trong ví dụ trên, ngay cả sau khi đã điều chỉnh cho sự khác biệt về bậc tự
do (dùng R2 hiệu chỉnh), mô hình bậc hai vẫn được ưa thích hơn
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.23
6.24
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
So sánh các mô hình với biến phụ thuộc có dạng khác nhau
R2 hoặc R2 hiệu chỉnh không được sử dụng để so sánh các mô hình mà
chúng có dạng hàm của biến phụ thuộc khác nhau
Ví dụ 6.4: Mức đãi ngộ đối với CEO và hiệu quả doanh nghiệp
log(salary) biếnthiên ít hơn so với salary (xem TSS)
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.25
6.26
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
Lựa chọn giữa các mô hình không lồng nhau:
Có các tiêu chuẩn lựa chọn mô hình trong EViews như sau:
• Các tiêu chuẩn sau càng lớn càng tốt
– R2 hiệu chỉnh
– Log likelihood (LL)
• Các tiêu chuẩn sau càng nhỏ càng tốt
– Akaike info criterion (AIC)
– Schwarz criterion (SC)
– Hannan-Quinn criter (HQC)
• Điều kiện sử dụng các tiêu chuẩn này:
– Cùng dạng hàm của biến phụ thuộc
– Cùng cỡ mẫu
23
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Lựa chọn giữa các mô hình không lồng nhau:
•
24
Ví duï:
Moâ hình
Tieâu chuaån
A B Choïn
R2 hieäu chænh 0,7 0,6 A
LL -0,25 -0,13 B
AIC 0,24 0,25 A
SC 0,31 0,37 A
HQC 0,28 0,26 B
Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017
https://sites.google.com/a/ueh.edu.vn/phamtricao/ 7
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Kiểm soát việc có quá nhiều yếu tố trong phân tích hồi quy
Trong một số trường hợp, một số biến không nên kiểm soát trong mô hình
Trong hồi quy của tử vong do giao thông (fatalities) theo thuế bia của bang
(tax) (và các yếu tố khác như miles, percmale,...) không nên kiểm soát trực tiếp
(đưa biến vào mô hình) lượng bia tiêu thụ trên đầu người (beercons)
Trong hồi quy của chi phí y tế gia đình theo việc sử dụng thuốc trừ sâu của
nông dân không nên kiểm soát số lần đi khám bác sĩ
Các hồi quy khác nhau có thể phục vụ các mục đích khác nhau
Trong hồi quy giá nhà theo các đặc điểm của ngôi nhà, chúng ta cần thêm biến
định giá của giá nhà nếu mục đích của hồi quy là nghiên cứu sự hợp lý của của
việc định giá; nếu không thì ta sẽ không thêm biến định giá vào
Phân tích hồi quy bội: Một số vấn đề mở rộng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Thêm biến độc lập để giảm phương sai của nhiễu
Việc thêm biến độc lập có thể làm trầm trọng thêm vấn đề đa cộng tuyến
Mặt khác, việc thêm biến độc lập làm giảm phương sai của nhiễu
Các biến không tương quan với biến độc lập đã có nên được thêm vào bởi vì chúng
làm giảm phương sai nhiễu mà không làm tăng tính đa cộng tuyến
Tuy nhiên, các biến không tương quan như vậy rất khó tìm thấy
Ví dụ: lượng bia tiêu thụ của mỗi cá nhân và giá bia
Việc bao gồm các đặc điểm cá nhân trong hồi quy lượng bia tiêu thụ theo giá bia
dẫn đến ước lượng hệ số co giãn của lượng cầu bia theo giá bia “chính xác” hơn
Phân tích hồi quy bội: Một số vấn đề mở rộng
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
27
Dự đoán điểm cho giá trị trung bình và giá trị cá biệt (cụ thể)
6.27
Giả sử c1, c2,, ck là giá trị cụ thể của x1, x2,, xk
Dự đoán (ước lượng) điểm của giá trị trung bình E(y/x1=c1,,xk=ck)
hay giá trị cá biệt y0 là:
6.29y0^ =
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
28
Dự đoán khoảng cho giá trị trung bình
Tức là ta chạy hồi quy y theo hệ số chặn, (x1-c1), (x2-c2),, (xk-ck)
6.30
Thay vào hồi quy trên
Ta được:
6.31
Giá trị dự đoán và sai số chuẩn của 0^ dễ dàng tìm được thông qua hệ số chặn của hàm hồi quy (6.31)
Khoảng tin cậy dự đoán 1- của giá trị trung bình là:
0^ t/2(n-k-1)*se(0^)
Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017
https://sites.google.com/a/ueh.edu.vn/phamtricao/ 8
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
• VD 6.5: Khoảng tin cậy dự đoán điểm trung bình GPA đại học
29
6.32
Dự đoán trung bình GPA đại học khi sat= 1200, hsperc= 30, hsize= 5?
Dự đoán điểm:0^= 1.493 + 0.00149*1200 - 0.01386*30 - 0.06088*5 + 0.00546*52 = 2.70
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
30
Đặt sat0= sat-1200, hsperc0= hsperc-30, hsize0= hsize-5, hsizesq0= hsize2-25
Khoảng tin cậy dự đoán 95% cho điểm trung bình GPA đại học là:2.70 1.96*0.02 hay (2.66 ; 2.74)
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
31
Tập tin gpa2.wf1
Dependent Variable: COLGPA Included observations: 4137 Variable Coefficient Std. Error t-Statistic Prob. C (0) 2.700075 0.019878 135.8334 0.0000 SAT-1200 0.001492 6.52E-05 22.88637 0.0000 HSPERC-30 -0.013856 0.000561 -24.69814 0.0000 HSIZE-5 -0.060881 0.016501 -3.689509 0.0002 HSIZE^2-25 0.005460 0.002270 2.405578 0.0162 R-squared 0.278136 Mean dependent var 2.652686 S.E. of regression 0.559864 Akaike info criterion 1.678962
Coefficient Confidence Intervals Included observations: 4137 95% CI Variable Coefficient Low High C (0) 2.700075 2.661104 2.739047 SAT-1200 0.001492 0.001365 0.001620 HSPERC-30 -0.013856 -0.014956 -0.012756 HSIZE-5 -0.060881 -0.093233 -0.028530 HSIZE^2-25 0.005460 0.001010 0.009910
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
32
Khoảng tin cậy dự đoán của giá trị cá biệt y0
Sai số dự đoán là:
6.33
6.34
Phương sai của sai số dự đoán:
Sai số chuẩn:
6.35
6.36
Khoảng tin cậy dự đoán 1- của dự đoán giá trị cá biệt y0 là:
6.37y0^ t/2(n-k-1)*se(e0^)
Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017
https://sites.google.com/a/ueh.edu.vn/phamtricao/ 9
PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
• VD 6.5 Khoảng tin cậy dự đoán điểm cá biệt GPA đại học
33
Khoảng tin cậy dự đoán 95% của điểm GPA từng học sinh cụ thể :
2.70 1.96*0.5604 hay (1.6016 đến 3.7984)
Ta có:
= 0.5604
;
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Dự đoán y khi biến phụ thuộc là log(y)
* Dưới giả định thêm vào là độc lập với :
Dự đoán của y
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.38
6.42-6.43
Không cần điều kiện u có phân phối chuẩn
6.40 Cần điều kiện u có phân phối chuẩn N(0,2) 2ˆ ˆexp(log( ) / 2)y y *
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
So sánh R2 của mô hình có log và không có log ở biến phụ thuộc
VD 6.7 và 6.8
Đây là các R2 cho dự đoán của biến salary khôngcó log (mặc dù hồi quy thứ hai nguyên gốc làlog(salary). Bây giờ có thể so sánh trực tiếp hai R2.
Phân tích hồi quy bội: Một số vấn đề mở rộng
6.47
Log(mktval)
6.45
R2~ = r(y, y^)2, với y^ tính theo công thức (6.40) hoặc (6.42-6.43)
Môøi gheù thaêm trang web:
36
https://sites.google.com/a/ueh.edu.vn/phamtricao/
https://sites.google.com/site/phamtricao/
Các file đính kèm theo tài liệu này:
- bai_giang_nhap_mon_kinh_te_luong_chuong_6_phan_tich_hoi_quy.pdf