Biến X giải thích được (/?2.ioo) % sự thay đổi của biến phụ thuộc Y. Phần còn lại do các yếu tố ngẫu nhiên.
Tính chất:
1. 0 < R2 < 1
2. R2 càng gần 1 càng tốt.
Hãy vẽ biếu đô phân tán vói tống thu nhập điều chỉnh là biến độc lập.
Dùng phương pháp bình phương nhỏ nhất để xây dựng pt hồi quy.
Hãy ước tính mức hợp lý của tong số chi được khấu trừ cho một người nộp thuế có tổng thu nhập điều chỉnh là 52 500 USD. Neu người nộp thuế này khai số thuế chi được khấu trừ là 20 400 USD, thì nhân viên IRS có yêu cầu kiểm toán hay không?
16 trang |
Chia sẻ: hachi492 | Ngày: 12/01/2022 | Lượt xem: 447 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Nguyên lý thống kê kinh tế - Chương 5: Tương quan và hồi quy - Hoàng Đức Thắng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương 5: TƯƠNG QUAN VÀ Hồl QUY
5.1. Tương quan
Cho hai biến ngẫu nhiên X, Y.
Tương quan (Correlation) giữa hai biến X, Y là khái niệm thê hiện mức độ của mối quan hệ giữa X và Y.
Hệ số tương quan (Correlation coefficient) là đại lượng đo lường cường độ của mối quan hệ giữa hai biến X và Y (không phân biệt biến nào là phụ thuộc, biến nào là độc lập).
Ký hiệu p : hệ số tương quan tong thê. (—1 < p < 1).
Biểu đồ phân tán (scatter diagram): đề thị thê hiện các cặp giá trị (X;, Ỹ)
GV: Hoàng Dức Tháng (hdthangCsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001. 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001. 45 Tiết)
perfect high moderate low
zero
low moderate high perfect
rxy
Strength of Correlation
kxy| = 1
Perfect
0,75< |rxy| <1
High (Strong)
0,5 < |rxy| < 0,75
Moderate
0,2 < |rxr <0,5
Low (Weak)
0< IdíyI <0,2
No Correlation
Hệ số tương quan Pearson
Cho hai biến ngẫu nhiên X, Y.
X XỊ x2 • ■ • xn Y yi y2 ■■■ yn
Hệ số tương quan mẫu (Pearson) của X và Y, ký hiệu rxY
Ễ(X,-X)(Y-Y) rXY = I „'~1 ' „ ==
y§(X-x)2.g(Y-Y)2
EXY-n.x.y
_ i=l
~ ^[ẺX,-2-n(x)2].[gY2-n(Ỹ)2]
GV: Hoàng Dức Tháng (hdthangBsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TÈ (867001, 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TẼ (867001. 45 Tiết)
Perfect
Negative
Correlation
No
Correlation
Ví dụ 78
High Negative Correlation
Low
Negative Correlation
Một công ty muốn nghiên cứu ảnh hưỏng của quảng cáo (QC) tói doanh so (DS) bán hàng. Dữ liệu về quảng cáo và doanh thu một số tháng thu thập được như sau.
-0.9
-0.5
0
Perfect
Positive
Correlation
Chi phí QC (Tr.d)
0,9
1,3
1,5
1,8
2,1 1
Tổng DS tháng tổi (Tr.đ)
100,1
151,6
170
199,3
221,2 1
Vẽ biểu đồ phân tán và tính hệ số tương quan Pearson.
ỉxnt' Positive Correlation
Hio/1
Positive Correlation
Biểu đồ phân tán
220-1
200-
:Õ
180-
160-
140-
120-
X
Y
X2
Y2
X.Y
0,9
100,1
1,3
151,6
1,5
170
1,8
199,3
2,1
221,2
E* =
Y.Ý
£x2
Y.X.Y
n = x= Y =
Hệ số tương quan:
£x,Y;-n.x.Y
rXY = /- '-1 =
ự[Ẻ X;2-n(x)2] . [Ê Y2-n(Ỹ)2]
Nhận xét: . . .
Chi phí quang cáo
GV: Hoàng Đức Tháng (hdthangCsgu.edu.vn) NGUYÊN LÝ THốNG KÊ KINH TE (867001. 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001. 45 Tiết)
Ví dụ 79
5.3. Vấn đề xếp hạng
Có số liệu về thời gian quảng cáo ( TGQC/tuần, đv: phút) trên truyền hình và lượng sản phẩm tiêu thụ (LTT/tuần, đv: 1000 sp) ỏ một công ty sản xuất đồ chơi trẻ em như sau
TGQC 28 37 44 36 47 35 26 29 33 32 31 28
LTT 41 32 49 42 38 33 27 24 35 30 34 25
Tính hệ số tương quan Pearson.
Cho biến ngẫu nhiên X = (Xi,...,x„). Ký hiệu:
- RXi là hạng của Xi. - Rx = (Rxi,-, Rx„)
Cách làm:
Quy ước thứ tự xếp hạng trước khi làm.
Đánh thứ tự.
Nếu có các giá trị Xi bằng nhau => trung bình vị trí.
Ví dụ 80 1
Điểm trung bình năm 2018-2019 của 10 học sinh lớp 12A1 như sau
HS
ABCDEFGH 1 J
Diêm TB(X)
9,8 7 9 8 9,8 10 6 9,8 7 5
Hạng(Rx)
3 7,5 5 6 3 1 9 3 7,5 10
GV: Hoàng Dức Tháng (hdthangCsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TÈ (867001, 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TẼ (867001. 45 Tiết)
Hệ số tương quan Spearman
Trường hợp X, Y được thê hiện dưói hình thức xếp hạng.
Bước 1:
-Xếp hạng các giá trị của Xi của biến X: Rx = (Rxi, •••, Rx„)- -Xếp hạng các giá trị của Yị của biến Y: Ry = (Ryí, —, Ry„Ỵ Bước 2: Tính hệ số tương quan hạng
6. XX
^XY 1 _ (-I
n (n2 — 1)
trong đó: dị = Rxị — Ry,-
Ví dụ 81
Khi tuyến dụng, một công ty đánh giá các ứng viên thông qua phỏng vấn và bài kiểm tra. Khi phỏng vấn, các ứng viên được đánh giá từ A (xuất sắc) đến E (không phù hợp) và bài kiểm tra được tính theo thang điếm 100. Ket quả của 5 ứng viên như sau:
ứng viên
28
37
44
36
47
Điểm phỏng vấn
A
B
A
E
D
Điếm bài thi
60
72
49
88
75
Tính hệ số tương quan hạng.
ứ.v
Điểm PV X
Hạng PV
Rx
Điểm BT Y
Hạng BT Ry
d
d2
1
A
60
2
B
72
3
A
49
4
E
88
5
D
75
Gỉải
Ví dụ 82
Có số liệu về thài gian quảng cáo ( TGQC/tuần, đv: phút) trên truyền hình và lượng sản phẩm tiêu thụ (LTT/tuần, đv: 1000 sp) ở một công ty sản xuất đồ chơi trẻ em như sau
TGQC 28 37 44 36 47 35 26 29 33 32 31 28
41 32 49 42 38 33 27 24 35 30 34 25
Tính hệ số tương quan Spearman.
Hệ số tương quan hạng
rxY = = — 0,925
GV: Hoàng Dức Tháng (hdthangCsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001, 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001, 45 Tiết)
Hồi quy
Hồi quy là phương pháp phân tích được dùng đê xem xét mối liên hệ giữa hai biến X, và Y, trong đó
X: biến độc lập (biến giải thích, ảnh hưởng đến biến Y).
Y: biến phụ thuộc (biến được giải thích, chịu ảnh hưỏng bởi X)
Ví dụ 83
Trong phân tích ảnh hưởng của chi phí quảng cáo đến doanh số bán hàng, ta có
X = chi phí quảng cáo.
= doanh số bán hàng.
Trong một cuộc khảo sát về việc đầu tư cho giáo dục và lợi ích thu được sau khi ra trường, ta có
X = đầu tư cho giáo dục.
= lợi ích thu được.
Hồi quy tuyến tính đơn giản
(Simple Linear Regression)
Giả sử rằng mối quan hệ thực sự giữa X và Y là đường thẳng và quan sát Y tại mỗi giá trị X là một biến ngẫu nhiên thỏa
E(Y|x) = íS0 + ia1x
trong đó: tung độ gốc Po và hệ số góc là những hệ số hồi quy chưa biết.
Giả sử những giá trị quan sát y được biêu diễn thông qua mô hình
Y = /30 + /31x + £ (12)
trong đó e là sai số ngẫu nhiên có trung bình bằng 0 và phương sai <T2 (không biết). Sai số của mỗi quan sát Y khác nhau được giả sử là những biến ngẫu nhiên không tương quan.
GV: Hoàng Dức Tháng (hdthangBsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TÈ (867001, 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TẼ (867001, 45 Tiết)
Giả sử có n cặp quan sát (xi,yi); (X2,y?);..; (xn,yn) và một đường thẳng ứng viên cho đường hồi quy ước lượng như hình
Karl Gauss (1777-1855) đề xuất ưổc tính /3o,/3i bằng phương pháp bình phương tối thiêu.
Sử dụng phương trình 12, ta có biêu diễn của n cặp quan sát như sau
y; = /3q + £1X; + £ (13)
và tông bình phương sai số giữa các quan sát và đường hồi quy đúng là
L = '^^ = '^{yi-Pữ- (14)
/=1 /=1
Giải bài toán cực tiểu phương trình 14, ta được
Câu hỏi: đường nào (/3o, /31) là tốt nhất cho bộ dữ liệu quan sát?
Định lý 0.1
Quá trình ước lượng trong hôi quy tuyên tính đơn giản
ưóc lượng bình phương cực tiểu của fio và là
t>0 = y — bỵ.x (15)
n n
E (xí - *) (y; - ỹ) E *i-yi - n.x.ỹ
bi. = ^-n =
£(x,-x)2 tx?-n.{x)2
/=1 /=1
(16)
1
Vậy, ước lượng cho đường thẳng hồi quy có dạng
y = bo + fax (17)
GV: Hoàng Dức Tháng (hdthangHsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001. 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn)NGUYÊN LÝ THốNG KÊ KINH TE (867001. 45 Tiết)
Ví dụ 84
Cho dữ liệu về số lượng sinh viên và doanh số bán hàng theo quý cùa 10 nhà hàng trong chuỗi cửa hàng ARMAND’S PIZZA PARLORS
Nhà li.iug
số lượug sv (1000 ugirói)
Donuli số báu
ỉ
*1
tlieo quý (1000 USD)
1
2
58
2
6
105
3
8
88
4
8
118
5
12
117
6
16
137
7
20
157
8
20
169
9
22
149
10
26
202
GV: Hoàng Đức Thắng (hdthangBsgu.edu.vn) NGUYÊN LÝ THốNG KÊ KINH TE (867001, 45 Tiết)
Giải.
Cách 1: Lập bảng tính.
N.H ỉ
Xf
Xị — ỉ
yt- ỹ
(x, — x)(y,
- ỹ)
(x, - X)2
1
2
58
-12
-72
864
144
2
6
105
-8
-25
200
64
3
8
88
-6
-42
252
36
4
8
118
-6
-12
72
36
5
12
117
—2
-13
26
4
6
16
137
2
7
14
4
7
20
157
6
27
162
36
8
20
169
6
39
234
36
9
22
149
8
19
152
64
10
26
202
12
72
864
144
Totals
140
1300
2840
568
Sx,
Vy
SCx, - iXy,
- V)
S(x,- i)!
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TẼ (867001. 45 Tiết)
Dồ thị PT hồi quy ước lượng ARMAND'S PIZZA PARLORS
Từ bảng trên, ta tính được
E(X; x)(T ỹ) 2840
01 E(x,-x)2 ~~ 568 5
bo = Ỹ- bí.x = 130 - 5.14 = 60.
Phương trình hồi quy ước lượng là:
ỹ = 60 + 5x
Cách 2: dùng máy tính.
61 =
bo =
=>ỹ =
Dùng máy tính tìm hệ số tương quan mẫu - phương trình hồi quy tuyến tính
Bước chuẩn bị:
Xóa bộ nhớ: Shift => [9] => [2] => Q
Khai báo cột tần số:
Shift => Mode ị ^(chọn STAT) => Q^(chọn ON)
Nhập dữ liệu
Mode => 0(chọn STAT) =» [U(chợn A+BX)
nhập dữ liệu xong nhấn AC \.
Xuất kết quà
Shift => [T] => []Qchọn Reg) => chọn kết quả cần xuất (í^ = g,b1=@,r = l]).
Ví dụ 85
Đối với sở thuế (Internal Revenue Service - IRS), tính hợp lí của tổng số chi được khấu trừ thuế phụ thuộc vào tổng thu nhập đã được điều chỉnh của người nộp thuế. Các khoản chi được khấu trừ lớn, trong đó bao gồm chi đóng góp từ thiện và các đóng góp y tế, là các khoản hợp lý hdn cho người nộp thuế cố tổng thu nhập điều chỉnh lớn. ở một mức thu nhập nào đó, nếu người nộp thuế kê khai số chi cần phải khấu trừ thuế lớn hơn số chi được khấu trừ thuế trung bình, thì khả năng phải thực hiện kiêm toán IRS tăng lên. Dữ liệu (ngàn USD) về tống thu nhập điều chỉnh và số chi khấu trừ trung bình hoặc hợp lý như sau
GV: Hoàng Dức Tháng (hdthangCsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001, 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001, 45 Tiết)
(SUM OF SQUARES DUE TO REGRESSION - SSR)
The hiện phần biến Y được giải thích bởi biến X.
Tổng thu nhập điêu chỉnh Sô tién chi khâu trừ thuê họp lý
(1000 USD) (1000 USD)
22
9.6
27
9.6
32
10.1
48
11.1
65
13.5
85
17.7
120
25.5
Hệ số xác định
Tổng bình phương do sai số
(SUM OF SQUARES DUE TO ERROR - SSE)
The hiện phần biến thiên của y do các nhân to không được nghiên cứu đến.
SSE=ị,(yi-ỹiý
i=l
Tổng bình phương do hồi quy
SSR= Ẻ(ỹi- ỹ) Hãy vẽ biếu đô phân tán vói tống thu nhập điều chỉnh là biến độc lập.
Dùng phương pháp bình phương nhỏ nhất để xây dựng pt hồi quy.
Hãy ước tính mức hợp lý của tong số chi được khấu trừ cho một người nộp thuế có tổng thu nhập điều chỉnh là 52 500 USD. Neu người nộp thuế này khai số thuế chi được khấu trừ là 20 400 USD, thì nhân viên IRS có yêu cầu kiểm toán hay không?
= (b?) ■ ịỵĩ- n«2
/■=1 Ư=1
GV: Hoàng Đức Thắng (hdthangOsgu.edu.vn)NGUYÊN LÝ THốNG KÊ KINH TE (867001, 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TẼ (867001, 45 Tiết)
SST = SSR + SSE
Hệ sô xác định
SSR
SST
i
Xị
D.s
y,
DS dự đoán ỹ = 60 + 5x
y; - ỹì
(y,--ýi)2
y; -y
(y;-ỹ)2
1
2
58
49
42
38
33
27
2
6
105
3
8
88
4
8
118
5
12
117
6
16
137
7
20
157
8
20
169
9
22
149
10
26
202
1530
4 5 ► 4 >
15730
GV: Hoàng Đức Thắng (hdthangOsgu.edu.vn) NGUYÊN LÝ THốNG KÊ KINH TE (867001, 45 Tiết)
c. Tổng bình phương toàn bộ (TOTAL SUM OF SQUARES - SST)
Thể hiện toàn bộ biến thiên của Y. ssT=Ẻ(y;-ỹ)2 = Ễyf-'’(ỹ)2 /=1 Í=1
Quan hệ giữa: SST, SSR, SSE:
Ý nghĩa:
Biến X giải thích được (/?2.ioo) % sự thay đổi của biến phụ thuộc Y. Phần còn lại do các yếu tố ngẫu nhiên.
Tính chất:
0 < R2 < 1
R2 càng gần 1 càng tốt.
Cách 2:
Xị
yi
X?
y?
2
58
4
3364
6
105
36
11025
8
88
64
7744
8
118
64
13924
12
117
144
13689
16
137
169
118769
20
157
400
24649
20
169
400
28561
22
149
484
22201
26
202
676
40804
x= 14
Ỹ = 130
52 = 2528
52 = 184730
Ta có:
SST = 15730; SSE = 1530
=> SSR = SST - SSE = 15730 - 1530 = 14200
Suy ra:
R Viết phương trình hàm hồi quy tuyến tính sản lượng sản xuất của công ty theo thời gian(theo 2 cách).
Dự báo giá trị sản lượng sản xuất của công ty trong 2 năm tiếp theo
Neu năm 2016, sản lượng sản xuất của công ty là 44 tấn. Viết lại hàm hồi quy.
=
Ta nói 90,27% sự thay đổi trong doanh số bán hàng có thể giải thích bởi mối quan hệ tuyến tính giưã số lượng sv và doanh số bán hàng.
SSR = (b?).
= (52) [2528 - 10.142] = 14200.
SST = ị,y?- n(ỹ)2 = 184730 - 10.1302 = 15730
Í=1
R2 = ...
GV: Hoàng Dức Tháng (hdthangCsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001. 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001. 45 Tiết)
Cách 3: dùng máy tính. Xem cuối chương.
Dữ liệu X là dãy số theo thời gian
Cho hai biến ngẫu nhiên X, Y.
X
X1
X2
Xft
Y
yi
yi
yn
trong đó X là biến theo thời gian.
Cách giải
Cách 1: giải bình thường.
Cách 2: đánh số 1,2,3,...
Cách 3: đánh số lại biến X: Xj => ti vói điều kiện: 52 ti = 0.
Nếu: n lẻ, tí e 4,—3,—2,—1,0,1,2,3,4,...}.
Nếu n chẵn, tj e {... — 5, —3, —1,1,3,5,...}.
GV: Hoàng Dức Tháng (hdthangBsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TÈ (867001, 45 Tiết)
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TẼ (867001. 45 Tiết)
Ví dụ 87
Hồi quy bội
Có tài liệu thống kê về sản lượng sản xuất của một công ty qua các năm như sau
Năm
2010
2011
2012
2013
2014
2015
Sản lượng (Tấn)
20
23
25
29
35
40
Mô hình hồi quy bội
y = Po + /31*1 + p2x2 H 1- PpXp + e (18)
trong đó Po,Pi, ■ ■■ ,Pp là các tham số của mô hình. E sai số ngẫu nhiên.
Phương trình hồi quy bội
E (y) = Po + P1X1 + p2x2 H F PpXp (19)
Phương trình hồi quy bội ước lượng
ỹ = bo + 61X1 + b2x2 H 1- bpXp (20)
trong đó : bo,bi,...,bp là các ước lượng của Pũ,Pi,-■■ĩPp- ỹ : giá trị ước lượng của biến phụ thuộc.
Hồi quy 3 biến
Phương pháp
Bước 1: Từ bảng dữ liệu, lập ma trận
1 X11 *21
1 x12 x22
1 xln x2n
yi
y2
Dặt B =
bo
bi
. b2 _
1
X11
X21
1
x12
x22
1
Xln
X2n
Bước 2: Tính
XT.X =
(xr.x) * 1
xt.y =
n £xụ
gxi; M
52 x2/ 52xli-x2i
52 y/ 1 52xi;y, Zx2;-y; J3X1
52 x2/
52 X1Í-X2Í
52 x2/
3x3
Bước 3: Tính ma trận B. B = (xrx) 1. (xr,y) =
Bước 4: viết PT hồi quy: ỹ = bo + Í>1X1 + Ủ2X2.
bo bi
b2
GV: Hoàng Dức Tháng (hdthangllsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TÈ (867001. 45 Tiết)
GV: Hoàng Đứe Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TẼ (867001. 45 Tiết)
Giải
1
1 1
1
XTX =
30
47 25
51
12
10 17
16
4
153
55
—
153
6335
2071
55
2071
789
(xrx)_1 =
30
12
30
47
25
51
354637 -26 -15781 1
-fêỹ81
29475
1 1
47 25
10 17
2^5
4Ịp
450
1
51
16
58950
94
108
112
178
12
10
17
16
XTX) \ (XTy)
■ 354637 -26
-15781 1
29£g5 2ị5 29|75
-i$8i ¥ 1B
. 29475 450 5895Q .
-108184 23 10033
1179 9 1179
PT hồi quy: ỹ =
492
19774
6960
GV: Hoàng Dức Tháng (hdthangCsgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001. 45 Tiết)
Hệ số xác định
Tổng bình phương do sai số
(SUM OF SQUARES DUE TO ERROR - SSE)
The hiện phần biến thiên của Y do các nhân tố không được nghiên cứu đến.
SSE = Ế (y,- - ỹịý2 = YtY - BtXtY
Í=1
Tổng bình phương do hồi quy
(SUM OF SQUARES DUE TO REGRESSION - SSR) Thể hiện phần biến Y được giải thích bởi biến X1,X2. SSR = Ị (ỹi- ỹ)2 = BT. (XtY) - n(ỹ)2
Í=1
GV: Hoàng Dức Tháng (hdthangBsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TÈ (867001, 45 Tiết)
Ma trận hệ số tương quan
Ma trận hệ số tương quan: R =
Trong đó
''YXi = rxiY =
ryx2 = rx2Y =
ÍYX1
1
rx2Xi
ryx2 rxix2
1
492
19774
6960
-108184 ,23 , 10033
1179 + 9 X1 + 1179 X2'
GV: Hoàng Đức Thắng (hdthangffisgu.edu.vn) NGUYÊN LÝ THONG KÊ KINH TỀ (867001. 45 Tiết)
c. Tổng bình phương toàn bộ
(TOTAL SUM OF SQUARES - SST)
The hiện toàn bộ biến thiên của Y.
ssr = g(y;-ỹ)2 = gy?-n(ỹ)2
Quan hệ giữa: SST, SSR, SSE:
SST = 5SR + SSE
Hệ số xác đinh
R2=SSR
SST
Ví dụ 89
Tìm hệ số xác định trong ví dụ 88.
GV: Hoàng Đức Thắng (hdthangfflsgu.edu.vn) NGUYÊN LÝ THÔNG KÊ KINH TẼ (867001, 45 Tiết)
Ví dụ 90
1 rxjY rXĩY
£ x2,-y,-n.x2.y
£x2;2-n(
O<1X2 = <X2X1 =
£xi,x2,-n.xi.x2
Nhiệm vụ
xl = SÔ dặm
x2 = sỏ lân
y = thòi gian vận
vận chuyên
di chuyên
vận chuyên
chuyên (giờ)
1
100
4
9.3
2
50
3
4.8
3
1(M)
4
8.9
4
100
2
65
5
50
2
4.2
6
80
2
6.2
7
75
s
ĩị
8
65
4
f>.0
9
90
3
7.6
10
90
2
6.1
Viết phương trình
hồi quy ưóc lượng. Tính R2
và ma trận tương
quan.
ỉ
*xo-
GV: Hoàng Đức Thắng (hdthangffisgu.edu.vn)
NGUYÊN LÝ THỐNG KÊ KINH TỀ (867001, 45 Tiết)
Cho bảng dữ liệu của cồng ty vận tải Butler như sau
Hướng dẫn dùng máy tính Casio
> Hồi quy đơn
Cho hai biến ngẫu nhiên X, Y.
XỊ yi
X2
2/2
Xn
Vn
Viết phương trình hồi quy ước lượng y = bo + bi.x, lìm hệ số tương quan mẫu VXY-
Tim SST, SSR, SSE, R2 .
Cách giải: 1.
Bước chuẩn bị:
Xóa bộ nhớ: Shift => [9~| => |~2~| => 1^1
Khai báo cột tần số: Shift => Mode =>
|jT| => [Z|(chọn STAT) => |T|(chọn ON)
Nhập dữ liệu
Mode I => |y|(chọn STAT) => [U(chọn A+BX)
nhập dữ liệu xong nhấn ị AC
Xuất kết quả
Shift => |T] => [|](chọn Reg) => chọn kết quả cần xuất (bo = |T[, 61 = [y|, rxY =
2.
Tính SSR = (6?).
n
2=1
n(x)2
Tinhf>2.
2=1
Shift => |T] => UQchọn Sum) => [T]
Tính x: Shift => |T| =>• |T|(chọn Var) => [2]
SSR.
n
Tính SST=±y2-n(ỹ}2
i=l
Tính 52 yĩ' Shift => |T| => UQchọn Sum) => [T|
2=1
Tính y : Shift => |T| => |T|(chọn Var) => [5]
=> SST.
> Hồi quy bội 3
Cho biến ngẫu nhiên X1, X2, và Y.
X1
xn
X12
xln
x2
x2l
X22
x2n
Y
Ỹ1
Ỹ2
Ỹn
Viết phương trình hồi quy ưốc lượng y = bo + bỵxỵ + 62^2-
lìm SST, SSR, SSE, R2 .
lìm ma trận hệ số tương qan.
Cách giải: 1.
Bước chuẩn bị:
Xóa bộ nhớ: Shift => [9~| => |~2~| => 1^1
Khai báo cột tần số: Shift => I Mode I => |jT| => [Z|(chọn STAT) => |T|(chọn ON)
Nhập X1,X2
Mode I => UQchọn STAT) => |T[(chọn A+BX)
Xi nhập vào cột X, X2 nhập vào cột Y.
Tính XTX
Trong đó
n
52
. I>2Í
_Ị2X2i
52
É 4
3x3
=
r>2í =
124 =
124 =
Tính XtY
Xt.Y =
_ĩ2yi
Ỵ^X2i-yi
Tính tương tự XT.X.
3x1
Shift
Shift
Shift
Shift
22 Zii.z2i = Shift I => co => [3] =s- [5]
Nhập vô máy dưới dạng ma trận Amáy
Đặt Amáy = XTX
Nhập ma trận A: I Mode I => rẽ] => |T[ => |T[
Thay X2 trong máy tính bằng Y để tính 52 yi và 52 xii-yi-
Thay Xị trong máy tính để tính tiếp 52 X2i.yi.
Nhập ma trận XTY vào máy dưới dạng ma trận ơmáy: ơmáy = XTY
Nhập ma ttận C: Shift => [4] => [U => [3] => [3]
Tính ma trân B
bo
&1
&2
Shift => |~4~| => [3]
X-1
=> X => Shi ft => |~4~| => |~5~|
=> BT = [ 60 bl 62 ]
Lưu ma trận BT vô máy tính dưới dạng ma trận Bmáy: Bmáy = BT
Nhập ma trận
bt: Shift
2. Tính SSR - SST
Tínhy
SSR: SSR = ^f. (XTy
Shift
X
=>
Shift
L/máy
-^máy
Tính y .
^SSR
SST: SST = E y^2 - n(Ỹ)2.
2=1
Ví dụ 1. Cho dữ liệu về số lượng sinh viên và doanh số bấn hàng theo quý cùa 10 nhà hàng trong chuỗi cửa hàng ARMAND’S PIZZA PARLORS
Miã bang
í
1
2
3
4
5
6
7
8
9
10
sẳ hrợug sv (1000 HÊnrửi)
-<7
2
I
I
8
12
lệ
20
20
22
26
Viết phương trình hồi quy ước lượng.
Tính R2.
Giải. Dùng máy tính
Máy
Ghi bài
Bưóc chuẩn bị:
Shift => |~9~| => |~2~| => I = I
Shift => Mode => |~ị~j => |~4~| => [T~|
Nhập dữ liệu
Mode => |~3~[ => |~2~|
Xuất kết quả
bữ : Shift => |T| => |~5~| => [TỊ
bl : Shift => |~1~| => |~5~[ => [2]
r : Shift => [T| => |~5~| => |~3~|
Tính SSR
Shift => [T] => |~3~| => [3T[
Shift => |~1~| => [TỊ => |~2~|
Tính SST
Shift => 0 => [3] => 0
Shift => |~1~| => |~T| => |~5~|
Do nu 11 sỗ tníu
í heo quy (1000 USD)
Jỉ
58
105
88
1 IS
117
137
157
169
J49
202
bo = 60
bl = 5
r = 0,9501
=> y = 60 + 5x
52 X2 = 2528
X = 14
=> SSR = (52) [2528 - 10.142] = 14200
52 y2 = 184730
ỹ= 130
=> SSR = 184730 - 10.1302 = 15730
R2 « 0,9027
Ví dụ 2. Cho bảng dữ liệu của công ty vận tải Butler như sau
Nhiệm vụ vạn chuyên
xl = sỏ dặm di chuyẻũ
s2 — sô lâu vận chuyên
y = thòi gian vận
chuyên (giờ)
1
100
4
9.3
2
50
3
4.8
3
100
4
8.9
4
100
2
6.5
5
50
2
4.2
6
80
2
6.2
7
75
3
7.4
8
65
4
6.0
9
90
3
7.6
lũ
90
2
6.1
Viết phương trình hồi quy ước lượng. Tính R2 và ma trận tương quan.
Nhận xét: Vói các bài có nhiều dữ liệu, ta không thể tính toán bằng cách nhân ma trận => máy tính hỗ trợ
Giải.
Ghi bài
Bấm máy
Mode => |~3~| => [~2~|
Shift
X
X
X
Shift
=>
X
=>
X
=>
X
52*1*
12 x2i
^2xỉi = Shift => E E E
524
Shift =>
Ysxu-x2i = Shift
Nhập Y thay cho %2
52 Vi = Shift => E E E
52 Xii-Vi = Shift => Ixl => [3] => [5]
Tính XT.X
n 52 xụ
52 *11 E^I-
52 x2i 52
52 ^2i
5 xli-~^2i
Éxĩ
3x3
10
800
29
800
67450
2345
29
2345
91
J 3x3
Tính Xt.Y =
_^yi
Ỵ^ii-yi
^x2i-yi
67
5594
J2x2i-yi
3x1
3x1
Bấm máy
Ghi bài
Nhập X‘2 vào máy thay cho X1
52 X2i-Vi = Shift => [T] => [3] => [][]
67
5594
202,2
Nhập ma trận XTX vào ma trận Amáy
Mode I =>[][]=> |T| => |T] : nhập
Nhập ma ttận XTY vào ma trận cmáy
Shift => g] => [2] => [3] => [3] : n^ập
TínhB: Shift I => g => [3] =>
X-1
Tính B =
bo bi bĩ
3x1
-0,8687
0,0611
0,9234
Nhập ma trận BT vào ma trận Bmáy
Shi ft => g => |~2~| => |~2~| => V => [TỊ
Tính y
Shi ft => |T~| => g| => |~5~|
Tính Ệ Yỉ
i=l
Shift => 0 => 0 => 0
PT hồi quy: y = —0,8687 + 0,0611.X1 + 0,9234.X2 => Bt = [ -0,8687 0,0611 0,9234 ]
Tính SSR = ^- -n(ỹỷ
-^máy t
^máy
Bt.(XtY) =470,302
^ = 6,7
SSR = 470,302 - 10 X 6,72 = 21,402
Tính SST = Ễ Tí2 - n(ỹỷ
i=l
£ ự =472,8
i=l
SST = 472,8 - 10 X 6,72 = 23,9
B2 = = 0,8955
23,9
Cách 1:
■ 1 30 12 ■
1 47 10
1 25 17 ’
1 51 16
ri 1 1 1
XT = 30 47 25 51
12 10 17 16 94
108
112
178
Các file đính kèm theo tài liệu này:
- bai_giang_nguyen_ly_thong_ke_kinh_te_chuong_5_tuong_quan_va.docx
- 05_chuong_5_lt_9701 (1)_2280794.pdf