Điều tra một số sản phẩm của một xí nghiệp về chiều dài (X (cm)) và hàm
lượng chất A (Y (%)), người ta có kết quả sau:
Y
X
8 10 12 14 16
100 5 5
110 4 6 7
120 5 9 8
130 4 6 9
140 5 7
Các sản phẩm có chiều dài không quá 110cm và hàm lượng chất A không
hơn 12% được gọi là sản phẩm loại II. Nếu xí nghiệp báo cáo rằng sản phẩm loại
II có chỉ tiêu Y trung bình là 10% thì có thể chấp nhận được không? Kết luận ở
mức ý nghĩa 5% (giả thiết hàm lượng này có phân phối chuẩn)
125 trang |
Chia sẻ: hachi492 | Ngày: 05/01/2022 | Lượt xem: 830 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài tập môn Xác suất thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
oảng tin cậy 95% cho tỉ lệ những hộ có nhu cầu cao ở
thành phố H.
b) Để ước lượng nhu cầu bột giặt trung bình của một hộ trong một tháng với
sai số ước lượng không quá 50 gam và độ tin cậy 95% thì cần điều tra thêm
bao nhiêu hộ gia đình nữa?
Giải
a) Từ dữ liệu đã cho ta tính được:
Giá trị trung bình mẫu: 1,803x =
Giá trị độ lệch chuẩn mẫu: 0,6233s =
Giá trị tỉ lệ mẫu: 140 0, 28
500
p = =
Khoảng tin cậy 95% cho tỷ lệ những hộ có nhu cầu cao: ( );x e x e− +
sai số ( )1 0,975
2
1
. .0,0201 0,0394
p p
e u u
n
+γ
−
= = =
Khoảng tin cậy 95%: ( )0, 2406;0,3194
b) Ta có
2 2
0,975
0,975
1,96.0,62330,05 . 596,9134
0,05 0,05
us
u n s
n
≤ ⇒ ≥ = =
Suy ra 1 597n =
Vậy cần điều tra thêm ít nhất 97 hộ nữa.
Nhu cầu
(kg/tháng) < 1 [1; 1,5)
[1,5;
2)
[2;
2,5)
[2,5;
3)
[3;
3,5) ≥ 3,5
Số hộ gia đình 21 147 192 78 34 16 12
Bài tập Xác suất thống kê Diệp Hoàng Ân
93
5. 37.
Để đánh giá mức tiêu hao nhiên liệu của một loại xe ô tô, người ta theo
dõi lượng tiêu hao nhiên liệu (lít/100 km) của 100 chuyến xe và có kết quả sau:
Lượng tiêu
hao [35; 40) [40; 45) [45; 50) [50; 55)
[55; 60)
Số chuyến xe 14 20 36 22 8
a) Tìm khoảng tin cậy 95% cho lượng tiêu hao nhiên liệu trung bình của loại
xe nói trên
b) Xe cần đưa vào kiểm tra kỹ thuật là xe có mức tiêu hao nhiên liệu từ 55
lít/100 km trở lên. Hãy ước lượng tỉ lệ xe cần đưa vào kiểm tra kỹ thuật tối
thiểu ở độ tin cậy 95%.
Giải
a) Gọi X là biến ngẫu nhiên chỉ mức tiêu hao nguyên liệu cho mỗi chuyến
xe. Từ số liệu trên ta xây dựng được bảng sau:
47x =
5
2 2 2
1
1
99
32,5758i i
i
s n x nx
=
= − =
∑
1 1 0,95
2 2
. .
100 100
5,7075 5,70751,96. =1,12se u u
n
+γ += = =
Do đó khoảng tin cậy 95% cho lượng tiêu hao nguyên liệu trung bình:
( )45,88;48,12
b) Tỷ lệ xe cần kiểm tra kỹ thuật của mẫu: 8 0,08
100
p = =
Tỉ lệ xe cần đưa vào kiểm tra kỹ thuật tối thiểu ở độ tin cậy 95% là p p e≥ −
với ( ) 0,951 0,08.0,92 0,04510
p p
e u u
n
γ
−
= = =
Suy ra 0,08 0,045 0,035p ≥ − = .
Bài tập Xác suất thống kê Diệp Hoàng Ân
94
CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT
6. 1.
Trong một cuộc điều tra về nhịp mạch của 64 thanh niên làm nghề A, kết quả
là nhịp mạch trung bình 74 lần/phút và độ lệch chuẩn bằng 9 lần/phút. Hãy kiểm
định xem đặc điểm nghề A có làm cho nhịp mạch của thanh niên tăng quá mức
bình thường không, biết rằng nhịp mạch bình thường của thanh niên là 72 lần /
phút. ( kết luận với mức 1%α = ).
Giải:
Gọi X là biến ngẫu nhiên chỉ nhịp mạch của thanh niên làm nghề A. Ta cần kiểm
định giả thiết:
0 1: 72; : 72H Hµ µ= > , ở mức 1%α = .
Nếu 0H đúng thì biến ngẫu nhiên ( )72 64 ~ 0,1−= XU N
s
.
Với 1%α = , 1 0,99 2,5758α−= = =gtth u u .
Với mẫu cụ thể ta có 74 72 16.8 1,778
9 9
u gtth−= = = < .
Vậy, ta chấp nhận giả thiết 0H nghĩa nghề A không làm tăng nhịp đập của thanh
niên.
6. 2. Điều tra Cholesterol toàn phần trong huyết thanh của 25 bệnh nhân bị
một loại bệnh B, ta có trung bình cộng của lượng Cholesterol là 172 mg% và độ
lệch chuẩn bằng 40 mg%. Theo tài liệu về hằng số sinh hoá bình thường của
người Việt Nam thì lượng Cholesterol trung bình toàn phần trong huyết thanh là
156 mg% và tuân theo luật phân phối chuẩn.
Hỏi lượng Cholesterol của các bệnh nhân mắc bệnh B có cao hơn bình thường
không? (kết luận ở mức 5%α = ) .
Giải:
Kiểm định giả thiết
( ) ( )0 1: 156 % ; : 156H mg H mgµ µ= > ở mức 5%α = .
Nếu 0H thì biến ngẫu nhiên ( )156 25 ~ 24XT tS
−
=
Với mức 0,05α = ta có ( ) ( )24 241 0,05 0,95 1,7109t t− = =
Với mẫu cụ thể ta tính được:
24
0,95
172 156 5 2
40
t t
−
= = > . Vậy 0H bị bác bỏ nghĩa là lượng Cholesterol của bệnh
nhân mắc bệnh B cao hơn bình thường.
6. 3. Một công ty bào chế một loại thuốc chữa dị ứng tuyên bố rằng thuốc
của họ có hiệu quả không dưới 90% trong việc làm giảm cơn dị ứng trong vòng 8
giờ. Một mẫu gồm 200 người bị dị ứng sử dụng loại thuốc trên, có 160 người
giảm cơn dị ứng. Hãy xác định xem lời tuyên bố của công ty có giá trị không? (
ở mức ý nghĩa α = 0,07).
Giải:
Bài tập Xác suất thống kê Diệp Hoàng Ân
95
Gọi p là tỉ lệ người giảm dị ứng khi dùng thuốc của công ty trong vòng 8 giờ. Ta
cần xác định xem p có bằng 90% trở lên hay không. Muốn vậy ta kiểm định giả
thiết:
0 0 1 0: 90%; : 90%H p p H p p= = < = ở mức ý nghĩa α = 0,07.
Nếu 0H đúng thì biến ngẫu nhiên ( ) ( )
0
0 0
~ 0, 1
1
P pU n N
p p
−
=
−
Với mức 0,07α = ta có 1 0,93 1,4758gtth u u−= − = − = −α .
Với mẫu cụ thể ta có: 160 / 200 0,9 200 4,714 1,4758
0,9.0,1
u gtth−= = − < = − .
Vậy ta bác bỏ giả thiết 0H nghĩa là tuyên bố của công ty không có giá trị. Kết luận
ở mức ý nghĩa 0,07.
6. 4. (3 điểm) Trước đây, Nhà máy Alpha sản xuất ra một loại sản phẩm với
tỉ lệ phế phẩm 5%. Năm nay, sau đợt cải tiến kỹ thuật, để kiểm tra hiệu quả, người
ta lấy ra ra một mẫu gồm 800 sản phẩm để kiểm tra thì thấy có 24 phế phẩm.
a) Với mức ý nghĩa α = 5%, hãy kiểm định xem đợt cải tiến kỹ thuật có
thực sự làm giảm tỉ lệ phế phẩm không?.
b) Sau đợt cải tiến kỹ thuật, nếu nhà máy báo cáo tỉ lệ phế phẩm là 2% thì
có chấp nhận được không? (ở mức ý nghĩa α = 3%).
Giải:
a) Gọi p là tỷ lệ phế phẩm sau đợt cải tiến kĩ thuật, tỉ lệ mẫu . Ta cần kiểm
định giả thiết sau:
0 0: 5%;H p p= = đối thiết 1 0:H p p< ở mức ý nghĩa α = 5%.
Nếu 0H đúng thì ( ) ( )
0
0 0
~ 0,1
1
P pU n N
p p
−
=
−
Với mức 5%α = ta có 1 0,95 1,65gtth u u−α= − = − = − .
Với mẫu cụ thể ta tính được
( )
0
0 0
0,03 0,05 800 2,6
0,05.0,951
p p
u n gtth
p p
− −
= = = − <
−
Vậy, ta bác bỏ 0H nghĩa là đợt cải tiến kĩ thuật thật sự làm giảm tỷ lệ phế
phẩm.
b) Ta kiểm định giả thiết 0 0: 2%;H p p= = đối thiết 1 0:H p p≠ ở mức
3%α = .
Nếu 0H đúng thì ( ) ( )
0
0 0
~ 0,1
1
P pU n N
p p
−
=
−
.
Bài tập Xác suất thống kê Diệp Hoàng Ân
96
Vơi s mức 3%α = ta có 0,9851
2
2,17gtth u uα
−
= = = .
Từ mẫu cụ thể ta tính được.
( )
0
0 0
0,03 0,02 800 2,02
0,02.0,981
p p
u n gtth
p p
−
−
= = = <
−
Vậy ta chấp nhận 0H nghĩa là chấp nhận lời tuyên bố của công ty.
6. 5. Tiền lương hàng tuần trung bình trên một mẫu gồm 30 công nhân trong
một xí nghiệp lớn là 180 (ngàn đồng) với với độ lệch chuẩn 14 (ngàn đồng).
Trong một xí nghiệp lớn khác, một mẫu gồm 40 công nhân được chọn ngẫu nhiên
có tiền lương hàng tuần trung bình là 170 (ngàn đồng) với độ lệch chuẩn 10 (ngàn
đồng). Tiền lương hàng tuần trung bình ở hai xí nghiệp trên có khác nhau không?
( ở mức ý nghĩa α = 5%). Giả sử tiền lương hàng tuần của hai xí nghiệp là biến
ngẫu nhiên có phân phối chuẩn có cùng phương sai.
Giải: Gọi X, Y là tiền lương hàng tuần của mỗi công nhân của hai xí nghiệp
trên tương ứng. Kiểm định giả thiết 0 1X Y X YH : ; H := ≠µ µ µ µ ở mức 5%α = .
Nếu 0H đúng thì ( ) ( )2 1 1 ~ 2n m
X YT t n m
S
−
= + −
+
với
2 2
2 ( 1) ( 1)
2
X Yn S m SS
n m
− + −
=
+ −
với mức 5%α = ta có ( ) ( )2 680,9751
2
1,9955n mgtth t t+ −α
−
= = =
Với mẫu cụ thể ta tính được
2 2
2 29 14 39 10 140 94
78
. .
s ,
+
= =
Do đó ( )2 1 1
180 170 3 4876
1 1140 94
30 40
tn
n m
x y
t , gtth
s
,
− −
= = = >
+
+
Vậy ta bác bỏ 0H nghĩa là tiền lương hàng tuần trung bình ở hai xí nghiệp
trên là khác nhau.
6. 6. Gọi X và Y lần lượt là biến ngẫu nhiên chỉ khối lượng của trẻ sơ sinh
trai và trẻ sơ sinh gái. Cho biết X và Y tuân theo luật phân phối chuẩn có cùng
phương sai. Khảo sát ngẫu nhiên 20 trẻ sơ sinh trai, người ta tính được x = 3200
g, Xs = 400 g và 17 trẻ sơ sinh gái, người ta tính được y = 3000 g, Ys = 380 g.
Phải chăng khối lượng của trẻ sơ sinh trai lớn hơn khối lượng của trẻ sơ sinh gái?
(kết luận với mức ý nghĩa α = 5%)
Giải:
Bài tập Xác suất thống kê Diệp Hoàng Ân
97
Kiểm định giả thiết 0 1X Y X YH : ; H :µ µ µ µ= > ở mức α = 5%.
Nếu 0H đúng thì ( ) ( )2 1 1 ~ 2n m
X YT t n m
S
−
= + −
+
với
2 2
2 ( 1) ( 1)
2
X Yn S m SS
n m
− + −
=
+ −
; 20 17n ; m= = .
Giá trị tới hạn ( )2 351 0 95 1 6896
n m
,
gtth t t ,α
+ −
−
= = =
Với mẫu cụ thể ta có
2 2
2 19 400 16 380 152868 57
35
. .
s ,
+
= =
( )2 1 1
3200 3000 1 55
1 1152868 57
20 17
tn
n m
x y
t , gtth
s
,
− −
= = = <
+
+
Ta chấp nhận 0H nghĩa là trọng lượng của trẻ sơ sinh trai không lớn hơn
trọng lượng của trẻ sơ sinh gái (α = 5%).
6. 7. Khối lượng của một loại sản phẩm do một nhà máy sản xuất là một
biến ngẫu nhiên tuân luật phân phối chuẩn N(500; (8,5)2). Sau một thời gian sản
xuất, ban lãnh đạo nhà máy nghi ngờ rằng khối lượng của loại sản phẩm này có xu
hướng giảm, nên tiến hành cân thử 25 sản phẩm và thu được kết quả sau:
Khối lượng (g) 480 485 490 495 500 510
Số sản phẩm 2 3 8 5 3 4
Với mức ý nghĩa α = 5% , hãy cho kết luận về điều nghi ngờ trên.
Giải:
Từ số liệu ta tính được 494x = ; 8 9s ,= 25n = .
Ta kiểm định giả thiết 0 0 1 0500H : ;H :µ µ µ µ= = < ở mức 5%α = .
Nếu 0H đúng thì BNN ( )0 0 1XU n ~ N ,µσ
−
= với 025 8 5 500n ; , ;σ µ= = =
Với mức 5%α = ta có 1 0 95 1 65,gtth u u ,α−= − = − = −
Với mẫu cụ thể giá trị của U là 494 500 5 3 53
8 5
u . , gtth
,
−
= = − < nên 0H bị bác
bỏ nghĩa là điều nghi ngờ trên là đúng.
6. 8. Một công ty muốn đánh giá về hiệu quả của một đợt quảng cáo đối với
số sản phẩm bán ra của công ty. 10 cửa hàng bán sản phẩm của công ty được chọn
ngẫu nhiên để theo dõi số lượng sản phẩm bán ra trong một tuần trước đợt quảng
cáo (TĐQC) và một tuần sau đợt quảng cáo (SĐQC).
Cửa 1 2 3 4 5 6 7 8 9 10
Bài tập Xác suất thống kê Diệp Hoàng Ân
98
hàng
TĐQC 53 114 81 86 34 66 89 113 88 111
SĐQC 137 135 83 125 47 46 114 157 57 144
Hãy cho kết luận về hiệu quả của đợt quảng cáo (ở mức α = 5%).
Giải:
Gọi D là hiệu số giữa số sản phẩm bán ra sau quảng cáo và trước quảng cáo
của mỗi của hàng. Bảng hiệu số:
D 84 21 2 39 13 -20 25 44 -31 33
Từ đó ta tính được 21 32 98Dd ;s ,= = .
Ta cần kiểm định giả thiết sau ở mức 5%α = .
0 10 0D DH : ; H :µ µ= >
Nếu 0H đúng thì ( )1
D
D nT ~ t n
S
= −
Với 5%α = ( )91 1,8331gtth t α−= =
Với mẫu cụ thể ta có 21 10 2 01
32 98
t , gtth
,
= = >
Nên 0H bị bác bỏ.
Vậy, đợt quảng cáo thật sự làm tăng số lượng sản phẩm bán ra.
6. 9. Một máy sản xuất tự động có tỉ lệ sản xuất ra sản phẩm loại A lúc đầu là
48%. Máy được cải tiến và sau một thời gian áp dụng, người ta kiểm tra 40 hộp,
mỗi hộp gồm 10 sản phẩm và ghi lại số sản phẩm loại A trong mỗi hộp (SSPLA/h)
như sau :
SSPLA/h 1 2 3 4 5 6 7 8 9 10
Số hộp 2 0 4 6 8 10 4 5 1 0
Hãy cho kết luận về hiệu quả của việc cải tiến máy ở mức ý nghĩa α = 0,05.
Giải:
Gọi p là tỉ lệ sản phẩm lạo A sau đợt cải tiến kỹ thuật.
Tỉ lệ sản phẩm loại A trên mẫu khảo sát:
215 43
400 80
p = =
Kiểm định giả thiết:
0 0 1 0: 48%; :H p p H p p= = > ở mức 5%α = .
Bài tập Xác suất thống kê Diệp Hoàng Ân
99
Nếu 0H đúng thì BNN
( ) ( )
0
0 0
~ 0,1
1
P pU n N
p p
−
=
−
Với mức ý nghĩa 0,05α = giá trị tới hạn bằng: 1 0,95 1,6449u uα− = =
Với mẫu cụ thể, ta tính được:
( ) ( )
0
0 0
43 0,48
80 400 2,3018
1 0,48 1 0,48
p p
u n
p p
−
−
= = =
− −
Vì u gtth> nên 0H bị bác bỏ nghĩa là việc cải tiến kỹ thuật thất sự mang lại hiệu
quả.
6. 10. Khối lượng trung bình khi xuất chuồng ở một trại chăn nuôi gà công nghiệp
năm trước là 3,3 kg/con. Năm nay người ta sử dụng loại thức ăn mới. Sau một thời
gian, cân thử 15 con khi xuất chuồng, có các số liệu sau: (đơn vị kg)
3,25; 2,50; 4,00; 3,75; 3,80; 3,90; 4,02;
3,60; 3,80; 3,20; 3,82; 3,40; 3,75; 4,00; 3,50,
Giả thiết khối lượng gà là biến ngẫu nhiên phân phối theo qui luật chuẩn với
phương sai 0,04.
Với mức ý nghĩa α = 0,05, hãy cho kết luận về tác dụng của loại thức ăn mới.
Giải:
Gọi X là BNN chỉ khối lượng gà khi xuất chuồng. Theo giả thiết
( )2~ ;0, 2X N µ . Từ số liệu đã cho ta tính được: 3,62x = ; 0,405s = .
Nếu thức ăn mới có tác dụng tốt thì khối lượng trung bình của gà xuất
chuồng năm nay sẽ cao hơn. Muốn kết luận về điều đó ta kiểm định giả thiết sau:
( )0 0 1 0: 3,3 ; :kgH Hµ µ µ µ= = > ở mức ý nghĩa 5%α = .
Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n Nµσ
−
=
Với mức ý nghĩa 0,05α = 1 1 0,05 0,95 1,6449gtth u u uα− == = = =
Với mẫu cụ thể ta tính được:
0 3,62 3,3 15 6,2
0,2
x
u n
µ
σ
− −
= = =
Vì u gtth> nên 0H bị bác bỏ.
Vậy, khối lượng trung bình của gà xuất chuồng năm nay cao hơn năm trước, nghĩa
là thức ăn mới có tác dụng tăng trọng lượng gà.
6. 11. Để điều tra khối lượng gà xuất chuồng ở một trại chăn nuôi gà công nghiệp
năm nay. Người ta cân thử 15 con khi xuất chuồng, có các số liệu sau: (đơn vị kg)
3,25; 2,50; 4,00; 3,75; 3,80; 3,90; 4,02;
Bài tập Xác suất thống kê Diệp Hoàng Ân
100
3,60; 3,80; 3,20; 3,82; 3,40; 3,75; 4,00; 3,50,
Giả thiết khối lượng gà là biến ngẫu nhiên phân phối theo qui luật chuẩn với
phương sai 0,04.
Có nên báo cáo khối lượng trung bình của gà xuất chuồng năm nay là 3,7 kg/con
hay không? (ở mức ý nghĩa α = 0,05).
Giải:
Gọi X là BNN chỉ khối lượng gà xuất chuồng năm nay.
Kiểm định giả thiết
( )0 0 1 0: 3,7 ; :H kg Hµ µ µ µ= = ≠ ở mức 5%α = .
Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n Nµσ
−
=
Với mức ý nghĩa 0,05α = 1 / 2 1 0,025 0,975 1,96gtth u u uα− == = = =
Với mẫu cụ thể ta tính được:
0 3,62 3,7 15 1,55
0,2
x
u n
µ
σ
− −
= = = −
Vì | |u gtth< nên 0H không bị bác bỏ.
Vậy, ở mức ý nghĩa 5% ta công nhận báo cáo của trại chăn nuôi.
6. 12. Một cuộc điều tra của Hội phụ nữ để đánh giá về một dư luận xã hội cho
rằng lương của phụ nữ thấp hơn lương của nam giới. Một mẫu nhiên gồm 4 đàn
ông có lương trung bình là 78,0 (ngàn đồng), với độ lệch chuẩn mẫu là 24,4; một
mẫu ngẫu nhiên khác độc lập với mẫu trên gồm 4 phụ nữ có lương trung bình là
63,5 (ngàn đồng), với độ lệch chuẩn là 20,2. Giả sử rằng lương của cả nam và nữ
giới đều là các biến ngẫu nhiên tuân theo luật phân phối chuẩn có cùng phương
sai. Hãy cho kết luận về cuộc điều tra trên ở mức ý nghĩa 10%.
Giải:
Gọi ,X Y theo thứ tự là lương của đàn ông và phụ nữ. Ta kiểm định giả thiết:
0 1: ; :X Y X YH Hµ µ µ µ= > ở mức 10%α = .
Nếu 0H đúng thì BNN ( )
2
~ 2
1 1
X YU t n m
S
n m
−
= + −
+
Vơi ( ) ( )
2 2
2 1 1
2
X Yn S m SS
n m
− + −
=
+ −
Với mức ý nghĩa 10%α = , ( ) ( )2 61 0,9 1,4398n mgtth t tα+ −−= = =
Với mẫu cụ thể: 2 222,4s =
Và
2 2
78 63,5 0,915
1 1 1 122,4
4 4
x y
t
s
n m
− −
= = =
+ +
Bài tập Xác suất thống kê Diệp Hoàng Ân
101
Vì t gtth< nên 0H không bị bác bỏ.
Vậy, kết luận của cuộc điều tra chưa đúng.
6. 13. Người ta muốn nghiên cứu tác dụng của việc cho sinh viên đi thực tế xem
sự tiếp thu kiến thức có tốt hơn không bằng cách so sánh điểm thi của nhóm sinh
viên không đi thực tế (SVKĐTT) với nhóm sinh viên có đi thực tế (SVCĐTT).
Kết quả như sau:
Điểm 0 1 2 3 4 5 6 7 8 9 10
SVCĐTT 0 0 3 9 7 5 17 10 11 4 1
SVKĐTT 3 3 6 1
1
7 13 10 12 4 1 3
Gọi X và Y lần lượt là biến ngẫu nhiên biểu thị điểm số của sinh viên có đi
thực tế và sinh viên không đi thực tế.
Điểm thi của nhóm sinh viên có đi thực tế có thực sự tốt hơn không? (kết
luận ở mức ý nghĩa α = 0,01 )
Giải:
Kiểm định giả thiết 0 1X Y X YH : ;H :µ µ µ µ= > ở mức ý nghĩa α = 0,01
Nếu 0H đúng thì BNN ( )2 2 0 1
X Y
X YU ~ N ,
s s
n m
−
=
+
Với 0 01,α = ta có 1 1 0 01 0 99 2,3263, ,gtth u u uα− −= = = =
Với mẫu cụ thể ta tính được
Từ bảng số liệu ta có: 67n = 5 85x ,= ; 2Xs = ; 73m = ; 4 88 2 39Yy , ; s ,= = .
2 2
5 85 4 88 2 6116
2 2 39
67 73
tn
, ,
u , gtth
,
−
= = >
+
Nên 0H bị bác bỏ nghĩa là SVCĐTT có điểm cao hơn SVKĐTT.
6. 14. Một công ty vận tải, muốn đánh giá tác dụng của một loại chất phụ gia pha
vào xăng, đã chọn 10 chiếc xe. Cho mỗi chiếc chạy hai lần với cùng điều kiện
như nhau; nhưng lần đầu với xăng không có chất phụ gia (KPG), lần sau, với cùng
một lượng xăng như lần đầu, có chất phụ gia (CPG). Người ta ghi lại số dặm đã
đi được của 10 chiếc xe trên trong hai lần như sau:
Xe KPG CPG Xe KPG CPG
Bài tập Xác suất thống kê Diệp Hoàng Ân
102
1
2
2
4
5
26,2
25,7
22,3
19,6
18,1
26,7
25,8
21,9
19,3
18,4
6
7
8
9
10
15,8
13,9
12,0
11,5
10,0
15,7
14,2
12,6
11,9
10,3
Có sự khác nhau giữa số dặm trung bình đi được với xăng không có chất phụ
gia và có chất phụ gia không? (kết luận ở mức ý nghĩa 5%)
Giải:
Gọi ,X Y lần lượt là các BNN chỉ số dăm đi được của xe KPG và xe CPG.
Đặt D X Y= − . Bảng số liệu cho D :
Xe 1 2 3 4 5 6 7 8 9 10
id -0,5 -0,1 0,4 0,3 -0,3 0,1 -0,3 -0,6 -0,4 -0,3
Từ đó ta tính được: 0,17, 0,3368Dd s= − =
Để xét xem khác nhau về số dặm trung bình giữa xe KPG và xe CPG ta kiểm
định giả thiết sau:
0 : 0; 0D DH µ µ= ≠ ở mức 5%α = .
Nếu 0H đúng thì BNN ( )10 ~ 9
D
DT t
S
=
Với 5% 0,05α = = : ( ) ( )9 90,05 0,9751
2
2,2622gtth t t
−
= = =
Với mẫu cụ thể ta có: 0,17 10 1,596
0,3368
t
−
= =
Vì | |t gtth< nên 0H được chấp nhận.
Vậy, ở mức ý nghĩa 5%α = không có sự khác nhau giữa số dặm trung bình
đi được với xăng không có chất phụ gia và có chất phụ gia.
6. 15. Khối lượng bao gạo (KLBG) là biến ngẫu nhiên có phân phối chuẩn
( )50;0,01N . Có nhiều ý kiến của khách hàng phản ánh là khối lượng bị thiếu. Một
nhóm thanh tra đã cân ngẫu nhiên 25 bao gạo trong kho và được kết quả như sau:
KLBG (kg) (48; 48,5] (48,5; 49] (49; 49,5] (49,5; 50] (50; 50,5]
Số bao gạo 2 5 10 6 2
Hãy kiểm định xem ý kiến của khách hàng phản ánh có đúng không? (kết
luận ở mức ý nghĩa α = 5%).
Giải:
Bài tập Xác suất thống kê Diệp Hoàng Ân
103
Gọi X là BNN chỉ khối lượng bao gạo. Từ số liệu đã cho ta tính được
49,27; 0,53x s= = .
Ta kiểm định giả thiết sau:
( )0 0 1 0: 50 ; :kgH Hµ µ µ µ= = < ở mức ý nghĩa α = 5%
Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n Nµσ
−
=
Với mức ý nghĩa α = 5% 1 0,05 1,6449gtth u −= − = −
Với mẫu cụ thể: 49,27 50 25 36,5
0,1
u
−
= = −
Vì u gtth< nên 0H bị bác bỏ. Nghĩa là ý kiến của khách hàng phản ánh là đúng (α
= 5%).
6. 16. Một mẫu gồm 300 cử tri ở khu vực A và một mẫu gồm 200 cử tri ở khu vực
B cho thấy có 56% và 48%, theo thứ tự, ủng hộ ứng cử viên X. Ở mức ý nghĩa
5%, hãy kiểm định giả thiết:
a) Có sự khác biệt giữa hai khu vực về sự ủng hộ ứng cử viên X.
b) Ứng cử viên X được ủng hộ hơn ở khu vực A.
Giải:
Gọi Ap và Bp theo thứ tự là tỷ lệ ủng hộ ứng cử viên X ở khu vực A và B.
a) Ta kiểm định giả thiết 0 1A B A BH : p p ; H : p p= ≠ ở mức ý nghĩa 5%α = .
Nếu 0H đúng thì
( )
( )
0 0
0 1
1 11
A BP PU ~ N ,
p p
n m
−
=
− +
với
0 0 528A B
np mpp ,
n m
+
= =
+
Với 5%α = ta có 0 9751
2
1 96
,
gtth u u ,α
−
= = =
Giá trị thực nghiệm 0 56 0 48 1 755
1 10 528 0 472
300 200
, ,
u , gtth
, . ,
−
= = <
+
Do đó 0H không bị bác bỏ nghĩa là sự khác nhau giữa tỷ lệ ủng hộ giữa hai
khu vực A, B đối với ứng cử viên X không có ý nghĩa về mặt thống kê.
b) Ta kiểm định giả thiết 0 1A B A BH : p p ; H : p p= > ở mức ý nghĩa 5%α = .
Nếu 0H đúng thì
( )
( )
0 0
0 1
1 11
A BP PU ~ N ,
p p
n m
−
=
− +
Bài tập Xác suất thống kê Diệp Hoàng Ân
104
0 0 528A B
np mpp ,
n m
+
= =
+
Với 5%α = ta có 1 0 95 1 65,gtth u u ,α−= = =
0 56 0 48 1 755
1 10 528 0 472
300 200
, ,
u , gtth
, . ,
−
= = >
+
Nên 0H bị bác bỏ nghĩa là ứng cử viên X được ủng hộ nhiều hơn ở khu vực
A.
6. 17. Điều tra ngẫu nhiên 200 người có hút thuốc lá, thấy có 28 người bị lao
phổi; 170 người không hút thuốc lá, thấy có 12 người bị lao phổi. Tỉ lệ lao phổi
giữa những người có và không hút thuốc lá có khác khau không? (kết luận ở mức
ý nghĩa α = 1%).
Giải:
Gọi 1p , 2p lần lượt là tỉ lệ lao phổi những người có hút thuốc lá và không
hút thuốc lá. Ta kiểm định giả thiết sau:
0 1 2 1 1 2: ; :H p p H p p= ≠ ở mức 1%α = .
Nếu 0H đúng thì BNN
( )
( )1 2
0 0
~ 0,1
1 11
P PU N
p p
n m
−
=
− +
Với 1 20
28 12 40 4
370 370 37
np mpp
n m
+ +
= = = =
+
Với mức 1%α = , 0,9951
2
2,5758gtth u uα
−
= = =
Với mẫu cụ thể ta có:
( )
1 2
0 0
28 12
200 170 2,1428
1 1 4 4 1 11 1
37 37
p p
u
p p
n m n m
−
−
= = =
− + − +
Ta có | |u gtth< nên 0H không bị bác bỏ nghĩa là tỉ lệ lao phổi giữa những
người có và không hút thuốc lá không khác khau (α = 1%).
6. 18. Một nhà máy có hai phân xưởng A và B cùng sản xuất một loại trục máy.
Sau một thời gian hoạt động, chọn ngẫu nhiên 20 trục máy do phân xưởng A sản
xuất, người ta đo được đường kính của chúng như sau (đơn vị mm)
250; 249; 251; 253; 248; 250; 250; 252; 257; 245;
248; 247; 249; 250; 280; 250; 247; 253; 256; 249.
Bài tập Xác suất thống kê Diệp Hoàng Ân
105
Giả sử đường kính của các trục máy ở hai phân xưởng A và B tuân theo luật
phân phối chuẩn có cùng phương sai.
Đo ngẫu nhiên đường kính 20 trục máy do phân xưởng B sản xuất, người ta
tính được đường kính trung bình là 249,8 với phương sai 56,2. Hãy kiểm định, ở
mức ý nghĩa α = 5%, giả thiết 0H cho rằng đường kính trung bình các trục máy
được sản xuất ở hai phân xưởng là như nhau đối với giả thiết 1H cho rằng chúng
khác nhau.
Giải:
Gọi ,X Y lần lượt là đường kính trục máy do phân xưởng A, B tương ứng sản
xuất.
Kiểm định giả thiết
0 1: ; :X Y X YH Hµ µ µ µ= ≠ ở mức ý nghĩa α = 5%.
Nếu 0H đúng thì BNN ( )
2
~ 2
1 1
X YT t n m
S
n m
−
= + −
+
Với 20; 20n m= = và ( ) ( )
2 2
2 1 1
2
X Yn S m SS
n m
− + −
=
+ −
Với ở mức ý nghĩa α = 5%, ( ) ( )2 380,9751
2
2,0244n mgtth t tα
+ −
−
= = =
Với mẫu cụ thể: 251,25x = và 7,7111Xs =
2 2 2
2 19. 19 19.7,7111 19.56, 2 57,83
38 38
X Ys ss
+ +
= = =
2
251, 25 249,8 0,6029
1 1 1 157,83
20 20
x y
t
s
n m
− −
= = =
+ +
Vì | |t gtth< nên 0H được chấp nhận. Đường kính trung bình các trục máy được
sản xuất ở hai phân xưởng là như nhau (ở mức ý nghĩa α = 5%).
6. 19. Phân xưởng A của một nhà máy sản xuất một loại trục máy. Sau một thời
gian hoạt động, chọn ngẫu nhiên 20 trục máy do phân xưởng A sản xuất, người ta
đo được đường kính của chúng như sau (đơn vị mm)
250; 249; 251; 253; 248; 250; 250; 252; 257; 245;
248; 247; 249; 250; 280; 250; 247; 253; 256; 249.
Giả sử đường kính của các trục máy của phân xưởng A tuân theo luật phân
phối chuẩn. Biết đường kính của một trục máy do phân xưởng A sản xuất, theo qui
định là 250 mm. Hãy cho kết luận về chất lượng sản xuất của phân xưởng A ở
mức ý nghĩa α = 5%.
Bài tập Xác suất thống kê Diệp Hoàng Ân
106
Giải:
Gọi X lần lượt là đường kính trục máy do phân xưởng A sản xuất. Từ số liệu ta
có:
251,25x = và 7,7111=s
Ta kiểm định giả thiết sau:
0 0 1 0: 250; :X XH Hµ µ µ µ= = ≠ ở mức 5%.α =
Nếu 0H đúng thì BNN ( )0 ~ 1µ−= −XT n t nS
Với mức 5%α = ( ) ( )19 190,9751
2
2,0930gtth t tα
−
= = =
Với mẫu cụ thể ta có: 251,25 250 20 0,786
7,111
t
−
= =
Vì | |t gtth< nên 0H đước chấp nhận. Do đó Tình hình sản xuất của phân
xưởng A bình thường (kết luận ở mức ý nghĩa α = 5%).
6. 20. Sản phẩm của một xí nghiệp đúc cho phép số khuyết tật trung bình cho
một sản phẩm là 3. Sau một đợt cải tiến kỹ thuật, người ta lấy ngẫu nhiên 36 sản
phẩm để kiểm tra số khuyết tật trên mỗi sản phẩm (SKTTMSP). Kết quả thu
được như sau:
SKTTMSP 0 1 2 3 4 5
6
Số sản phẩm 7 4 4 6 8 6
1
Hãy cho kết luận về hiệu quả của đợt cải tiến kỹ thuật đối với số khuyết tật
trung bình của một sản phẩm ở mức ý nghĩa α = 10%.
Giải:
Từ số liệu ta tính được 2,7222; 1,86x s= =
Để kết luận về hiệu quả đợt cải tiến kỹ thuật ta kiểm định giả thiết:
0 0 1 0: 3; :H Hµ µ µ µ= = < ở mức ý nghĩa α = 10%
Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n N
s
µ−
=
Với ở mức ý nghĩa α = 10% 1 0,9 1,2816gtth u uα−= − = − = −
Với mẫu cụ thể 2,722 3 36 0,896
1,86
u
−
= = −
Vì u gtth> nên 0H không bị bác bỏ nghĩa là đợt cải tiến kỹ thuật không mang lại
hiệu quả (kết luận ở mức ý nghĩa α = 10%).
Bài tập Xác suất thống kê Diệp Hoàng Ân
107
6. 21. Sản phẩm của một xí nghiệp đúc cho phép số khuyết tật trung bình cho một
sản phẩm là 3. Sau một đợt cải tiến kỹ thuật, người ta lấy ngẫu nhiên 36 sản
phẩm để kiểm tra số khuyết tật trên mỗi sản phẩm (SKTTMSP). Kết quả thu
được như sau:
SKTTMSP 0 1 2 3 4 5
6
Số sản phẩm 7 4 4 6 8 6
1
Sản phẩm có không quá 2 khuyết tật được gọi là sản phẩm loại A. Tỉ lệ sản
phẩm loại A trước đợt cải tiến kỹ thuật là 40%. Đợt cải tiến kỹ thuật có thực sự
làm tăng tỉ lệ sản phẩm loại A không? (kết luận ở mức ý nghĩa 5%).
Giải:
Gọi p là tỉ lệ sản phẩm loại A. Tỉ lệ mẫu: 15 5
36 12
p = = .
Kiểm định giả thiết
0 0 1 0: 40%; :H p p H p p= = > ở mức ý nghĩa α = 5%
N Nếu 0H đúng thì BNN ( ) ( )
0
0 0
~ 0,1
1
P pU n N
p p
−
=
−
Với ở mức ý nghĩa α = 5%, 1 0,95 1,6449gtth u uα−= = =
Với mẫu cụ thể ta có: ( )
5 /12 0, 4 36 0, 204
0, 4 1 0, 4
u
−
= =
−
Vì u gtth< nên 0H không bị bác bỏ.
Vậy, đợt cải tiến kỹ thuật không làm tăng tỉ lệ sản phẩm loại A. (kết luận ở mức ý
nghĩa α = 5%).
6. 22. Những thống kê trong năm trước cho thấy một người Mỹ đi du lịch ở châu
Âu trong vòng 3 tuần sẽ chi hết 1010 USD cho việc mua sắm. Năm nay, người ta
thống kê trên 50 khách du lịch thì thấy số tiền trung bình mà họ chi tiêu là 1090
USD và độ lệch chuẩn là 300 USD. Với mức ý nghĩa 1%α = hãy cho biết mức chi
tiêu của những khách du lịch năm nay có tăng so với năm trước không?
Giải:
Gọi X là BNN chỉ mức chi tiêu của mỗi khách du lịch trong năm nay, EXµ = . Ta
kiểm định giả thiết
0 0 1 0: 1010; :H Hµ = µ = µ > µ ở ý nghĩa 1%α =
Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n N
s
− µ
=
Với ý nghĩa 1%α = , 1 0,99 2,3263gtth u u−α= = =
Bài tập Xác suất thống kê Diệp Hoàng Ân
108
Với mẫu cụ thể ta có: 1090 1010 50 1,8856
300
u
−
= =
Vì u gtth< nên 0H không bị bác bỏ.
Vậy, chưa đủ cơ sở để kết luận mức chi tiêu của những khách du lịch năm nay
tăng.
6. 23. Một hãng bào chế thuốc đang thử nghiệm hai loại thuốc gây mê A và B
mới. Việc thử nghiệm được tiến hành trên hai nhóm thú vật khác nhau. Nhóm thứ
nhất gồm 100 con dùng thuốc A thì có 71 con bị mê; nhóm thứ hai gồm 90 con
dùng thuốc B thì có 58 con bị mê. Hãng bào chế muốn kiểm định xem tác dụng
của hai loại thuốc trên có khác nhau không ở mức ý nghĩa 5%. Hãy cho biết kết
luận.
Giải:
Gọi 1p và 2p lần lượt là tỉ lệ con vật bị mê khi dùng thuốc A, B tương ứng. Giá trị
tỉ lệ mẫu đối với 2 loại thuốc đó là 1 2
71 58
;
100 90
p p= = .
Tỉ lệ chung là 71 58 129 0,6789
190 190
p += = = . Ta kiểm định giả thiết
0 1 2 1 1 2: ; :H p p H p p= ≠ ở mức ý nghĩa 5%α = .
Nếu 0H đúng thì BNN
( )
( )1 2 ~ 0,1
1 11
P PU N
p p
n m
−
=
− +
Với ở mức ý nghĩa 5%α = , 0,9751
2
1,96gtth u uα
−
= = =
Với mẫu cụ thể ta tính được:
( )
1 2
71 58
100 90 0,017
1 1 129 129 1 11 1
190 190 100 90
p p
u
p p
n m
−
−
= = =
− + − +
Vì | |u gtth< nên 0H không bị bác bỏ.
Vậy, tác dụng của hai loại thuốc trên không khác nhau ở mức ý nghĩa 5%.
6. 24. Với ý muốn làm tăng chỉ số mỡ sữa của loại giống bò A, một trại chăn nuôi
cho lai bò giống A với một loại bò giống B. Đo chỉ số mỡ sữa của 130 con bò lai
giống được chọn ngẫu nhiên trong đàn bò của trại, người ta có kết
Chỉ số mỡ sữa Số bò lai
Bài tập Xác suất thống kê Diệp Hoàng Ân
109
[3,0; 3,6)
[3,6; 4,2)
[4,2; 4,8)
[4,8; 5,4)
[5,4; 6,0)
[6,0; 6,6)
[6,6; 7,2)
2
8
35
43
22
15
5
Biết rằng chỉ số mỡ sữa trung bình của giống bò A thuần chủng là 4,95. Hãy cho
kết luận về hiệu quả của việc lai giống ở mức ý nghĩa 1%.
Giải:
Gọi X là BNN chỉ chỉ số mỡ sữa của giống bò lai. Từ số liệu ta tính được: 5,15x =
và 0,77s = . Ta kiểm định giả thiết:
0 0 1 0: 4,95; :H Hµ = µ = µ > µ ở mức ý nghĩa α = 1%.
Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n N
s
− µ
=
Với ở mức ý nghĩa α = 1%, 1 0,99 2,3263gtth u u−α= = =
Với mẫu cụ thể ta tính được:
5,15 4,95 130 2,96
0,77
u
−
= =
Vì u gtth> nên 0H bị bác bỏ.
Vậy, chỉ số mỡ sữa của giống bò lai cao hơn bò thuần chủng.
6. 25. Điều tra về một nguyên nhân gây ung thư phổi: Thăm dò trong 200 người
có hút thuốc lá, thấy có 28 người bị K phổi; trong 170 người không không hút
thuốc lá, có 12 người bị K phổi. Hỏi tỉ lệ người bị K phổi trên những người hút
thuốc lá có cao hơn tỉ lệ đó trên những người không hút thuốc lá không? (Kết luận
ở mức 5%α = ).
Giải:
Gọi 1 2,p p lần lượt là tỉ lệ người bị K phổi trong số những người hút thuốc và
không hút thuốc. Ta kiểm định giả thiết:
0 1 2 1 1 2: ; :H p p H p p= > ở mức 5%α =
Nếu 0H đúng thì BNN
( )
( )1 2 ~ 0,1
1 11
P PU N
p p
n m
−
=
− +
Với 5%α = , 1 0,95 1,6449gtth u u−α= = =
Với mẫu cụ thể ta tính được:
1 2
28 7 6 28 12 4
; ;
200 50 85 200 170 37
p p p += = = = =
+
Bài tập Xác suất thống kê Diệp Hoàng Ân
110
( )
1 2 2,14
1 11
200 170
p p
u
p p
−
= =
− +
Ta có u gtth> nên 0H bị bác bỏ. Vậy tỉ lệ bị K phổi trong số những người hút
thuốc là cao hơn tỉ lệ đó trên những nguoif không hút thuốc lá.
6. 26. Nếu máy móc hoạt động bình thường thì khối lượng một sản phẩm tuân
theo luật phân phối chuẩn với độ lệch chuẩn không quá 1kg. Có thể coi máy móc
còn hoạt động bình thường hay không nếu cân thử 30 sản phẩm do máy đó sản
xuất ra, thì tính được độ lệch chuẩn là 1,1 kg. Yêu cầu kết luận ở mức ý nghĩa
1%α = .
Giải: Kiểm định giả thiết về phương sai:
2 2 2 2
0 0 1 01H : ;H :σ σ σ σ= = ≠ ở mức ý nghĩa 1%α =
Nếu 0H đúng thì ( )
2
2
2
( 1)
~ 1
o
n SY n−= χ −
σ
Với mẫu cụ thể ta có
229 1 1 35 09
1
. ,y ,= =
Với 0 01,α = ta có 0,01
2 2
2 2( 1) (29) 13,121nαχ − = χ =
0,01
2 2
2 2
1 1
( 1) (29) 52,336nα
−
−
χ − = χ =
Do 2 2
12 2
1 1( n ) y ( n )α αχ χ
−
− < < − nên 0H không bị bác bỏ nghĩa là:
Chưa đủ cơ sở để nói rằng máy móc hoạt động không bình thường.
6. 27. Một nhà sản xuất bóng đèn cho rằng chất lượng bóng đèn được coi là đồng
đều nếu tuổi thọ của bóng đèn có độ lệch chuẩn bằng 1000 hoặc ít hơn. Lấy ngẫu
nhiên 10 bóng để kiểm tra, thì được độ lệch chuẩn mẫu là 1150, Vậy, với mức ý
nghĩa 5%, có thể coi chất lượng bóng đèn do công ty đó sản xuất là đồng đều
không? Biết rằng tuổi thọ của bóng đèn là một BNN có phân phối chuẩn.
Giải:
Kiểm định giả thiết về phương sai dạng 2 2 2 2 20 0 1 01000H : ;H :σ σ σ σ= = > ở
mức 5%α = .
Nếu 0H đúng thì ( )
2
2
2
( 1)
~ 1
o
n SY n−= χ −
σ
Giá trị tơi hạn: 2 21 0,95( 1) (9) 16,919gtth n−α= χ − = χ =
Với mẫu cụ thể ta có
2
2
9 1150 11 9025
1000
.y , gtth= = <
Bài tập Xác suất thống kê Diệp Hoàng Ân
111
0H được chấp nhận nghĩa là có thể coi chất lượng bóng đèn do công ty đó
sản xuất là đồng đều.
6. 28. Tại một nông trường, để điều tra khối lượng của một loại trái cây, sau một
đợt bón một loại phân mới, người ta cân thử một số trái cây được chọn ngẫu nhiên
và được kết quả sau:
Khối lượng (gam) Số trái cây
[45, 50)
[50, 55)
[55, 60)
[60, 65)
[65, 70)
[70, 75)
[75, 80)
≥ 80
2
11
25
74
187
43
16
3
Trước kia, khối lượng trung bình của mỗi trái là 65 gam. Hãy đánh giá xem loại
phân bón mới có mang lại hiệu quả không? (kết luận ở mức ý nghĩa α = 1%).
Giải:
Từ số liệu đã cho ta tính được 361; 66,38; 5, 41n x s= = =
Kiểm định giả thiết 0 0 1 0: 65( ); :H g Hµ = µ = µ > µ ở mức 1%α =
Nếu 0H đúng thì ( )0 ~ 0,1XU n N
s
− µ
=
Với 0,01α = ta suy ra: 1 0,99 2,33gtth u u−α= = =
Với mẫu cụ thể ta tính được: 66,38 65 361 4,85
5,41
u gtth−= = >
Vậy 0H bị bác bỏ nghĩa là: loại phân bón mới có mang lại hiệu quả. (kết luận ở
mức ý nghĩa α = 1%).
6. 29. Một công ty thương mại, dựa vào kinh nghiệm quá khứ, đã xác định rằng
vào cuối năm thì 80% số hoá đơn đã được thanh toán đầy đủ, 10% khất lại 1
tháng, 6% khất lại 2 tháng, và 4% khất lại hơn 2 tháng. Vào cuối năm nay, công ty
kiểm tra một mẫu ngẫu nhiên gồm 400 hoá đơn và thấy rằng: 287 hoá đơn đã được
thanh toán đầy đủ, 49 khất lại 1 tháng, 30 khất lại 2 tháng và 34 khất lại hơn 2
tháng. Như vậy, việc thanh toán hoá đơn năm nay có còn theo qui luật như những
năm trước không? (kết luận ở mức ý nghĩa 5%α = ).
Giải: Ta kiểm định giả thiết về phân phối.
0 :H Việc thanh toán hoá đơn năm nay theo qui luật năm trước
Bài tập Xác suất thống kê Diệp Hoàng Ân
112
1 :H Việc thanh toán hoá đơn năm nay không theo qui luật năm trước.
Ở mức ý nghĩa α = 5%.
Bảng tần số lý thuyết và thực nghiệm:
Thanh toán
đầy đủ ( 1x )
Khuất lại 1
tháng ( 2x )
Khuất lại 2
tháng ( 3x )
Khuất lại
hơn 2 tháng
( 4x )
Tần số quan
sát
287 49 30 34
Tần số lý
thuyết
320 40 24 16
Ta có:
( ) ( ) ( ) ( ) ( )2 2 2 2 242
1
287 320 49 40 30 24 34 16
27,178
320 40 24 16
i i
i i
o eQ
e
=
− − − − −
= = + + + =∑
Với 5%α = , gtth = ( ) ( )2 21 0,953 3 7,815−αχ = χ =
Ta thấy ( )2 21 3Q −α> χ nên:
Việc thanh toán hoá đơn năm nay không còn theo qui luật như những năm
trước. (kết luận ở mức ý nghĩa α = 5%).
6. 30. Để lập kế hoạch sản xuất mặt hàng mới, một công ty đã tiến hành điều tra
về sở thích của khách hàng về 3 loại mẫu khác nhau của cùng một loại hàng. Kết
quả được trình bày ở bảng sau:
Mẫu
hàng
Ý kiến
A B C
Thích 43 30 42
Không thích 35 53 39
Không có ý kiến 22 17 19
Có hay không sự phân biệt về sở thích của khách hàng đối với 3 loại mẫu nói
trên? Kết luận ở mức ý nghĩa 5%.
Giải: Ta kiểm định giả thiết về phân phối.
0 :H Không có sự phân biệt về sở thích
1 :H Có sự phân biệt về sở thích đối với 3 mặt hàng (mức ý nghĩa 5%).
Bảng đối chiếu tần số: Trong ngoặc là tần số lý thuyết:
Mẫu A B C
Bài tập Xác suất thống kê Diệp Hoàng Ân
113
hàng
Ý kiến
Thích 43
(38,33)
30
(38,33)
42
(38,33)
Không thích 35
(42,33)
53
(42,33)
39
(42,33)
Không có ý kiến 22
(19,33)
17
(19,33)
19
(19,33)
( )292
1
7,606i i
i i
o eQ
e
=
−
= =∑
( ) ( )2 21 0,954 4 9,488−αχ = χ =
Ta thấy ( )2 21 8Q −α< χ nên 0H được chấp nhận nghĩa là:
Không có sự phân biệt về sở thích đối với 3 mặt hàng.
6. 31. Điều tra một số sản phẩm của một xí nghiệp về chiều dài (X (cm)) và hàm
lượng chất A (Y (%)), người ta có kết quả sau:
Y
X
8 10 12 14 16
100 5 5
110 4 6 7
120 5 9 8
130 4 6 9
140 5 7
Các sản phẩm có chiều dài không quá 110cm và hàm lượng chất A không
hơn 12% được gọi là sản phẩm loại II. Nếu xí nghiệp báo cáo rằng sản phẩm loại
II có chỉ tiêu Y trung bình là 10% thì có thể chấp nhận được không? Kết luận ở
mức ý nghĩa 5% (giả thiết hàm lượng này có phân phối chuẩn)
Giải:
Bảng số liệu cho chỉ tiêu Y của những sản phẩm loại A.
jy 8 10 12
jn 9 11 7
Giá trị trung bình mẫu: 9,85y = và
giá trị độ lệch chuẩn mẫu: 1,56Ys = , cỡ mẫu 27n = .
Bài tập Xác suất thống kê Diệp Hoàng Ân
114
Ta kiểm định giả thiết sau:
( )0 0 1 0: 10 % ; :Y YH Hµ µ µ µ= = ≠ ở mức ý nghĩa 5%
Nếu 0H đúng thì BNN ( )0 ~ 1
Y
YT n t n
S
µ−
= −
Với mức ý nghĩa 5%α = ta tính được ( )260,051
2
2,0555gtth t
−
= =
Với mẫu cụ thể ta tính được: 9,85 10 27 0,5
1,56
t
−
= = −
Ta có t gtth< nên 0H không bị bác bỏ.
Vậy, chấp nhận báo cáo của xí nghiệp (ở mức ý nghĩa 5%).
6. 32. Gạo đủ tiêu chuẩn xuất khẩu là gạo có tỉ lệ hạt nguyên, hạt vỡ và tấm, theo
thứ tự, là: 90%, 6% và 4%.
Kiểm tra 1000 hạt gạo của một lô gạo, người ta thấy trong đó có:
Hạt nguyên: 880; hạt vỡ: 60 và tấm: 60
Hỏi lô gạo có đủ tiêu chuẩn xuất khẩu không? Cho kết luận ở mức ý nghĩa
5%.
Giải:
Để kết luận về tiêu chuẩn của lô gạo ta kiểm định giả thiết sau:
0 :H Lô gạo đủ tiêu chuẩn xuất khẩu.
1 :H Lô gạo không đủ tiêu chuẩn xuất khẩu (ở mức ý nghĩa 5%).
Nếu 0H đúng thì trong 1000 hạt gạo có 900 hạt nguyên, 60 hạt vỡ và 40 hạt
tấm.
Ta có ( ) ( ) ( )
2 2 2
2 880 900 60 60 60 40 10,44
900 60 40
Q − − −= + + =
Với 5%,α = ( )31 0,05 7,815gtth χ −= =
Vì 2Q gtth> nên 0H bị bác bỏ.
Vậy, lô gạo không đủ tiêu chuẩn xuất khẩu (kết luận ở mức ý nghĩa 5%).
6. 33. Giám đốc trại gà Alpha xem lại hồ sơ của một đợt khảo sát về khối lượng
của gà xuất chuồng ở trại gà thì thấy số liệu được ghi như sau:
Khối lượng (kg) Số con gà
Bài tập Xác suất thống kê Diệp Hoàng Ân
115
[2,3; 2,7)
[2,7; 2,9)
[2,9; 3,1)
[3,1; 3,3)
[3,3; 3,5)
[3,5; 3,7)
[3,7; 3,9)
5
30
41
25
10
5
5
Ban giám đốc trại gà Alpha báo cáo rằng khối lượng trung bình của gà trên 3 kg.
Hãy cho nhận xét về báo cáo trên ở mức ý nghĩa 2%.
Giải:
Từ số liệu ta tính được:
121; 3,06; 0,2826n x s= = = .
Ta kiểm định giả thiết sau:
0 0 1 0: 3; :X XH Hµ µ µ µ= = > ở mức 2%α = .
Nếu 0H đúng thì BNN ( )0 ~ 0,1
X
XU n N
s
µ−
=
Với 2%α = , 1 0,95 1,6449gtth u uα−= = =
Với mẫu cụ thể: 0 3,06 3 121 2,3354
0, 2826X
x
u n
s
µ− −
= = =
Vì u gtth> nên 0H bị bác bỏ nghĩa là báo cáo của Ban giám đốc là đúng (ở mức ý
nghĩa 5%).
6. 34. Để so sánh thời gian cắt trung bình của một máy tiện loại cũ với một máy
tiện loại mới, người ta cho mỗi máy cắt thử 10 lần và đo thời gian cắt (tính bằng
giây) . Kết quả thu được như sau:
Máy loại cũ: 58, 58, 56, 38, 70, 38, 42, 75, 68, 67.
Máy loại mới: 57, 55, 63, 24, 67, 43, 33, 68, 56, 54..
Biết rằng thời gian cắt của máy loại cũ và của máy loại mới là các biến
ngẫu nhiên tuân theo luật phân phối chuẩn có độ lệch chuẩn, theo thứ tự, là 13,5
giây và 14,5 giây.
Với mức ý nghĩa 5%, có thể cho rằng máy loại mới tốt hơn (có thời gian cắt
trung bình ít hơn) máy loại cũ hay không?
Giải:
Gọi ,X Y theo thứ tự là BNN chỉ thời gian cắt của máy tiện cũ và máy tiện
mới.
Bài tập Xác suất thống kê Diệp Hoàng Ân
116
Ta kiểm định giả thiết sau: 0 1: ; ;X Y X YH Hµ µ µ µ= > ở mức ý nghĩa 5%.
Nếu 0H đúng thù BNN ( )2 2 ~ 0,1
X Y
X YU N
n m
σ σ
−
=
+
Với 5%α = , 1 ,05 0,95 1,6449gtth u u−0= = =
Với mẫu cụ thể ta tính được:
57; 13,6; 52; 14,46X Yx s y s= = = =
Do đó 57 52 2,988
13,5 14,5
10 10
u
−
= =
+
Vì u gtth> nên 0H bị bác bỏ.
Vậy, có thể cho rằng máy loại mới tốt hơn (có thời gian cắt trung bình ít hơn)
máy loại cũ.
Bài tập Xác suất thống kê Diệp Hoàng Ân
117
CHƯƠNG 7: TƯƠNG QUAN VÀ HỒI QUY
7.1.
Xem vectơ ngẫu nhiên (X,Y) tuân theo luật phân phối chuẩn hai chiều mà
một mẫu ngẫu nhiên gồm 8 cặp được chọn ra như sau:
xi 1 2 3 4 5 6 7 8
yi 5 7 11 17 21 25 29 32
a) Hãy tính giá trị hệ số tương quan mẫu của X và Y và cho nhận xét.
b) Hãy kiểm định giả thiết về sự tương quan giữa X à Y ở mức 5%α = .
c) Hãy lập hàm hồi quy tuyến tính mẫu và dự đoán nếu X lấy giá trị bằng
20 thì Y nhận giá trị bao nhiêu?
Giải:
a) .r 0,996( 1)s .s
−
= =
−
∑ i i
X Y
x y n x y
n
. X và Y có quan hệ gần như tuyến tính.
b) Kiểm định giả thiết
0 1: 0; : 0H Hρ ρ= ≠ ở mức 5%α =
Nếu 0H đúng thì ( )221T ~ 2
−
−
= −
n
R
R t n
( 8n = và 1
( ).( )
( 1)
n
i i
i
X Y
X X Y Y
n S S
R =
− −
−
∑
= là hệ số tương quan mẫu)
Với 5%α = , gtth ( )61 / 2 2,4469t α−= = .
Với mẫu cụ thể, ta có 0,996r = và 2 2
2 60,996 27,3
1 1 0,996
n
t r
r
−
= = =
− −
Vì t gtth> nên 0H bị bác bỏ nghĩa là ,X Y thật sự tương quan.
c) Phương trình hồi quy tuyến tính mẫu:
0.107 4,107y x= − + . Từ đó, nếu 20X = thì 82,036Y = .
7.2.
Một cơ sở sản xuất đã ghi lại số tiền đã chi cho việc nghiên cứu phát triển
và lợi nhuận hàng năm của cơ sở trong 6 năm vừa qua như sau: (đơn vị 106 VNĐ)
Chi nghiên cứu 5 11 4 5 3 2
Lợi nhuận
31 40 30 34 25 20
Bài tập Xác suất thống kê Diệp Hoàng Ân
118
a) Hãy tính giá trị hệ số tương quan mẫu giữa chi nghiên cứu và lợi
nhuận.
b) Chi nghiên cứu và lợi nhuận có thực sự tương quan không? (kết luận
ở mức ý nghĩa α = 2%).
c) Viết phương trình đường hồi qui tuyến tính mẫu của lợi nhuận theo
chi phí nghiên cứu.
Giải:
a) 0,909r =
b) Kiểm định giả thiết
0 1: 0; : 0H Hρ = ρ ≠ ở mức ý nghĩa 1%α =
Nếu 0H đúng thì BNN ( )221T ~ 2
n
R
R t n−
−
= −
( ) ( )1 / 2 0,992 4 3,7469gtth t t t−α= − = =
Với mẫu cụ thể ta có 2
40,909 4,361
1 0,909
t = =
−
Vì t gthh> nên 0H bị bác bỏ. Nghĩa là X và Y thực sự tương quan.
(kết luận ở mức ý nghĩa α = 2%).
c) Phương trình đường hồi quy tuyến tính mẫu:
2 20y x= +
7.3.
Đo chiều cao Y (cm) và chiều dài chi dưới X (cm) của một nhóm thanh
niên, người ta thu được số liệu sau:
yi 160 161,5 163 165 167 168 171 172
xi 78 79 80 81 82 83 84 85
(a). Tính giá trị hệ số tương quan mẫu của X và Y.
(b). Ở mức ý nghĩa α = 5%, hãy cho nhận xét về tài liệu cho rằng hệ số
tương quan của X và Y là 0,9.
(c). Viết phương trình đường hồi quy mẫu của Y theo X.
Đáp số:
(a) r = 0,996
(b) Kiểm định giả thiết H0: ρ = 0,9 đối với H1: ρ ≠ 0,9.
Trắc nghiệm U 2 đuôi được sử dụng, với
Bài tập Xác suất thống kê Diệp Hoàng Ân
119
~ (0,1)Z
Z
ZU N− µ=
σ
.
Với mức α = 5% , 0,975gtth 1,96u= = ;
với mẫu cụ thể, chúng ta có :
( )1 0,99612 1 0,996ln 3,106z +−= = ,
( )1 0,9 0,91 12 1 0,9 2(8 1) 5ln 1,5365;Z Z+− −µ = + = σ = ,
và 3,509Z
Z
z
u
− µ
σ
= =
Vì gtthu > nên ở mức ý nghĩa α = 5%, giả thiết H0 bị bác bỏ, nghĩa là
tài liệu không được chấp nhận (ở mức ý nghĩa α = 5%).
(c) y = 1,768x + 21,857.
7.4. Một giảng viên dạy môn thống kê yêu cầu mỗi sinh viên phải làm một
đồ án phân tích dữ liệu và dự kỳ thi hết môn. Sau đó, một mẫu gồm 10 sinh viên
được chọn ngẫu nhiên, điểm số được ghi lại như sau:
Điểm thi 81 62 74 78 93 69 72 83 90 84
Điểm đồ
án 76 71 69 76 87 62 80 75
92 79
(a) Tìm khoảng tin cậy 95% cho điểm thi trung bình của một sinh viên (giả
thiết điểm thi của sinh viên tuân theo luật phân phối chuẩn).
(b) Ở mức ý nghĩa 5%, hãy đánh giá về sự tương quan tuyến tính giữa hai
loại điểm trên.
Giải:
(a) Gọi X là điểm thi của sinh viên. Ta có: 78,6x = 9,57s = .
Khoảng tin cậy 95% cho điểm thi trung bình của một sinh viên: ( );x e x e− +
( )9
1
2
5,97
. 2,2622. 4,27
10 10
s
e t +γ= = =
Khoảng tin cậy cần tìm ( )74,33; 82,87 .
(b) Gọi Y là điểm đồ án của sinh viên. Đặt
,X Yρ ρ= .
Chúng ta phải có quyết định giữa hai giả thiết:
H0: ρ = 0 và H1: ρ ≠ 0,
Nếu H0 đúng thì BNN
Bài tập Xác suất thống kê Diệp Hoàng Ân
120
2
10 2
1
T
R
R −
−
= ~ t(8)
Với mức α = 5% , giá trị tới hạn là: (8)0,975 2,3060t = ;
với mẫu cụ thể, chúng ta có hệ số tương quan mẫu: 0,776r = . Do đó:
2
0,776. 8 3, 48
1 (0,776)
t = =
−
Vì |t| >2,306 nên giả thiết H0 bị bác bỏ ở mức ý nghĩa α = 5%. Nói cách
khác, chúng ta chấp nhận rằng X và Y tương quan ở mức ý nghĩa 5%.
7.5. Để thực hiện một công trình nghiên cứu về mối quan hệ giữa chiều
cao Y(m) và đường kính X(cm) của một loại cây, người ta quan sát trên một mẫu
ngẫu nhiên và có kết quả sau:
xi 28 28 24 30 60 30 32 42 43 49
yi 5 6 5 6 10 5 7 8 9 10
(a). Hãy tính giá trị hệ số tương quan mẫu của X và Y và cho nhận xét.
(b) Viết phương trình đường thẳng hồi quy mẫu của Y theo X. Hãy dự báo
chiều cao của cây có đường kính 45 cm.
Giải:
(a) r = 0,939.
Vì r rất gần 1 nên giữa X và Y có hồi qui tuyến tính.
(b) y = 0,166x + 1,041.
Dự báo chiều cao của cây có đường kính 45 cm là:
y = 0,166 × 45 + 1,041 = 8,5 m
7.6. X (%) và Y(kg/mm2) là hai chỉ tiêu chất lượng của một loại sản
phẩm. Điều tra ở một số sản phẩm, bảng sau:
X 2 2 4 6 4 6 8 6 8 6 8
Y 5 10 10 10 15 15 15 20 20 25 25
Tần số 2 1 2 4 2 6 4 3 3 1 2
a) Hãy tính các giá trị trung bình mẫu của X, Y; phương sai mẫu của X, Y
và hệ số tương quan mẫu giữa X và Y.
b) Viết phương trình hồi quy mẫu của Y theo X. Từ đó dự đoán xem nếu chỉ
tiêu X là 9 thì chỉ tiêu Y là bao nhiêu?
Giải:
a) Ta có trung bình mẫu:
Bài tập Xác suất thống kê Diệp Hoàng Ân
121
5,93; 15,17;x y= =
Phương sai mẫu:
2 23,44; 28,42X Yσ σ= =
Hệ số tương quan mẫu: 0,66r =
b) Phương trình hồi quy Y theo X: 3,86 1.91y x= +
Nếu X có giá trị là 9 thì Y sẽ nhận giá trị là 21.
7.7. X (%) và Y(kg/mm2) là hai chỉ tiêu chất lượng của một loại sản
phẩm. Điều tra ở một số sản phẩm, bảng sau:
X 2 2 4 6 4 6 8 6 8 6 8
Y 5 10 10 10 15 15 15 20 20 25 25
Tần số 2 1 2 4 2 6 4 3 3 1 2
a) Tính giá trị hệ số tương quan mẫu giữ X và Y. Viết Viết phương trình hồi
quy mẫu của Y theo X.
b) Kiểm định giả thiết xem X và Y có tương quan không ở mức ý nghĩa 5%?
Giải:
a) Giá trị hệ số tương quan mẫu: 0,66r = .
Phương trình hồi quy Y theo X: 3,86 1.91y x= + .
b) Kiểm định giả thiết 0 1: 0; : 0H Hρ ρ= ≠ ở mức ý nghĩa 5%
Nếu 0H đúng thì BNN
2
2
1
T ~ ( 2)n
R
R t n−
−
= −
Với mức ý nghĩa 5%, ( )280,975 2,0484gtth t= =
Với mẫu cụ thể ta có
2
2 4,69
1
n
t r
r
−
= =
−
Vì >t gtth nên 0H bị bác bỏ, nghĩa là X và Y tương quan ở mức ý nghĩa 5%.
7.8. X (%) và Y(kg/mm2) là hai chỉ tiêu chất lượng của một loại sản
phẩm. Điều tra ở một số sản phẩm, bảng sau:
X 2 2 4 6 4 6 8 6 8 6 8
Y 5 10 10 10 15 15 15 20 20 25 25
Tần số 2 1 2 4 2 6 4 3 3 1 2
a) Tìm khoảng tin cậy 95% cho chỉ tiêu Y (giả thiết chỉ tiêu Y tuân theo luật
phân phối chuẩn).
Bài tập Xác suất thống kê Diệp Hoàng Ân
122
b) Viết phương trình hồi quy mẫu của Y theo X. Từ đó dự đoán xem nếu chỉ
tiêu X là 9 thì chỉ tiêu Y là bao nhiêu?
Giải:
a) Trung bình mẫu chỉ tiêu Y là: 15,17; 5,33= =Yy s
Khoảng tin cậy 95% cho trung bình chỉ tiêu Y là: ( );y e y e− +
Với ( )290,975
5,33
. 2,0452. 1,99 2
30 30
Yse t= = = ≈
Vậy khoảng tin cậy cần tìm là:
( )13,18;17,16
b) Phương trình hồi quy Y theo X: 3,86 1.91y x= +
Nếu X có giá trị là 9 thì Y sẽ nhận giá trị là 21.
7.9. X (%) và Y(kg/mm2) là hai chỉ tiêu chất lượng của một loại sản
phẩm. Điều tra ở một số sản phẩm, bảng sau:
X 2 2 4 6 4 6 8 6 8 6 8
Y 5 10 10 10 15 15 15 20 20 25 25
Tần số 2 1 2 4 2 6 4 3 3 1 2
a) Có tài liệu cho rằng trung bình chỉ tiêu X là 6,5%. Hãy cho nhận xét về tài
liệu trên ở mức ý nghĩa 5%. Giả thiết các chỉ tiêu X, Y tuân theo luật phân
phối chuẩn.
b) Tính giá trị hệ số tương quan mẫu của X và Y. Viết phương trình đường
thẳng hồi quy mẫu của Y theo X.
Giải:
a) Kiểm định giả thiết 0 0 1 0: 6,5; :X XH Hµ µ µ µ= = ≠ ở mức ý nghĩa 5%.
Nếu 0H đúng thì BNN ( )0 ~ 1XT n t nS
µ−
= −
Với ở mức ý nghĩa 5%, ( )290,975 2,0452gtth t= =
Vói mẫu cụ thể ta tính được: 5,93 6,5 30 0,908
3,44
t
−
= =
Vì t gtth< nên 0H không bị bác bỏ nghĩa là ta chấp nhận tài liêu trên ở
mức ý nghĩa 5%.
b) Giá trị hệ số tương quan mẫu: 0,66r = .
Phương trình hồi quy Y theo X: 3,86 1.91y x= + .
Bài tập Xác suất thống kê Diệp Hoàng Ân
123
7.10. Nghiên cứu lượng phân bón (X kg) được dùng để bón cho ruộng trong
một vụ; Y(kg/1000m2) là năng suất lúa. Thống kê ở 30 hộ gia đình, kết quả như
sau:
Số hộ 3 5 2 6 4 3 5 2
xi 40 40 50 50 50 60 60 60
yi 270 280 280 290 300 300 310 320
a) Tính giá trị hệ số tương quan mẫu của X và Y. Viết phương trình hồi quy
mẫu Y theo X.
b) Kiểm định giả thiết cho rằng hệ số tương quan của X và Y bằng 0,9 ở
mức ý nghĩa α = 5%.
Giải:
a) Giá trị hệ số tương quan mẫu: 0,891r = .
Phương trình đường hồi quy mẫu: 210,15 1,64Y X= + .
b) Kiểm định giả thiết 0 0 1 0: 0,9; :H Hρ ρ ρ ρ= = ≠ ở mức ý nghĩa α = 5%.
Trắc nghiệm U 2 đuôi được sử dụng, với
~ (0,1)Z
Z
ZU N− µ=
σ
.
Với mức α = 5% , 0,975gtth 1,96u= = ;
Với mẫu cụ thể, ta có
1
2
1 0,891ln 1,427
1 0,891
+
= = =
−
z z
( )1 0,9 0,91 12 1 0,9 2(30 1) 27ln 1,488;Z Z+− −µ = + = σ =
0,317− µ
σ
= =
Z
Z
z
u
Vì | |u gtth< nên 0H được chấp nhận nghĩa là giả thiết hệ số tương quan của X và
Y bằng 0,9 là đúng ở mức ý nghĩa α = 5%.
7.11. Để nghiên cứu sự tương quan giữa chiều cao X (cm) và sức nặngY
(kg) con người, quan sát trên một mẫu ngẫu nhiên, người ta có kất quả sau:
yk
xi
[40, 45) [45, 50) [50, 55) [55, 60) [60,
65)
Bài tập Xác suất thống kê Diệp Hoàng Ân
124
[140, 145)
[145, 150)
[150, 155)
[155, 160)
[160, 165)
1 4
2 6 1
10 8 2
8 6 3
1 1
(a) Hãy lập bảng phân bố tần số, tần suất cho các giá trị của X, Y.
(b) Tính các giá trị trung bình mẫu, độ lệch chuẩn mẫu và hệ số tương quan
mẫu của X và Y. Viết phương trình đường thẳng hồi quy tuyến tính mẫu của Y
theo X.
Giải:
a) Bảng tần số, tần suất của X và Y:
Biến X Biến Y
Lớp Tần số Tần suất Lớp Tần số Tần suất
[140, 145) 5 0,094 [40, 45) 1 0,019
[145, 150) 9 0,170 [45, 50) 6 0,113
[150, 155) 20 0,377 [50, 55) 24 0,453
[155, 160) 17 0,321 [55, 60) 16 0,302
[160, 165) 2 0,038 [60, 65) 6 0,113
b) 152,69; 54,23; 5,14; 4,41X Yx y s s= = = =
0,6544r =
Phương trình hồi quy:
31,59 0,56y x= − +
7.12. Để nghiên cứu sự tương quan giữa chiều cao X (cm) và sức nặngY
(kg) con người, quan sát trên một mẫu ngẫu nhiên, người ta có kất quả sau:
yk
xi
[40, 45) [45, 50) [50, 55) [55, 60) [60,
65)
Bài tập Xác suất thống kê Diệp Hoàng Ân
125
[140, 145)
[145, 150)
[150, 155)
[155, 160)
[160, 165)
1 4
2 6 1
10 8 2
8 6 3
1 1
a) Tính giá trị hệ số tương quan mẫu của X và Y. Viết phương trình đường thẳng
hồi quy tuyến tính mẫu của Y theo X.
b) Có tài liệu cho biết hệ số tương quan giữa X và Y là 0,65. Hãy cho nhận xét về
tài liệu đó, ở mức α = 5%.
Giải:
a) 0,6544r =
Phương trình hồi quy:
31,59 0,56y x= − +
b) Kiểm định giả thiết 0H : ρ = 0,65 đối với H1: ρ ≠ 0,65 ở mức α =
5%.
Trắc nghiệm U 2 đuôi được sử dụng, với
~ (0,1)Z
Z
ZU N− µ=
σ
.
Với mức α = 5% , 0,975gtth 1,96u= = ;
với mẫu cụ thể, chúng ta có :
( )1 0,654412 1 0,6544ln 0,783+−= =z ,
( )1 0,65 0,651 12 1 0,65 2(53 1) 50ln 0,7816;+− −µ = + = σ =Z Z ,
và 0,01− µ
σ
= =
Z
Z
z
u
Vì gtth<u nên ở mức ý nghĩa α = 5%, giả thiết 0H được chấp nhận, nghĩa là
tài liệu được chấp nhận (ở mức ý nghĩa α = 5%).
Các file đính kèm theo tài liệu này:
- bai_tap_mon_xac_suat_thong_ke.pdf