Bài tập môn Xác suất thống kê

Điều tra một số sản phẩm của một xí nghiệp về chiều dài (X (cm)) và hàm lượng chất A (Y (%)), người ta có kết quả sau: Y X 8 10 12 14 16 100 5 5 110 4 6 7 120 5 9 8 130 4 6 9 140 5 7 Các sản phẩm có chiều dài không quá 110cm và hàm lượng chất A không hơn 12% được gọi là sản phẩm loại II. Nếu xí nghiệp báo cáo rằng sản phẩm loại II có chỉ tiêu Y trung bình là 10% thì có thể chấp nhận được không? Kết luận ở mức ý nghĩa 5% (giả thiết hàm lượng này có phân phối chuẩn)

pdf125 trang | Chia sẻ: hachi492 | Ngày: 05/01/2022 | Lượt xem: 830 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Bài tập môn Xác suất thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
oảng tin cậy 95% cho tỉ lệ những hộ có nhu cầu cao ở thành phố H. b) Để ước lượng nhu cầu bột giặt trung bình của một hộ trong một tháng với sai số ước lượng không quá 50 gam và độ tin cậy 95% thì cần điều tra thêm bao nhiêu hộ gia đình nữa? Giải a) Từ dữ liệu đã cho ta tính được: Giá trị trung bình mẫu: 1,803x = Giá trị độ lệch chuẩn mẫu: 0,6233s = Giá trị tỉ lệ mẫu: 140 0, 28 500 p = = Khoảng tin cậy 95% cho tỷ lệ những hộ có nhu cầu cao: ( );x e x e− + sai số ( )1 0,975 2 1 . .0,0201 0,0394 p p e u u n +γ − = = = Khoảng tin cậy 95%: ( )0, 2406;0,3194 b) Ta có 2 2 0,975 0,975 1,96.0,62330,05 . 596,9134 0,05 0,05 us u n s n    ≤ ⇒ ≥ = =       Suy ra 1 597n = Vậy cần điều tra thêm ít nhất 97 hộ nữa. Nhu cầu (kg/tháng) < 1 [1; 1,5) [1,5; 2) [2; 2,5) [2,5; 3) [3; 3,5) ≥ 3,5 Số hộ gia đình 21 147 192 78 34 16 12 Bài tập Xác suất thống kê Diệp Hoàng Ân 93 5. 37. Để đánh giá mức tiêu hao nhiên liệu của một loại xe ô tô, người ta theo dõi lượng tiêu hao nhiên liệu (lít/100 km) của 100 chuyến xe và có kết quả sau: Lượng tiêu hao [35; 40) [40; 45) [45; 50) [50; 55) [55; 60) Số chuyến xe 14 20 36 22 8 a) Tìm khoảng tin cậy 95% cho lượng tiêu hao nhiên liệu trung bình của loại xe nói trên b) Xe cần đưa vào kiểm tra kỹ thuật là xe có mức tiêu hao nhiên liệu từ 55 lít/100 km trở lên. Hãy ước lượng tỉ lệ xe cần đưa vào kiểm tra kỹ thuật tối thiểu ở độ tin cậy 95%. Giải a) Gọi X là biến ngẫu nhiên chỉ mức tiêu hao nguyên liệu cho mỗi chuyến xe. Từ số liệu trên ta xây dựng được bảng sau: 47x = 5 2 2 2 1 1 99 32,5758i i i s n x nx =   = − =    ∑ 1 1 0,95 2 2 . . 100 100 5,7075 5,70751,96. =1,12se u u n +γ += = = Do đó khoảng tin cậy 95% cho lượng tiêu hao nguyên liệu trung bình: ( )45,88;48,12 b) Tỷ lệ xe cần kiểm tra kỹ thuật của mẫu: 8 0,08 100 p = = Tỉ lệ xe cần đưa vào kiểm tra kỹ thuật tối thiểu ở độ tin cậy 95% là p p e≥ − với ( ) 0,951 0,08.0,92 0,04510 p p e u u n γ − = = = Suy ra 0,08 0,045 0,035p ≥ − = . Bài tập Xác suất thống kê Diệp Hoàng Ân 94 CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT 6. 1. Trong một cuộc điều tra về nhịp mạch của 64 thanh niên làm nghề A, kết quả là nhịp mạch trung bình 74 lần/phút và độ lệch chuẩn bằng 9 lần/phút. Hãy kiểm định xem đặc điểm nghề A có làm cho nhịp mạch của thanh niên tăng quá mức bình thường không, biết rằng nhịp mạch bình thường của thanh niên là 72 lần / phút. ( kết luận với mức 1%α = ). Giải: Gọi X là biến ngẫu nhiên chỉ nhịp mạch của thanh niên làm nghề A. Ta cần kiểm định giả thiết: 0 1: 72; : 72H Hµ µ= > , ở mức 1%α = . Nếu 0H đúng thì biến ngẫu nhiên ( )72 64 ~ 0,1−= XU N s . Với 1%α = , 1 0,99 2,5758α−= = =gtth u u . Với mẫu cụ thể ta có 74 72 16.8 1,778 9 9 u gtth−= = = < . Vậy, ta chấp nhận giả thiết 0H nghĩa nghề A không làm tăng nhịp đập của thanh niên. 6. 2. Điều tra Cholesterol toàn phần trong huyết thanh của 25 bệnh nhân bị một loại bệnh B, ta có trung bình cộng của lượng Cholesterol là 172 mg% và độ lệch chuẩn bằng 40 mg%. Theo tài liệu về hằng số sinh hoá bình thường của người Việt Nam thì lượng Cholesterol trung bình toàn phần trong huyết thanh là 156 mg% và tuân theo luật phân phối chuẩn. Hỏi lượng Cholesterol của các bệnh nhân mắc bệnh B có cao hơn bình thường không? (kết luận ở mức 5%α = ) . Giải: Kiểm định giả thiết ( ) ( )0 1: 156 % ; : 156H mg H mgµ µ= > ở mức 5%α = . Nếu 0H thì biến ngẫu nhiên ( )156 25 ~ 24XT tS − = Với mức 0,05α = ta có ( ) ( )24 241 0,05 0,95 1,7109t t− = = Với mẫu cụ thể ta tính được: 24 0,95 172 156 5 2 40 t t − = = > . Vậy 0H bị bác bỏ nghĩa là lượng Cholesterol của bệnh nhân mắc bệnh B cao hơn bình thường. 6. 3. Một công ty bào chế một loại thuốc chữa dị ứng tuyên bố rằng thuốc của họ có hiệu quả không dưới 90% trong việc làm giảm cơn dị ứng trong vòng 8 giờ. Một mẫu gồm 200 người bị dị ứng sử dụng loại thuốc trên, có 160 người giảm cơn dị ứng. Hãy xác định xem lời tuyên bố của công ty có giá trị không? ( ở mức ý nghĩa α = 0,07). Giải: Bài tập Xác suất thống kê Diệp Hoàng Ân 95 Gọi p là tỉ lệ người giảm dị ứng khi dùng thuốc của công ty trong vòng 8 giờ. Ta cần xác định xem p có bằng 90% trở lên hay không. Muốn vậy ta kiểm định giả thiết: 0 0 1 0: 90%; : 90%H p p H p p= = < = ở mức ý nghĩa α = 0,07. Nếu 0H đúng thì biến ngẫu nhiên ( ) ( ) 0 0 0 ~ 0, 1 1 P pU n N p p − = − Với mức 0,07α = ta có 1 0,93 1,4758gtth u u−= − = − = −α . Với mẫu cụ thể ta có: 160 / 200 0,9 200 4,714 1,4758 0,9.0,1 u gtth−= = − < = − . Vậy ta bác bỏ giả thiết 0H nghĩa là tuyên bố của công ty không có giá trị. Kết luận ở mức ý nghĩa 0,07. 6. 4. (3 điểm) Trước đây, Nhà máy Alpha sản xuất ra một loại sản phẩm với tỉ lệ phế phẩm 5%. Năm nay, sau đợt cải tiến kỹ thuật, để kiểm tra hiệu quả, người ta lấy ra ra một mẫu gồm 800 sản phẩm để kiểm tra thì thấy có 24 phế phẩm. a) Với mức ý nghĩa α = 5%, hãy kiểm định xem đợt cải tiến kỹ thuật có thực sự làm giảm tỉ lệ phế phẩm không?. b) Sau đợt cải tiến kỹ thuật, nếu nhà máy báo cáo tỉ lệ phế phẩm là 2% thì có chấp nhận được không? (ở mức ý nghĩa α = 3%). Giải: a) Gọi p là tỷ lệ phế phẩm sau đợt cải tiến kĩ thuật, tỉ lệ mẫu . Ta cần kiểm định giả thiết sau: 0 0: 5%;H p p= = đối thiết 1 0:H p p< ở mức ý nghĩa α = 5%. Nếu 0H đúng thì ( ) ( ) 0 0 0 ~ 0,1 1 P pU n N p p − = − Với mức 5%α = ta có 1 0,95 1,65gtth u u−α= − = − = − . Với mẫu cụ thể ta tính được ( ) 0 0 0 0,03 0,05 800 2,6 0,05.0,951 p p u n gtth p p − − = = = − < − Vậy, ta bác bỏ 0H nghĩa là đợt cải tiến kĩ thuật thật sự làm giảm tỷ lệ phế phẩm. b) Ta kiểm định giả thiết 0 0: 2%;H p p= = đối thiết 1 0:H p p≠ ở mức 3%α = . Nếu 0H đúng thì ( ) ( ) 0 0 0 ~ 0,1 1 P pU n N p p − = − . Bài tập Xác suất thống kê Diệp Hoàng Ân 96 Vơi s mức 3%α = ta có 0,9851 2 2,17gtth u uα − = = = . Từ mẫu cụ thể ta tính được. ( ) 0 0 0 0,03 0,02 800 2,02 0,02.0,981 p p u n gtth p p − − = = = < − Vậy ta chấp nhận 0H nghĩa là chấp nhận lời tuyên bố của công ty. 6. 5. Tiền lương hàng tuần trung bình trên một mẫu gồm 30 công nhân trong một xí nghiệp lớn là 180 (ngàn đồng) với với độ lệch chuẩn 14 (ngàn đồng). Trong một xí nghiệp lớn khác, một mẫu gồm 40 công nhân được chọn ngẫu nhiên có tiền lương hàng tuần trung bình là 170 (ngàn đồng) với độ lệch chuẩn 10 (ngàn đồng). Tiền lương hàng tuần trung bình ở hai xí nghiệp trên có khác nhau không? ( ở mức ý nghĩa α = 5%). Giả sử tiền lương hàng tuần của hai xí nghiệp là biến ngẫu nhiên có phân phối chuẩn có cùng phương sai. Giải: Gọi X, Y là tiền lương hàng tuần của mỗi công nhân của hai xí nghiệp trên tương ứng. Kiểm định giả thiết 0 1X Y X YH : ; H := ≠µ µ µ µ ở mức 5%α = . Nếu 0H đúng thì ( ) ( )2 1 1 ~ 2n m X YT t n m S − = + − + với 2 2 2 ( 1) ( 1) 2 X Yn S m SS n m − + − = + − với mức 5%α = ta có ( ) ( )2 680,9751 2 1,9955n mgtth t t+ −α − = = = Với mẫu cụ thể ta tính được 2 2 2 29 14 39 10 140 94 78 . . s , + = = Do đó ( )2 1 1 180 170 3 4876 1 1140 94 30 40 tn n m x y t , gtth s , − − = = = > +   +    Vậy ta bác bỏ 0H nghĩa là tiền lương hàng tuần trung bình ở hai xí nghiệp trên là khác nhau. 6. 6. Gọi X và Y lần lượt là biến ngẫu nhiên chỉ khối lượng của trẻ sơ sinh trai và trẻ sơ sinh gái. Cho biết X và Y tuân theo luật phân phối chuẩn có cùng phương sai. Khảo sát ngẫu nhiên 20 trẻ sơ sinh trai, người ta tính được x = 3200 g, Xs = 400 g và 17 trẻ sơ sinh gái, người ta tính được y = 3000 g, Ys = 380 g. Phải chăng khối lượng của trẻ sơ sinh trai lớn hơn khối lượng của trẻ sơ sinh gái? (kết luận với mức ý nghĩa α = 5%) Giải: Bài tập Xác suất thống kê Diệp Hoàng Ân 97 Kiểm định giả thiết 0 1X Y X YH : ; H :µ µ µ µ= > ở mức α = 5%. Nếu 0H đúng thì ( ) ( )2 1 1 ~ 2n m X YT t n m S − = + − + với 2 2 2 ( 1) ( 1) 2 X Yn S m SS n m − + − = + − ; 20 17n ; m= = . Giá trị tới hạn ( )2 351 0 95 1 6896 n m , gtth t t ,α + − − = = = Với mẫu cụ thể ta có 2 2 2 19 400 16 380 152868 57 35 . . s , + = = ( )2 1 1 3200 3000 1 55 1 1152868 57 20 17 tn n m x y t , gtth s , − − = = = < +   +    Ta chấp nhận 0H nghĩa là trọng lượng của trẻ sơ sinh trai không lớn hơn trọng lượng của trẻ sơ sinh gái (α = 5%). 6. 7. Khối lượng của một loại sản phẩm do một nhà máy sản xuất là một biến ngẫu nhiên tuân luật phân phối chuẩn N(500; (8,5)2). Sau một thời gian sản xuất, ban lãnh đạo nhà máy nghi ngờ rằng khối lượng của loại sản phẩm này có xu hướng giảm, nên tiến hành cân thử 25 sản phẩm và thu được kết quả sau: Khối lượng (g) 480 485 490 495 500 510 Số sản phẩm 2 3 8 5 3 4 Với mức ý nghĩa α = 5% , hãy cho kết luận về điều nghi ngờ trên. Giải: Từ số liệu ta tính được 494x = ; 8 9s ,= 25n = . Ta kiểm định giả thiết 0 0 1 0500H : ;H :µ µ µ µ= = < ở mức 5%α = . Nếu 0H đúng thì BNN ( )0 0 1XU n ~ N ,µσ − = với 025 8 5 500n ; , ;σ µ= = = Với mức 5%α = ta có 1 0 95 1 65,gtth u u ,α−= − = − = − Với mẫu cụ thể giá trị của U là 494 500 5 3 53 8 5 u . , gtth , − = = − < nên 0H bị bác bỏ nghĩa là điều nghi ngờ trên là đúng. 6. 8. Một công ty muốn đánh giá về hiệu quả của một đợt quảng cáo đối với số sản phẩm bán ra của công ty. 10 cửa hàng bán sản phẩm của công ty được chọn ngẫu nhiên để theo dõi số lượng sản phẩm bán ra trong một tuần trước đợt quảng cáo (TĐQC) và một tuần sau đợt quảng cáo (SĐQC). Cửa 1 2 3 4 5 6 7 8 9 10 Bài tập Xác suất thống kê Diệp Hoàng Ân 98 hàng TĐQC 53 114 81 86 34 66 89 113 88 111 SĐQC 137 135 83 125 47 46 114 157 57 144 Hãy cho kết luận về hiệu quả của đợt quảng cáo (ở mức α = 5%). Giải: Gọi D là hiệu số giữa số sản phẩm bán ra sau quảng cáo và trước quảng cáo của mỗi của hàng. Bảng hiệu số: D 84 21 2 39 13 -20 25 44 -31 33 Từ đó ta tính được 21 32 98Dd ;s ,= = . Ta cần kiểm định giả thiết sau ở mức 5%α = . 0 10 0D DH : ; H :µ µ= > Nếu 0H đúng thì ( )1 D D nT ~ t n S = − Với 5%α = ( )91 1,8331gtth t α−= = Với mẫu cụ thể ta có 21 10 2 01 32 98 t , gtth , = = > Nên 0H bị bác bỏ. Vậy, đợt quảng cáo thật sự làm tăng số lượng sản phẩm bán ra. 6. 9. Một máy sản xuất tự động có tỉ lệ sản xuất ra sản phẩm loại A lúc đầu là 48%. Máy được cải tiến và sau một thời gian áp dụng, người ta kiểm tra 40 hộp, mỗi hộp gồm 10 sản phẩm và ghi lại số sản phẩm loại A trong mỗi hộp (SSPLA/h) như sau : SSPLA/h 1 2 3 4 5 6 7 8 9 10 Số hộp 2 0 4 6 8 10 4 5 1 0 Hãy cho kết luận về hiệu quả của việc cải tiến máy ở mức ý nghĩa α = 0,05. Giải: Gọi p là tỉ lệ sản phẩm lạo A sau đợt cải tiến kỹ thuật. Tỉ lệ sản phẩm loại A trên mẫu khảo sát: 215 43 400 80 p = = Kiểm định giả thiết: 0 0 1 0: 48%; :H p p H p p= = > ở mức 5%α = . Bài tập Xác suất thống kê Diệp Hoàng Ân 99 Nếu 0H đúng thì BNN ( ) ( ) 0 0 0 ~ 0,1 1 P pU n N p p − = − Với mức ý nghĩa 0,05α = giá trị tới hạn bằng: 1 0,95 1,6449u uα− = = Với mẫu cụ thể, ta tính được: ( ) ( ) 0 0 0 43 0,48 80 400 2,3018 1 0,48 1 0,48 p p u n p p − − = = = − − Vì u gtth> nên 0H bị bác bỏ nghĩa là việc cải tiến kỹ thuật thất sự mang lại hiệu quả. 6. 10. Khối lượng trung bình khi xuất chuồng ở một trại chăn nuôi gà công nghiệp năm trước là 3,3 kg/con. Năm nay người ta sử dụng loại thức ăn mới. Sau một thời gian, cân thử 15 con khi xuất chuồng, có các số liệu sau: (đơn vị kg) 3,25; 2,50; 4,00; 3,75; 3,80; 3,90; 4,02; 3,60; 3,80; 3,20; 3,82; 3,40; 3,75; 4,00; 3,50, Giả thiết khối lượng gà là biến ngẫu nhiên phân phối theo qui luật chuẩn với phương sai 0,04. Với mức ý nghĩa α = 0,05, hãy cho kết luận về tác dụng của loại thức ăn mới. Giải: Gọi X là BNN chỉ khối lượng gà khi xuất chuồng. Theo giả thiết ( )2~ ;0, 2X N µ . Từ số liệu đã cho ta tính được: 3,62x = ; 0,405s = . Nếu thức ăn mới có tác dụng tốt thì khối lượng trung bình của gà xuất chuồng năm nay sẽ cao hơn. Muốn kết luận về điều đó ta kiểm định giả thiết sau: ( )0 0 1 0: 3,3 ; :kgH Hµ µ µ µ= = > ở mức ý nghĩa 5%α = . Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n Nµσ − = Với mức ý nghĩa 0,05α = 1 1 0,05 0,95 1,6449gtth u u uα− == = = = Với mẫu cụ thể ta tính được: 0 3,62 3,3 15 6,2 0,2 x u n µ σ − − = = = Vì u gtth> nên 0H bị bác bỏ. Vậy, khối lượng trung bình của gà xuất chuồng năm nay cao hơn năm trước, nghĩa là thức ăn mới có tác dụng tăng trọng lượng gà. 6. 11. Để điều tra khối lượng gà xuất chuồng ở một trại chăn nuôi gà công nghiệp năm nay. Người ta cân thử 15 con khi xuất chuồng, có các số liệu sau: (đơn vị kg) 3,25; 2,50; 4,00; 3,75; 3,80; 3,90; 4,02; Bài tập Xác suất thống kê Diệp Hoàng Ân 100 3,60; 3,80; 3,20; 3,82; 3,40; 3,75; 4,00; 3,50, Giả thiết khối lượng gà là biến ngẫu nhiên phân phối theo qui luật chuẩn với phương sai 0,04. Có nên báo cáo khối lượng trung bình của gà xuất chuồng năm nay là 3,7 kg/con hay không? (ở mức ý nghĩa α = 0,05). Giải: Gọi X là BNN chỉ khối lượng gà xuất chuồng năm nay. Kiểm định giả thiết ( )0 0 1 0: 3,7 ; :H kg Hµ µ µ µ= = ≠ ở mức 5%α = . Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n Nµσ − = Với mức ý nghĩa 0,05α = 1 / 2 1 0,025 0,975 1,96gtth u u uα− == = = = Với mẫu cụ thể ta tính được: 0 3,62 3,7 15 1,55 0,2 x u n µ σ − − = = = − Vì | |u gtth< nên 0H không bị bác bỏ. Vậy, ở mức ý nghĩa 5% ta công nhận báo cáo của trại chăn nuôi. 6. 12. Một cuộc điều tra của Hội phụ nữ để đánh giá về một dư luận xã hội cho rằng lương của phụ nữ thấp hơn lương của nam giới. Một mẫu nhiên gồm 4 đàn ông có lương trung bình là 78,0 (ngàn đồng), với độ lệch chuẩn mẫu là 24,4; một mẫu ngẫu nhiên khác độc lập với mẫu trên gồm 4 phụ nữ có lương trung bình là 63,5 (ngàn đồng), với độ lệch chuẩn là 20,2. Giả sử rằng lương của cả nam và nữ giới đều là các biến ngẫu nhiên tuân theo luật phân phối chuẩn có cùng phương sai. Hãy cho kết luận về cuộc điều tra trên ở mức ý nghĩa 10%. Giải: Gọi ,X Y theo thứ tự là lương của đàn ông và phụ nữ. Ta kiểm định giả thiết: 0 1: ; :X Y X YH Hµ µ µ µ= > ở mức 10%α = . Nếu 0H đúng thì BNN ( ) 2 ~ 2 1 1 X YU t n m S n m − = + −   +    Vơi ( ) ( ) 2 2 2 1 1 2 X Yn S m SS n m − + − = + − Với mức ý nghĩa 10%α = , ( ) ( )2 61 0,9 1,4398n mgtth t tα+ −−= = = Với mẫu cụ thể: 2 222,4s = Và 2 2 78 63,5 0,915 1 1 1 122,4 4 4 x y t s n m − − = = =     + +        Bài tập Xác suất thống kê Diệp Hoàng Ân 101 Vì t gtth< nên 0H không bị bác bỏ. Vậy, kết luận của cuộc điều tra chưa đúng. 6. 13. Người ta muốn nghiên cứu tác dụng của việc cho sinh viên đi thực tế xem sự tiếp thu kiến thức có tốt hơn không bằng cách so sánh điểm thi của nhóm sinh viên không đi thực tế (SVKĐTT) với nhóm sinh viên có đi thực tế (SVCĐTT). Kết quả như sau: Điểm 0 1 2 3 4 5 6 7 8 9 10 SVCĐTT 0 0 3 9 7 5 17 10 11 4 1 SVKĐTT 3 3 6 1 1 7 13 10 12 4 1 3 Gọi X và Y lần lượt là biến ngẫu nhiên biểu thị điểm số của sinh viên có đi thực tế và sinh viên không đi thực tế. Điểm thi của nhóm sinh viên có đi thực tế có thực sự tốt hơn không? (kết luận ở mức ý nghĩa α = 0,01 ) Giải: Kiểm định giả thiết 0 1X Y X YH : ;H :µ µ µ µ= > ở mức ý nghĩa α = 0,01 Nếu 0H đúng thì BNN ( )2 2 0 1 X Y X YU ~ N , s s n m − = + Với 0 01,α = ta có 1 1 0 01 0 99 2,3263, ,gtth u u uα− −= = = = Với mẫu cụ thể ta tính được Từ bảng số liệu ta có: 67n = 5 85x ,= ; 2Xs = ; 73m = ; 4 88 2 39Yy , ; s ,= = . 2 2 5 85 4 88 2 6116 2 2 39 67 73 tn , , u , gtth , − = = > + Nên 0H bị bác bỏ nghĩa là SVCĐTT có điểm cao hơn SVKĐTT. 6. 14. Một công ty vận tải, muốn đánh giá tác dụng của một loại chất phụ gia pha vào xăng, đã chọn 10 chiếc xe. Cho mỗi chiếc chạy hai lần với cùng điều kiện như nhau; nhưng lần đầu với xăng không có chất phụ gia (KPG), lần sau, với cùng một lượng xăng như lần đầu, có chất phụ gia (CPG). Người ta ghi lại số dặm đã đi được của 10 chiếc xe trên trong hai lần như sau: Xe KPG CPG Xe KPG CPG Bài tập Xác suất thống kê Diệp Hoàng Ân 102 1 2 2 4 5 26,2 25,7 22,3 19,6 18,1 26,7 25,8 21,9 19,3 18,4 6 7 8 9 10 15,8 13,9 12,0 11,5 10,0 15,7 14,2 12,6 11,9 10,3 Có sự khác nhau giữa số dặm trung bình đi được với xăng không có chất phụ gia và có chất phụ gia không? (kết luận ở mức ý nghĩa 5%) Giải: Gọi ,X Y lần lượt là các BNN chỉ số dăm đi được của xe KPG và xe CPG. Đặt D X Y= − . Bảng số liệu cho D : Xe 1 2 3 4 5 6 7 8 9 10 id -0,5 -0,1 0,4 0,3 -0,3 0,1 -0,3 -0,6 -0,4 -0,3 Từ đó ta tính được: 0,17, 0,3368Dd s= − = Để xét xem khác nhau về số dặm trung bình giữa xe KPG và xe CPG ta kiểm định giả thiết sau: 0 : 0; 0D DH µ µ= ≠ ở mức 5%α = . Nếu 0H đúng thì BNN ( )10 ~ 9 D DT t S = Với 5% 0,05α = = : ( ) ( )9 90,05 0,9751 2 2,2622gtth t t − = = = Với mẫu cụ thể ta có: 0,17 10 1,596 0,3368 t − = = Vì | |t gtth< nên 0H được chấp nhận. Vậy, ở mức ý nghĩa 5%α = không có sự khác nhau giữa số dặm trung bình đi được với xăng không có chất phụ gia và có chất phụ gia. 6. 15. Khối lượng bao gạo (KLBG) là biến ngẫu nhiên có phân phối chuẩn ( )50;0,01N . Có nhiều ý kiến của khách hàng phản ánh là khối lượng bị thiếu. Một nhóm thanh tra đã cân ngẫu nhiên 25 bao gạo trong kho và được kết quả như sau: KLBG (kg) (48; 48,5] (48,5; 49] (49; 49,5] (49,5; 50] (50; 50,5] Số bao gạo 2 5 10 6 2 Hãy kiểm định xem ý kiến của khách hàng phản ánh có đúng không? (kết luận ở mức ý nghĩa α = 5%). Giải: Bài tập Xác suất thống kê Diệp Hoàng Ân 103 Gọi X là BNN chỉ khối lượng bao gạo. Từ số liệu đã cho ta tính được 49,27; 0,53x s= = . Ta kiểm định giả thiết sau: ( )0 0 1 0: 50 ; :kgH Hµ µ µ µ= = < ở mức ý nghĩa α = 5% Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n Nµσ − = Với mức ý nghĩa α = 5% 1 0,05 1,6449gtth u −= − = − Với mẫu cụ thể: 49,27 50 25 36,5 0,1 u − = = − Vì u gtth< nên 0H bị bác bỏ. Nghĩa là ý kiến của khách hàng phản ánh là đúng (α = 5%). 6. 16. Một mẫu gồm 300 cử tri ở khu vực A và một mẫu gồm 200 cử tri ở khu vực B cho thấy có 56% và 48%, theo thứ tự, ủng hộ ứng cử viên X. Ở mức ý nghĩa 5%, hãy kiểm định giả thiết: a) Có sự khác biệt giữa hai khu vực về sự ủng hộ ứng cử viên X. b) Ứng cử viên X được ủng hộ hơn ở khu vực A. Giải: Gọi Ap và Bp theo thứ tự là tỷ lệ ủng hộ ứng cử viên X ở khu vực A và B. a) Ta kiểm định giả thiết 0 1A B A BH : p p ; H : p p= ≠ ở mức ý nghĩa 5%α = . Nếu 0H đúng thì ( ) ( ) 0 0 0 1 1 11 A BP PU ~ N , p p n m − =   − +    với 0 0 528A B np mpp , n m + = = + Với 5%α = ta có 0 9751 2 1 96 , gtth u u ,α − = = = Giá trị thực nghiệm 0 56 0 48 1 755 1 10 528 0 472 300 200 , , u , gtth , . , − = = <   +    Do đó 0H không bị bác bỏ nghĩa là sự khác nhau giữa tỷ lệ ủng hộ giữa hai khu vực A, B đối với ứng cử viên X không có ý nghĩa về mặt thống kê. b) Ta kiểm định giả thiết 0 1A B A BH : p p ; H : p p= > ở mức ý nghĩa 5%α = . Nếu 0H đúng thì ( ) ( ) 0 0 0 1 1 11 A BP PU ~ N , p p n m − =   − +    Bài tập Xác suất thống kê Diệp Hoàng Ân 104 0 0 528A B np mpp , n m + = = + Với 5%α = ta có 1 0 95 1 65,gtth u u ,α−= = = 0 56 0 48 1 755 1 10 528 0 472 300 200 , , u , gtth , . , − = = >   +    Nên 0H bị bác bỏ nghĩa là ứng cử viên X được ủng hộ nhiều hơn ở khu vực A. 6. 17. Điều tra ngẫu nhiên 200 người có hút thuốc lá, thấy có 28 người bị lao phổi; 170 người không hút thuốc lá, thấy có 12 người bị lao phổi. Tỉ lệ lao phổi giữa những người có và không hút thuốc lá có khác khau không? (kết luận ở mức ý nghĩa α = 1%). Giải: Gọi 1p , 2p lần lượt là tỉ lệ lao phổi những người có hút thuốc lá và không hút thuốc lá. Ta kiểm định giả thiết sau: 0 1 2 1 1 2: ; :H p p H p p= ≠ ở mức 1%α = . Nếu 0H đúng thì BNN ( ) ( )1 2 0 0 ~ 0,1 1 11 P PU N p p n m − =   − +    Với 1 20 28 12 40 4 370 370 37 np mpp n m + + = = = = + Với mức 1%α = , 0,9951 2 2,5758gtth u uα − = = = Với mẫu cụ thể ta có: ( ) 1 2 0 0 28 12 200 170 2,1428 1 1 4 4 1 11 1 37 37 p p u p p n m n m − − = = =      − + − +          Ta có | |u gtth< nên 0H không bị bác bỏ nghĩa là tỉ lệ lao phổi giữa những người có và không hút thuốc lá không khác khau (α = 1%). 6. 18. Một nhà máy có hai phân xưởng A và B cùng sản xuất một loại trục máy. Sau một thời gian hoạt động, chọn ngẫu nhiên 20 trục máy do phân xưởng A sản xuất, người ta đo được đường kính của chúng như sau (đơn vị mm) 250; 249; 251; 253; 248; 250; 250; 252; 257; 245; 248; 247; 249; 250; 280; 250; 247; 253; 256; 249. Bài tập Xác suất thống kê Diệp Hoàng Ân 105 Giả sử đường kính của các trục máy ở hai phân xưởng A và B tuân theo luật phân phối chuẩn có cùng phương sai. Đo ngẫu nhiên đường kính 20 trục máy do phân xưởng B sản xuất, người ta tính được đường kính trung bình là 249,8 với phương sai 56,2. Hãy kiểm định, ở mức ý nghĩa α = 5%, giả thiết 0H cho rằng đường kính trung bình các trục máy được sản xuất ở hai phân xưởng là như nhau đối với giả thiết 1H cho rằng chúng khác nhau. Giải: Gọi ,X Y lần lượt là đường kính trục máy do phân xưởng A, B tương ứng sản xuất. Kiểm định giả thiết 0 1: ; :X Y X YH Hµ µ µ µ= ≠ ở mức ý nghĩa α = 5%. Nếu 0H đúng thì BNN ( ) 2 ~ 2 1 1 X YT t n m S n m − = + −   +    Với 20; 20n m= = và ( ) ( ) 2 2 2 1 1 2 X Yn S m SS n m − + − = + − Với ở mức ý nghĩa α = 5%, ( ) ( )2 380,9751 2 2,0244n mgtth t tα + − − = = = Với mẫu cụ thể: 251,25x = và 7,7111Xs = 2 2 2 2 19. 19 19.7,7111 19.56, 2 57,83 38 38 X Ys ss + + = = = 2 251, 25 249,8 0,6029 1 1 1 157,83 20 20 x y t s n m − − = = =     + +        Vì | |t gtth< nên 0H được chấp nhận. Đường kính trung bình các trục máy được sản xuất ở hai phân xưởng là như nhau (ở mức ý nghĩa α = 5%). 6. 19. Phân xưởng A của một nhà máy sản xuất một loại trục máy. Sau một thời gian hoạt động, chọn ngẫu nhiên 20 trục máy do phân xưởng A sản xuất, người ta đo được đường kính của chúng như sau (đơn vị mm) 250; 249; 251; 253; 248; 250; 250; 252; 257; 245; 248; 247; 249; 250; 280; 250; 247; 253; 256; 249. Giả sử đường kính của các trục máy của phân xưởng A tuân theo luật phân phối chuẩn. Biết đường kính của một trục máy do phân xưởng A sản xuất, theo qui định là 250 mm. Hãy cho kết luận về chất lượng sản xuất của phân xưởng A ở mức ý nghĩa α = 5%. Bài tập Xác suất thống kê Diệp Hoàng Ân 106 Giải: Gọi X lần lượt là đường kính trục máy do phân xưởng A sản xuất. Từ số liệu ta có: 251,25x = và 7,7111=s Ta kiểm định giả thiết sau: 0 0 1 0: 250; :X XH Hµ µ µ µ= = ≠ ở mức 5%.α = Nếu 0H đúng thì BNN ( )0 ~ 1µ−= −XT n t nS Với mức 5%α = ( ) ( )19 190,9751 2 2,0930gtth t tα − = = = Với mẫu cụ thể ta có: 251,25 250 20 0,786 7,111 t − = = Vì | |t gtth< nên 0H đước chấp nhận. Do đó Tình hình sản xuất của phân xưởng A bình thường (kết luận ở mức ý nghĩa α = 5%). 6. 20. Sản phẩm của một xí nghiệp đúc cho phép số khuyết tật trung bình cho một sản phẩm là 3. Sau một đợt cải tiến kỹ thuật, người ta lấy ngẫu nhiên 36 sản phẩm để kiểm tra số khuyết tật trên mỗi sản phẩm (SKTTMSP). Kết quả thu được như sau: SKTTMSP 0 1 2 3 4 5 6 Số sản phẩm 7 4 4 6 8 6 1 Hãy cho kết luận về hiệu quả của đợt cải tiến kỹ thuật đối với số khuyết tật trung bình của một sản phẩm ở mức ý nghĩa α = 10%. Giải: Từ số liệu ta tính được 2,7222; 1,86x s= = Để kết luận về hiệu quả đợt cải tiến kỹ thuật ta kiểm định giả thiết: 0 0 1 0: 3; :H Hµ µ µ µ= = < ở mức ý nghĩa α = 10% Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n N s µ− = Với ở mức ý nghĩa α = 10% 1 0,9 1,2816gtth u uα−= − = − = − Với mẫu cụ thể 2,722 3 36 0,896 1,86 u − = = − Vì u gtth> nên 0H không bị bác bỏ nghĩa là đợt cải tiến kỹ thuật không mang lại hiệu quả (kết luận ở mức ý nghĩa α = 10%). Bài tập Xác suất thống kê Diệp Hoàng Ân 107 6. 21. Sản phẩm của một xí nghiệp đúc cho phép số khuyết tật trung bình cho một sản phẩm là 3. Sau một đợt cải tiến kỹ thuật, người ta lấy ngẫu nhiên 36 sản phẩm để kiểm tra số khuyết tật trên mỗi sản phẩm (SKTTMSP). Kết quả thu được như sau: SKTTMSP 0 1 2 3 4 5 6 Số sản phẩm 7 4 4 6 8 6 1 Sản phẩm có không quá 2 khuyết tật được gọi là sản phẩm loại A. Tỉ lệ sản phẩm loại A trước đợt cải tiến kỹ thuật là 40%. Đợt cải tiến kỹ thuật có thực sự làm tăng tỉ lệ sản phẩm loại A không? (kết luận ở mức ý nghĩa 5%). Giải: Gọi p là tỉ lệ sản phẩm loại A. Tỉ lệ mẫu: 15 5 36 12 p = = . Kiểm định giả thiết 0 0 1 0: 40%; :H p p H p p= = > ở mức ý nghĩa α = 5% N Nếu 0H đúng thì BNN ( ) ( ) 0 0 0 ~ 0,1 1 P pU n N p p − = − Với ở mức ý nghĩa α = 5%, 1 0,95 1,6449gtth u uα−= = = Với mẫu cụ thể ta có: ( ) 5 /12 0, 4 36 0, 204 0, 4 1 0, 4 u − = = − Vì u gtth< nên 0H không bị bác bỏ. Vậy, đợt cải tiến kỹ thuật không làm tăng tỉ lệ sản phẩm loại A. (kết luận ở mức ý nghĩa α = 5%). 6. 22. Những thống kê trong năm trước cho thấy một người Mỹ đi du lịch ở châu Âu trong vòng 3 tuần sẽ chi hết 1010 USD cho việc mua sắm. Năm nay, người ta thống kê trên 50 khách du lịch thì thấy số tiền trung bình mà họ chi tiêu là 1090 USD và độ lệch chuẩn là 300 USD. Với mức ý nghĩa 1%α = hãy cho biết mức chi tiêu của những khách du lịch năm nay có tăng so với năm trước không? Giải: Gọi X là BNN chỉ mức chi tiêu của mỗi khách du lịch trong năm nay, EXµ = . Ta kiểm định giả thiết 0 0 1 0: 1010; :H Hµ = µ = µ > µ ở ý nghĩa 1%α = Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n N s − µ = Với ý nghĩa 1%α = , 1 0,99 2,3263gtth u u−α= = = Bài tập Xác suất thống kê Diệp Hoàng Ân 108 Với mẫu cụ thể ta có: 1090 1010 50 1,8856 300 u − = = Vì u gtth< nên 0H không bị bác bỏ. Vậy, chưa đủ cơ sở để kết luận mức chi tiêu của những khách du lịch năm nay tăng. 6. 23. Một hãng bào chế thuốc đang thử nghiệm hai loại thuốc gây mê A và B mới. Việc thử nghiệm được tiến hành trên hai nhóm thú vật khác nhau. Nhóm thứ nhất gồm 100 con dùng thuốc A thì có 71 con bị mê; nhóm thứ hai gồm 90 con dùng thuốc B thì có 58 con bị mê. Hãng bào chế muốn kiểm định xem tác dụng của hai loại thuốc trên có khác nhau không ở mức ý nghĩa 5%. Hãy cho biết kết luận. Giải: Gọi 1p và 2p lần lượt là tỉ lệ con vật bị mê khi dùng thuốc A, B tương ứng. Giá trị tỉ lệ mẫu đối với 2 loại thuốc đó là 1 2 71 58 ; 100 90 p p= = . Tỉ lệ chung là 71 58 129 0,6789 190 190 p += = = . Ta kiểm định giả thiết 0 1 2 1 1 2: ; :H p p H p p= ≠ ở mức ý nghĩa 5%α = . Nếu 0H đúng thì BNN ( ) ( )1 2 ~ 0,1 1 11 P PU N p p n m − =   − +    Với ở mức ý nghĩa 5%α = , 0,9751 2 1,96gtth u uα − = = = Với mẫu cụ thể ta tính được: ( ) 1 2 71 58 100 90 0,017 1 1 129 129 1 11 1 190 190 100 90 p p u p p n m − − = = =      − + − +          Vì | |u gtth< nên 0H không bị bác bỏ. Vậy, tác dụng của hai loại thuốc trên không khác nhau ở mức ý nghĩa 5%. 6. 24. Với ý muốn làm tăng chỉ số mỡ sữa của loại giống bò A, một trại chăn nuôi cho lai bò giống A với một loại bò giống B. Đo chỉ số mỡ sữa của 130 con bò lai giống được chọn ngẫu nhiên trong đàn bò của trại, người ta có kết Chỉ số mỡ sữa Số bò lai Bài tập Xác suất thống kê Diệp Hoàng Ân 109 [3,0; 3,6) [3,6; 4,2) [4,2; 4,8) [4,8; 5,4) [5,4; 6,0) [6,0; 6,6) [6,6; 7,2) 2 8 35 43 22 15 5 Biết rằng chỉ số mỡ sữa trung bình của giống bò A thuần chủng là 4,95. Hãy cho kết luận về hiệu quả của việc lai giống ở mức ý nghĩa 1%. Giải: Gọi X là BNN chỉ chỉ số mỡ sữa của giống bò lai. Từ số liệu ta tính được: 5,15x = và 0,77s = . Ta kiểm định giả thiết: 0 0 1 0: 4,95; :H Hµ = µ = µ > µ ở mức ý nghĩa α = 1%. Nếu 0H đúng thì BNN ( )0 ~ 0,1XU n N s − µ = Với ở mức ý nghĩa α = 1%, 1 0,99 2,3263gtth u u−α= = = Với mẫu cụ thể ta tính được: 5,15 4,95 130 2,96 0,77 u − = = Vì u gtth> nên 0H bị bác bỏ. Vậy, chỉ số mỡ sữa của giống bò lai cao hơn bò thuần chủng. 6. 25. Điều tra về một nguyên nhân gây ung thư phổi: Thăm dò trong 200 người có hút thuốc lá, thấy có 28 người bị K phổi; trong 170 người không không hút thuốc lá, có 12 người bị K phổi. Hỏi tỉ lệ người bị K phổi trên những người hút thuốc lá có cao hơn tỉ lệ đó trên những người không hút thuốc lá không? (Kết luận ở mức 5%α = ). Giải: Gọi 1 2,p p lần lượt là tỉ lệ người bị K phổi trong số những người hút thuốc và không hút thuốc. Ta kiểm định giả thiết: 0 1 2 1 1 2: ; :H p p H p p= > ở mức 5%α = Nếu 0H đúng thì BNN ( ) ( )1 2 ~ 0,1 1 11 P PU N p p n m − =   − +    Với 5%α = , 1 0,95 1,6449gtth u u−α= = = Với mẫu cụ thể ta tính được: 1 2 28 7 6 28 12 4 ; ; 200 50 85 200 170 37 p p p += = = = = + Bài tập Xác suất thống kê Diệp Hoàng Ân 110 ( ) 1 2 2,14 1 11 200 170 p p u p p − = =   − +    Ta có u gtth> nên 0H bị bác bỏ. Vậy tỉ lệ bị K phổi trong số những người hút thuốc là cao hơn tỉ lệ đó trên những nguoif không hút thuốc lá. 6. 26. Nếu máy móc hoạt động bình thường thì khối lượng một sản phẩm tuân theo luật phân phối chuẩn với độ lệch chuẩn không quá 1kg. Có thể coi máy móc còn hoạt động bình thường hay không nếu cân thử 30 sản phẩm do máy đó sản xuất ra, thì tính được độ lệch chuẩn là 1,1 kg. Yêu cầu kết luận ở mức ý nghĩa 1%α = . Giải: Kiểm định giả thiết về phương sai: 2 2 2 2 0 0 1 01H : ;H :σ σ σ σ= = ≠ ở mức ý nghĩa 1%α = Nếu 0H đúng thì ( ) 2 2 2 ( 1) ~ 1 o n SY n−= χ − σ Với mẫu cụ thể ta có 229 1 1 35 09 1 . ,y ,= = Với 0 01,α = ta có 0,01 2 2 2 2( 1) (29) 13,121nαχ − = χ = 0,01 2 2 2 2 1 1 ( 1) (29) 52,336nα − − χ − = χ = Do 2 2 12 2 1 1( n ) y ( n )α αχ χ − − < < − nên 0H không bị bác bỏ nghĩa là: Chưa đủ cơ sở để nói rằng máy móc hoạt động không bình thường. 6. 27. Một nhà sản xuất bóng đèn cho rằng chất lượng bóng đèn được coi là đồng đều nếu tuổi thọ của bóng đèn có độ lệch chuẩn bằng 1000 hoặc ít hơn. Lấy ngẫu nhiên 10 bóng để kiểm tra, thì được độ lệch chuẩn mẫu là 1150, Vậy, với mức ý nghĩa 5%, có thể coi chất lượng bóng đèn do công ty đó sản xuất là đồng đều không? Biết rằng tuổi thọ của bóng đèn là một BNN có phân phối chuẩn. Giải: Kiểm định giả thiết về phương sai dạng 2 2 2 2 20 0 1 01000H : ;H :σ σ σ σ= = > ở mức 5%α = . Nếu 0H đúng thì ( ) 2 2 2 ( 1) ~ 1 o n SY n−= χ − σ Giá trị tơi hạn: 2 21 0,95( 1) (9) 16,919gtth n−α= χ − = χ = Với mẫu cụ thể ta có 2 2 9 1150 11 9025 1000 .y , gtth= = < Bài tập Xác suất thống kê Diệp Hoàng Ân 111 0H được chấp nhận nghĩa là có thể coi chất lượng bóng đèn do công ty đó sản xuất là đồng đều. 6. 28. Tại một nông trường, để điều tra khối lượng của một loại trái cây, sau một đợt bón một loại phân mới, người ta cân thử một số trái cây được chọn ngẫu nhiên và được kết quả sau: Khối lượng (gam) Số trái cây [45, 50) [50, 55) [55, 60) [60, 65) [65, 70) [70, 75) [75, 80) ≥ 80 2 11 25 74 187 43 16 3 Trước kia, khối lượng trung bình của mỗi trái là 65 gam. Hãy đánh giá xem loại phân bón mới có mang lại hiệu quả không? (kết luận ở mức ý nghĩa α = 1%). Giải: Từ số liệu đã cho ta tính được 361; 66,38; 5, 41n x s= = = Kiểm định giả thiết 0 0 1 0: 65( ); :H g Hµ = µ = µ > µ ở mức 1%α = Nếu 0H đúng thì ( )0 ~ 0,1XU n N s − µ = Với 0,01α = ta suy ra: 1 0,99 2,33gtth u u−α= = = Với mẫu cụ thể ta tính được: 66,38 65 361 4,85 5,41 u gtth−= = > Vậy 0H bị bác bỏ nghĩa là: loại phân bón mới có mang lại hiệu quả. (kết luận ở mức ý nghĩa α = 1%). 6. 29. Một công ty thương mại, dựa vào kinh nghiệm quá khứ, đã xác định rằng vào cuối năm thì 80% số hoá đơn đã được thanh toán đầy đủ, 10% khất lại 1 tháng, 6% khất lại 2 tháng, và 4% khất lại hơn 2 tháng. Vào cuối năm nay, công ty kiểm tra một mẫu ngẫu nhiên gồm 400 hoá đơn và thấy rằng: 287 hoá đơn đã được thanh toán đầy đủ, 49 khất lại 1 tháng, 30 khất lại 2 tháng và 34 khất lại hơn 2 tháng. Như vậy, việc thanh toán hoá đơn năm nay có còn theo qui luật như những năm trước không? (kết luận ở mức ý nghĩa 5%α = ). Giải: Ta kiểm định giả thiết về phân phối. 0 :H Việc thanh toán hoá đơn năm nay theo qui luật năm trước Bài tập Xác suất thống kê Diệp Hoàng Ân 112 1 :H Việc thanh toán hoá đơn năm nay không theo qui luật năm trước. Ở mức ý nghĩa α = 5%. Bảng tần số lý thuyết và thực nghiệm: Thanh toán đầy đủ ( 1x ) Khuất lại 1 tháng ( 2x ) Khuất lại 2 tháng ( 3x ) Khuất lại hơn 2 tháng ( 4x ) Tần số quan sát 287 49 30 34 Tần số lý thuyết 320 40 24 16 Ta có: ( ) ( ) ( ) ( ) ( )2 2 2 2 242 1 287 320 49 40 30 24 34 16 27,178 320 40 24 16 i i i i o eQ e = − − − − − = = + + + =∑ Với 5%α = , gtth = ( ) ( )2 21 0,953 3 7,815−αχ = χ = Ta thấy ( )2 21 3Q −α> χ nên: Việc thanh toán hoá đơn năm nay không còn theo qui luật như những năm trước. (kết luận ở mức ý nghĩa α = 5%). 6. 30. Để lập kế hoạch sản xuất mặt hàng mới, một công ty đã tiến hành điều tra về sở thích của khách hàng về 3 loại mẫu khác nhau của cùng một loại hàng. Kết quả được trình bày ở bảng sau: Mẫu hàng Ý kiến A B C Thích 43 30 42 Không thích 35 53 39 Không có ý kiến 22 17 19 Có hay không sự phân biệt về sở thích của khách hàng đối với 3 loại mẫu nói trên? Kết luận ở mức ý nghĩa 5%. Giải: Ta kiểm định giả thiết về phân phối. 0 :H Không có sự phân biệt về sở thích 1 :H Có sự phân biệt về sở thích đối với 3 mặt hàng (mức ý nghĩa 5%). Bảng đối chiếu tần số: Trong ngoặc là tần số lý thuyết: Mẫu A B C Bài tập Xác suất thống kê Diệp Hoàng Ân 113 hàng Ý kiến Thích 43 (38,33) 30 (38,33) 42 (38,33) Không thích 35 (42,33) 53 (42,33) 39 (42,33) Không có ý kiến 22 (19,33) 17 (19,33) 19 (19,33) ( )292 1 7,606i i i i o eQ e = − = =∑ ( ) ( )2 21 0,954 4 9,488−αχ = χ = Ta thấy ( )2 21 8Q −α< χ nên 0H được chấp nhận nghĩa là: Không có sự phân biệt về sở thích đối với 3 mặt hàng. 6. 31. Điều tra một số sản phẩm của một xí nghiệp về chiều dài (X (cm)) và hàm lượng chất A (Y (%)), người ta có kết quả sau: Y X 8 10 12 14 16 100 5 5 110 4 6 7 120 5 9 8 130 4 6 9 140 5 7 Các sản phẩm có chiều dài không quá 110cm và hàm lượng chất A không hơn 12% được gọi là sản phẩm loại II. Nếu xí nghiệp báo cáo rằng sản phẩm loại II có chỉ tiêu Y trung bình là 10% thì có thể chấp nhận được không? Kết luận ở mức ý nghĩa 5% (giả thiết hàm lượng này có phân phối chuẩn) Giải: Bảng số liệu cho chỉ tiêu Y của những sản phẩm loại A. jy 8 10 12 jn 9 11 7 Giá trị trung bình mẫu: 9,85y = và giá trị độ lệch chuẩn mẫu: 1,56Ys = , cỡ mẫu 27n = . Bài tập Xác suất thống kê Diệp Hoàng Ân 114 Ta kiểm định giả thiết sau: ( )0 0 1 0: 10 % ; :Y YH Hµ µ µ µ= = ≠ ở mức ý nghĩa 5% Nếu 0H đúng thì BNN ( )0 ~ 1 Y YT n t n S µ− = − Với mức ý nghĩa 5%α = ta tính được ( )260,051 2 2,0555gtth t − = = Với mẫu cụ thể ta tính được: 9,85 10 27 0,5 1,56 t − = = − Ta có t gtth< nên 0H không bị bác bỏ. Vậy, chấp nhận báo cáo của xí nghiệp (ở mức ý nghĩa 5%). 6. 32. Gạo đủ tiêu chuẩn xuất khẩu là gạo có tỉ lệ hạt nguyên, hạt vỡ và tấm, theo thứ tự, là: 90%, 6% và 4%. Kiểm tra 1000 hạt gạo của một lô gạo, người ta thấy trong đó có: Hạt nguyên: 880; hạt vỡ: 60 và tấm: 60 Hỏi lô gạo có đủ tiêu chuẩn xuất khẩu không? Cho kết luận ở mức ý nghĩa 5%. Giải: Để kết luận về tiêu chuẩn của lô gạo ta kiểm định giả thiết sau: 0 :H Lô gạo đủ tiêu chuẩn xuất khẩu. 1 :H Lô gạo không đủ tiêu chuẩn xuất khẩu (ở mức ý nghĩa 5%). Nếu 0H đúng thì trong 1000 hạt gạo có 900 hạt nguyên, 60 hạt vỡ và 40 hạt tấm. Ta có ( ) ( ) ( ) 2 2 2 2 880 900 60 60 60 40 10,44 900 60 40 Q − − −= + + = Với 5%,α = ( )31 0,05 7,815gtth χ −= = Vì 2Q gtth> nên 0H bị bác bỏ. Vậy, lô gạo không đủ tiêu chuẩn xuất khẩu (kết luận ở mức ý nghĩa 5%). 6. 33. Giám đốc trại gà Alpha xem lại hồ sơ của một đợt khảo sát về khối lượng của gà xuất chuồng ở trại gà thì thấy số liệu được ghi như sau: Khối lượng (kg) Số con gà Bài tập Xác suất thống kê Diệp Hoàng Ân 115 [2,3; 2,7) [2,7; 2,9) [2,9; 3,1) [3,1; 3,3) [3,3; 3,5) [3,5; 3,7) [3,7; 3,9) 5 30 41 25 10 5 5 Ban giám đốc trại gà Alpha báo cáo rằng khối lượng trung bình của gà trên 3 kg. Hãy cho nhận xét về báo cáo trên ở mức ý nghĩa 2%. Giải: Từ số liệu ta tính được: 121; 3,06; 0,2826n x s= = = . Ta kiểm định giả thiết sau: 0 0 1 0: 3; :X XH Hµ µ µ µ= = > ở mức 2%α = . Nếu 0H đúng thì BNN ( )0 ~ 0,1 X XU n N s µ− = Với 2%α = , 1 0,95 1,6449gtth u uα−= = = Với mẫu cụ thể: 0 3,06 3 121 2,3354 0, 2826X x u n s µ− − = = = Vì u gtth> nên 0H bị bác bỏ nghĩa là báo cáo của Ban giám đốc là đúng (ở mức ý nghĩa 5%). 6. 34. Để so sánh thời gian cắt trung bình của một máy tiện loại cũ với một máy tiện loại mới, người ta cho mỗi máy cắt thử 10 lần và đo thời gian cắt (tính bằng giây) . Kết quả thu được như sau: Máy loại cũ: 58, 58, 56, 38, 70, 38, 42, 75, 68, 67. Máy loại mới: 57, 55, 63, 24, 67, 43, 33, 68, 56, 54.. Biết rằng thời gian cắt của máy loại cũ và của máy loại mới là các biến ngẫu nhiên tuân theo luật phân phối chuẩn có độ lệch chuẩn, theo thứ tự, là 13,5 giây và 14,5 giây. Với mức ý nghĩa 5%, có thể cho rằng máy loại mới tốt hơn (có thời gian cắt trung bình ít hơn) máy loại cũ hay không? Giải: Gọi ,X Y theo thứ tự là BNN chỉ thời gian cắt của máy tiện cũ và máy tiện mới. Bài tập Xác suất thống kê Diệp Hoàng Ân 116 Ta kiểm định giả thiết sau: 0 1: ; ;X Y X YH Hµ µ µ µ= > ở mức ý nghĩa 5%. Nếu 0H đúng thù BNN ( )2 2 ~ 0,1 X Y X YU N n m σ σ − = + Với 5%α = , 1 ,05 0,95 1,6449gtth u u−0= = = Với mẫu cụ thể ta tính được: 57; 13,6; 52; 14,46X Yx s y s= = = = Do đó 57 52 2,988 13,5 14,5 10 10 u − = = + Vì u gtth> nên 0H bị bác bỏ. Vậy, có thể cho rằng máy loại mới tốt hơn (có thời gian cắt trung bình ít hơn) máy loại cũ. Bài tập Xác suất thống kê Diệp Hoàng Ân 117 CHƯƠNG 7: TƯƠNG QUAN VÀ HỒI QUY 7.1. Xem vectơ ngẫu nhiên (X,Y) tuân theo luật phân phối chuẩn hai chiều mà một mẫu ngẫu nhiên gồm 8 cặp được chọn ra như sau: xi 1 2 3 4 5 6 7 8 yi 5 7 11 17 21 25 29 32 a) Hãy tính giá trị hệ số tương quan mẫu của X và Y và cho nhận xét. b) Hãy kiểm định giả thiết về sự tương quan giữa X à Y ở mức 5%α = . c) Hãy lập hàm hồi quy tuyến tính mẫu và dự đoán nếu X lấy giá trị bằng 20 thì Y nhận giá trị bao nhiêu? Giải: a) .r 0,996( 1)s .s − = = − ∑ i i X Y x y n x y n . X và Y có quan hệ gần như tuyến tính. b) Kiểm định giả thiết 0 1: 0; : 0H Hρ ρ= ≠ ở mức 5%α = Nếu 0H đúng thì ( )221T ~ 2 − − = − n R R t n ( 8n = và 1 ( ).( ) ( 1) n i i i X Y X X Y Y n S S R = − − − ∑ = là hệ số tương quan mẫu) Với 5%α = , gtth ( )61 / 2 2,4469t α−= = . Với mẫu cụ thể, ta có 0,996r = và 2 2 2 60,996 27,3 1 1 0,996 n t r r − = = = − − Vì t gtth> nên 0H bị bác bỏ nghĩa là ,X Y thật sự tương quan. c) Phương trình hồi quy tuyến tính mẫu: 0.107 4,107y x= − + . Từ đó, nếu 20X = thì 82,036Y = . 7.2. Một cơ sở sản xuất đã ghi lại số tiền đã chi cho việc nghiên cứu phát triển và lợi nhuận hàng năm của cơ sở trong 6 năm vừa qua như sau: (đơn vị 106 VNĐ) Chi nghiên cứu 5 11 4 5 3 2 Lợi nhuận 31 40 30 34 25 20 Bài tập Xác suất thống kê Diệp Hoàng Ân 118 a) Hãy tính giá trị hệ số tương quan mẫu giữa chi nghiên cứu và lợi nhuận. b) Chi nghiên cứu và lợi nhuận có thực sự tương quan không? (kết luận ở mức ý nghĩa α = 2%). c) Viết phương trình đường hồi qui tuyến tính mẫu của lợi nhuận theo chi phí nghiên cứu. Giải: a) 0,909r = b) Kiểm định giả thiết 0 1: 0; : 0H Hρ = ρ ≠ ở mức ý nghĩa 1%α = Nếu 0H đúng thì BNN ( )221T ~ 2 n R R t n− − = − ( ) ( )1 / 2 0,992 4 3,7469gtth t t t−α= − = = Với mẫu cụ thể ta có 2 40,909 4,361 1 0,909 t = = − Vì t gthh> nên 0H bị bác bỏ. Nghĩa là X và Y thực sự tương quan. (kết luận ở mức ý nghĩa α = 2%). c) Phương trình đường hồi quy tuyến tính mẫu: 2 20y x= + 7.3. Đo chiều cao Y (cm) và chiều dài chi dưới X (cm) của một nhóm thanh niên, người ta thu được số liệu sau: yi 160 161,5 163 165 167 168 171 172 xi 78 79 80 81 82 83 84 85 (a). Tính giá trị hệ số tương quan mẫu của X và Y. (b). Ở mức ý nghĩa α = 5%, hãy cho nhận xét về tài liệu cho rằng hệ số tương quan của X và Y là 0,9. (c). Viết phương trình đường hồi quy mẫu của Y theo X. Đáp số: (a) r = 0,996 (b) Kiểm định giả thiết H0: ρ = 0,9 đối với H1: ρ ≠ 0,9. Trắc nghiệm U 2 đuôi được sử dụng, với Bài tập Xác suất thống kê Diệp Hoàng Ân 119 ~ (0,1)Z Z ZU N− µ= σ . Với mức α = 5% , 0,975gtth 1,96u= = ; với mẫu cụ thể, chúng ta có : ( )1 0,99612 1 0,996ln 3,106z +−= = , ( )1 0,9 0,91 12 1 0,9 2(8 1) 5ln 1,5365;Z Z+− −µ = + = σ = , và 3,509Z Z z u − µ σ = = Vì gtthu > nên ở mức ý nghĩa α = 5%, giả thiết H0 bị bác bỏ, nghĩa là tài liệu không được chấp nhận (ở mức ý nghĩa α = 5%). (c) y = 1,768x + 21,857. 7.4. Một giảng viên dạy môn thống kê yêu cầu mỗi sinh viên phải làm một đồ án phân tích dữ liệu và dự kỳ thi hết môn. Sau đó, một mẫu gồm 10 sinh viên được chọn ngẫu nhiên, điểm số được ghi lại như sau: Điểm thi 81 62 74 78 93 69 72 83 90 84 Điểm đồ án 76 71 69 76 87 62 80 75 92 79 (a) Tìm khoảng tin cậy 95% cho điểm thi trung bình của một sinh viên (giả thiết điểm thi của sinh viên tuân theo luật phân phối chuẩn). (b) Ở mức ý nghĩa 5%, hãy đánh giá về sự tương quan tuyến tính giữa hai loại điểm trên. Giải: (a) Gọi X là điểm thi của sinh viên. Ta có: 78,6x = 9,57s = . Khoảng tin cậy 95% cho điểm thi trung bình của một sinh viên: ( );x e x e− + ( )9 1 2 5,97 . 2,2622. 4,27 10 10 s e t +γ= = = Khoảng tin cậy cần tìm ( )74,33; 82,87 . (b) Gọi Y là điểm đồ án của sinh viên. Đặt ,X Yρ ρ= . Chúng ta phải có quyết định giữa hai giả thiết: H0: ρ = 0 và H1: ρ ≠ 0, Nếu H0 đúng thì BNN Bài tập Xác suất thống kê Diệp Hoàng Ân 120 2 10 2 1 T R R − − = ~ t(8) Với mức α = 5% , giá trị tới hạn là: (8)0,975 2,3060t = ; với mẫu cụ thể, chúng ta có hệ số tương quan mẫu: 0,776r = . Do đó: 2 0,776. 8 3, 48 1 (0,776) t = = − Vì |t| >2,306 nên giả thiết H0 bị bác bỏ ở mức ý nghĩa α = 5%. Nói cách khác, chúng ta chấp nhận rằng X và Y tương quan ở mức ý nghĩa 5%. 7.5. Để thực hiện một công trình nghiên cứu về mối quan hệ giữa chiều cao Y(m) và đường kính X(cm) của một loại cây, người ta quan sát trên một mẫu ngẫu nhiên và có kết quả sau: xi 28 28 24 30 60 30 32 42 43 49 yi 5 6 5 6 10 5 7 8 9 10 (a). Hãy tính giá trị hệ số tương quan mẫu của X và Y và cho nhận xét. (b) Viết phương trình đường thẳng hồi quy mẫu của Y theo X. Hãy dự báo chiều cao của cây có đường kính 45 cm. Giải: (a) r = 0,939. Vì r rất gần 1 nên giữa X và Y có hồi qui tuyến tính. (b) y = 0,166x + 1,041. Dự báo chiều cao của cây có đường kính 45 cm là: y = 0,166 × 45 + 1,041 = 8,5 m 7.6. X (%) và Y(kg/mm2) là hai chỉ tiêu chất lượng của một loại sản phẩm. Điều tra ở một số sản phẩm, bảng sau: X 2 2 4 6 4 6 8 6 8 6 8 Y 5 10 10 10 15 15 15 20 20 25 25 Tần số 2 1 2 4 2 6 4 3 3 1 2 a) Hãy tính các giá trị trung bình mẫu của X, Y; phương sai mẫu của X, Y và hệ số tương quan mẫu giữa X và Y. b) Viết phương trình hồi quy mẫu của Y theo X. Từ đó dự đoán xem nếu chỉ tiêu X là 9 thì chỉ tiêu Y là bao nhiêu? Giải: a) Ta có trung bình mẫu: Bài tập Xác suất thống kê Diệp Hoàng Ân 121 5,93; 15,17;x y= = Phương sai mẫu: 2 23,44; 28,42X Yσ σ= = Hệ số tương quan mẫu: 0,66r = b) Phương trình hồi quy Y theo X: 3,86 1.91y x= + Nếu X có giá trị là 9 thì Y sẽ nhận giá trị là 21. 7.7. X (%) và Y(kg/mm2) là hai chỉ tiêu chất lượng của một loại sản phẩm. Điều tra ở một số sản phẩm, bảng sau: X 2 2 4 6 4 6 8 6 8 6 8 Y 5 10 10 10 15 15 15 20 20 25 25 Tần số 2 1 2 4 2 6 4 3 3 1 2 a) Tính giá trị hệ số tương quan mẫu giữ X và Y. Viết Viết phương trình hồi quy mẫu của Y theo X. b) Kiểm định giả thiết xem X và Y có tương quan không ở mức ý nghĩa 5%? Giải: a) Giá trị hệ số tương quan mẫu: 0,66r = . Phương trình hồi quy Y theo X: 3,86 1.91y x= + . b) Kiểm định giả thiết 0 1: 0; : 0H Hρ ρ= ≠ ở mức ý nghĩa 5% Nếu 0H đúng thì BNN 2 2 1 T ~ ( 2)n R R t n− − = − Với mức ý nghĩa 5%, ( )280,975 2,0484gtth t= = Với mẫu cụ thể ta có 2 2 4,69 1 n t r r − = = − Vì >t gtth nên 0H bị bác bỏ, nghĩa là X và Y tương quan ở mức ý nghĩa 5%. 7.8. X (%) và Y(kg/mm2) là hai chỉ tiêu chất lượng của một loại sản phẩm. Điều tra ở một số sản phẩm, bảng sau: X 2 2 4 6 4 6 8 6 8 6 8 Y 5 10 10 10 15 15 15 20 20 25 25 Tần số 2 1 2 4 2 6 4 3 3 1 2 a) Tìm khoảng tin cậy 95% cho chỉ tiêu Y (giả thiết chỉ tiêu Y tuân theo luật phân phối chuẩn). Bài tập Xác suất thống kê Diệp Hoàng Ân 122 b) Viết phương trình hồi quy mẫu của Y theo X. Từ đó dự đoán xem nếu chỉ tiêu X là 9 thì chỉ tiêu Y là bao nhiêu? Giải: a) Trung bình mẫu chỉ tiêu Y là: 15,17; 5,33= =Yy s Khoảng tin cậy 95% cho trung bình chỉ tiêu Y là: ( );y e y e− + Với ( )290,975 5,33 . 2,0452. 1,99 2 30 30 Yse t= = = ≈ Vậy khoảng tin cậy cần tìm là: ( )13,18;17,16 b) Phương trình hồi quy Y theo X: 3,86 1.91y x= + Nếu X có giá trị là 9 thì Y sẽ nhận giá trị là 21. 7.9. X (%) và Y(kg/mm2) là hai chỉ tiêu chất lượng của một loại sản phẩm. Điều tra ở một số sản phẩm, bảng sau: X 2 2 4 6 4 6 8 6 8 6 8 Y 5 10 10 10 15 15 15 20 20 25 25 Tần số 2 1 2 4 2 6 4 3 3 1 2 a) Có tài liệu cho rằng trung bình chỉ tiêu X là 6,5%. Hãy cho nhận xét về tài liệu trên ở mức ý nghĩa 5%. Giả thiết các chỉ tiêu X, Y tuân theo luật phân phối chuẩn. b) Tính giá trị hệ số tương quan mẫu của X và Y. Viết phương trình đường thẳng hồi quy mẫu của Y theo X. Giải: a) Kiểm định giả thiết 0 0 1 0: 6,5; :X XH Hµ µ µ µ= = ≠ ở mức ý nghĩa 5%. Nếu 0H đúng thì BNN ( )0 ~ 1XT n t nS µ− = − Với ở mức ý nghĩa 5%, ( )290,975 2,0452gtth t= = Vói mẫu cụ thể ta tính được: 5,93 6,5 30 0,908 3,44 t − = = Vì t gtth< nên 0H không bị bác bỏ nghĩa là ta chấp nhận tài liêu trên ở mức ý nghĩa 5%. b) Giá trị hệ số tương quan mẫu: 0,66r = . Phương trình hồi quy Y theo X: 3,86 1.91y x= + . Bài tập Xác suất thống kê Diệp Hoàng Ân 123 7.10. Nghiên cứu lượng phân bón (X kg) được dùng để bón cho ruộng trong một vụ; Y(kg/1000m2) là năng suất lúa. Thống kê ở 30 hộ gia đình, kết quả như sau: Số hộ 3 5 2 6 4 3 5 2 xi 40 40 50 50 50 60 60 60 yi 270 280 280 290 300 300 310 320 a) Tính giá trị hệ số tương quan mẫu của X và Y. Viết phương trình hồi quy mẫu Y theo X. b) Kiểm định giả thiết cho rằng hệ số tương quan của X và Y bằng 0,9 ở mức ý nghĩa α = 5%. Giải: a) Giá trị hệ số tương quan mẫu: 0,891r = . Phương trình đường hồi quy mẫu: 210,15 1,64Y X= + . b) Kiểm định giả thiết 0 0 1 0: 0,9; :H Hρ ρ ρ ρ= = ≠ ở mức ý nghĩa α = 5%. Trắc nghiệm U 2 đuôi được sử dụng, với ~ (0,1)Z Z ZU N− µ= σ . Với mức α = 5% , 0,975gtth 1,96u= = ; Với mẫu cụ thể, ta có 1 2 1 0,891ln 1,427 1 0,891 +  = = =  −  z z ( )1 0,9 0,91 12 1 0,9 2(30 1) 27ln 1,488;Z Z+− −µ = + = σ = 0,317− µ σ = = Z Z z u Vì | |u gtth< nên 0H được chấp nhận nghĩa là giả thiết hệ số tương quan của X và Y bằng 0,9 là đúng ở mức ý nghĩa α = 5%. 7.11. Để nghiên cứu sự tương quan giữa chiều cao X (cm) và sức nặngY (kg) con người, quan sát trên một mẫu ngẫu nhiên, người ta có kất quả sau: yk xi [40, 45) [45, 50) [50, 55) [55, 60) [60, 65) Bài tập Xác suất thống kê Diệp Hoàng Ân 124 [140, 145) [145, 150) [150, 155) [155, 160) [160, 165) 1 4 2 6 1 10 8 2 8 6 3 1 1 (a) Hãy lập bảng phân bố tần số, tần suất cho các giá trị của X, Y. (b) Tính các giá trị trung bình mẫu, độ lệch chuẩn mẫu và hệ số tương quan mẫu của X và Y. Viết phương trình đường thẳng hồi quy tuyến tính mẫu của Y theo X. Giải: a) Bảng tần số, tần suất của X và Y: Biến X Biến Y Lớp Tần số Tần suất Lớp Tần số Tần suất [140, 145) 5 0,094 [40, 45) 1 0,019 [145, 150) 9 0,170 [45, 50) 6 0,113 [150, 155) 20 0,377 [50, 55) 24 0,453 [155, 160) 17 0,321 [55, 60) 16 0,302 [160, 165) 2 0,038 [60, 65) 6 0,113 b) 152,69; 54,23; 5,14; 4,41X Yx y s s= = = = 0,6544r = Phương trình hồi quy: 31,59 0,56y x= − + 7.12. Để nghiên cứu sự tương quan giữa chiều cao X (cm) và sức nặngY (kg) con người, quan sát trên một mẫu ngẫu nhiên, người ta có kất quả sau: yk xi [40, 45) [45, 50) [50, 55) [55, 60) [60, 65) Bài tập Xác suất thống kê Diệp Hoàng Ân 125 [140, 145) [145, 150) [150, 155) [155, 160) [160, 165) 1 4 2 6 1 10 8 2 8 6 3 1 1 a) Tính giá trị hệ số tương quan mẫu của X và Y. Viết phương trình đường thẳng hồi quy tuyến tính mẫu của Y theo X. b) Có tài liệu cho biết hệ số tương quan giữa X và Y là 0,65. Hãy cho nhận xét về tài liệu đó, ở mức α = 5%. Giải: a) 0,6544r = Phương trình hồi quy: 31,59 0,56y x= − + b) Kiểm định giả thiết 0H : ρ = 0,65 đối với H1: ρ ≠ 0,65 ở mức α = 5%. Trắc nghiệm U 2 đuôi được sử dụng, với ~ (0,1)Z Z ZU N− µ= σ . Với mức α = 5% , 0,975gtth 1,96u= = ; với mẫu cụ thể, chúng ta có : ( )1 0,654412 1 0,6544ln 0,783+−= =z , ( )1 0,65 0,651 12 1 0,65 2(53 1) 50ln 0,7816;+− −µ = + = σ =Z Z , và 0,01− µ σ = = Z Z z u Vì gtth<u nên ở mức ý nghĩa α = 5%, giả thiết 0H được chấp nhận, nghĩa là tài liệu được chấp nhận (ở mức ý nghĩa α = 5%).

Các file đính kèm theo tài liệu này:

  • pdfbai_tap_mon_xac_suat_thong_ke.pdf