Giáo trình Xác suất thống kê - Nguyễn Thị Thu Thủy

Bài tập 4.26. Mở thử 200 hộp của kho đồ hộp thấy có 10 hộp bị biến chất. Với độ tin cậy 95% hãy ước lượng tỷ lệ hộp bị biến chất tối đa của kho. Bài tập 4.27. Chọn ngẫu nhiên ra 1000 trường hợp điều trị bệnh ung thư phổi, các bác sĩ thống kê thấy có 823 bệnh nhân bị chết trong vòng 10 năm. (a) Ước lượng khoảng cho tỷ lệ tử vong của bệnh nhân điều trị bệnh ung thư phổi với độ tin cậy 99%. (b) Cần phải lấy số lượng mẫu là bao nhiêu để với độ tin cậy 95% các sai số khi dự đoán tỷ lệ bệnh nhân điều trị ung thư phổi tử vong 10 năm là ít hơn 0,03? Bài tập 4.28. Cần phải lập một mẫu ngẫu nhiên với kích thước là bao nhiêu để tỷ lệ phế phẩm của mẫu là 0,2 và độ dài khoảng tin cậy đối xứng là 0,05 và độ tin cậy của ước lượng là 95%. Bài tập 4.29. Làm cách nào để ước lượng số thú hiếm trong một khu rừng với độ tin cậy 95%. Bài tập 4.30. Nghiên cứu về năng suất của loại hoa màu A, người ta kiểm tra năng suất của 64 điểm trồng loại hoa màu này thu được bảng số liệu

pdf194 trang | Chia sẻ: hachi492 | Ngày: 05/01/2022 | Lượt xem: 924 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Giáo trình Xác suất thống kê - Nguyễn Thị Thu Thủy, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
độ chệch. Ta mong muốn tìm được ước lượng sao cho sai số bình phương trung bình MSE(G) = E(G− θ)2 nhỏ nhất có thể. Tuy nhiên trong nhiều trường hợp tìm ước lượng thỏa mãn điều kiện này khá khó. Lưu ý rằng E(G− θ)2 = [E(G)− θ]2 +V(G) = (Độ chệch)2 +V(G). Vì vậy ta thường chỉ tìm ước lượng tốt nhất trong các ước lượng không chệch tức là ước lượng không chệch có phương sai V(G) nhỏ nhất trong các ước lượng không chệch. Ước lượng đó gọi là ước lượng hiệu quả. Khi ta không biết ước lượng hiệu quả có tồn tại hay không thì để so sánh các ước lượng không chệch ta sẽ so sánh độ lệch tiêu chuẩn hay phương sai của chúng. Ước lượng không chệch có độ lệch tiêu chuẩn hay phương sai nhỏ hơn sẽ "tốt hơn". Độ lệch tiêu chuẩn của ước lượng điểm G, ký hiệu là σG được gọi là sai số tiêu chuẩn (standard error). Ước lượng điểm của sai số tiêu chuẩn được ký hiệu là σˆG. Tổng quát hơn để so sánh hai ước lượng điểm G1 và G2 cho tham số θ bất kỳ, ta so sánh sai số bình phương trung bình, 4.2. Ước lượng điểm 166 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST ước lượng nào có sai số bình phương trung bình bé hơn là ước lượng tốt hơn. Tức là nếu độ hiệu quả tương đối MSE(G1) MSE(G2) nhỏ hơn 1 thì ta kết luận rằng ước lượng G1 hiệu quả hơn ước lượng G2. Để xét xem ước lượng không chệch G có phải là ước lượng hiệu quả của θ hay không ta cần phải tìm một cận dưới của phương sai của các ước lượng không chệch và so sánh phương sai của G với cận dưới này. Điều này được giải quyết bằng bất đẳng thức Cramer–Rao phát biểu như sau. Định lý 4.1. Cho mẫu ngẫu nhiên WX = (X1,X2, . . . ,Xn) được lấy từ tổng thể có dấu hiệu nghiên cứu được mô hình hóa bởi biến ngẫu nhiên X mà hàm mật độ xác suất f (X, θ) hay hàm phân phối xác suất F(X, θ) thỏa mãn một số điều kiện nhất định (thường được thỏa mãn trong thực tế) và θˆ là ước lượng không chệch bất kỳ của θ thì V(G) ≥ 1 nE ( ∂(ln f (X,θ)) ∂θ )2 (4.28) 4.2.2 Ước lượng điểm cho một số tham số thông dụng (a) Ước lượng điểm cho kỳ vọng hay giá trị trung bình: Giả sử X là biến ngẫu nhiên với kỳ vọng E(X) = µ chưa biết, µ được xem là trung bình của tổng thể. Từ X ta lập mẫu ngẫu nhiênWX = (X1,X2, . . . ,Xn) cỡ n. Chọn X = 1 n n ∑ i=1 Xi làm ước lượng điểm cho kỳ vọng E(X) = µ. Ước lượng điểm X thỏa mãn cả ba tính chất tốt đã nêu ở trên: không chệch, vững và hiệu quả. Khi ta có một mẫu cụ thểWX = (x1, x2, . . . , xn) thì x = 1 n n ∑ i=1 xi là một ước lượng điểm của µ. (b) Ước lượng điểm cho phương sai: Giả sử X là biến ngẫu nhiên với phương sai V(X) = σ2 chưa biết, σ2 được xem là phương sai của tổng thể. Nếu ta có một mẫu ngẫu nhiên WX = (X1,X2, . . . ,Xn) cỡ n của X thì xuất phát từ công thức tính phương sai, đại lượng Sˆ2 = 1 n n ∑ i=1 ( Xi − X )2 4.2. Ước lượng điểm 167 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST được xem xét để dùng làm ước lượng cho σ2. Tuy nhiên không khó để chỉ ra rằng E(Sˆ2) = n− 1 n σ2 nghĩa là Sˆ2 là một ước lượng chệch của σ2. Để thu được ước lượng không chệch cho σ2 ta "hiệu chỉnh" đại lượng này một chút bằng cách đặt S2 = 1 n− 1 n ∑ i=1 ( Xi − X )2 = n n− 1 Sˆ 2. Đại lượng S2 (chính là phương sai hiệu chỉnh mẫu ngẫu nhiên) là ước lượng không chệch cho σ2. Người ta đã chứng minh được rằng cả Sˆ2 và S2 đều là ước lượng vững cho σ2. Như vậy ước lượng tốt cho σ2 là S2. Khi có mẫu cụ thểWX = (x1, x2, . . . , xn) ta tính được các giá trị cụ thể của Sˆ2 và S2, ký hiệu là sˆ2 và s2: sˆ2 = 1 n n ∑ i=1 ( xi − x )2 ; s2 = 1 n− 1 n ∑ i=1 ( xi − x )2 = n n− 1 sˆ 2. đây là các ước lượng điểm của σ2. Ví dụ 4.11. Chỉ số IQ của 10 sinh viên được cho như sau: 87, 81, 88, 85, 100, 90, 114, 93, 86, 98 1. Ước lượng điểm cho chỉ số IQ trung bình là trung bình mẫu x = 92, 2. 2. Ước lượng điểm cho độ lệch tiêu chuẩn σ của chỉ số IQ là độ lệch tiêu chuẩn hiệu chỉnh mẫu s = 9, 64. 3. Sai số tiêu chuẩn của trung bình mẫu là σx = σ/ √ n, trong đó n = 10 là cỡ mẫu. Ước lượng điểm cho sai số tiêu chuẩn của trung bình mẫu là σˆx = s√ n = 9, 64√ 10 = 3, 05. Nếu ta dùng µˆ = x1 + x2 2 như một ước lượng điểm cho chỉ số IQ trung bình thì sai số tiêu chuẩn là σµˆ = σ/ √ 2 và ước lượng điểm cho sai số tiêu chuẩn này là σˆµ = s√ 2 = 9, 64√ 2 = 6, 81. Rõ ràng ước lượng µˆ không hiệu quả bằng ước lượng x. (c) Ước lượng điểm cho tỷ lệ: Cho p là một tỷ lệ hay xác suất của một sự kiện A trong tổng thể chưa biết. Ta thực hiện n quan sát độc lập và gọi m là số lần xuất hiện A. Khi đó tần suất mẫu f = m n là ước lượng điểm cho p. Người ta chứng minh được rằng ước lượng này có cả ba tính chất tốt đã nêu ở trên: không chệch, vững và hiệu quả. 4.2. Ước lượng điểm 168 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Ví dụ 4.12. Trong đợt vận động bầu cử tổng thống người ta phỏng vấn ngẫu nhiên 1600 cử tri thì được biết 960 người sẽ bỏ phiếu cho ứng cử viên A. Hãy chỉ ra ước lượng điểm cho tỷ lệ phiếu thực mà ứng cử viên A sẽ thu được. Lời giải Ví dụ 4.12 Ước lượng điểm cần tìm là f = 960 1600 = 0, 6 = 60%. 4.2.3 Phương pháp ước lượng hợp lý cực đại (maximum-likelihood esti- mation) Giả sử ta đã biết quy luật phân phối xác suất dạng tổng quát của biến ngẫu nhiên X, chẳng hạn hàm mật độ xác suất fX(x, θ) (có thể hiểu fX(x, θ) là công thức xác suất nếu X rời rạc). Cần ước lượng tham số θ của X ta lập mẫu cụ thểWx = (x1, x2, . . . , xn). Hàm của đối số θ L ( x1, x2, . . . , xn, θ ) = fX(x1, θ) fX(x2, θ) . . . fX(xn, θ) (4.29) và gọi là hàm số hợp lý của tham số θ. Giá trị của hàm hợp lý chính là xác suất hay mật độ xác suất tại điểmWx = (x1, x2, . . . , xn). Giá trị g = g(x1, x2, . . . , xn) được gọi là ước lượng hợp lý cực đại của θ nếu ứng với giá trị này của θ hàm hợp lý đạt cực đại. Do hàm L và hàm ln L đạt cực đại tại cùng một giá trị của θ nên ta có thể tìm giá trị của θ để ln L đạt cực đại theo các bước sau. 1. Tìm đạo hàm bậc nhất của hàm ln L theo θ. 2. Lập phương trình d ln L dθ = 0. Phương trình này gọi là phương trình hợp lý. Giả sử nó có nghiệm θ = g = g(x1, x2, . . . , xn). 3. Tìm đạo hàm bậc hai d2 ln L dθ2 . Nếu tại điểm θ = g đạo hàm bậc hai âm thì tại điểm này hàm ln L đạt cực đại. Do đó g = g(x1, x2, . . . , xn) là ước lượng điểm hợp lý tối đa cần tìm. Ví dụ 4.13. Bằng phương pháp hợp lý cực đại ta tìm được ước lượng của tham số p trong quy luật phân phối nhị thức B(n; p) là xn và ước lượng của tham số λ trong quy luật phân phối Poisson là 1x . (Phần chứng minh xem như bài tập). Ví dụ 4.14. Tìm ước lượng hợp lý cực đại của các tham số µ và σ của biến ngẫu nhiên tuân theo quy luật phân phối chuẩn N (µ; σ2). Lời giải Ví dụ 4.14 Dễ thấy hàm hợp lý có dạng L = 1 (σ √ 2pi)n e− 1 2σ2 ∑ni=1(xi−µ)2 . 4.2. Ước lượng điểm 169 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Lập hệ phương trình hợp lý  d ln L dµ = 0, d ln L dσ = 0. Giải hệ này ta nhận được µ = x và σ = s. Chú ý 4.2. Đối số của hàm hợp lý là θ chứ không phải x1, x2, . . . , xn. Do vậy nếu thay giá trị mẫu cụ thểWx = (x1, x2, . . . , xn) bằng mẫu ngẫu nhiênWX = (X1,X2, . . . ,Xn) thì kết quả và chứng minh trên vẫn đúng. Do đó ta thu được kết quả tổng quát hơn. Chẳng hạn, nếu X tuân theo quy luật phân phối chuẩn thì ước lượng hợp lý của µ là X và ước lượng hợp lý của σ là S. Ngoài ra còn các phương pháp Bayes, phương pháp minimax, phương pháp bootstrap . . . Các phương pháp này tìm ước lượng điểm cũng như các tiêu chuẩn để kiểm tra các tính chất tốt của một ước lượng điểm nằm ngoài phạm vi của bài học. 4.2. Ước lượng điểm 170 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST BÀI 12 (2 tiết) 4.3 Ước lượng khoảng Phương pháp ước lượng điểm nói trên có nhược điểm là khi kích thước mẫu bé thì ước lượng điểm có thể sai lệch rất nhiều so với giá trị của tham số cần ước lượng. Mặt khác phương pháp trên cũng không thể đánh giá được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Do đó khi kích thước mẫu bé người ta thường dùng phương pháp ước lượng khoảng tin cậy cho trường hợp một tham số. Khái niệm ước lượng khoảng Giả sử chưa biết đặc trưng θ nào đó của biến ngẫu nhiên X. Ước lượng khoảng của θ là chỉ ra một khoảng số (g1, g2) nào đó chứa θ, tức là có thể ước lượng g1 < θ < g2. Phương pháp khoảng ước lượng tin cậy Để ước lượng tham số θ của biến ngẫu nhiên X, từ biến ngẫu nhiên này ta lập mẫu ngẫu nhiên WX = (X1,X2, . . . ,Xn) cỡ n. Chọn thống kê G(X, θ) sao cho mặc dù chưa biết giá trị của θ, quy luật phân phối xác suất của G vẫn hoàn toàn xác định. Do đó, với xác suất α khá bé ta tìm được P(G1 < θ < G2) = 1− α. Vì α khá bé, nên γ = 1− α khá lớn (thông thường yêu cầu 1− α = γ ≥ 0, 95 để có thể áp dụng nguyên lý xác suất lớn cho sự kiện (G1 < θ < G2)). Khi đó, sự kiện (G1 < θ < G2) hầu như chắc chắn xảy ra trong một phép thử. Thực hiện một phép thử đối với mẫu ngẫu nhiênWX ta thu được mẫu cụ thểWx = (x1, x2, . . . , xn), từ đó tính được các giá trị của G1,G2, ký hiệu là g1, g2. Như vậy có thể kết luận: với độ tin cậy 1− α = γ tham số θ nằm trong khoảng (g1, g2). (a) (G1,G2) được gọi là khoảng tin cậy của θ với độ tin cậy γ = 1− α. (b) 1− α = γ được gọi là độ tin cậy của ước lượng. (c) I = G2 − G1 được gọi là độ dài khoảng tin cậy. Các cận G1 và G2 phụ thuộc vào mẫu ngẫu nhiên WX = (X1,X2, . . . ,Xn) nên chúng là các biến ngẫu nhiên. Ta thường mong muốn tìm được các khoảng tin cậy có hai tính chất sau: 1. Có độ tin cậy cao. 2. Độ dài khoảng tin cậy nhỏ, tức là hiệu G2 − G1 bé. Đôi khi ta chỉ quan tâm đến giá trị lớn nhất hay giá trị nhỏ nhất của tham số. Ví dụ ta xét hai kết luận sau: 4.3. Ước lượng khoảng 171 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST 1. Với xác suất 95% thì chiều cao trung bình của người Việt Nam nhỏ hơn 168cm. 2. Với xác suất 95%, chiều cao trung bình của sinh viên Đại học Bách khoa Hà Nội lớn hơn 165cm. Ở kết luận thứ nhất, với độ tin cậy 95% thì chiều cao trung bình của người Việt Nam nằm trong khoảng (0; 168) và ta chỉ quan tâm đến giá trị lớn nhất. Ở kết luận thứ hai, với độ tin cậy 95% thì chiều cao trung bình của sinh viên Đại học Bách khoaHàNội thuộc khoảng (165;+∞) và ta chỉ quan tâm đến giá trị nhỏ nhất. Các khoảng tin cậy dạng này được gọi là khoảng tin cậy một phía. Khoảng tin cậy mà chỉ quan tâm đến cận trên được gọi là khoảng tin cậy lớn nhất hay khoảng tin cậy trái còn khoảng tin cậy mà chỉ quan tâm tới cận dưới được gọi là khoảng tin cậy nhỏ nhất hay khoảng tin cậy phải. Khoảng tin cậy mà ta quan tâm tới cả hai cận (trên và dưới) được gọi là khoảng tin cậy hai phía (đôi khi gọi là khoảng tin cậy đối xứng vì các cận trên, cận dưới thường đối xứng qua ước lượng điểm của tham số). Dưới đây là các khoảng tin cậy cho kỳ vọng hay giá trị trung bình, phương sai và tỷ lệ hay xác suất. 4.3.1 Khoảng tin cậy cho kỳ vọng Bài toán 4.1. Giả sử biến ngẫu nhiên X có kỳ vọng E(X) = µ và phương sai V(X) = σ2, trong đó E(X) = µ chưa biết. Bài toán đặt ra là tìm ước lượng khoảng cho µ dựa trên các quan sát Wx = (x1, x2, . . . , xn). Từ tổng thể, ta lập mẫu ngẫu nhiênWX = (X1,X2, . . . ,Xn) và xét các trường hợp sau. Trường hợp phân phối chuẩn, phương sai đã biết Giả sử X ∼ N (µ; σ2) với σ2 đã biết. Khi đó X = 1 n ∑ n i=1 Xi là biến ngẫu nhiên có phân phối chuẩn với kỳ vọng E(X) = µ và phương sai V(X) = σ2 n .Do đó U = X− µ σ √ n (4.30) có phân phối chuẩn tắc N (0; 1). Chọn cặp số không âm α1, α2 thỏa mãn α1 + α2 = α, tìm các phân vị chuẩn tắc uα1 , u1−α2 sao cho P(U < uα1) = α1; P(U < u1−α2) = 1− α2. Do tính chất của phân phối chuẩn tắc uα1 = −u1−α1 , suy ra P(−u1−α1 < U < u1−α2) = P(uα1 < U < u1−α2) = P(U < u1−α2)− P(U < uα1) = 1− α2 − α1 = 1− α. 4.3. Ước lượng khoảng 172 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Như vậy, 1− α = P(−u1−α1 < U < u1−α2) = P ( − u1−α1 < X− µ σ √ n < u1−α2 ) . Hay 1− α = P ( X− u1−α2 σ√ n < µ < X+ u1−α1 σ√ n ) . Khi có mẫu cụ thểWX = (x1, x2, . . . , xn), tính được giá trị cụ thể x của X, khi đó khoảng tin cậy cho µ với độ tin cậy γ = 1− α là:( x− u1−α2 σ√ n ; x+ u1−α1 σ√ n ) (4.31) Như vậy, với độ tin cậy γ = 1− α cho trước, có vô số khoảng tin cậy cho µ vì có vô số cặp α1, α2 thỏa mãn α1 + α2 = α. Ở đây ta chỉ xét một số trường hợp đặc biệt. (a) Khoảng tin cậy hai phía (đối xứng) (α1 = α2 = α/2)( x− u1− α2 σ√ n ; x+ u1− α2 σ√ n ) (4.32) trong đó u1− α2 được tra từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ thức Φ(u1− α2 ) = 1− α 2 (4.33) hoặc tra từ bảng giá trị hàm Laplace (Phụ lục 2) từ hệ thức φ(u1− α2 ) = 1− α 2 (4.34) (b) Khoảng tin cậy trái (α1 = α, α2 = 0):( −∞ ; x+ u1−α σ√n ) (4.35) trong đó u1−α được tra từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ thức Φ(u1−α) = 1− α . (4.36) hoặc tra từ bảng giá trị hàm Laplace (Phụ lục 2) từ hệ thức φ(u1−α) = 1− 2α 2 . (4.37) (c) Khoảng tin cậy phải (α1 = 0, α2 = α):( x− u1−α σ√n ; +∞ ) (4.38) 4.3. Ước lượng khoảng 173 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Ví dụ 4.15. Trọng lượng của một loại sản phẩm là biến ngẫu nhiên tuân theo luật phân phối chuẩn với độ lệch tiêu chuẩn là 6 gam. Cân thử 36 sản phẩm loại này ta thu được kết quả sau: 177 165 152 174 159 166 160 152 162 175 158 169 166 162 181 168 170 150 173 164 167 177 167 175 165 182 166 158 166 170 168 165 160 160 169 166 1. Với độ tin cậy 1− α = 95%, hãy tìm khoảng tin cậy đối xứng của trọng lượng trung bình của loại sản phẩm nói trên. 2. Có thể khẳng định trọng lượng trung bình của sản phẩm ít nhất là bao nhiêu với độ tin cậy 99%. 3. Với độ tin cậy 99% hãy tìm khoảng tin cậy cho trọng lượng trung bình của sản phẩm. Lời giải Ví dụ 4.15 Gọi X là trọng lượng sản phẩm, X ∼ N (µ, σ2) với σ = 6. Trọng lượng trung bình của sản phẩm là E(X) = µ chưa biết cần ước lượng. 1. Đây là bài toán ước lượng bằng khoảng tin cậy đối xứng cho kỳ vọng E(X) = µ của tổng thể có phân phối chuẩn khi đã biết phương sai với σ = 6. • Chọn thống kê U = X− µ σ √ n. Thống kê U ∼ N (0; 1). • Với α = 0, 05, Φ(u1− α2 ) = Φ(u0,975) = 0, 975, tra bảng giá trị hàm phân phối chuẩn tắc nhận được u0,975 = 1, 96. • Từ số liệu đã cho ta có cỡ mẫu n = 36, trung bình mẫu x = 166, 22 (gam), suy ra khoảng tin cậy 95% cho trọng lượng trung bình là( x− u1− α2 σ√ n ; x+ u1− α2 σ√ n ) = ( 166, 22− 1, 96× 6√ 36 166, 22+ 1, 96× 6√ 36 ) hay (164, 26 < µ < 168, 18). • Vậy với độ tin cậy 95%, trọng lượng trung bình của loại sản phẩm nói trên từ 164,26 gam đến 168,18 gam. 2. Với độ tin cậy γ = 99% suy ra α = 0, 01, Φ(u1−α) = Φ(u0,99) = 0, 99, tra bảng giá trị hàm phân phối chuẩn tắc nhận được u0,99 = 2, 33 (xem Hình 4.4). Giá trị bé nhất cho trọng lượng trung bình là x− u1−α σ√n = 166, 22− 2, 33 6√ 36 = 163, 89. Tức là với xác suất 99% ta có thể khẳng định trọng lượng trung bình của sản phẩm lớn hơn 163,89 gam. 4.3. Ước lượng khoảng 174 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Hình 4.4: Giá trị của u1−α với độ tin cậy 99% 3. Ta có u1− α2 = 2, 58 (xem Hình 4.5) nên khoảng tin cậy cho trọng lượng trung bình của sản phẩm với độ tin cậy 99% là = ( 166, 22− 2, 58× 6√ 36 166, 22+ 2, 58× 6√ 36 ) = (163, 64 ; 168, 80). Như vậy, trên cùng một mẫu nếu độ tin cậy càng lớn thì độ dài của khoảng tin cậy càng lớn. Hình 4.5: Giá trị của u1− α2 với độ tin cậy 99% Chú ý 4.3. 1. Chú ý rằng không thể viết P(164, 26 < µ < 168, 18) = 0, 95 vì độ tin cậy gắn với khoảng tin cậy ngẫu nhiên chứ không gắn với mẫu cụ thể. Hơn nữa vì µ là một hằng số nên nó chỉ có thể thuộc hoặc không thuộc khoảng (164,26; 168,18) nên (164, 26 < µ < 168, 18) không phải là sự kiện ngẫu nhiên. 2. Ta có thể xác định u1− α2 = 1, 96 ở ý Ví dụ 4.15(1) từ bảng giá trị hàm Laplace (Phụ lục 2) từ hệ thức φ(u1−α) = 1− α 2 . Trong phần tiếp theo ta chỉ đưa ra công thức áp dụng. Trường hợp phân phối chuẩn, phương sai chưa biết Trong nhiều bài toán thực tế ta không biết phương sai của tổng thể. Với giả thiết dữ liệu tuân theo phân phối chuẩn thì người ta đã chứng minh được rằng thống kê T = X− µ S √ n (4.39) 4.3. Ước lượng khoảng 175 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST có phân phối Student với n− 1 bậc tự do, T ∼ t(n− 1). Bằng phương pháp tương tự như đã trình bày ở trên, ta có thể tìm được các khoảng tin cậy cho kỳ vọng E(X) = µ với độ tin cậy γ = 1− α. (a) Khoảng tin cậy hai phía (đối xứng)( x− t(n−1)1− α2 s√ n ; x+ t(n−1)1− α2 s√ n ) (4.40) (b) Khoảng tin cậy trái ( −∞ ; x+ t(n−1)1−α s√ n ) (4.41) (c) Khoảng tin cậy phải ( x− t(n−1)1−α s√ n ; +∞ ) (4.42) trong đó t(n−1)1− α2 , t (n−1) 1−α được tra từ bảng phân phối Student với n− 1 bậc tự do (Phụ lục 4). Ví dụ 4.16. Để kiểm tra sự chính xác của hệ thống đóng gói tự động các bao gạo khi xuất khẩu tại một nhà máy, người ta đã chọn ngẫu nhiên 16 bao và tính được trọng lượng trung bình là 49,75 kg và độ lệch tiêu chuẩn hiệu chỉnh mẫu là 0,5 kg. Giả thiết rằng trọng lượng của những bao gạo có phân phối chuẩn. 1. Tìm khoảng tin cậy cho trọng lượng trung bình của bao gạo với độ tin cậy 95%. 2. Với độ tin cậy 95% có thể khẳng định trọng lượng trung bình của bao gạo cao nhất là bao nhiêu? Dựa trên kết quả thu được có thể khẳng định về trung bình các bao gạo đã bị đóng thiếu hay không nếu biết rằng trọng lượng chuẩn mỗi bao là 50 kg. Lời giải Ví dụ 4.16 Gọi X là trọng lượng các bao gạo được đóng gói tự động, X ∼ N (µ, σ2). Trọng lượng trung bình là E(X) = µ chưa biết, cần ước lượng. 1. Đây là bài toán ước lượng bằng khoảng tin cậy đối xứng cho kỳ vọng E(X) = µ của tổng thể có phân phối chuẩn khi chưa biết phương sai. • Chọn thống kê T = X− µ S √ n. Thống kê T có phân phối Student, T ∼ t(n−1). • Với độ tin cậy 99% suy ra α = 0, 05, t(n−1)1− α2 = t (15) 0,975 = 2, 13, tra bảng phân phối Student (Phụ lục 4). 4.3. Ước lượng khoảng 176 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST • Ta có n = 16, x = 49, 75, s = 0, 5, suy ra khoảng tin cậy 95% cho trọng lượng trung bình là( x− t(n−1)1−α s√ n ; +∞ ) = ( 49, 75− 2, 13× 0, 5√ 16 49, 75+ 2, 13× 0, 5√ 16 ) hay (49, 48 < µ < 50, 02). • Vậy với độ tin cậy 95%, ta có thể khẳng định trọng lượng trung bình của các bao gạo nói trên từ 49,48 kg đến 50,02 kg. 2. Đây là bài toán ước lượng bằng khoảng tin cậy một phía cho kỳ vọng E(X) = µ của tổng thể có phân phối chuẩn khi chưa biết phương sai. • Với độ tin cậy 95% suy ra t(n−1)1−α = t (15) 0,95 = 1, 75, tra bảng phân phối Student (Phụ lục 4). • Khoảng tin cậy lớn nhất cho lượng trung bình là( 0; x+ t(n−1)1−α s√ n ) = (0; 49, 75+ 1, 75 0, 5√ 16 ) = (0; 49, 97). • Với độ tin cậy 95% giá trị lớn nhất cho trọng lượng trung bình của các bao gạo là 49,97 kg. Ta có thể khẳng định về trung bình các bao gạo đã bị đóng thiếu. Trường hợp mẫu cỡ lớn (n ≥ 30) Khi mẫu cỡ n lớn, trung bình mẫu ngẫu nhiên X có phân phối xấp xỉ phân phối chuẩn với trung bình µ và phương sai σ2/n do đó thống kê U = X− µ σ √ n ∼ N (0, 1) (4.43) Cũng do n lớn nên ta có thể xấp xỉ σ (chưa biết) bởi S do đó thống kê U = X− µ S √ n ∼ N (0, 1) (4.44) Trong thực hành cho phép vận dụng với n ≥ 30. Các lập luận như đã trình bày ở trên, các khoảng tin cậy cho µ là: (a) Khoảng tin cậy hai phía (đối xứng)( x− u1− α2 s√ n ; x+ u1− α2 s√ n ) (4.45) 4.3. Ước lượng khoảng 177 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST (b) Khoảng tin cậy trái ( −∞ ; x+ u1−α s√n ) (4.46) (c) Khoảng tin cậy phải ( x− u1−α s√n ; +∞ ) (4.47) Ví dụ 4.17. Để ước lượng trọng lượng trung bình của loại trái cây A tại một vùng, người ta thu hoạch ngẫu nhiên 100 trái cây A của vùng đó và thu được kết quả sau Trọng lượng (gam) 40-42 42-44 44-46 46-48 48-50 50-52 Số trái 7 13 25 35 15 5 Hãy ước lượng trọng lượng trung bình của loại trái cây A trong vùng bằng khoảng tin cậy đối xứng với độ tin cậy 95%. Cho biết trọng lượng loại trái cây A là biến ngẫu nhiên tuân theo luật phân phối chuẩn. Lời giải Ví dụ 4.17 Gọi X là trọng lượng loại trái cây A, X ∼ N (µ, σ2). Trọng lượng trung bình của loại trái cây A là E(X) = µ chưa biết, cần ước lượng. Đây là bài toán ước lượng khoảng của kỳ vọng của biến ngẫu nhiên phân phối chuẩn trường hợp chưa biết phương sai, mẫu cỡ n = 100 > 30. • Chọn thống kê U = X− µ S √ n. Vì n = 100 > 30 nên thống kê U ∼ N (0, 1). • Khoảng tin cậy đối xứng cho E(X) = µ là ( x− u1− α2 s√ n ; x+ u1− α2 s√ n ) trong đó, với α = 0, 05, u1− α2 = u0,975 = 1, 96 được tra từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3). • Từ số liệu đã cho tính được n = 100, x = 46, 06, s = 2, 48. Suy ra khoảng tin cậy đối xứng của µ là ( 46, 06− 1, 96× 2, 48√ 100 ; 46, 06+ 1, 96× 2, 48√ 100 ) hay (45, 573 ; 46, 546). • Vậy với độ tin cậy 95%, trọng lượng trung bình của loại trái cây A ở vùng trên từ 45,573 gam đến 46,546 gam. 4.3.2 Khoảng tin cậy cho phương sai (đọc thêm) Bài toán 4.2. Giả sử X là biến ngẫu nhiên có phân phối chuẩn, X ∼ N (µ; σ2), với phương sai V(X) = σ2 chưa biết. Hãy ước lượng khoảng cho phương sai σ2 dựa trên số liệu quan sát Wx = (x1, x2, . . . , xn). Lập một mẫu ngẫu nhiênWX = (X1,X2, . . . ,Xn) kích thước n và xét các trường hợp sau. 4.3. Ước lượng khoảng 178 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Trường hợp kỳ vọng chưa biết Người ta đã chứng minh được rằng thống kê χ2 = (n− 1)S2 σ2 (4.48) là biến ngẫu nhiên có phân phối khi bình phương với (n− 1) bậc tự do, χ2(n− 1). Chọn cặp số không âm α1, α2 thỏamãn α1+ α2 = α, tìm các phân vị P(χ2 < χ2(n−1,α1)) = α1; P(χ2 < χ2(n−1,1−α2)) = 1− α2. Từ đó suy ra P ( χ2(n−1,α1) < χ 2 < χ2(n−1,1−α2) ) = P ( χ2(n−1,α1) < (n− 1)S2 σ2 < χ2(n−1,1−α2) ) = 1− α, hay tương đương với P ( (n− 1)S2 χ2 (n−1,1−α2) < σ2 < (n− 1)S2 χ2 (n−1,α1) ) = 1− α. Khi có mẫu cụ thểWX = (x1, x2, . . . , xn), tính được giá trị cụ thể s2 của S2, khi đó khoảng tin cậy cho σ2 với độ tin cậy γ = 1− α là:( (n− 1)s2 χ2 (n−1,1−α2) ; (n− 1)s2 χ2 (n−1,α1) ) (4.49) Ta xét một số trường hợp cụ thể của (4.49). (a) Khoảng tin cậy hai phía (α1 = α2 = α/2)( (n− 1)s2 χ2 (n−1,1−α/2) ; (n− 1)s2 χ2 (n−1,α/2) ) (4.50) (b) Khoảng tin cậy trái (α1 = α, α2 = 0):( 0 ; (n− 1)s2 χ2 (n−1,α) ) (4.51) (c) Khoảng tin cậy phải (α1 = 0, α2 = α):( (n− 1)s2 χ2 (n−1,1−α) ; +∞ ) (4.52) Chú ý 4.4. 1. Giá trị χ2(n−1,1−α/2), χ 2 (n−1,α/2), χ 2 (n−1,α) và χ 2 (n−1,1−α) được tra từ bảng phân phối khi bình phương với n− 1 bậc tự do (Phụ lục 6). 2. Lấy căn bậc hai các cận trong các khoảng tin cậy cho phương sai ta sẽ thu được các khoảng tin cậy cho các độ lệch chuẩn. 4.3. Ước lượng khoảng 179 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Trường hợp kỳ vọng đã biết Nếu kỳ vọng E(X) = µ0 đã biết, người ta đã chứng minh được rằng thống kê χ2 = ∑ni=1 ( Xi − µ0 )2 σ2 (4.53) là biến ngẫu nhiên có phân phối khi bình phương với n bậc tự do, χ2(n). Làm giống như trường hợp trên ta nhận được: (a) Khoảng tin cậy hai phía (∑ni=1 (xi − µ0)2 χ2 (n,1−α/2) ; ∑ni=1 ( xi − µ0 )2 χ2 (n,α/2) ) (4.54) (b) Khoảng tin cậy trái ( 0 ; ∑ni=1 ( xi − µ0 )2 χ2 (n,α) ) (4.55) (c) Khoảng tin cậy phải (∑ni=1 (xi − µ0)2 χ2 (n,1−α) ; +∞ ) (4.56) Ví dụ 4.18. Trọng lượng của một loại sản phẩm tuân theo luật phân phối chuẩn. Cân thử từng sản phẩm của một mẫu ngẫu nhiên gồm 25 đơn vị, ta nhận được kết quả sau: Trọng lượng sản phẩm (gam) 29,3 29,7 30 30,5 30,75 Số sản phẩm 4 5 8 5 3 Với độ tin cậy 95% hãy tìm khoảng tin cậy cho phương sai của trọng lượng sản phẩm trong hai trường hợp 1. Đã biết kỳ vọng E(X) = 30. 2. Không biết kỳ vọng. Lời giải Ví dụ 4.18 Gọi X là trọng lượng sản phẩm, X ∼ N (µ, σ2). Phương sai của trọng lượng sản phẩm là V(X) = σ2 chưa biết, cần ước lượng. Đây là bài toán ước lượng khoảng của phương sai của biến ngẫu nhiên phân phối chuẩn. 1. Trường hợp E(X) = 30 đã biết. 4.3. Ước lượng khoảng 180 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST • Chọn thống kê χ2 = ∑ n i=1(Xi − µ)2 σ2 . Thống kê χ2 có phân phối khi bình phương với n bậc tự do. • Với độ tin cậy 95% suy ra α = 0, 05, tra bảng phân phối khi bình phương (Phụ lục 5), χ2(n,1−α/2) = χ 2 (25;0,975) = 40, 65, χ 2 (n,α/2) = χ 2 (25;0,025) = 13, 12. • Từ số liệu đã cho tính được n = 25, ∑5i=1 ni(xi − 30)2 = 5, 13. Suy ra khoảng tin cậy cần tìm là ( ∑ni=1(xi − µ0)2 χ2 (n,1−α/2) ; ∑ n i=1(xi − µ0)2 χ2 (n,α/2) ) = ( 5, 13 40, 65 ; 5, 13 13, 12 ) hay (0, 1262 < σ2 < 0, 3910). • Vậy với độ tin cậy 95%, phương sai của trọng lượng sản phẩm từ 0,1262 đến 0,3910. 2. Trường hợp kỳ vọng chưa biết ta sử dụng thống kê χ2 = (n− 1)S2 σ2 ∼ χ2(n−1). Tra bảng phân phối khi bình phương với độ tin cậy 95% và bậc tư do n− 1 = 24 ta được χ2(n−1,1−α/2) = χ 2 (24;0,975) = 39, 36, χ 2 (n−1,α/2) = χ 2 (24;0,025) = 12, 40. Tính x = 1 25 ∑ 5 i=1 nixi = 30, 012, (n− 1)s2 = ∑5i=1 ni(xi − 30, 012)2 = 5, 1264. Vậy khoảng tin cậy cần tìm là ( ∑ni=1(xi − x)2 χ2 (n−1,1−α/2) ; ∑ n i=1(xi − x)2 χ2 (n−1,α/2) ) = ( 5, 1264 39, 36 ; 5, 1264 12, 40 ) hay (0, 1302 < σ2 < 0, 4134). Vậy với độ tin cậy 95% phương sai σ2 lớn hơn 0,1302 và nhỏ hơn 0,4134 hay độ lệch chuẩn σ nằm từ 0,3608 gam đến 0,6430 gam. 4.3.3 Khoảng tin cậy cho xác suất Bài toán 4.3. Ta xét một tổng thể mà mỗi cá thể hoặc có tính chất A hoặc không có tính chất A nào đó. Gọi p là tỷ lệ cá thể có tính chất A trong tổng thể. Thông thường p chưa biết. Dựa trên một mẫu được chọn ngẫu nhiên, hãy tìm khoảng tin cậy cho p với độ tin cậy γ = 1− α cho trước. Ta thực hiện n phép thử độc lập, cùng điều kiện. Gọi m là số cá thể có tính chất A trong n cá thể được chọn. Khi đó m là biến ngẫu nhiên có phân phối nhị thức B(n; p). Khi n lớn thì m có phân phối xấp xỉ phân phối chuẩn và do đó tần suất f = m n cũng có phân phối xấp xỉ phân phối chuẩn với trung bình E( f ) = p và phương sai V( f ) = p(1− p) n . Xấp xỉ này "tốt" 4.3. Ước lượng khoảng 181 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST nếu np > 5 và n(1− p) > 5. Tuy nhiên vì p chưa biết nên phương sai V( f ) chưa biết. Do f là ước lượng điểm tốt cho p nên phương sai V( f ) có thể được xấp xỉ bằng f (1− f ) n . Khi đó thống kê U = f − p√ f (1− f ) √ n (4.57) có phân phối xấp xỉ phân phối chuẩn tắc N (0; 1). Từ đó ta tìm được các khoảng tin cậy cho p khi có mẫu cụ thể là: (a) Khoảng tin cậy hai phía (đối xứng) ( f − u1− α2 f (1− f ) n ; f + u1− α2 f (1− f ) n ) (4.58) (b) Khoảng tin cậy trái ( 0 ; f + u1−α f (1− f ) n ) (4.59) (c) Khoảng tin cậy phải ( f − u1−α f (1− f ) n ; 1 ) (4.60) Chú ý 4.5. Vì p chưa biết nên ta không kiểm tra được điều kiện np > 5 và n(1− p) > 5. Trong thực hành ta dùng các điều kiện n f > 5 và n(1− f ) > 5. Ví dụ 4.19. Điều tra nhu cầu tiêu dùng loại hàng A trong 100 hộ gia đình ở khu dân cư B thấy 60 hộ gia đình có nhu cầu loại hàng trên. Với độ tin cậy 1− α = 95% hãy tìm khoảng tin cậy đối xứng của tỷ lệ hộ gia đình có nhu cầu loại hàng đó. Giả thích kết quả thu được. Lời giải Ví dụ 4.19 Gọi p là tỷ lệ hộ gia đình ở khu dân cư B có nhu cầu mặt hàng A. Kiểm tra điều kiện n f = 100× 0, 6 = 60 > 5 và n(1− f ) = 100× 0, 4 = 40 > 5. Đây là bài toán ước lượng khoảng của tỷ lệ trường hợp mẫu cỡ n đủ lớn. • Thống kê U = f − p√ f (1− f ) √ n có phân phối xấp xỉ phân phối chuẩn tắc N (0; 1). • Khoảng tin cậy đối xứng của xác suất p là( f − u1− α2 f (1− f ) n ; f + u1− α2 f (1− f ) n ) trong đó u1− α2 = u0,975 = 1, 96 được tra từ bảng giá trị hàm phân phối chuẩn tắc. 4.3. Ước lượng khoảng 182 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST • Với n = 100, m = 60, f = m n = 0, 6, suy ra khoảng tin cậy cần tìm là( 0, 6− 1, 96 0, 6× 0, 4 100 ; 0, 6− 1, 96 0, 6× 0, 4 100 ) = (0, 504 ; 0, 696). • Vậy tỷ lệ hộ gia đình ở khu dân cư B có nhu cầu loại hàng A là từ 50,4% đến 69,6% với độ tin cậy 95%. Vì mọi giá trị trong khoảng tin cậy này đều nhỏ hơn 70% nên ta cũng có thể khẳng định rằng có ít hơn 70% hộ gia đình có nhu cầu mặt hàng A. 4.3.4 Xác định kích thước mẫu Bài toán 4.4. Giả sử θ là một tham số của tổng thể và G = Gn(X1,X2, . . . ,Xn) là một ước lượng cho θ dựa trên mẫu ngẫu nhiênWX = (X1,X2, . . . ,Xn) có kích thước n. Cho trước số ε > 0 và γ ∈ (0; 1). Ta nói rằng Gn có độ chính xác (hay sai số) ε với độ tin cậy γ nếu P ( |θ − Gn| ≤ ε ) ≥ γ (4.61) Nếu kích thước mẫu n càng lớn thì độ chính xác của ước lượng càng cao, sai số càng nhỏ. Tuy nhiên kích thước mẫu càng lớn thì nhà nghiên cứu càng tốn nhiều thời gian, tiền bạc và công sức cho việc thu thập dữ liệu. Bài toán đặt ra là cần chọn kích thước mẫu tối thiểu là bao nhiêu để đủ đạt được độ chính xác mong muốn. Ta xét các trường hợp sau đây. (a) Trường hợp ước lượng cho giá trị trung bình Giả sử với độ tin cậy γ cho trước, ta muốn có ước lượng cho giá trị trung bình µ với sai số không quá ε. Trong trường hợp X có phân phối chuẩn và phương sai σ2 đã biết thì P ( |x− µ| ≤ u1−α/2 σ√n ) = γ (4.62) ở đây α = 1− γ. Do đó nếu n thỏa mãn u1−α/2 σ√ n ≤ ε hay tương đương với n ≥ σ 2(u1−α/2)2 ε2 (4.63) thì P ( |x− µ| ≤ ε ) ≥ P ( |x− µ| ≤ u1−α/2 σ√n ) = γ. 4.3. Ước lượng khoảng 183 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Ta sẽ chọn kích thước mẫu n là số nguyên dương bé nhất thỏa mãn điều kiện (4.63) thì sẽ đạt được độ chính xác (hay sai số) với độ tin cậy γmong muốn. Tuy nhiên công thức trên chỉ áp dụng được khi σ đã biết. Trong trường hợp X có phân phối chuẩn và phương sai chưa biết thì P ( |x− µ| ≤ t(n−1)1−α/2 s√ n ) = γ. Do đó nếu n thỏa mãn t(n−1)1−α/2 s√ n ≤ ε hay tương đương với n ≥ s 2(t(n−1)1−α/2) 2 ε2 (4.64) thì ta sẽ có P ( |x− µ| ≤ ε ) ≥ γ. Ta không thể tìm n thỏa mãn (4.64) vì cả s và t(n−1)1−α/2 đều phụ thuộc vào n. Tuy nhiên, nhìn vào bảng phân phối Student ta thấy khi số bậc tự do lớn thì các phân vị của phân phối Student t(n−1)1−α/2 và các phân vị của phân phối chuẩn tắc u1−α/2 gần như nhau, vì vậy ta có thể chọn n thỏa mãn n ≥ s 2(u1−α/2)2 ε2 (4.65) Như vậy, nếu tìm được ước lượng cho s thì ta sẽ tìm được n từ bất đẳng thức này. Người ta thường lấy một mẫu sơ bộ cỡ mẫu n đủ lớn (n ≥ 30) để tính s rồi sau đó tìm n từ bất đẳng thức (4.65). Ví dụ 4.20. Ta muốn xây dựng một ước lượng với độ tin cậy 95% và độ chính xác 2 dặm cho vận tốc trung bình của ô tô trên đường cao tốc. Một mẫu điều tra sơ bộ với cỡ mẫu 50 cho ta s = 9 dặm. Hỏi cần lấy mẫu cỡ tối thiểu là bao nhiêu để đạt được độ chính xác và độ tin cậy đã đặt ra. Lời giải Ví dụ 4.20 Ta có ε = 2, s = 9, γ = 95% nên u1−α/2 = 1, 96. Từ bất đẳng thức (4.65) ta có n ≥ s 2(u1−α/2)2 ε2 = 92(1, 96)2 22 = 77, 79. Nghĩa là ta phải lấy cỡ mẫu ít nhất là 78. Tuy nhiên vì ta đã có mẫu sơ bộ với cỡ 50, nên thực ra ta chỉ cần bổ sung thêm 28 quan sát nữa. Chú ý 4.6. 1. Việc lấy mẫu sơ bộ để tìm s là hợp lý vì ta biết rằng s là ước lượng vững cho σ, nghĩa là s hội tụ đến σ khi n → ∞, do đó khi n lớn thì các giá trị của s khá "ổn định" và "gần" σ. 4.3. Ước lượng khoảng 184 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST 2. Trong ví dụ trên, phương sai của tổng thể dữ liệu được ước lượng thông qua độ phân tán củamẫu sơ bộ. Ta cũng có thể ước lượng phương sai của tổng thể dữ liệu theo những cách khác. Ví dụ 4.21. Ta muốn ước lượng số năm đi học của những người trưởng thành trong một vùng với độ tin cậy 95% và độ chính xác không quá 1 năm thì cần lấy mẫu tối thiểu là bao nhiêu? Lời giải Ví dụ 4.21 Ta có ε = 1, γ = 95% nên u1−α/2 = 1, 96. Để ước lượng phương sai của tổng thể dữ liệu, ta nhận thấy rằng số năm học dao động từ ) đến 18. Nếu phân phối của số năm đi học là phân phối chuẩn thì hầu hết các giá trị quan sát sẽ thuộc khoảng (µ− 3σ; µ+ 3σ). Khoảng này có độ dài 6σ do đó ta dùng ước lượng 6σ = 18 hay σ = 3. Từ đó ta tìm được n ≥ 3 2(1, 96)2 12 = 35. Ta cũng có thể đoán rằng số năm học không thể quá 24 và do đó độ lệch tiêu chuẩn σ không thể quá 4 để có ước lượng thô về σ từ đó tìm n. (b) Trường hợp ước lượng cho tỷ lệ Ta xét một tổng thể mà mỗi cá thể hoặc có tính chất A hoặc không có tính chất A nào đó. Gọi p là tỷ lệ cá thể có tính chất A trong tổng thể. Thông thường p chưa biết. Giả sử trên một mẫu ngẫu nhiên cỡ n có m cá thể có tính chất A. Khi đó tần suất fn = m n có phân phối xấp xỉ phân phối chuẩn với trung bình là p và phương sai p(1− p) n . Do đó P ( | fn − p| ≤ u1−α/2 √ p(1− p)√ n ) = γ (4.66) ở đây α = 1− γ. Do đó nếu n thỏa mãn u1−α/2 √ p(1− p)√ n ≤ ε hay tương đương với n ≥ (u1−α/2) 2p(1− p) ε2 (4.67) thì P ( | fn − p| ≤ ε ) ≥ γ. Như vậy ta cần lấy n là số nguyên dương nhỏ nhất thỏa mãn (4.67). Tuy nhiên, vì giá trị của p chưa biết, nên vế phải của (4.67) chưa xác định. Có hai cách để khắc phục tình trạng này. 4.3. Ước lượng khoảng 185 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST 1. Cách thứ nhất là lấy một mẫu sơ bộ kích thước k để thu được tần suất fk và lấy fk làm ước lượng ban đầu cho p. Khi đó bất đẳng thức (4.67) trở thành n ≥ (u1−α/2) 2 fk(1− fk) ε2 (4.68) với điều kiện k fk > 5 và k(1− fk) > 5 (4.69) Ta sẽ lấy n là số nguyên dương nhỏ nhất thỏa mãn (4.68) và (4.69). 2. Cách thứ hai, sử dụng bất đẳng thức Cauchy p(1− p) ≤ 1 4 ta nhận được u1−α/2 p(1− p) n ≤ u1−α/2 2 √ n . Nếu ta chọn n thỏa mãn điều kiện u1−α/2 2 √ n hay n ≥ (u1−α/2) 2 4ε2 (4.70) thì n thỏa mãn điều kiện (4.67). Vậy ta sẽ lấy n là số nguyên dương nhỏ nhất thỏa mãn (4.70). Ví dụ 4.22. Một kỹ sư muốn ước lượng tỷ lệ sản phẩm loại A của một nhà máy với độ tin cậy 90% và sai số không quá 0,02. Hỏi kỹ sư đó phải lấy một mẫu cỡ n bằng bao nhiêu? Lời giải Ví dụ 4.22 1. Nếu làm theo cách thứ nhất, trước hết người kỹ sư lấy một mẫu cỡ n = 1000 sản phẩm kiểm tra thấy có 640 sản phẩm loại A. Khoảng tin cậy của tỷ lệ sản phẩm loại A của nhà máy dựa trên mẫu điều tra này là f − u1−α/2 f (1− f ) n ; f + u1−α/2 f (1− f ) n = (0, 64− 1, 645 0, 64(1− 0, 64) 1000 0, 64+ 1, 645 0, 64(1− 0, 64) 1000 ) = (0, 64−, 25 ; 0, 64+ 0, 25). Sai số của ước lượng là 0,25 lớn hơn 0,02. Vậy cần lấy mẫu lớn hơn nữa. Cỡ mấu n phải thỏa mãn (4.68), tức là n ≥ (1, 645) 2(0, 64)(0, 36) (0, 02)2 = 1558, 67. Vậy n = 1559. 4.3. Ước lượng khoảng 186 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST 2. Nếu sử dụng cách thứ hai thì phải chọn n thỏa mãn (4.70), tức là n ≥ (1, 645) 2 (4)(0, 02)2 = 1691, 266. Do đó n = 1692. Ví dụ 4.23. Một cuộc thăm dò dư luận tại thành phố A được tiến hành để hỏi xem có nên thực hiện một dự án quan trọng với kinh phí lớn trong thành phố hay không. Tỷ lệ người ủng hộ việc thực hiện dự án trên mẫu thăm dò cho ta ước lượng tỷ lệ người ủng hộ việc thực hiện dự án trên toàn bộ số dân của thành phố. Nếu ước lượng tỷ lệ này với độ tin cậy 95% và sai số không quá 0,03 thì phải lấy cỡ mẫu bao nhiêu? Lời giải Ví dụ 4.23 Nếu sử dụng cách thứ hai, ta phải chọn n thỏa mãn (4.70) hay n ≥ (1, 96) 2 (4)(0, 03)2 = 1067, 111. Do đó n = 1068. Điều thú vị nhất trong tính toán trên là cỡ mẫu tối thiểu n chỉ phụ thuộc vào độ chính xác và độ tin cậy mà ta mong muốn, chứ không phụ thuộc vào tổng số dân trên thành phố. Nếu hỏi ý kiến 1068 người, thì ta đạt được độ tin cậy là 95% và độ chính xác 0,03 mà không phụ thuộc vào tổng số dân trên thành phố là 5 triệu, là 50 triệu hay 500 triệu! Chú ý 4.7. 1. Cái khó khăn ở đây là không phải thu thập ý kiến của càng nhiều người càng tốt. Vấn đề lớn là phải đảm bảo đây là mẫu ngẫu nhiên. Chẳng hạn nếu thực hiện ý kiến qua mạng: • Gửi email đến n địa chỉ ngẫu nhiên. Giả sử trường hợp tốt nhất, cả n người đều trả lời. Vấn đề là không phải ai cũng dùng email. • Ngay cả trường hợp tất cả mọi người đều dùng email, thì không phải ai cũng trả lời. Quyết định trả lời và câu trả lời cũng liên quan đến nhau. Nếu xe hơi của bạn chạy tốt, ít khi bạn trả lời những câu hỏi liên quan đến chất lượng của hãng; nhưng nếu có trục trặc thì khả năng này rất cao. Nếu ta thấy 30% khách trên mạng than thở về chất lượng của xe cũng không nói lên là 30% số người mua xe gặp vấn đề. 2. Nếu p khá gần 0,5 thì sự khác nhau giữa số n tìm được theo hai cách sẽ không nhiều lắm. Nhưng nếu n khá gần 0 hoặc 1 thì sự khác biệt sẽ rất lớn. Do đó, nếu cảm thấy tỷ lệ p rất bé hoặc rất lớn thì nên dùng cách thứ nhất. Hướng dẫn sử dụng phần mềm thống kê R R là phần mềm thống kê miễn phí, được phát triển tại phòng thí nghiệm AT&T bởi Rick Becker, John Chambers và các cộng sự. Phiên bản đầu tiên của R được viết vào năm 1976. Tham khảo tại 2. 2Nguyễn Văn Tuấn (2015). Phân tích dữ liệu với R. NXB tổng hợp thành phố Hồ Chí Minh. 4.3. Ước lượng khoảng 187 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST 1. Để tìm khoảng tin cậy cho giá trị trung bình trong trường hợp dữ liệu có phân phối chuẩn và phương sai chưa biết đơn giản nhất là ta dùng hàm t.test(). 2. Để tìm khoảng tin cậy cho giá trị trung bình trong trường hợp dữ liệu có phân phối chuẩn và phương sai đã biết ta dùng hàm z.test(). 3. Để tìm khoảng tin cậy cho tỷ lệ ta dùng hàm prop.test(). Đối với các khoảng tin cậy một phía ta đặt giá trị "less", "greater" cho tham số alternative (giá trị mặc định của tham số này là "two.sided"). Bài tập Chương 4 Ước lượng khoảng cho kỳ vọng Bài tập 4.1. Xác suất để một sinh viên Đại học Bách khoa Hà Nội thi trượt môn Giải tích 2 là p. Một mẫu lớn n sinh viên được lựa chọn ngẫu nhiên và ký hiệu X là số sinh viên đã trượt môn Giải tích 2 trong mẫu. (a) Giải thích tại sao có thể sử dụng X n để ước lượng cho p? (b) Trình bày cách tính xấp xỉ xác suất sự sai khác giữa X n và p nhỏ hơn 0, 01? Áp dụng cho n = 500 và p = 0, 2. Bài tập 4.2. Tuổi thọ của một loại bóng đèn do một dây chuyền công nghệ sản xuất ra có độ lệch chuẩn là 305 giờ. Người ta lấy ngẫu nhiên ra 45 bóng đèn loại này thấy tuổi thọ trung bình là 2150 giờ. Với độ tin cậy 95% hãy ước lượng tuổi thọ trung bình của loại bóng đèn nói trên. Bài tập 4.3. Một kỹ sư cho biết trọng lượng tạp chất trong một sản phẩm tuân theo luật phân phối chuẩn với độ lệch chuẩn bằng 3,8gam. Một mẫu ngẫu nhiên gồm 9 sản phẩm được tiến hành kiểm tra và thấy lượng tạp chất như sau (đơn vị tính là gam): 18,2 13,7 15,9 17,4 21,8 16,6 12,3 18,8 16,2 (a) Tìm khoảng tin cậy cho trọng lượng trung bình tạp chất của sản phẩm với độ tin cậy 99%. (b) Không cần tính toán, nếu độ tin cậy 95% thì khoảng ước lượng trung bình sẽ rộng hơn, hẹp hơn hay bằng như trong ý (a)? Bài tập Chương 4 188 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Bài tập 4.4. Giả sử chiều dài của một chi tiết sản phẩm là biến ngẫu nhiên tuân theo luật phân phối chuẩn với độ lệch chuẩn là 0,2m. Người ta sản xuất thử nghiệm 35 sản phẩm loại này và tính được chiều dài trung bình là 25m. Với độ tin cậy 95% hãy ước lượng khoảng cho chiều dài trung bình của chi tiết sản phẩm đang được thử nghiệm. Bài tập 4.5. Để xác định trọng lượng trung bình của các bao gạo được đóng gói bằng máy tự động, người ta chọn ngẫu nhiên ra 20 bao gạo và thấy trung bình mẫu là 49,2kg và độ lệch chuẩn mẫu hiệu chỉnh là 1,8kg. Biết rằng trọng lượng các bao gạo xấp xỉ phân phối chuẩn. Hãy tìm khoảng tin cậy cho trọng lượng trung bình của một bao gạo với độ tin cậy 99%. Bài tập 4.6. Thời gian đợi phục vụ tại một cửa hàng ăn nhanh là biến ngẫu nhiên xấp xỉ phân phối chuẩn. Người ta khảo sát 16 người thì thấy thời gian đợi trung bình là 4 phút và độ lệch chuẩn mẫu hiệu chỉnh là 1,8 phút. Với độ tin cậy 99% hãy tìm khoảng tin cậy cho thời gian chờ đợi trung bình của một khách hàng tại cửa hàng ăn nhanh này. Bài tập 4.7. Một mẫu ngẫu nhiên gồm 16 thùng hàng được chọn ra từ tất cả các thùng hàng được sản xuất bởi nhà máy trong một tháng. Trọng lượng của 16 thùng hàng lần lượt như sau (đơn vị tính là kg): 18,6 18,4 19,2 19,8 19,4 19,5 18,9 19,4 19,7 20,1 20,2 20,1 18,6 18,4 19,2 19,8 Tìm khoảng tin cậy cho trọng lượng trung bình tổng thể của tất cả các thùng hàng của nhà máy với độ tin cậy 95%, biết rằng trọng lượng thùng hàng được chọn ngẫu nhiên là biến ngẫu nhiên tuân theo luật phân phối chuẩn. Bài tập 4.8. Để định mức thời gian gia công một chi tiết máy, người ta theo dõi ngẫu nhiên quá trình gia công 35 chi tiết máy và thu được số liệu: Thời gian (phút) 16-17 17-18 18-19 19-20 20-21 21-22 Số chi tiết máy 3 4 10 9 5 4 Giả sử thời gian gia công chi tiết máy là biến ngẫu nhiên tuân theo luật phân phối chuẩn. Với độ tin cậy 95% hãy ước lượng khoảng tin cậy cho thời gian gia công trung bình một chi tiết máy nói trên. Bài tập 4.9. Đo áp lực X (tính bằng kg/cm2) của 18 thùng chứa ta được bảng kết quả sau: Áp lực (kg/cm2) 19,6 19,5 19,9 20,0 19,8 20,5 21,0 18,5 19,7 Số thùng 1 2 2 4 2 3 2 1 1 Với độ tin cậy 99% hãy tìm khoảng ước lượng đối xứng của áp lực trung bình của các thùng trên. Biết rằng áp lực là biến ngẫu nhiên tuân theo luật phân phối chuẩn. Bài tập Chương 4 189 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Bài tập 4.10. Một bài báo trong Nuclear Engineering International (tháng 2 năm 1988, trang 33) mô tả một số đặc điểm của các thanh nhiên liệu được sử dụng trong một lò phản ứng hạt nhân của một công ty điện lực ở Na Uy. Người ta đo tỷ lệ làm giàu của 12 thanh và có được dữ liệu sau: 2,94 3,00 2,90 2,90 2,75 2,95 2,75 3,00 2,95 2,82 2,81 3,05 Giả sử tỷ lệ làm giàu của các thanh nhiên liệu tuân theo luật phân phối chuẩn. Hãy ước lượng khoảng cho tỷ lệ làm giàu trung bình của các thanh nhiên liệu với độ tin cậy 95%. Bài tập 4.11. Trọng lượng những viên gạch trong một quá trình sản xuất gạch được giả sử là tuân theo luật phân phối chuẩn. Một mẫu ngẫu nhiên gồm 25 viên gạch vừa sản xuất ra trong ngày có trọng lượng trung bình 2,45 kg và độ lệch chuẩn mẫu hiệu chỉnh là 0,15 kg. (a) Tìm khoảng tin cậy của trọng lượng trung bình của tất cả các viên gạch trong ngày với độ tin cậy 99%. (b) Không cần tính toán, với độ tin cậy 95% thì khoảng tin cậy trung bình sẽ rộng hơn, hẹp hơn hay bằng với kết quả ý (a)? (c) Một mẫu ngẫu nhiên gồm 20 viên gạch sẽ được chọn ra trong ngày mai. Không cần tính toán, với độ tin cậy 99% thì khoảng tin cậy cho trọng lượng trung bình của tất cả các viên gạch sản xuất ra trong ngày mai sẽ rộng hơn, hẹp hơn hay bằng như trong ý (a)? (d) Sự thật rằng, độ lệch chuẩn mẫu của các viên gạch sản xuất trong ngày mai là 0,10kg. Không cần tính toán, với độ tin cậy 99% thì khoảng tin cậy cho trọng lượng trung bình của tất cả các viên gạch sản xuất ra trong ngày mai sẽ rộng hơn, hẹp hơn hay bằng như trong ý (a)? Bài tập 4.12. Một trường đại học lớn đang quan tâm về lượng thời gian sinh viên tự nghiên cứu mỗi tuần. Người ta tiến hành khảo sát một mẫu ngẫu nhiên gồm 16 sinh viên, dữ liệu cho thấy thời gian nghiên cứu trung bình của một sinh viên là 15,26 giờ/tuần và độ lệch chuẩn hiệu chỉnh là 6,43 giờ. Giả sử thời gian nghiên cứu của sinh viên của trường đại học trên là tuân theo luật phân phối chuẩn. (a) Tìm khoảng tin cậy cho lượng thời gian tự nghiên cứu trung bình mỗi tuần cho tất cả sinh viên trường đại học này với độ tin cậy 95%. (b) Không cần tính toán, khoảng tin cậy của trung bình tổng thể khi ước lượng sẽ rộng hơn hay hẹp hơn với ba điều kiện sau: b1. Mẫu gồm 30 sinh viên được chọn ra, với tất cả các điều kiện khác giống như ý (a)? b2. Độ lệch chuẩn mẫu là 4,15 giờ, tất cả các điều kiện khác giống như ý (a)? Bài tập Chương 4 190 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST b3. Độ tin cậy 99%, tất cả các điều kiện khác giống như ý (a)? Bài tập 4.13. Một kỹ sư nghiên cứu về cường độ nén của bê tông đang được thử nghiệm. Anh ta tiến hành kiểm tra 12 mẫu vật và có được các dữ liệu sau đây: 2216 2234 2225 2301 2278 2255 2249 2204 2286 2263 2275 2295 Giả sử cường độ nén của bê tông đang thử nghiệm tuân theo luật phân phối chuẩn. (a) Hãy ước lượng khoảng với độ tin cậy 95% cho cường độ nén trung bình của bê tông đang được thử nghiệm. (b) Hãy ước lượng khoảng tin cậy phải cho cường độ nén trung bình của bê tông đang được thử nghiệm với độ tin cậy 99%. Bài tập 4.14. Người ta chọn ngẫu nhiên ra 49 sinh viên của một trường đại học và thấy chiều cao trung bình mẫu là 163cm và độ lệch chuẩn mẫu hiệu chỉnh là 12cm. Hãy tìm khoảng ước lượng với độ tin cậy 99% cho chiều cao trung bình của sinh viên của trường đó. Bài tập 4.15. Một trường đại học tiến hành một nghiên cứu xem trung bình một sinh viên tiêu hết bao nhiêu tiền điện thoại trong một tháng. Họ điều tra 60 sinh viên và cho thấy số tiền trung bình mẫu là 95 nghìn và độ lệch chuẩn mẫu hiệu chỉnh là 36 nghìn. Hãy ước lượng khoảng với độ tin cậy 95% cho số tiền điện thoại trung bình trong một tháng của mỗi sinh viên. Bài tập 4.16. Người ta điều tra 35 người nghiện thuốc lá được chọn ngẫu nhiên từ số lượng người nghiện hút thuốc lá của một thành phố thấy số điếu thuốc hút trong 5 ngày của họ là: 31 37 48 40 59 97 98 87 80 68 64 45 48 62 74 76 79 85 83 81 93 82 85 79 34 57 95 49 59 63 48 79 50 55 63 Hãy tìm khoảng ước lượng cho số điếu thuốc hút trung bình trong 5 ngày của những người nghiện thuốc lá của thành phố đó với độ tin cậy 99%. Bài tập 4.17. Để nghiên cứu về thời gian xem ti vi của một thanh niên từ 18 đến 35 tuổi trong vòng một tuần, người ta tiến hành khảo sát trên 40 người và cho ta bảng số liệu sau: 39 02 43 35 15 54 23 21 25 07 24 33 17 23 24 43 11 15 17 15 19 06 43 35 25 37 15 14 08 11 29 12 13 25 15 28 24 06 16 7 Hãy tìm khoảng ước lượng cho thời gian xem ti vi trung bình của thanh niên trong độ tuổi trên trong vòng một tuần với độ tin cậy 99%. Bài tập 4.18. Để điều tra tiền điện phải trả trong một tháng của một hộ dân cư ở phường A, người ta kiểm tra ngẫu nhiên 200 hộ gia đình ở phường này và được kết quả sau: Bài tập Chương 4 191 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Số tiền (nghìn đồng) [80,180) [180,280) [280,380) [380,480) [480,580) [580,680) [680,780] Số hộ gia đình 14 25 43 46 39 23 10 Ước lượng khoảng cho số tiền trung bình một hộ dân phải trả ở phường đó với độ tin cậy 95%. Bài tập 4.19. Để ước lượng số lượng xăng hao phí trên một tuyến đường của một hãng xe khách, người ta tiến hành chạy thử nghiệm 55 lần liên tiếp trên tuyến đường này và có được số liệu: Lượng xăng hao phí 10,5-11 11-11,5 11,5-12 12-12,5 12,5-13 13-13,5 Tần số 5 12 15 13 6 4 Hãy ước lượng lượng xăng hao phí trung bình cho một xe với độ tin cậy 95%. Bài tập 4.20. Để xác định giá trung bình đối với một loại hàng hóa trên thị trường, người ta điều tra ngẫu nhiên tại 100 cửa hàng thu được số liệu sau: Giá (nghìn đồng) 83 85 87 89 91 93 95 97 99 101 Số cửa hàng 5 8 13 14 30 11 8 6 4 1 Với độ tin cậy 95% hãy ước lượng giá trung bình của loại hàng đó tại thời điểm đang xét. Biết rằng giá hàng hóa là biến ngẫu nhiên tuân theo luật phân phối chuẩn. Ước lượng khoảng cho tỷ lệ hay xác suất Bài tập 4.21. Để ước lượng cho tỷ lệ những cây bạch đàn có chiều cao đạt chuẩn phục vụ cho việc khai thác ở một nông trường lâm nghiệp, người ta tiến hành đo ngẫu nhiên chiều cao của 135 cây và thấy có 36 cây cao từ 7,5m trở lên. Hãy ước lượng khoảng cho tỷ lệ các cây bạch đàn có chiều cao trên 7,5m với độ tin cậy 95%. Bài tập 4.22. Để ước lượng số cá có trong hồ người ta bắt từ hồ lên 100 con đánh dấu rồi thả lại vào hồ. Sau đó người ta bắt lên 300 con thì thấy có 32 con bị đánh dấu. Hãy ước lượng khoảng cho số cá có trong hồ với độ tin cậy 99%. Bài tập 4.23. Để điều tra thị phần xe máy, người ta chọn ngẫu nhiên ra 450 người mua xe máy trong một tháng ở các địa bàn ở một thành phố thì có 275 người mua xe Honda. Tìm khoảng tin cậy cho tỷ lệ người mua xe Honda với độ tin cậy 95%. Bài tập 4.24. Kiểm tra ngẫu nhiên 400 sản phẩm do một hệ thống máy mới sản xuất thì thấy có 387 chính phẩm. Hãy ước lượng tỷ lệ chính phẩm tối thiểu của hệ thống máy mới với độ tin cậy 95%. Bài tập 4.25. Thử nghiệm 560 bóng đèn điện tử do một nhà máy sản xuất thì thấy 10 bóng có lỗi kỹ thuật. Hãy tìm ước lượng cho tỷ lệ bóng có lỗi kỹ thuật tối đa với độ tin cậy 95%. Bài tập Chương 4 192 MI2020-KỲ 20201–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST Bài tập 4.26. Mở thử 200 hộp của kho đồ hộp thấy có 10 hộp bị biến chất. Với độ tin cậy 95% hãy ước lượng tỷ lệ hộp bị biến chất tối đa của kho. Bài tập 4.27. Chọn ngẫu nhiên ra 1000 trường hợp điều trị bệnh ung thư phổi, các bác sĩ thống kê thấy có 823 bệnh nhân bị chết trong vòng 10 năm. (a) Ước lượng khoảng cho tỷ lệ tử vong của bệnh nhân điều trị bệnh ung thư phổi với độ tin cậy 99%. (b) Cần phải lấy số lượng mẫu là bao nhiêu để với độ tin cậy 95% các sai số khi dự đoán tỷ lệ bệnh nhân điều trị ung thư phổi tử vong 10 năm là ít hơn 0,03? Bài tập 4.28. Cần phải lập một mẫu ngẫu nhiên với kích thước là bao nhiêu để tỷ lệ phế phẩm của mẫu là 0,2 và độ dài khoảng tin cậy đối xứng là 0,05 và độ tin cậy của ước lượng là 95%. Bài tập 4.29. Làm cách nào để ước lượng số thú hiếm trong một khu rừng với độ tin cậy 95%. Bài tập 4.30. Nghiên cứu về năng suất của loại hoa màu A, người ta kiểm tra năng suất của 64 điểm trồng loại hoa màu này thu được bảng số liệu Năng suất (tạ/ha) 40–45 45–50 50–55 55-60 60–65 65–70 Số điểm 2 5 15 30 8 4 (a) Hãy ước lượng năng suất trung bình của loại hoa màu A với độ tin cậy 95%; Nếu muốn sai số của ước lượng giảm đi 2 lần thì cần kiểm tra bao nhiêu điểm để đảm bảo yêu cầu nêu trên? (b) Biết rằng trên toàn miền Bắc có 10.000 điểm trồng loại hoa màu A. Hãy cho biết có khoảng bao nhiêu điểm đạt năng suất trên 60 tạ/ha? Hãy kết luận với độ tin cậy 99%. (c) Hãy cho biết tỷ lệ những điểm có năng suất trên 60 tạ/ha của loại hoa màu A tối thiểu là bao nhiêu? Hãy kết luận với độ tin cậy 95%? Bài tập Chương 4 193

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_xac_suat_thong_ke_nguyen_thi_thu_thuy.pdf
  • pdf20201_XSTK_MI2020_CHUONG1_NTTThuy.pdf
  • pdf20201_XSTK_MI2020_CHUONG2_NTTThuy.pdf
  • pdf20201_XSTK_MI2020_CHUONG3_NTTThuy.pdf
  • pdf20201_XSTK_MI2020_CHUONG4_NTTThuy.pdf