Giáo trình Thống kê kinh tế - Nguyễn Thị Phương Hảo

Kiểm định Chi bình phương (𝛘𝟐) về sự phù hợp Kiểm định sự phù hợp là kiểm định xem giả thuyết về phân phối của tổng thể và số liệu thực tế phù hợp (thích hợp) đến mức độ nào với giả định về phân phối của tổng thể a) Kiểm định sự phù hợp trong trường hợp giả định đã biết các tham số của tổng thể Chọn một mẫu ngẫu nhiên n quan sát, được chia thành k nhóm khác nhau: mỗi quan sát chỉ thuộc vào một nhóm thứ i nào đó (i = 1, ,k). Oi là số lượng quan sát ở nhóm thứ i. pi xác suất giả thuyết để 1 quan sát rơi vào nhóm thứ i. Vấn đề đặt ra là kiểm định giả thuyế H0 về phân phối của tổng thể 1. Giả thuyết H0: Tổng thể có phân phối xác suất pi H1: Tổng thể không có phân phối xác suất pi 2. Giá trị kiểm định: χ2 = ∑ ( Oi−Ei)2 Ei ki= 1 ; Ei = 𝑛 × pi Điều kiện: kiểm định có ý nghĩa khi Ei ≥ 5 3. Quyết định bác bỏ H0 khi 𝝌2 > 𝝌( 2𝑘−1),𝛼

pdf77 trang | Chia sẻ: hachi492 | Lượt xem: 361 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Giáo trình Thống kê kinh tế - Nguyễn Thị Phương Hảo, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
tính chất tương đối. Nó được xác định khi ta đặt giả thuyết Ho. Thông thường sai lầm nào gây ra tổn thất lớn hơn người ta sẽ đặt giả thuyết Ho sao cho sai lầm đó là loại I và định trước khả năng mắc phải sai lầm loại I không vượt qua một số α nào đó (α = 5%), tức là thực hiện kiểm định giả thuyết Ho ở mức ý nghĩa α cho trước. 5.1.3 Quy trình tổng quát trong kiểm định giả thuyết Bài toán kiểm định ở đây được thực hiện với giá trị cho trước của mức ý nghĩa . Các bước tiến hành gồm 4 bước sau: - Bước 1: Xây dựng giả thuyết. - Bước 2: Tính trị số thống kê của kiểm định. - Bước 3: So sánh giá trị lý thuyết (được xác định dựa trên mức ý nghĩa α và phân phối mẫu) với giá trị thực tế (tính được ở B2) để kết luận bác bỏ hay chấp nhận H0. - Bước 4: Kết luận bằng lời dựa trên kết quả ở bước 3 và nội dung nghiên cứu ban đầu. 5.1.4 Miền bác bỏ và miền xác định trong kiểm định: - Kiểm định hai phía; Miền bác bỏ nằm về hai phía của miền chấp nhận 𝑍𝛼/2 0 α/2 𝐌𝐢ề𝐧 𝐛á𝐜 𝐛ỏ 𝑍𝛼/2 𝐌𝐢ề𝐧 𝐛á𝐜 𝐛ỏ α/2 α/2 43 - Kiểm định bên trái: Miền bác bỏ nằm về phía bên trái của miền chấp nhận - Kiểm định bên phải: Miền bác bỏ nằm về phía bên phải của miền chấp nhận 5.2 Kiểm định tham số 5.2.1 Kiểm định giả thuyết về số trung bình một tổng thể 5.2.1.1 Trường hợp biết phương sai tổng thể -𝜎2 Điều kiện áp dụng cho trường hợp này là tổng thể X có phân phối chuẩn hoặc có cỡ mẫu n ≥ 30, các bước kiểm định như sau: 𝑍𝛼 0 1 − α 𝐌𝐢ề𝐧 𝐛á𝐜 𝐛ỏ 𝛼 0 α 𝐌𝐢ề𝐧 𝐛á𝐜 𝐛ỏ 𝑍𝛼 1 − α 44 Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết H0: 𝜇 ≤ 𝜇0 H1: 𝜇 > 𝜇0 H0: 𝜇 ≥ 𝜇0 H1: 𝜇 < 𝜇0 H0: 𝜇 = 𝜇0 H1: 𝜇 ≠ 𝜇0 2. Kiểm định Z = x̅ − μ0 σ √n 3. Bác bỏ H0 khi Z> Zα Z Zα 2⁄ hay Z < −Zα 2⁄ Đối với trường hợp này ta sử dụng phân phối chuẩn để thực hiện kiểm định giả thuyết thống kê, có thể gọi tắt là kiểm định Z, nguyên tắc bác bỏ H0 trong kiểm định Z như sau: Bác bỏ H0 trong kiểm định 1 đuôi: |Z| > Zα Bác bỏ H0 trong kiểm định 2 đuôi: |Z| > Zα 2⁄ Ví dụ 5.4: Một máy đóng mì gói tự động quy định khối lượng trung bình 1 gói là 75g, độ lệch chuẩn là 15g. Sau một thời gian sử dụng, người ta tiến hành kiểm tra mẫu 80 gói và tính được khối lượng trung bình là 72g. Hãy đánh giá về mức độ chính xác của máy đóng gói này với mức ý nghĩa α = 5%. Giải: Gọi μ là khối lượng thực tế 1 gói mì ; μo là khối lượng quy định 1 gói mì. Ta có: n = 80; δ = 15g; α = 5%. (1) Đặt giả thuyết Ho: μ = μo = 75 Đối thuyết H1: μ ≠ μo ≠ 75 (2) Giá trị kiểm định Z : Z = x̅−μ0 σ √n = 72−75 15 √80 = 1,79 Tra bảng Z lý thuyết: Zα 2⁄ = Z(2,5%) = 1,96 (3) Quyết định: Vì |Z|< Zα 2⁄ ; 1,79 < 1,96 nên ta chấp nhận Ho, tức là μ = μo = 75g. (4) Kết luận: Như vậy với mức ý nghĩa α = 5% ta có kết luận là khối lượng trung bình 1 gói mì không sai khác với tiêu chuẩn quy định. 45 5.2.1.2 Trường hợp chưa biết phương sai tổng thể -𝜎2 a) Trường hợp n≥ 𝟑𝟎 Thực hiện tương tự các bước của kiểm định trung bình trong trường hợp đã biết phương sai tổng thể (𝜎2); nhưng ở bước tính giá trị kiểm định ta buộc phải dùng phương sai mẫu (S2) thay cho phương sai tổng thể chưa biết. Ta có kiểm định Z với : 𝐙 = x̅ − μ0 S √n b) Trường hợp n < 𝟑𝟎: Trong trường hợp này điều kiện tổng thể phải có phân phối chuẩn. Ta có dạng tổng quát kiểm định như sau: Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết H0: 𝜇 ≤ 𝜇0 H1: 𝜇 > 𝜇0 H0: 𝜇 ≥ 𝜇0 H1: 𝜇 < 𝜇0 H0: 𝜇 = 𝜇0 H1: 𝜇 ≠ 𝜇0 2. Kiểm định 𝐭 = x̅ − μ0 S √n 3. Bác bỏ H0 khi t > tn−1,α t tn−1,α 2⁄ hay t < −tn−1,α 2⁄ Tương tự như đối với kiểm định Z, ta có thể gọi trong trường hợp này là kiểm định Student và có thể tóm tắt nguyên tác bác bỏ H0 như sau: Bác bỏ H0 trong kiểm định 1 đuôi: |t| > tn−1,α Bác bỏ H0 trong kiểm định 2 đuôi: |t| > tn−1,α 2⁄ Ví dụ 5.5: Một nhà sản xuất đèn chiếu X quang cho biết tuổi thọ trung bình thấp nhất là 65 giờ. Kết quả kiểm tra từ mẫu ngẫu nhiên 21 đèn cho thấy tuổi thọ trung bình là 62,5 giờ, với độ lệch chuẩn là 3. Với α =1 %, có thể kết luận gì về lời tuyên bố của nhà sản xuất? Cho biết tuổi thọ bóng đèn có phân phân phối chuẩn Giải: Gọi tuổi thọ trung bình của 1 bóng đèn thực tế là μ, μ chưa biết 46 Ta có: n = 21, �̅� = 62,5 ; μ = 65; α = 1 % (1) Đặt giả thuyết Ho: μ ≥ 65; Đối thuyết H1: μ < 65 (2) Giá trị kiểm định: 𝐭 = x̅ − μ0 S √n = 62,5 − 65 3 √21 = −3,82 T lý thuyết: T (n-1; α) = T (20; 0,01) = 2,528 (3) Quyết định: Vì |t| = 3,82 > T20, 0,01 = 2,528 nên giả thuyết Ho bị bác bỏ (4) Kết luận: Với mức ý nghĩa α = 1% ta có thể kết luận lời tuyên bố của nhà sản xuất là sai 5.2.2 Kiểm định giả thuyết về tỷ lệ p của tổng thể Giả sử ta có mẫu ngẫu nhiên n quan sát. Gọi: p là tỷ lệ của tổng thể, p̂ là tỷ lệ của quan sát mẫu, p0 là tỷ lệ nào đó cần kiểm định. Điều kiện cỡ mẫu n≥ 𝟒𝟎 Trong trường hợp này ta có kiểm định phân phối chuẩn, các bước kiểm định như sau: Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết H0: p ≤ p0 H1: p > p0 H0: p ≥ p0 H1: p < p0 H0: p = p0 H1: p ≠ p0 2. Kiểm định Z = p̂ − p0 √p0(1 − p0) n 3. Bác bỏ H0 khi Z> Zα Z Zα 2⁄ hay Z < −Zα 2⁄ Bác bỏ H0 trong kiểm định 1 đuôi: |Z| > Zα Bác bỏ H0 trong kiểm định 2 đuôi: |Z| > Zα 2⁄ Ví dụ 5.6: Giả sử sản phẩm của một công ty sản xuất vỏ xe ô tô đã chiếm được thị phần 42%. Hiện tại, trước cạnh tranh của đối thủ và những thay đổi của môi trường 47 kinh doanh, ban lãnh đạo muốn kiểm tra lại xem thị phần của công ty có còn 42% hay không. Chọn một mẫu ngẫu nhiên 550 ô tô trên đường, kết quả cho thấy có 219 xe sử dụng vỏ xe của công ty. Có thể kết luận gì? Với mức ý nghĩa α = 10% Gọi p là tỷ lệ xe sử dụng vỏ xe của công ty Ta có: n = 550; 𝑝 ̂ = 219 550 = 0,398; p0 = 0,42; α = 10% (1) Đặt giả thuyết Ho: p ≥ 0,42; Đối thuyết H1: p < 0,42 (2) Giá trị kiểm định: Z = p̂ − p0 √p0(1 − p0) n = 0,398 − 0,42 √0,42(1 − 0,42) 550 = −1,037 Z lý thuyết: Z0,1 = 1,28 (3) Quyết định: Vì |Z| = 1,037 < Z 0,1 = 1,28 chấp nhận giả thuyết Ho (4) Kết luận: Ở mức ý nghĩa α = 10% ta có thể nói rằng hiện tại công ty chiếm ít nhất 42% thị trường về vỏ xe ô tô 5.2.3 Kiểm định giả thuyết về phương sai của tổng thể Chọn một mẫu ngẫu nhiên n quan sát được chọn từ tổng thể phân phối chuẩn.Gọi S2 là phương sai mẫu, kiểm định giả thuyết về phương sai tổng thể được thực hiện như sau: Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết H0: 𝛿2 ≤ 𝛿0 2 H1: 𝛿2 > 𝛿0 2 H0: 𝛿2 ≥ 𝛿0 2 H1: 𝛿2 < 𝛿0 2 H0: 𝛿2 = 𝛿0 2 H1: 𝛿2 ≠ 𝛿0 2 2. Kiểm định 𝜒𝑛−1 2 = (𝑛 − 1)𝑆2 𝛿0 2 3. Bác bỏ H0 khi 𝜒𝑛−1 2 > 𝜒𝑛−1,α 2 𝜒𝑛−1 2 < 𝜒𝑛−1,1−α 2 𝜒𝑛−1 2 > 𝜒𝑛−1,α/2 2 hay 𝜒𝑛−1 2 > 𝜒𝑛−1,1−α/2 2 48 Ví dụ 5.7: Bộ phận giám sát chất lượng quan tâm đến đường kính một loại chi tiết sản phẩm. - Quá trình sản xuất còn được xem là tốt và chi tiết sản phẩm sản xuất ra được chấp nhận nếu phương sai của đường kính tối đa không quá 1, nếu phương sai vượt quá 1, phải xem xét lại máy móc và sửa chữa. - Với mẫu ngẫu nhiên 31 chi tiết, phương sai đường kính tính được là 1,62. - Ở mức ý nghĩa α =0,05, ta có thể kết luận như thế nào về quá trình sản xuất? Biết rằng đường kính của các chi tiết máy là biến ngẫu nhiên có phân phối chuẩn. Gọi 𝛿2là phương sai của đường kính sản phẩm. Ta có: n=31; S2 =1,62; 𝛿0 2 =1; α =5% 1. Đặt giả thuyết: H0: 𝛿2 ≤ 1 H1: 𝛿2 > 1 2. Giá trị kiểm định: 𝜒𝑛−1 2 = (𝑛−1)𝑆2 𝛿0 2 = 𝜒30 2 = (31−1)𝑥1,62 1 = 48,6 3. Quyết định: 𝜒30 2 = 48,6 > 𝜒30,0,05 2 = 43,77 => Bác bỏ giả thuyết H0. 4. Kết luận: Ở mức ý nghĩa 5%, ta kết luận cần phải xem xét, sửa chữa máy móc. 5.3 Giá trị p của kiểm định Nếu giả sử trong ví dụ 5.4 trên ta kiểm định giả thuyết Ho: μ = μo với mức ý nghĩa α = 10% thì ta có cùng kết luận như trên không? Với α = 10% ta có Zα/2 = Z(5%) = 1,645 < |𝑍| thực nghiệm =1,79, ta bác bỏ Ho. Vậy với mức ý nghĩa α nhỏ nhất nào thì ở đó giả thuyết Ho bị bác bỏ. Mức ý nghĩa nhỏ nhất đó gọi là giá trị P (P - value). Lấy lại ví dụ 5.4 trên ta thấy, với giá trị kiểm định thực nghiệm Ho bị bác bỏ |𝑍|thực nghiệm =1,79, thì giả thuyết Ho bị bác bỏ ở bất cứ giá trị nào của α mà ở đó Zα <1,79. Tra bảng Z ta có kết quả: ϕ (1,79) = 0,4633; mà α/2 = 0,5 - 0,4633 = 0,0367 Vậy α = 2 x 0,0367 = 0,0734 hay 7,34%; Nghĩa là giả thuyết Ho sẽ bị bác bỏ ở bất kỳ mức ý nghĩa α nào lớn hơn 7,34%. Có thể hình dung miền chấp nhận, miền bác bỏ theo giá trị P ở sơ đồ sau: 49 Hình 5.1. Miền chấp nhận, miền bác bỏ theo giá trị P Chú ý: 1) Trong thực tế tính giá trị P ((P - value) có thể sử dụng hàm NORMSDIST trong EXCEL hoặc các phần mềm thống kê. - Nếu sử dụng hàm NORMSDIST trong EXCEL thì thực hiện như sau: Ta có P - value = P(Z > 1,79) = P(Z <- 1,79)= 1- NORMSDIST(1,79)= 0,0367269 (tra hàm = NORMSDIST(1.79) trong EXCEL). Từ đó α = 2 x 0,0367 = 0,0734 hay 7,34%. - Nếu sử dụng các phần mềm thống kê, các kết quả xử lý số liệu bằng máy tính thường luôn thể hiện giá trị P. 2) Nếu quy định trước mức ý nghĩa α, có thể dùng P - value để kết luận theo α. Khi đó nguyên tắc kiểm định như sau: - P-value <α thì bác bỏ Ho, chấp nhận H1 - P-value ≥ α thì chưa có cơ sở để bác bỏ Ho. 3) Có thể kiểm định giả thuyết Ho theo P-value theo nguyên tắc sau: - P- value > 0,1 thì thường chấp nhận Ho - 0,05 < P- value ≤ 0,1 thì cần cân nhắc cẩn thận trước khi bác bỏ Ho (có thể tham khảo thêm tình hình); - 0,01 < P- value ≤ 0,05 thì nghiêng về hướng bác bỏ Ho nhiều hơn; - 0,001 < P- value ≤ 0,01 thì ít băn khoăn khi bác bỏ Ho nhều hơn; - P- value ≤ 0,001 thì có thể yên tâm khi bác bỏ Ho. 50% P =7,34% 10% 5% Chấp nhận H 0 Bác bỏ H 0 Giá trị P value 1,645 1,79 0 1,96 50 5.4 Kiểm định sự khác biệt 5.4.1 Kiểm định giả thuyết về sự khác nhau giữa 2 số trung bình của 2 tổng thể 5.4.1.1 Trường hợp lấy mẫu từng cặp Chọn một mẫu ngẫu nhiên có n cặp quan sát (xi, yi) từ hai tổng thể X, Y có phân phối chuẩn. D0 là một giá trị cho trước, ta thực hiện các bước kiểm định như sau: Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 > 𝐷0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 < 𝐷0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0 2. Giá trị kiểm định t = �̅� − D0 Sd √𝑛 3. Bác bỏ H0 khi t > tn−1,α t tn−1,α 2⁄ hay t < −tn−1,α 2⁄ Trong đó: Do : Giá trị cụ thể cho trước d̅: Trung bình của tổng thể sai lệch (X - Y); �̅� = ∑ di n i=1 𝑛 = ∑ (xi n i=1 − 𝑦i) 𝑛 n: Số đơn vị mẫu quan sát T: Tiêu chuẩn kiểm định (T thực nghiệm) Sd: Độ lệch chuẩn của tổng thể sai lệch (X - Y); 𝑆𝑑 2 = ∑ (𝑑𝑖−d)̅̅ ̅ 2 ni=1 n−1 Ví dụ 5.8: Công ty VINAMILK áp dụng công nghệ mới trong chế biến sữa chua. Hãy kiểm định xem năng suất lao động của công nhân sau khi sử dụng công nghệ mới với công nghệ cũ có khác nhau không với mức ý nghĩa là 5% ? Giải: Lấy mẫu 10 công nhân trong Công ty, thu thập số liệu về năng suất lao động của 10 công nhân này trước và sau khi áp dụng công nghệ mới. Kết quả điều tra thể hiện ở bảng sau 51 Thứ tự công nhân quan sát NSLĐ (kg/ngày) X - Y Trước khi áp dụng công nghệ mới (X) Sau khi áp dụng công nghệ mới (Y) 1 50 52 -2 2 48 46 2 3 45 50 -5 4 60 65 -5 5 70 78 -8 6 62 61 1 7 55 58 -3 8 62 70 -8 9 58 67 -9 10 53 65 -12 Trung bình 56,30 61,20 -4,90 Phương sai 57,57 97,07 20,10 Độ lệch chuẩn 7,59 9,85 4,4833 Ta có: n = 10, d̅ = −4,9, D0 = 0, Sd = 4,4833, α = 5% Gọi: μx NSLĐ trung bình của 10 công nhân theo công nghệ cũ = 56,30 μy NSLĐ trung bình của 10 công nhân theo công nghệ mới = 61,20 1. Đặt giả thuyết: { 𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0 = 0 𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0 ≠ 0 2. Giá trị kiểm định: t = �̅�−D0 Sd √𝑛 = −4,9−0 4,4833 √10 = −3,456 52 T lý thuyết : tn−1,α 2⁄ = t9, 0,025 = 2,262 3. Quyết định: |t| = 3,456 > tn−1,α 2⁄ = 2,262 nên ta bác bỏ Ho, nghĩa là năng suất lao động của công nhân sau khi áp dụng công nghệ mới khác với công nghệ cũ. Vì �̅� = 4,9 > Do nên μx - μy > 0, nghĩa là ở mức ý nghĩa 5% áp dụng công nghệ mới đã làm tăng năng suất so với công nghệ cũ. 5.4.1.2 Trường hợp lấy mẫu độc lập: Gọi 𝑛𝑥 , 𝑛𝑦 là số quan sát của các mẫu ngẫu nhiên độc lập 𝑥1 , 𝑥2𝑥𝑛, 𝑦1, 𝑦2𝑦𝑛, từ hai tổng thể X,Y có trung bình 𝜇𝑥, 𝜇𝑦 và phương sai δx 2 , δ𝑦 2 . Với trung bình mẫu �̅�, �̅� và phương sai mẫu là Sx 2 , S𝑦 2; với mức ý nghĩa α a) Nếu biết phương sai tổng thể Điều kiện trong trường hợp này là hai tổng thể có phân phối chuẩn hoặc có cỡ mẫu lớn (n>30). Ta có kiểm định Z như sau: Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 > 𝐷0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 < 𝐷0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0 2. Giá trị kiểm định 𝐙 = (�̅� − �̅�) − 𝐃𝟎 √ δx2 𝑛𝑥 + δ𝑦2 𝑛𝑦 3. Bác bỏ H0 khi Z > 𝑍α Z 𝑍α/2 hay Z < - 𝑍α/2 b) Nếu chưa biết phương sai tổng thể, giả sử 2 phương sai khác nhau - Trường hợp có cỡ mẫu lớn (n>30): ta vẫn sử dụng công thức trên với phương sai mẫu thay cho phương sai tổng thể và không cần điều kiện phân phối. Ta có kiểm định Z như sau: 53 Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 > 𝐷0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 < 𝐷0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0 2. Giá trị kiểm định Z = (�̅� − �̅�) − D0 √ Sx2 𝑛𝑥 + S𝑦2 𝑛𝑦 3. Bác bỏ H0 khi Z > 𝑍α Z 𝑍α/2 hay Z < - 𝑍α/2 - Trường hợp cỡ mẫu nhỏ (n < 30): với giả định cả hai tổng thể X, Y có phân phối chuẩn, ta vẫn sử dụng phương sai mẫu thay cho phương sai tổng thể, nhưng khi đó tiêu chuẩn kiểm định theo phân phối Student bậc tự do được xác định bởi công thức: Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 > 𝐷0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 < 𝐷0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0 𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0 2. Giá trị kiểm định 𝐭 = (�̅� − �̅�) − 𝐃𝟎 √ Sx2 𝑛𝑥 + S𝑦2 𝑛𝑦 3. Bác bỏ H0 khi t > tn,α t tn,α 2⁄ hay t < −tn,α 2⁄ Ví dụ 5.9: Một nghiên cứu về hai nhãn hiệu pin X và Y (cùng chủng loại) của hai nhà sản xuất khác nhau được thực hiện. - Chọn ngẫu nhiên mỗi nhãn hiệu 100 pin, kết quả được ghi nhận như sau: + Pin X có thời gian sử dụng trung bình là 308 phút, độ lệch chuẩn 84 phút. 54 + Các chỉ số tương ứng của pin Y lần lượt là 254 phút và 67 phút. - Có thể kết luận thời gian sử dụng trung bình của pin X lớn hơn pin Y ít nhất là 45 phút được không với mức ý nghĩa α =0,1. Ta có: nx = ny = 100, �̅� = 308, �̅�= 254, D0 = 45 Sx = 84, Sy = 67, α = 10% 1. Đặt giả thuyết: { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 45 𝐻1: 𝜇𝑥 − 𝜇𝑦 > 45 2. Giá trị kiểm định: 𝐭 = (�̅�− �̅�)−𝐃𝟎 √Sx 2 𝑛𝑥 + S𝑦 2 𝑛𝑦 = 𝐭 = (308− 254)−𝟒𝟓 √ 84 100 + 67 100 = 𝟎, 𝟖𝟑𝟖 3. Quyết định: |𝑍| = 0,838 chấp nhận giả thuyết H0. 4. KL: Ở mức ý nghĩa 10%, không đủ chứng cớ để kết luận thời gian sử dụng trung bình của pin X lớn hơn pin Y là 45 phút. 5.4.2 Kiểm định sự khác biệt của hai tỷ lệ tổng thể (với cỡ mẫu lớn >=40) Chọn 2 mẫu ngẫu nhiên độc lập từ 2 tổng thể X và Y có cỡ mẫu lớn có tỷ lệ tổng thể và tỷ lệ mẫu lần lượt là px, p𝑦, 𝑝𝑥̅̅ ̅, 𝑝𝑦̅̅ ̅. Giá trị kiểm định p0 cho trước và mức ý nghĩa α. Ta có các trường hợp sau: 5.4.2.1 Chệnh lệch hai tổng thể bằng 0 ( p0 = 0) Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết { 𝐻0: 𝑝𝑥 − 𝑝𝑦 ≤ 0 𝐻1: 𝑝𝑥 − 𝑝𝑦 > 0 { 𝐻0: 𝑝𝑥 − 𝑝𝑦 ≥ 0 𝐻1: 𝑝𝑥 − 𝑝𝑦 < 0 { 𝐻0: 𝑝𝑥 − 𝑝𝑦 = 0 𝐻1: 𝑝𝑥 − 𝑝𝑦 ≠ 0 2. Giá trị kiểm định Z = (𝑝𝑥̅̅ ̅ − 𝑝𝑦̅̅ ̅) √�̅�(1 − �̅�)( 1 𝑛𝑥 + 1 𝑛𝑦 ) 3. Bác bỏ H0 khi Z > 𝑍α Z 𝑍α/2 hay Z < -𝑍α/2 Trong đó: �̅� = 𝑛𝑥𝑝𝑥̅̅̅̅ +𝑛𝑦𝑝𝑦̅̅ ̅̅ 𝑛𝑥+𝑛𝑦 55 5.4.2.2 Chệnh lệch hai tổng thể khác 0 ( p0 ≠ 0) Một đuôi phải Một đuôi trái Hai đuôi 1. Đặt giả thuyết { 𝐻0: 𝑝𝑥 − 𝑝𝑦 ≤ 𝑃0 𝐻1: 𝑝𝑥 − 𝑝𝑦 > 𝑃0 { 𝐻0: 𝑝𝑥 − 𝑝𝑦 ≥ 𝑃0 𝐻1: 𝑝𝑥 − 𝑝𝑦 < 𝑃0 { 𝐻0: 𝑝𝑥 − 𝑝𝑦 = 𝑃0 𝐻1: 𝑝𝑥 − 𝑝𝑦 ≠ 𝑃0 2. Giá trị kiểm định 𝐙 = (𝑝𝑥̅̅ ̅ − 𝑝𝑦̅̅ ̅) − 𝑃0 √ 𝑝𝑥̅̅ ̅(1 − 𝑝𝑥̅̅ ̅) 𝑛𝑥 + 𝑝𝑦̅̅ ̅(1 − 𝑝𝑦̅̅ ̅) 𝑛𝑦 3. Bác bỏ H0 khi Z > 𝑍α Z 𝑍α/2 hay Z < -𝑍α/2 Ví dụ 5.10: Một công ty nước giải khát đang nghiên cứu việc đưa vào một công thức mới để cải tiến sản phẩm của mình. -Với công thức cũ, khi cho 500 người dùng thử thì có 120 người tỏ ra ưa thích nó. -Với công thức mới, khi cho 1000 người khác dùng thử thì có 300 người tỏ ra ưa thích nó. -Hãy kiểm định xem công thức mới đưa vào có làm tăng tỷ lệ những người ưa thích nước giải khát hay không với α =5%? Giải: Gọi px , py là tỷ lệ người ưa thích sản phẩm cũ, mới. Ta có: nx = 500; ny = 1000; α = 5% 𝑝𝑥̅̅ ̅ = 120 500 = 0,14 ; 𝑝𝑦̅̅ ̅ = 300 1.000 = 0,3; p0 =0 1. Đặt giả thuyết: { 𝐻0: 𝑝𝑥 − 𝑝𝑦 ≥ 0 𝐻1: 𝑝𝑥 − 𝑝𝑦 < 0 ; �̅� = 𝑛𝑥𝑝𝑥̅̅̅̅ +𝑛𝑦𝑝𝑦̅̅ ̅̅ 𝑛𝑥+𝑛𝑦 = 500 𝑥0,14+1.000𝑥0,3 500+1.000 = 0,28 2. Giá trị kiểm định: Z = (𝑝𝑥̅̅̅̅ − 𝑝𝑦̅̅ ̅̅ ) √�̅�(1−�̅�)( 1 𝑛𝑥 + 1 𝑛𝑦 ) = (0,14− 0,3) √0,28(1−0,28)( 1 500 + 1 1.000 ) = −2,44 3. Quyết định: |𝑍| = 2,44 > 𝑍α= 1,645 => bác bỏ giả thuyết H0. 4. KL: Với α =5%, ta có thể kết luận khách hàng có xu hướng ưa chuộng sản phẩm với công thức mới hơn. 56 CÂU HỎI ÔN TẬP CHƯƠNG 5 Câu 1: Kiểm định giả thuyết là gì? Trình bày quy tắc đặt giả thuyết Câu 2: Trình bày các bước kiểm định giả thuyết. Câu 3: Trình bày công thức tính tiêu chuẩn kiểm định khi kiểm định giả thuyết về số trung bình một tổng thể - Trường hợp biết phương sai - Trường hợp chưa biết phương sai Câu 4: Trình bày công thức tính tiêu chuẩn kiểm định khi kiểm định tỷ lệ của tổng thể Câu 5: Trình bày công thức tính tiêu chuẩn kiểm định khi kiểm định về sự khác nhau giữa 2 số trung bình của 2 tổng thể - Trường hợp lấy mẫu từng cặp - Trường hợp lấy mẫu độc lập 57 CHƯƠNG 6: PHÂN TÍCH PHƯƠNG SAI (ANOVA) MỘT YẾU TỐ Phân tích phương sai thực chất là bài toán kiểm định về sự bằng nhau của nhiều trung bình tổng thể. Phân tích phương sai được dùng như là một công cụ để xem xét ảnh hưởng của một hay một số yếu tố nguyên nhân (định tính) đến một yếu tố kết quả kết quả (định lượng). Bài toán này được giải quyết trong điều kiện tổng thể có phân phối chuẩn và phương sai bằng nhau. Đây là điều kiện làm cho bài toán này khó ứng dụng. Bài toán này gọi là phân tích phương sai bởi vì khi giải quyết bài toán này người ta chủ yếu dựa vào tính chất của phương sai. 6.1 ANOVA một yếu tố Phân tích phương sai một yếu tố là phân tích ảnh hưởng của một yếu tố nguyên nhân (thường là yếu tố định tính) đến một yếu tố kết quả (thường là yếu tố định lượng) đang nghiên cứu. a) Bài toán: Giả sử chúng ta cần so sánh số trung bình của k tổng thể độc lập. Người ta lấy k mẫu có số quan sát là 𝑛1; 𝑛2 𝑛𝑘; tuân theo phân phối chuẩn. Trung bình của các tổng thể được ký hiệu là 𝜇1; 𝜇2.𝜇𝑘 thì mô hình phân tích phương sai một yếu tố ảnh hưởng được mô tả dưới dạng kiểm định giả thuyết có dạng như sau: 𝐻0: Yếu tố kết quả không bị ảnh hưởng bởi yếu tố đang xét 𝐻1: Yếu tố kết quả có bị ảnh hưởng bởi yếu tố đang xét Hay: 𝐻0: 𝜇1 = 𝜇2 = ⋯ 𝜇𝑘 𝐻1: Tồn tại ít nhất 1 cặp có 𝜇1 ≠ 𝜇2; 𝜇2 ≠ 𝜇𝑘 Để kiểm định ta đưa ra 2 giả thiết sau: 1) Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2) 2) Ta lấy k mẫu độc lập từ k tổng thể. Mỗi mẫu được quan sát nj lần. b) Các bước tiến hành: Bước 1: Tính các trung bình mẫu và trung bình chung của k mẫu Trung bình mẫu 𝑥1̅; 𝑥2̅̅ ̅; 𝑥𝑘̅̅ ̅ được tính theo công thức: 𝑥�̅� = ∑ 𝑋𝑖𝑗 𝑛𝑖 𝑗=1 𝑛𝑖 (𝑖 = 1,2 𝑘) Trung bình chung của k mẫu được tính theo công thức: 58 �̅� = ∑ 𝑛𝑖 × 𝑥�̅� 𝑘 𝑖=1 ∑ 𝑛𝑖 𝑘 𝑖=1 (𝑖 = 1,2 𝑘) Bước 2: Tính các tổng độ lệch bình phương - Tổng các độ lệch bình phương trong nội bộ từng mẫu (SSW): 𝑆𝑆𝑊 = ∑ ∑(𝑋𝑖𝑗 − 𝑋�̅�) 2 𝑛𝑗 𝑗=1 𝑡 𝑖=1 - Tổng các độ lệch bình phương giữa các mẫu (SSB). 𝑆𝑆𝐵 = ∑(𝑋𝑖 − �̅�) 2 × 𝑛𝑖 𝑡 𝑖=1 - Tổng các độ lệch bình phương của toàn bộ tổng thể (SST): TSS = SSW + SSB = ∑ ∑ (𝑋𝑖𝑗 − �̅�) 2𝑛𝑗 𝑗=1 𝑡 𝑖=1 Như vậy, toàn bộ biến thiên của yếu tố kết quả (SST) được phân tích thành 2 phần: phần biến thiên do yếu tố nguyên nhân đang nghiên cứu (SSW); phần biến thiên còn lại do yếu tố khác không nghiên cứu ở đây (MSB). Nếu phần biến thiên do yếu tố nguyên nhân đang nghiên cứu tạo ra càng nhiều so với phần biến thiên do yếu tố khác tạo ra, thì ta càng có cơ sở để bác bỏ Ho và đi đến kết luận yếu tố nguyên nhân có ảnh hưởng có ý nghĩa đến yếu tố kết quả. Bước 3: Tính các phương sai (phương sai của nội bộ mẫu và phương sai giữa các mẫu) - Phương sai của nội bộ mẫu (MSW) 𝑀𝑆𝑊 = 𝑆𝑆𝑊 𝑛 − 𝑘 ; - Phương sai giữa các mẫu (MSB) 𝑀𝑆𝐵 = 𝑆𝑆𝐵 𝑘 − 1 Bước 4: Kiểm định giả thuyết - Tính tiêu chuẩn kiểm định F (F thực nghiệm): F = MSB MSW Tìm F lý thuyết (F tiêu chuẩn = F (k-1; n-k; α)): 59 F lý thuyết là giá trị giới hạn tra từ bảng phân phối F với k-1 bậc tự do của phương sai ở tử số và ; n-k bậc tự do của phương sai ở mẫu số với mức ý nghĩa α. Nếu F thực nghiệm > F lý thuyết, bác bỏ Ho, nghĩa là các số trung bình của k tổng thể không bằng nhau. Bảng phân tích phương sai 1 yếu tố khi sử dụng phần mềm EXCEL hoặc SPSS tóm tắt như sau: Bảng gốc bằng tiếng Anh Source of variation Sum of squares(SS) Degree of freedom (df) Mean squares (MS) F- ratio Between - groups SSB (k-1) MSB F = MSB MSW Within - groups SSW (n-k) MSW Total SST (n-1) Bảng phân tích phương sai tổng quát dịch ra tiếng việt – ANOVA Nguồn biến động Tổng độ lệch bình phương (SS) Bậc tự do(df) Phương sai (MS) F- Tỷ số Giữa các mẫu SSB (k-1) MSB F = MSB MSW Trong nội bộ các mẫu SSW (n-k) MSW Tổng số SST (n-1) Ví dụ 6.1: Ban Giám hiệu một trường đại học muốn nghiên cứu ảnh hưởng của việc đi làm thêm đối với kết quả học tập của sinh viên. Một sinh viên đã thu thập thời gian đi làm thêm và kết quả học tập của một số sinh viên trong trường. Sinh viên có đi làm thêm được chia thành ba nhóm. Nhóm thứ nhất gồm 7 sinh viên có thời gian làm thêm ít, dưới 6 giờ / tuần. Nhóm thứ hai gồm 7 sinh viên có thời gian làm thêm vừa phải, từ 6 đến 12 giờ / tuần. Nhóm thứ ba gồm 8 sinh viên có thời gian làm thêm nhiều, trên 12 giờ / tuần. Điểm trung bình học tập của các sinh viên đó như sau. 60 Nhóm 1: làm thêm ít (<6 giờ /tuần) Nhóm 2: làm thêm TB (6-12 giờ/tuần) Nhóm 3: làm thêm nhiều (>12 giờ/tuần) 6,3 7,2 6,3 7,0 6,6 5,8 6,5 6,1 6,0 6,6 5,8 5,5 7,2 6,8 5,2 6,9 7,1 6,5 6,4 5,9 5,3 6,2 Yêu cầu: Kiểm định phát biểu giả thuyết: thời gian đi làm thêm không ảnh hưởng đến kêt qủa học tập của sinh viên, nghĩa là điểm trung bình học tập của ba nhóm trên là như nhau: Giải: - Đặt giả thuyết 𝐻0: yếu tố kết quả học tập không bị ảnh hưởng bởi thời gian đi làm thêm 𝐻1: yếu tố kết quả học tập bị ảnh hưởng bởi thời gian đi làm thêm 𝐻0: 𝐻0: 𝜇1 = 𝜇2 = ⋯ 𝜇𝑘 𝐻1: Tồn tại ít nhất 1 cặp có 𝜇1 ≠ 𝜇2; 𝜇2 ≠ 𝜇𝑘 Bước 1. Tính trung bình của từng nhóm và trung bình chung của ba nhóm. 𝑥1̅ = 46,9 7 = 6,7; 𝑥2̅̅ ̅ = 45,5 7 = 6,5; 𝑥3̅̅ ̅ = 46,8 8 = 5,85 �̅� = 46,9+45,5+46,8 7+7+8 = 6,3273 Bước 2. Tính các tổng độ lệch bình phương 61 SS1 = 0,68; SS2 = 1,96; SS3 = 1,62 SSW = SS1 + SS2 + SS3 = 0,68+1,96+ 1,62 = 4,26 𝑆𝑆𝐵 = ∑ (𝑋𝑖 − �̅�) 2 × 𝑛𝑖 𝑡 𝑖=1 = (6,7 − 6,3273) 2𝑥7 + (6,5 − 6,3273)2𝑥7 + (5,85 − 6,3273)2𝑥8 = 3,004 Bước 3: Tính các phương sai + Phương sai của nội bộ mẫu (MSW) 𝑀𝑆𝑊 = 𝑆𝑆𝑊 𝑛 − 𝑘 = 4,26 22 − 3 = 0,224 + Phương sai giữa các mẫu (MSB) 𝑀𝑆𝐵 = 𝑆𝑆𝐵 𝑘 − 1 = 3,004 3 − 1 = 1,502 Bước 4: Kiểm định giả thuyết - Tính F thực nghiệm: F = MSB MSW = 1,502 0,224 = 6,7 - Tra bảng F lý thuyết: F (k-1; n-k; α))= F (2; 19; 0,05)= 3,52 - So sánh F thực nghiệm với F lý thuyết ta thấy: F thực nghiệm > F lý thuyết: bác bỏ Ho hay việc đi làm thêm có ảnh hưởng đến kết quả học tập của sinh viên Sử dụng kết quả của máy tính, phần mềm EXCEL chúng ta cũng có kết quả tương tự Anova: Single Factor SUMMARY Groups Count Sum Average Variance Nhóm 1: làm thêm ít (<6 giờ /tuần) 7 46,9 6,7 0,113333 Nhóm 2: làm thêm TB (6-12 giờ/tuần) 7 45,5 6,5 0,326667 Nhóm 3: làm thêm nhiều (>12 giờ/tuần) 8 46,8 5,85 0,231429 ANOVA 62 Source of Variation SS df MS F P-value F crit Between Groups 3,003636364 2 1,501818 6,69825 0,006287 3,521893 Within Groups 4,26 19 0,224211 Total 7,263636364 21 6.2. Kiểm định TUKEY. Từ phần nghiên cứu ở trên, nếu chấp nhận giả thuyết H0 thì việc phân tích phương sai kết thúc. Nếu bác bỏ H0 có nghĩa không phải trung bình của các tổng thể bằng nhau. Vì vậy cần phân tích sâu: Trung bình của những tổng thể nào thì khác nhau, tổng thể nào có trung bình lớn hơn, hoặc nhỏ hơn. Có nhiều phương pháp để tiếp tục phân tích sâu. Ở đây chỉ giới thiệu phương pháp khá thông dụng là phương pháp TUKEY Với cùng mức ý nghĩa 𝛼, ta so sánh từng cặp trung bình để phát hiện những nhóm khác nhau. { 𝐻0: 𝜇1 = 𝜇2 𝐻1: 𝜇1 ≠ 𝜇2 , { 𝐻0: 𝜇1 = 𝜇3 𝐻1: 𝜇1 ≠ 𝜇3 ,. { 𝐻0: 𝜇𝑘−1 = 𝜇𝑘 𝐻1: 𝜇𝑘−1 ≠ 𝜇𝑘 Khi có k nhóm, số cặp cần phải kiểm định là tổ hợp chập 2 của k nhóm 𝐶𝑘 2 Bước 1: tính Dij = |xi̅ − xj̅| Bước 2: tính T = q(k,n−k),α√ 𝑀𝑆𝑊 𝑛𝑚𝑖𝑛 𝑛𝑚𝑖𝑛 = 𝑚𝑖𝑛{𝑛1, 𝑛2 , 𝑘 } trong đó q: phân phối Turkey Bước 3: Bác bỏ H0 nếu Dij >T Ví dụ 6.2: Sử dụng ví dụ 6.1 Trong ví dụ 1 ta có k=3, vậy ta cần kiểm định 𝐶3 2 = 3 cặp { 𝐻0: 𝜇1 = 𝜇2 𝐻1: 𝜇1 ≠ 𝜇2 , { 𝐻0: 𝜇2 = 𝜇3 𝐻1: 𝜇2 ≠ 𝜇3 , { 𝐻0: 𝜇1 = 𝜇3 𝐻1: 𝜇1 ≠ 𝜇3 D12 = |x1̅ − x2̅| = 0,2; D23 = 0,65; D31 = 0,85 63 T = 3,59√ 0,224 7 = 0,6422 D12 < 𝑇 → 𝜇1 = 𝜇2, D23 > 𝑇 → 𝜇2 ≠ 𝜇3, D31 > 𝑇 → 𝜇1 ≠ 𝜇3, Vì x1̅, x2̅ > x3̅ → 𝜇2 > 𝜇3, 𝜇1 > 𝜇3, CÂU HỎI ÔN TẬP CHƯƠNG 6 Câu 1: Phân tích phương sai một yếu tố để làm gì Câu 2: Trình bày các bước phân tích phương sai một yếu tố Câu 3: Kiểm định Tukey để làm gì. Trình bày các bước 64 CHƯƠNG 7: KIỂM ĐỊNH PHI THAM SỐ Ở chương 5 chúng ta đã nói đến kiểm định giả thuyết về các đặc trưng (trung bình, tỷ lệ, phương sai) của tổng thể và thường giả định tổng thể có phân phối chuẩn. Trong chương này, cũng với giả thuyết H0 về tham số tổng thể, chúng ta sẽ đề cập đến các kiểm định mà phần lớn không gắn liền với tham số nào của mẫu, và vì vậy, chúng được gọi là kiểm định phi tham số. Kiểm định phi tham số có thể được sử dụng với các loại dữ liệu mà việc đo lường được thực hiện trên các thang đo không chặt chẽ, hoặc không đáp ứng các điều kiện về phân phối chặt chẽ của kiểm định phi tham số. Kiểm định phi tham số được sử dụng rộng rãi vì dùng được với nhiều loại dữ liệu và không đòi hỏi các điều kiện nghiêm ngặt về phân phối tổng thể. Tuy nhiên kiểm định phi tham số thường có độ chính xác thấp hơn kiểm định tham số do đó không nên quá lạm dụng 6.1 Kiểm định Wilcoxon. Kiểm định Wilcoxon được áp dụng trong trường hợp kiểm định sự bằng nhau của hai trung bình tổng thể, mẫu phối hợp từng cặp Chọn mẫu cặp quan sát (xi, yi). Với mức ý nghĩa 𝛼 ta có các bước kiểm định như sau: (1) Đặt giả thuyết về sự giống nhau của hai tổng thể: Một đuôi phải Một đuôi trái Hai đuôi { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 0 𝐻1: 𝜇𝑥 − 𝜇𝑦 > 0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 0 𝐻1: 𝜇𝑥 − 𝜇𝑦 < 0 { 𝐻0: 𝜇𝑥 − 𝜇𝑦 = 0 𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 0 a) Trường hợp mẫu nhỏ (n ≤ 20): (2) Giá trị kiểm định: - Tính các chênh lệch giữa các cặp: di = xi - yi - Xếp hạng giá trị tuyệt đối các chệch lệch |𝑑𝑖| theo thứ tự tăng dần, các giá trị bằng nhau sẽ nhận hạng trung bình, bỏ qua trường hợp chênh lệch bằng 0 - Tìm tổng các hạng được xếp của di mang dấu dương (T+) 𝑇+ = ∑ 𝑟𝑎𝑛𝑘(|𝑑𝑖| 𝑑𝑖>0 ) 65 - Tìm tổng các hạng được xếp của di mang dấu (T-) 𝑇− = ∑ 𝑟𝑎𝑛𝑘(|𝑑𝑖| 𝑑𝑖<0 ) (3) Quy tắc kiểm định: Ta kết luận ở mức ý nghĩa 𝛼 như sau: - Kiểm định hai phía: Tiêu chuẩn kiểm định T= min(T+, T-) + T ≤ 𝑇𝑛+,𝛼/2 : Bác bỏ H0, chấp nhận H1 + T > 𝑇𝑛+,𝛼/2: Chưa đủ cơ sở bác bỏ H0 - Kiểm định phía phải: Tiêu chuẩn kiểm định T = T+ + T ≤ 𝑇𝑛+,𝛼 : Bác bỏ H0, chấp nhận H1 + T > 𝑇𝑛+,𝛼: Chưa đủ cơ sở bác bỏ H0 - Kiểm định phía trái: Tiêu chuẩn kiểm định T = T+ + T ≤ 𝑇𝑛+,𝛼 : Bác bỏ H0, chấp nhận H1 + T > 𝑇𝑛+,𝛼: Chưa đủ cơ sở bác bỏ H0 Với 𝑇𝑛+,𝛼 là giá trị của kiểm định Willcoxon, n+ là số cặp quan sát có 𝑑𝑖 ≠ 0 Ví dụ 6.1: Mẫu 9 khách hàng được chọn ngẫu nhiên và yêu cầu họ cho biết sở thích về 2 loại kem đánh răng A, B thông qua thang điểm từ 1 (thấp nhất) đến 5 (cao nhất). Khách hàng 1 2 3 4 5 6 7 8 9 Kem đánh răng A 4 5 2 3 3 1 3 2 2 Kem đánh răng B 3 5 5 2 5 5 3 5 5 Hãy kiểm định giả thuyết cho rằng không có xu hướng nghiêng về loại nào trong sở thích đối với 2 loại kem đánh răng A, B với 𝛼 =5%. Gọi 𝜇𝑥 và 𝜇𝑦 là điểm trung bình sở thích của khách hàng về kem đánh răng A và B. 1. Đặt giả thuyết: { 𝐻0: 𝜇𝑥 − 𝜇𝑦 = 0 𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 0 2. Giá trị kiểm định: 66 Khách hàng 1 2 3 4 5 6 7 8 9 Tổng Kem đánh răng A 4 5 2 3 3 1 3 2 2 Kem đánh răng B 3 5 5 2 5 5 3 5 5 Chênh lệch 1 0 -3 1 -2 -4 0 -3 -3 Hạng + 1,5 1,5 3 Hạng - 5 3 7 5 5 25 3. Quyết định: T = min(T+, T-) = min(3, 25) = 3 ; n+ =7 T = 3 Bác bỏ giả thuyết H0. 4. Kết luận: Với 𝛼 =5%, có thể cho rằng có sự khác biệt trong việc ưa chuộng hai loại kem đánh răng A và B. b) Trường hợp mẫu lớn (n>20): 1. Giả thuyết: có thể đặt ở dạng 1 đuôi hoặc 2 đuôi 2. Giá trị kiểm định: 𝑍 = 𝑇 − 𝜇𝑇 𝜎𝑇 ; Nếu n lớn thì phân phối Willcoxon gần như phân phối chuẩn, lúc này trung bình và phương sai được tính như sau: + Trung bình: 𝜇𝑇 = 𝑛(𝑛+1) 4 + Phương sai: 𝜎𝑇 2 = 𝑛(𝑛+1)(2𝑛+1) 24 3. Quyết định bác bỏ H0: - 1 đuôi: |𝑍| > 𝑍𝛼 - 2 đuôi: |𝑍| > 𝑍𝛼/2 6.2 Kiểm định Mann-Whitney (Kiểm định U) Cũng như kiểm định T nhưng kiểm định U xem xét trường hợp các mẫu độc lập Chọn 2 mẫu ngẫu nhiên độc lập có n1, n2 quan sát từ hai tổng thể có trung bình là 𝜇1, 𝜇2. Với mức ý nghĩa 𝛼, các bước kiểm định: 67 a/ Trường hợp mẫu nhỏ (n1, n2 < 10): 1. Đặt giả thuyết: { 𝐻0: 𝜇𝑥 − 𝜇𝑦 = 0 𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 0 2. Giá trị kiểm định: - Xếp hạng tất cả các giá trị của 2 mẫu theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận hạng trung bình của hai hạng liên tiếp - Cộng các hạng của tất cả các giá trị ở mẫu thứ nhất. Ký hiệu 𝑅1 - Giá trị kiểm định: 𝑈1 = 𝑛1. 𝑛2 + 𝑛1(𝑛1+1) 2 − 𝑅1 ; 𝑈2 = 𝑛1. 𝑛2 − 𝑈1 𝑈 = min( 𝑈1, 𝑈2) - Tra bảng phân phối để tìm F(U) = Fn1,n2(U) 3. Quyết định bác bỏ H0 khi: α > 2F(U) b/ Trường hợp mẫu lớn (n1, n2 ≥ 10): Phân phối U được xem là phân phối chuẩn 1. Đặt giả thuyết: Giả thuyết có thể đặt ở dạng 1 đuôi hoặc 2 đuôi. 2. Giá trị kiểm định: 𝑍 = 𝑈 − 𝜇𝑢 𝜎𝑢 Với : + Trung bình: 𝜇𝑢 = 𝑛1.𝑛2 2 + Phương sai: 𝜎𝑇 2 = 𝑛1.𝑛2 (𝑛1+𝑛2+1) 12 3. Quyết định bác bỏ H0: - 1 đuôi: |𝑍| > 𝑍𝛼 - 2 đuôi: |𝑍| > 𝑍𝛼/2 Ví dụ 6.2: Tại một trang trại nuôi lợn người ta thử áp dụng một loại thuốc tăng trọng bổ sung vào khẩu phần thức ăn của 10 con lợn, sau 3 tháng người ta thu thập số liệu về trọng lượng của lợn (X). Đồng thời người ta cũng thu thập số liệu về 15 con lợn khác không dùng thuốc tăng trọng (Y). Hãy kiểm tra xem trọng lượng có như nhau hay không khi thử nghiệm với 𝛼 =5%. 68 Lợn 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Tổng X 60 61 62 62 63 63 68 64 64 65 Y 56 56 57 57 58 58 58 59 59 60 60 60 61 61 62 Rank(X) 11,5 15 18 18 20,5 20,5 25 22,5 22,5 24 197,5 Rank(Y) 1,5 1,5 3,5 3,5 6 6 6 8,5 8,5 11,5 11,5 11,5 15 15 18 127,5 Gọi 𝜇1 và 𝜇2là trọng lượng của lợn có sử dụng và không sử dụng thức ăn tăng trọng. 1. Đặt giả thuyết: { 𝐻0: 𝜇𝑥 − 𝜇𝑦 = 0 𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 0 2. Giá trị kiểm định: 𝑈 = 𝑛1. 𝑛2 + 𝑛1(𝑛1+1) 2 − 𝑅1 = 10𝑥15 + 10𝑥(10+1) 2 − 197,5 = 7,5 𝜇𝑢 = 𝑛1.𝑛2 2 = 10𝑥15 2 = 75 𝜎𝑇 2 = 𝑛1. 𝑛2 (𝑛1 + 𝑛2 + 1) 12 = 10𝑥15𝑥(10 + 15 + 1) 12 = 325 𝑍 = 𝑈 − 𝜇𝑢 𝜎𝑢 = 7,5 − 75 √325 = −3,744 3. Quyết định: |𝑍|= 3,744 > Z 2,5% = 1,96 => Bác bỏ H0. 4. Kết luận: Với 𝛼 =5%, trọng lượng của lợn có thay đổi khi sử dụng thuốc tăng trọng. 6.3 Kiểm định Kruskal-Wallis. Đây là trường hợp mở rộng của kiểm định Mann-Whitney, chúng ta sẽ thực hiện bài toán kiểm định về sự bằng nhau của k trung bình tổng thể Chọn k mẫu ngẫu nhiên độc lập có n1, n2,nk quan sát, gọi 𝑛 = ∑ 𝑛𝑖. Xếp hạng tất cả các quan sát theo thứ tự tăng dần, những giá trị bằng nhau sẽ nhận hạng trung bình. Gọi R1, R2Rk là tổng hạng của từng mẫu 1. Giả thuyết: { 𝐻0: 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 𝐻1: 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 2. Giá trị kiểm định: 𝑊 = 12 𝑛(𝑛+1) ∑ 𝑅𝑖 2 𝑛𝑖 − 3(𝑛 + 1)𝑘𝑖=1 3. Quyết định bác bỏ H0 khi 𝑊 > 𝝌𝑘−1,𝛼 2 69 Ví dụ 6.3: Một nhà nghiên cứu muốn xem xét tổng giá trị sản phẩm sản xuất của 3 ngành A, B, C có giống nhau không. Người ta chọn một số xí nghiệp hoạt động trong các ngành này và có bảng số liệu như bên dưới. Có thể kết luận gì ở 𝛼 = 0,5%? ĐVT: Triệu đồng Xí nghiệp 1 2 3 4 5 6 7 8 Ngành A 1,38 1,55 1,9 2,0 1,22 2,11 1,98 1,61 Ngành B 2,33 2,5 2,79 3,01 1,99 2,45 Ngành C 1.06 1,37 1,09 1,65 1,44 1,11 1. Giả thuyết: { 𝐻0: 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 𝐻1: 𝜇𝐴 ≠ 𝜇𝐵 ≠ 𝜇𝐶 2. Giá trị kiểm định: Xí nghiệp 1 2 3 4 5 6 7 8 Tổng Ngành A 1,38 1,55 1,9 2,0 1,22 2,11 1,98 1,61 Ngành B 2,33 2,5 2,79 3,01 1,99 2,45 Ngành C 1.06 1,37 1,09 1,65 1,44 1,11 Rank (A) 6 8 11 14 4 15 12 9 79 Rank (B) 16 18 19 20 13 17 103 Rank (C) 1 5 2 10 7 3 28 𝑊 = 12 𝑛(𝑛+1) ∑ 𝑅𝑖 2 𝑛𝑖 − 3(𝑛 + 1) = 12 20(20+1) ( 792 8 + 1032 6 + 282 6 ) − 3(20 + 1) = 13,54𝑘𝑖=1 3. Quyết định: 𝑊 = 13,54 > 𝝌𝑘−1,𝛼 2 = 𝑋2,0,05 2 = 10,579 => Bác bỏ H0 4. Kết luận, với 𝛼 =0,5%, tổng giá trị sản phẩm trung bình của các ngành là khác nhau. 70 6.4 Kiểm định Chi bình phương 6.4.1 Kiểm định Chi bình phương (𝛘𝟐) về sự phù hợp Kiểm định sự phù hợp là kiểm định xem giả thuyết về phân phối của tổng thể và số liệu thực tế phù hợp (thích hợp) đến mức độ nào với giả định về phân phối của tổng thể a) Kiểm định sự phù hợp trong trường hợp giả định đã biết các tham số của tổng thể Chọn một mẫu ngẫu nhiên n quan sát, được chia thành k nhóm khác nhau: mỗi quan sát chỉ thuộc vào một nhóm thứ i nào đó (i = 1,,k). Oi là số lượng quan sát ở nhóm thứ i. pi xác suất giả thuyết để 1 quan sát rơi vào nhóm thứ i. Vấn đề đặt ra là kiểm định giả thuyế H0 về phân phối của tổng thể 1. Giả thuyết H0: Tổng thể có phân phối xác suất pi H1: Tổng thể không có phân phối xác suất pi 2. Giá trị kiểm định: χ2 = ∑ ( Oi−Ei) 2 Ei k i=1 ; Ei = 𝑛 × pi Điều kiện: kiểm định có ý nghĩa khi Ei ≥ 5 3. Quyết định bác bỏ H0 khi 𝝌2 > 𝝌(𝑘−1),𝛼 2 Ví dụ 6.4.1: Ở một bar có 4 nhãn hiệu bia khác nhau. 160 khách hàng được chọn ngẫu nhiên cho thấy sự lựa chọn về các nhãn hiệu như sau: Nhãn hiệu Bia A Bia B Bia C Bia D Số khách hàng 34 46 29 51 Có thể kết luận sự ưa chuộng của khách hàng về 4 loại bia là như nhau được không ở mức ý nghĩa 2,5%? Nhãn hiệu (x) Bia A Bia B Bia C Bia D Tổng Số khách hàng (Oi) 34 46 29 51 160 Giả thuyết H0 (pi) 0,25 0,25 0,25 0,25 1 Ei = 𝑛 × pi 40 40 40 40 ( Oi − Ei) 2 Ei 0,9 0,9 3,03 3,03 7,86 1. Giả thuyết: H0: pA= pB = pC = pD = 0,25 71 H1: pA ≠ pB ≠ pC ≠ pD 2. Giá trị kiểm định: χ2 = 7,86; 𝐸𝑖 = 40 > 5: kiểm định có ý nghĩa χ2 = 7,86 < 𝝌(𝑘−1),𝛼 2 = 𝝌3,0,025 2 = 9,384 3. Quyết định:=> Chấp nhận giả thuyết H0. 4. Kết luận: Ở mức ý nghĩa 2,5% sự ưa chuộng của khách hàng về 4 nhãn hiệu bia là như nhau. b) Kiểm định sự phù hợp trong trường hợp chưa biết các tham số của tổng thể Ở phần a) là phương pháp kiểm định sự phù hợp với xác suất để một quan sát rơi vào nhóm thứ I (pi) đã được định rõ trong giả thuyết H0 Phần này ta nghiên cứu việc kiểm định giả thuyết các quan sát tuân theo một quy luật phân phối nào đó. Trong trường hợp này ta phải xác định pi xác suất để một quan sát rơi vào nhóm thứ i. Sau đó áp dụng phương pháp tương tự như phần a) 6.4.2 Kiểm định Chi bình phương (𝝌𝟐) về tính độc lập của hai biến định tính Đây là bài toán xét đồng thời hai dấu hiệu định tính (2 mẫu ngẫu nhiên độc lập được xét) trên 1 tổng thể. Kiểm định xem giữa hai tiêu thức (định tính) của tổng thể có mối liên hệ hay không. Ví dụ mối liên hệ giữa giới tính với hành vi tiêu dùng Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp thành 2 tiêu thức với nhau, hình thành nên bảng phân nhóm kết hợp gồm r hàng và c cột. Gọi nij là số lượng quan sát tương ứng với hàng i và cột j, n là tổng quan sát của r hàng đồng thời cũng là tổng quan sát c cột Phân nhóm theo tiêu thức thứ hai Phân nhóm theo tiêu thức thứ nhất 1 2 c ∑ 1 n11 n12 n1c R1 2 n21 n22 n2c R2 . ... .. . R nr1 nr2 . nr2 Rr ∑ C 1 C2 . CC Cn 1. Đặt giả thuyết: 72 𝐻0: không có mối liên hệ giữa hai tiêu thức 𝐻1: Tồn tại mối liên hệ giữa hai tiêu thức 2. Giá trị kiểm định: χ2 = ∑ ∑ ( nij − Eij) 2 Eij c j=1 r i=1 Eij = 𝐶𝑗 𝑅𝑖 𝑛 3. Quyết định bác bỏ H0 khi 𝝌2 > 𝝌(𝑟−1)(𝑐−1),𝛼 2 Ví dụ 6.4.2: Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát, một mẫu ngẫu nhiên 2.425 người tiêu dùng với các nhãn hiệu nước giải khát được ưa thích như sau: Giới tính Nhãn hiệu ưa thích Coca Pepsi 7Up Nam 308 177 114 Nữ 502 627 697 Kiểm định giả thuyết không có mối liên hệ nào giữa giới tính và sự ưa thích nhãn hiệu nước giải khát ở mức ý nghĩa 𝛼 = 0,5%. 1. Đặt giả thuyết: 𝐻0: Không có mối liên hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát H1: Có mối liên hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát. 3. Giá trị kiểm định: 73 Giới tính Nhãn hiệu ưa thích Coca Pepsi 7Up Ri 𝝌𝟐 Nam 308 177 114 599 E1j 200,08 198,60 200,33 - ( n1j − E1j) 2 E1j 58,21 2,35 37,2 - 97,76 Nữ 502 627 697 1826 E2j 609,92 605,4 610,67 - ( n2j − E2j) 2 E2j 19,1 0,77 12,2 32,07 32,07 Cj 810 804 811 2425 χ2 = ∑ ∑ ( nij − Eij) 2 Eij = 97,76 + 32,07 = 129,83 c j=1 r i=1 Eij = 𝐶𝑗 𝑅𝑖 𝑛 3. Quyết định: 129,83 = χ2> 𝝌(𝑟−1)(𝑐−1),𝛼 2 = 𝝌(2−1)(3−1),5% 2 = 𝝌2,5% 2 = 10,597 => bác bỏ giả thuyết H0. 4. Kết luận: Ở mức ý nghĩa 𝛼 = 0,5%, giả thuyết H0 bị bác bỏ, có nghĩa là có mối liên hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát. CÂU HỎI ÔN TẬP CHƯƠNG 7 Câu 1: Trình bày các bước kiểm định Wilcoxon. Câu 2: Trình bày các bước kiểm định Mann-Whitney Câu 3: Trình bày các bước kiểm định Kruskal-Wallis. Câu 4: Trình bày các bước kiểm định Chi bình phương 74 MỤC LỤC CHƯƠNG 1: GIỚI THIỆU VỀ THỐNG KÊ KINH TẾ ................................................ 1 1.1 Thống kê và các phân nhánh của thống kê .......................................................... 1 1.1.1 Định nghĩa thống kê ...................................................................................... 1 1.1.2 Các phân nhánh của thống kê. ...................................................................... 1 1.2 Các khái niệm căn bản. ........................................................................................ 2 1.2.1 Tổng thể thống kê và đơn vị tổng thể ........................................................... 2 1.2.2 Mẫu ............................................................................................................... 3 1.2.3 Tiêu thức (biến) thống kê ............................................................................. 3 1.2.4 Chỉ tiêu thống kê .......................................................................................... 4 1.3 Các loại thang đo trong thống kê ......................................................................... 5 1.3.1 Thang đo định danh: ...................................................................................... 5 1.3.2 Thang đo thứ bậc: ......................................................................................... 5 1.3.3 Thang đo khoảng: ......................................................................................... 6 1.3.4 Thang đo tỷ lệ: .............................................................................................. 6 1.4 Dữ liệu dùng trong thống kê ................................................................................ 6 CÂU HỎI ÔN TẬP CHƯƠNG 1 ................................................................................... 8 CHƯƠNG 2: THỐNG KÊ MÔ TẢ ................................................................................ 9 2.1 Mô tả dữ liệu cho một tiêu thức định tính bằng bảng phân phối và biểu đồ ........ 9 2.1.1 Lập bảng phân phối ...................................................................................... 9 2.1.2 Trình bày bằng biểu đồ ................................................................................. 9 2.2 Mô tả dữ liệu cho một tiêu thức định lượng bằng bảng phân phối và biểu đồ ..... 9 2.2.1 Lập bảng phân phối ....................................................................................... 9 2.2.2 Trình bày bằng biểu đồ ............................................................................... 13 2.3 Mô tả một tiêu thức định lượng bằng các chỉ tiêu thống kê ............................... 13 2.3.1 Các chỉ tiêu đo lường khuynh hướng tập trung. ......................................... 13 2.3.1.1 Số trung bình ....................................................................................... 13 2.3.1.2 Mode (Mo) ........................................................................................... 16 2.3.1.3 Số trung vị (Me) .................................................................................... 18 2.3.2. Các chỉ tiêu đo lường độ phân tán. ............................................................. 20 2.3.2.1. Khoảng biến thiên của tiêu thức (toàn cự): (R) ................................... 20 2.3.2.2. Độ lệch tuyệt đối bình quân (𝒅) .......................................................... 20 2.3.2.3. Phương sai ........................................................................................... 21 75 2.3.2.4. Độ lệch tiêu chuẩn ............................................................................... 22 2.3.2.5. Hệ số biến thiên (V) ............................................................................ 23 2.4 Các chỉ tiêu mô tả hình dáng phân phối 1 tiêu thức định lượng......................... 23 CÂU HỎI ÔN TẬP CHƯƠNG 2 ................................................................................. 25 CHƯƠNG 3: PHÂN PHỐI CHUẨN VÀ PHÂN PHỐI MẪU .................................... 26 3.1 Phân phối chuẩn................................................................................................. 26 3.1.1 Định nghĩa ................................................................................................... 26 3.1.2. Phân phối chuẩn tắc (đơn giản): ................................................................. 27 3.1.3. Khái niệm 𝒁𝜶: ............................................................................................ 27 3.2 Phân phối của một vài đại lượng thống kê: ....................................................... 28 3.2.1. Phân phối “Khi bình phương”: ................................................................... 28 3.2.2. Phân phối Student (𝐭- t distribution) ........................................................... 28 3.2.3. Phân phối Fisher (𝐅 distribution) ................................................................ 29 3.3 Phân phối mẫu ................................................................................................... 29 CÂU HỎI ÔN TẬP CHƯƠNG 3 ................................................................................. 30 CHƯƠNG 4: ƯỚC LƯỢNG THAM SỐ CỦA TỔNG THỂ ...................................... 31 4.1 Các khái niệm .................................................................................................... 31 4.1.1 Khái niệm ước lượng: .................................................................................. 31 4.1.2 Khái niệm ước lượng điểm .......................................................................... 31 4.1.3 Khái niệm ước lượng khoảng: ..................................................................... 32 4.1.4 Khái niệm về khoảng tin cậy ....................................................................... 33 4.2 Tham số tổng thể và thống kê mẫu ..................................................................... 33 4.3 Ước lượng điểm .................................................................................................. 33 4.4 Ước lượng khoảng .............................................................................................. 34 4.4.1 Ước lượng khoảng của số trung bình tổng thể ........................................... 34 4.4.1.1 Khi đã biết phương sai của tổng thể 𝛿2 ............................................... 34 4.4.1.2 Khi chưa biết phương sai của tổng thể 𝛿2 ........................................... 35 4.4.2 Ước lượng khoảng của tỉ lệ tổng thể ........................................................... 36 4.4.3 Ước lượng khoảng của phương sai tổng thể ............................................... 37 4.5 Ước lượng cở mẫu. ............................................................................................. 38 4.5.1 Kích thước mẫu khi ước lượng số trung bình tổng thể .............................. 38 4.5.2 Kích thước mẫu khi ước lượng tỷ lệ tổng thể ............................................. 39 CÂU HỎI ÔN TẬP CHƯƠNG 4 ................................................................................. 39 CHƯƠNG 5: KIỂM ĐỊNH THAM SỐ VÀ KIỂM ĐỊNH SỰ KHÁC BIỆT .............. 40 5.1 Các khái niệm ..................................................................................................... 40 76 5.1.1 Giả thuyết và kiểm định giả thuyết.............................................................. 40 5.1.2 Các loại sai lầm trong kiểm định gia thuyết ................................................ 41 5.1.3 Quy trình tổng quát trong kiểm định giả thuyết .......................................... 42 5.1.4 Miền bác bỏ và miền xác định trong kiểm định: ......................................... 42 5.2 Kiểm định tham số .............................................................................................. 43 5.2.1 Kiểm định giả thuyết về số trung bình một tổng thể .................................. 43 5.2.1.1 Trường hợp biết phương sai tổng thể -𝜎2 ........................................... 43 5.2.1.2 Trường hợp chưa biết phương sai tổng thể -𝜎2 ................................... 45 5.2.2 Kiểm định giả thuyết về tỷ lệ p của tổng thể ............................................... 46 5.2.3 Kiểm định giả thuyết về phương sai của tổng thể ...................................... 47 5.3 Giá trị p của kiểm định ....................................................................................... 48 5.4 Kiểm định sự khác biệt ....................................................................................... 50 5.4.1 Kiểm định giả thuyết về sự khác nhau giữa 2 số trung bình của 2 tổng thể 50 5.4.1.1 Trường hợp lấy mẫu từng cặp .............................................................. 50 5.4.1.2 Trường hợp lấy mẫu độc lập: ............................................................... 52 5.4.2 Kiểm định sự khác biệt của hai tỷ lệ tổng thể (với cỡ mẫu lớn >=40) ........ 54 5.4.2.1 Chệnh lệch hai tổng thể bằng 0 ( p0 = 0) .............................................. 54 5.4.2.2 Chệnh lệch hai tổng thể khác 0 ( p0 ≠ 0)............................................. 55 CÂU HỎI ÔN TẬP CHƯƠNG 5 ................................................................................. 56 CHƯƠNG 6: PHÂN TÍCH PHƯƠNG SAI (ANOVA) MỘT YẾU TỐ ..................... 57 6.1 ANOVA một yếu tố ........................................................................................... 57 6.2. Kiểm định TUKEY. ......................................................................................... 62 CÂU HỎI ÔN TẬP CHƯƠNG 6 ................................................................................. 63 CHƯƠNG 7: KIỂM ĐỊNH PHI THAM SỐ ................................................................ 64 6.1 Kiểm định Wilcoxon. ....................................................................................... 64 6.2 Kiểm định Mann-Whitney (Kiểm định U) ........................................................ 66 6.3 Kiểm định Kruskal-Wallis. ............................................................................... 68 6.4 Kiểm định Chi bình phương ............................................................................. 70 6.4.1 Kiểm định Chi bình phương (𝛘𝟐) về sự phù hợp ........................................ 70 6.4.2 Kiểm định Chi bình phương (𝝌𝟐) về tính độc lập của hai biến định tính ... 71 CÂU HỎI ÔN TẬP CHƯƠNG 7 ................................................................................. 73

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_thong_ke_kinh_te_nguyen_thi_phuong_hao.pdf