Kiểm định Chi bình phương (𝛘𝟐) về sự phù hợp
Kiểm định sự phù hợp là kiểm định xem giả thuyết về phân phối của tổng thể
và số liệu thực tế phù hợp (thích hợp) đến mức độ nào với giả định về phân phối của
tổng thể
a) Kiểm định sự phù hợp trong trường hợp giả định đã biết các tham số của tổng thể
Chọn một mẫu ngẫu nhiên n quan sát, được chia thành k nhóm khác nhau: mỗi
quan sát chỉ thuộc vào một nhóm thứ i nào đó (i = 1, ,k). Oi là số lượng quan sát ở
nhóm thứ i. pi xác suất giả thuyết để 1 quan sát rơi vào nhóm thứ i. Vấn đề đặt ra là
kiểm định giả thuyế H0 về phân phối của tổng thể
1. Giả thuyết H0: Tổng thể có phân phối xác suất pi
H1: Tổng thể không có phân phối xác suất pi
2. Giá trị kiểm định: χ2 = ∑ ( Oi−Ei)2
Ei
ki=
1 ; Ei = 𝑛 × pi
Điều kiện: kiểm định có ý nghĩa khi Ei ≥ 5
3. Quyết định bác bỏ H0 khi 𝝌2 > 𝝌( 2𝑘−1),𝛼
77 trang |
Chia sẻ: hachi492 | Ngày: 18/01/2022 | Lượt xem: 319 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Giáo trình Thống kê kinh tế - Nguyễn Thị Phương Hảo, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
tính chất tương đối. Nó
được xác định khi ta đặt giả thuyết Ho. Thông thường sai lầm nào gây ra tổn thất
lớn hơn người ta sẽ đặt giả thuyết Ho sao cho sai lầm đó là loại I và định trước
khả năng mắc phải sai lầm loại I không vượt qua một số α nào đó (α = 5%), tức
là thực hiện kiểm định giả thuyết Ho ở mức ý nghĩa α cho trước.
5.1.3 Quy trình tổng quát trong kiểm định giả thuyết
Bài toán kiểm định ở đây được thực hiện với giá trị cho trước của mức ý nghĩa .
Các bước tiến hành gồm 4 bước sau:
- Bước 1: Xây dựng giả thuyết.
- Bước 2: Tính trị số thống kê của kiểm định.
- Bước 3: So sánh giá trị lý thuyết (được xác định dựa trên mức ý nghĩa α và phân
phối mẫu) với giá trị thực tế (tính được ở B2) để kết luận bác bỏ hay chấp nhận H0.
- Bước 4: Kết luận bằng lời dựa trên kết quả ở bước 3 và nội dung nghiên cứu ban
đầu.
5.1.4 Miền bác bỏ và miền xác định trong kiểm định:
- Kiểm định hai phía; Miền bác bỏ nằm về hai phía của miền chấp nhận
𝑍𝛼/2 0
α/2
𝐌𝐢ề𝐧 𝐛á𝐜 𝐛ỏ
𝑍𝛼/2
𝐌𝐢ề𝐧 𝐛á𝐜 𝐛ỏ
α/2
α/2
43
- Kiểm định bên trái: Miền bác bỏ nằm về phía bên trái của miền chấp nhận
- Kiểm định bên phải: Miền bác bỏ nằm về phía bên phải của miền chấp nhận
5.2 Kiểm định tham số
5.2.1 Kiểm định giả thuyết về số trung bình một tổng thể
5.2.1.1 Trường hợp biết phương sai tổng thể -𝜎2
Điều kiện áp dụng cho trường hợp này là tổng thể X có phân phối chuẩn hoặc
có cỡ mẫu n ≥ 30, các bước kiểm định như sau:
𝑍𝛼 0
1 − α
𝐌𝐢ề𝐧 𝐛á𝐜 𝐛ỏ
𝛼
0
α
𝐌𝐢ề𝐧 𝐛á𝐜 𝐛ỏ
𝑍𝛼
1 − α
44
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết H0: 𝜇 ≤ 𝜇0
H1: 𝜇 > 𝜇0
H0: 𝜇 ≥ 𝜇0
H1: 𝜇 < 𝜇0
H0: 𝜇 = 𝜇0
H1: 𝜇 ≠ 𝜇0
2. Kiểm định
Z =
x̅ − μ0
σ
√n
3. Bác bỏ H0 khi Z> Zα Z Zα 2⁄ hay Z < −Zα 2⁄
Đối với trường hợp này ta sử dụng phân phối chuẩn để thực hiện kiểm định giả
thuyết thống kê, có thể gọi tắt là kiểm định Z, nguyên tắc bác bỏ H0 trong kiểm định Z
như sau:
Bác bỏ H0 trong kiểm định 1 đuôi: |Z| > Zα
Bác bỏ H0 trong kiểm định 2 đuôi: |Z| > Zα 2⁄
Ví dụ 5.4: Một máy đóng mì gói tự động quy định khối lượng trung bình 1 gói
là 75g, độ lệch chuẩn là 15g. Sau một thời gian sử dụng, người ta tiến hành kiểm tra
mẫu 80 gói và tính được khối lượng trung bình là 72g. Hãy đánh giá về mức độ chính
xác của máy đóng gói này với mức ý nghĩa α = 5%.
Giải:
Gọi μ là khối lượng thực tế 1 gói mì ; μo là khối lượng quy định 1 gói mì.
Ta có: n = 80; δ = 15g; α = 5%.
(1) Đặt giả thuyết Ho: μ = μo = 75
Đối thuyết H1: μ ≠ μo ≠ 75
(2) Giá trị kiểm định Z : Z =
x̅−μ0
σ
√n
=
72−75
15
√80
= 1,79
Tra bảng Z lý thuyết: Zα 2⁄ = Z(2,5%) = 1,96
(3) Quyết định: Vì |Z|< Zα 2⁄ ; 1,79 < 1,96 nên ta chấp nhận Ho, tức là μ = μo = 75g.
(4) Kết luận: Như vậy với mức ý nghĩa α = 5% ta có kết luận là khối lượng trung bình
1 gói mì không sai khác với tiêu chuẩn quy định.
45
5.2.1.2 Trường hợp chưa biết phương sai tổng thể -𝜎2
a) Trường hợp n≥ 𝟑𝟎
Thực hiện tương tự các bước của kiểm định trung bình trong trường hợp đã biết
phương sai tổng thể (𝜎2); nhưng ở bước tính giá trị kiểm định ta buộc phải dùng
phương sai mẫu (S2) thay cho phương sai tổng thể chưa biết. Ta có kiểm định Z với :
𝐙 =
x̅ − μ0
S
√n
b) Trường hợp n < 𝟑𝟎: Trong trường hợp này điều kiện tổng thể phải có phân
phối chuẩn. Ta có dạng tổng quát kiểm định như sau:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết H0: 𝜇 ≤ 𝜇0
H1: 𝜇 > 𝜇0
H0: 𝜇 ≥ 𝜇0
H1: 𝜇 < 𝜇0
H0: 𝜇 = 𝜇0
H1: 𝜇 ≠ 𝜇0
2. Kiểm định
𝐭 =
x̅ − μ0
S
√n
3. Bác bỏ H0 khi t > tn−1,α t tn−1,α 2⁄
hay t < −tn−1,α 2⁄
Tương tự như đối với kiểm định Z, ta có thể gọi trong trường hợp này là kiểm
định Student và có thể tóm tắt nguyên tác bác bỏ H0 như sau:
Bác bỏ H0 trong kiểm định 1 đuôi: |t| > tn−1,α
Bác bỏ H0 trong kiểm định 2 đuôi: |t| > tn−1,α 2⁄
Ví dụ 5.5: Một nhà sản xuất đèn chiếu X quang cho biết tuổi thọ trung bình
thấp nhất là 65 giờ. Kết quả kiểm tra từ mẫu ngẫu nhiên 21 đèn cho thấy tuổi thọ trung
bình là 62,5 giờ, với độ lệch chuẩn là 3. Với α =1 %, có thể kết luận gì về lời tuyên bố
của nhà sản xuất? Cho biết tuổi thọ bóng đèn có phân phân phối chuẩn
Giải:
Gọi tuổi thọ trung bình của 1 bóng đèn thực tế là μ, μ chưa biết
46
Ta có: n = 21, �̅� = 62,5 ; μ = 65; α = 1 %
(1) Đặt giả thuyết Ho: μ ≥ 65;
Đối thuyết H1: μ < 65
(2) Giá trị kiểm định:
𝐭 =
x̅ − μ0
S
√n
=
62,5 − 65
3
√21
= −3,82
T lý thuyết: T (n-1; α) = T (20; 0,01) = 2,528
(3) Quyết định: Vì |t| = 3,82 > T20, 0,01 = 2,528 nên giả thuyết Ho bị bác bỏ
(4) Kết luận: Với mức ý nghĩa α = 1% ta có thể kết luận lời tuyên bố của nhà
sản xuất là sai
5.2.2 Kiểm định giả thuyết về tỷ lệ p của tổng thể
Giả sử ta có mẫu ngẫu nhiên n quan sát. Gọi: p là tỷ lệ của tổng thể, p̂ là tỷ lệ
của quan sát mẫu, p0 là tỷ lệ nào đó cần kiểm định. Điều kiện cỡ mẫu n≥ 𝟒𝟎
Trong trường hợp này ta có kiểm định phân phối chuẩn, các bước kiểm định
như sau:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết H0: p ≤ p0
H1: p > p0
H0: p ≥ p0
H1: p < p0
H0: p = p0
H1: p ≠ p0
2. Kiểm định
Z =
p̂ − p0
√p0(1 − p0)
n
3. Bác bỏ H0 khi Z> Zα Z Zα 2⁄ hay Z < −Zα 2⁄
Bác bỏ H0 trong kiểm định 1 đuôi: |Z| > Zα
Bác bỏ H0 trong kiểm định 2 đuôi: |Z| > Zα 2⁄
Ví dụ 5.6: Giả sử sản phẩm của một công ty sản xuất vỏ xe ô tô đã chiếm được
thị phần 42%. Hiện tại, trước cạnh tranh của đối thủ và những thay đổi của môi trường
47
kinh doanh, ban lãnh đạo muốn kiểm tra lại xem thị phần của công ty có còn 42% hay
không. Chọn một mẫu ngẫu nhiên 550 ô tô trên đường, kết quả cho thấy có 219 xe sử
dụng vỏ xe của công ty. Có thể kết luận gì? Với mức ý nghĩa α = 10%
Gọi p là tỷ lệ xe sử dụng vỏ xe của công ty
Ta có: n = 550; 𝑝 ̂ =
219
550
= 0,398; p0 = 0,42; α = 10%
(1) Đặt giả thuyết Ho: p ≥ 0,42;
Đối thuyết H1: p < 0,42
(2) Giá trị kiểm định:
Z =
p̂ − p0
√p0(1 − p0)
n
=
0,398 − 0,42
√0,42(1 − 0,42)
550
= −1,037
Z lý thuyết: Z0,1 = 1,28
(3) Quyết định: Vì |Z| = 1,037 < Z 0,1 = 1,28 chấp nhận giả thuyết Ho
(4) Kết luận: Ở mức ý nghĩa α = 10% ta có thể nói rằng hiện tại công ty chiếm
ít nhất 42% thị trường về vỏ xe ô tô
5.2.3 Kiểm định giả thuyết về phương sai của tổng thể
Chọn một mẫu ngẫu nhiên n quan sát được chọn từ tổng thể phân phối
chuẩn.Gọi S2 là phương sai mẫu, kiểm định giả thuyết về phương sai tổng thể được
thực hiện như sau:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết H0: 𝛿2 ≤ 𝛿0
2
H1: 𝛿2 > 𝛿0
2
H0: 𝛿2 ≥ 𝛿0
2
H1: 𝛿2 < 𝛿0
2
H0: 𝛿2 = 𝛿0
2
H1: 𝛿2 ≠ 𝛿0
2
2. Kiểm định
𝜒𝑛−1
2 =
(𝑛 − 1)𝑆2
𝛿0
2
3. Bác bỏ H0 khi 𝜒𝑛−1
2 > 𝜒𝑛−1,α
2 𝜒𝑛−1
2 < 𝜒𝑛−1,1−α
2 𝜒𝑛−1
2 > 𝜒𝑛−1,α/2
2 hay
𝜒𝑛−1
2 > 𝜒𝑛−1,1−α/2
2
48
Ví dụ 5.7: Bộ phận giám sát chất lượng quan tâm đến đường kính một loại chi
tiết sản phẩm.
- Quá trình sản xuất còn được xem là tốt và chi tiết sản phẩm sản xuất ra được
chấp nhận nếu phương sai của đường kính tối đa không quá 1, nếu phương sai vượt
quá 1, phải xem xét lại máy móc và sửa chữa.
- Với mẫu ngẫu nhiên 31 chi tiết, phương sai đường kính tính được là 1,62.
- Ở mức ý nghĩa α =0,05, ta có thể kết luận như thế nào về quá trình sản xuất?
Biết rằng đường kính của các chi tiết máy là biến ngẫu nhiên có phân phối chuẩn.
Gọi 𝛿2là phương sai của đường kính sản phẩm.
Ta có: n=31; S2 =1,62; 𝛿0
2 =1; α =5%
1. Đặt giả thuyết: H0: 𝛿2 ≤ 1
H1: 𝛿2 > 1
2. Giá trị kiểm định: 𝜒𝑛−1
2 =
(𝑛−1)𝑆2
𝛿0
2 = 𝜒30
2 =
(31−1)𝑥1,62
1
= 48,6
3. Quyết định: 𝜒30
2 = 48,6 > 𝜒30,0,05
2 = 43,77 => Bác bỏ giả thuyết H0.
4. Kết luận: Ở mức ý nghĩa 5%, ta kết luận cần phải xem xét, sửa chữa máy móc.
5.3 Giá trị p của kiểm định
Nếu giả sử trong ví dụ 5.4 trên ta kiểm định giả thuyết Ho: μ = μo với mức ý
nghĩa α = 10% thì ta có cùng kết luận như trên không?
Với α = 10% ta có Zα/2 = Z(5%) = 1,645 < |𝑍| thực nghiệm =1,79, ta bác bỏ Ho.
Vậy với mức ý nghĩa α nhỏ nhất nào thì ở đó giả thuyết Ho bị bác bỏ. Mức ý
nghĩa nhỏ nhất đó gọi là giá trị P (P - value).
Lấy lại ví dụ 5.4 trên ta thấy, với giá trị kiểm định thực nghiệm Ho bị bác bỏ
|𝑍|thực nghiệm =1,79, thì giả thuyết Ho bị bác bỏ ở bất cứ giá trị nào của α mà ở đó
Zα <1,79.
Tra bảng Z ta có kết quả: ϕ (1,79) = 0,4633; mà α/2 = 0,5 - 0,4633 = 0,0367
Vậy α = 2 x 0,0367 = 0,0734 hay 7,34%; Nghĩa là giả thuyết Ho sẽ bị bác bỏ ở
bất kỳ mức ý nghĩa α nào lớn hơn 7,34%.
Có thể hình dung miền chấp nhận, miền bác bỏ theo giá trị P ở sơ đồ sau:
49
Hình 5.1. Miền chấp nhận, miền bác bỏ theo giá trị P
Chú ý:
1) Trong thực tế tính giá trị P ((P - value) có thể sử dụng hàm NORMSDIST
trong EXCEL hoặc các phần mềm thống kê.
- Nếu sử dụng hàm NORMSDIST trong EXCEL thì thực hiện như sau:
Ta có P - value = P(Z > 1,79) = P(Z <- 1,79)= 1- NORMSDIST(1,79)=
0,0367269 (tra hàm = NORMSDIST(1.79) trong EXCEL).
Từ đó α = 2 x 0,0367 = 0,0734 hay 7,34%.
- Nếu sử dụng các phần mềm thống kê, các kết quả xử lý số liệu bằng máy tính
thường luôn thể hiện giá trị P.
2) Nếu quy định trước mức ý nghĩa α, có thể dùng P - value để kết luận theo α.
Khi đó nguyên tắc kiểm định như sau:
- P-value <α thì bác bỏ Ho, chấp nhận H1
- P-value ≥ α thì chưa có cơ sở để bác bỏ Ho.
3) Có thể kiểm định giả thuyết Ho theo P-value theo nguyên tắc sau:
- P- value > 0,1 thì thường chấp nhận Ho
- 0,05 < P- value ≤ 0,1 thì cần cân nhắc cẩn thận trước khi bác bỏ Ho (có thể
tham khảo thêm tình hình);
- 0,01 < P- value ≤ 0,05 thì nghiêng về hướng bác bỏ Ho nhiều hơn;
- 0,001 < P- value ≤ 0,01 thì ít băn khoăn khi bác bỏ Ho nhều hơn;
- P- value ≤ 0,001 thì có thể yên tâm khi bác bỏ Ho.
50% P =7,34% 10% 5%
Chấp nhận H
0
Bác bỏ H
0
Giá trị P value
1,645
1,79
0 1,96
50
5.4 Kiểm định sự khác biệt
5.4.1 Kiểm định giả thuyết về sự khác nhau giữa 2 số trung bình của 2 tổng thể
5.4.1.1 Trường hợp lấy mẫu từng cặp
Chọn một mẫu ngẫu nhiên có n cặp quan sát (xi, yi) từ hai tổng thể X, Y có
phân phối chuẩn. D0 là một giá trị cho trước, ta thực hiện các bước kiểm định như sau:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 > 𝐷0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 < 𝐷0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0
2. Giá trị kiểm định
t =
�̅� − D0
Sd
√𝑛
3. Bác bỏ H0 khi t > tn−1,α t tn−1,α 2⁄
hay t < −tn−1,α 2⁄
Trong đó: Do : Giá trị cụ thể cho trước
d̅: Trung bình của tổng thể sai lệch (X - Y); �̅� =
∑ di
n
i=1
𝑛
=
∑ (xi
n
i=1 − 𝑦i)
𝑛
n: Số đơn vị mẫu quan sát
T: Tiêu chuẩn kiểm định (T thực nghiệm)
Sd: Độ lệch chuẩn của tổng thể sai lệch (X - Y); 𝑆𝑑
2 =
∑ (𝑑𝑖−d)̅̅ ̅
2 ni=1
n−1
Ví dụ 5.8: Công ty VINAMILK áp dụng công nghệ mới trong chế biến sữa
chua. Hãy kiểm định xem năng suất lao động của công nhân sau khi sử dụng công
nghệ mới với công nghệ cũ có khác nhau không với mức ý nghĩa là 5% ?
Giải: Lấy mẫu 10 công nhân trong Công ty, thu thập số liệu về năng suất lao
động của 10 công nhân này trước và sau khi áp dụng công nghệ mới. Kết quả điều tra
thể hiện ở bảng sau
51
Thứ tự công
nhân quan sát
NSLĐ (kg/ngày)
X - Y
Trước khi áp dụng
công nghệ mới (X)
Sau khi áp dụng
công nghệ mới (Y)
1 50 52 -2
2 48 46 2
3 45 50 -5
4 60 65 -5
5 70 78 -8
6 62 61 1
7 55 58 -3
8 62 70 -8
9 58 67 -9
10 53 65 -12
Trung bình 56,30 61,20 -4,90
Phương sai 57,57 97,07 20,10
Độ lệch chuẩn 7,59 9,85 4,4833
Ta có: n = 10, d̅ = −4,9, D0 = 0, Sd = 4,4833, α = 5%
Gọi: μx NSLĐ trung bình của 10 công nhân theo công nghệ cũ = 56,30
μy NSLĐ trung bình của 10 công nhân theo công nghệ mới = 61,20
1. Đặt giả thuyết:
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0 = 0
𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0 ≠ 0
2. Giá trị kiểm định: t =
�̅�−D0
Sd
√𝑛
=
−4,9−0
4,4833
√10
= −3,456
52
T lý thuyết : tn−1,α 2⁄ = t9, 0,025 = 2,262
3. Quyết định: |t| = 3,456 > tn−1,α 2⁄ = 2,262 nên ta bác bỏ Ho, nghĩa là năng
suất lao động của công nhân sau khi áp dụng công nghệ mới khác với công nghệ cũ.
Vì �̅� = 4,9 > Do nên μx - μy > 0, nghĩa là ở mức ý nghĩa 5% áp dụng công nghệ
mới đã làm tăng năng suất so với công nghệ cũ.
5.4.1.2 Trường hợp lấy mẫu độc lập:
Gọi 𝑛𝑥 , 𝑛𝑦 là số quan sát của các mẫu ngẫu nhiên độc lập 𝑥1 , 𝑥2𝑥𝑛, 𝑦1,
𝑦2𝑦𝑛, từ hai tổng thể X,Y có trung bình 𝜇𝑥, 𝜇𝑦 và phương sai δx
2 , δ𝑦
2 . Với trung
bình mẫu �̅�, �̅� và phương sai mẫu là Sx
2 , S𝑦
2; với mức ý nghĩa α
a) Nếu biết phương sai tổng thể
Điều kiện trong trường hợp này là hai tổng thể có phân phối chuẩn hoặc có cỡ
mẫu lớn (n>30). Ta có kiểm định Z như sau:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 > 𝐷0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 < 𝐷0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0
2. Giá trị kiểm định
𝐙 =
(�̅� − �̅�) − 𝐃𝟎
√
δx2
𝑛𝑥
+
δ𝑦2
𝑛𝑦
3. Bác bỏ H0 khi Z > 𝑍α Z 𝑍α/2 hay Z < -
𝑍α/2
b) Nếu chưa biết phương sai tổng thể, giả sử 2 phương sai khác nhau
- Trường hợp có cỡ mẫu lớn (n>30): ta vẫn sử dụng công thức trên với
phương sai mẫu thay cho phương sai tổng thể và không cần điều kiện phân phối. Ta
có kiểm định Z như sau:
53
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 > 𝐷0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 < 𝐷0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0
2. Giá trị kiểm định
Z =
(�̅� − �̅�) − D0
√
Sx2
𝑛𝑥
+
S𝑦2
𝑛𝑦
3. Bác bỏ H0 khi Z > 𝑍α Z 𝑍α/2 hay Z < -
𝑍α/2
- Trường hợp cỡ mẫu nhỏ (n < 30): với giả định cả hai tổng thể X, Y có phân
phối chuẩn, ta vẫn sử dụng phương sai mẫu thay cho phương sai tổng thể, nhưng khi
đó tiêu chuẩn kiểm định theo phân phối Student bậc tự do được xác định bởi công
thức:
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 > 𝐷0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 < 𝐷0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 = 𝐷0
𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 𝐷0
2. Giá trị kiểm định
𝐭 =
(�̅� − �̅�) − 𝐃𝟎
√
Sx2
𝑛𝑥
+
S𝑦2
𝑛𝑦
3. Bác bỏ H0 khi t > tn,α t tn,α 2⁄
hay t < −tn,α 2⁄
Ví dụ 5.9: Một nghiên cứu về hai nhãn hiệu pin X và Y (cùng chủng loại) của
hai nhà sản xuất khác nhau được thực hiện.
- Chọn ngẫu nhiên mỗi nhãn hiệu 100 pin, kết quả được ghi nhận như sau:
+ Pin X có thời gian sử dụng trung bình là 308 phút, độ lệch chuẩn 84 phút.
54
+ Các chỉ số tương ứng của pin Y lần lượt là 254 phút và 67 phút.
- Có thể kết luận thời gian sử dụng trung bình của pin X lớn hơn pin Y ít nhất
là 45 phút được không với mức ý nghĩa α =0,1.
Ta có: nx = ny = 100, �̅� = 308, �̅�= 254, D0 = 45
Sx = 84, Sy = 67, α = 10%
1. Đặt giả thuyết: {
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 45
𝐻1: 𝜇𝑥 − 𝜇𝑦 > 45
2. Giá trị kiểm định: 𝐭 =
(�̅�− �̅�)−𝐃𝟎
√Sx
2
𝑛𝑥
+
S𝑦
2
𝑛𝑦
= 𝐭 =
(308− 254)−𝟒𝟓
√
84
100
+
67
100
= 𝟎, 𝟖𝟑𝟖
3. Quyết định: |𝑍| = 0,838 chấp nhận giả thuyết H0.
4. KL: Ở mức ý nghĩa 10%, không đủ chứng cớ để kết luận thời gian sử dụng
trung bình của pin X lớn hơn pin Y là 45 phút.
5.4.2 Kiểm định sự khác biệt của hai tỷ lệ tổng thể (với cỡ mẫu lớn >=40)
Chọn 2 mẫu ngẫu nhiên độc lập từ 2 tổng thể X và Y có cỡ mẫu lớn có tỷ lệ
tổng thể và tỷ lệ mẫu lần lượt là px, p𝑦, 𝑝𝑥̅̅ ̅, 𝑝𝑦̅̅ ̅. Giá trị kiểm định p0 cho trước và mức
ý nghĩa α. Ta có các trường hợp sau:
5.4.2.1 Chệnh lệch hai tổng thể bằng 0 ( p0 = 0)
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết
{
𝐻0: 𝑝𝑥 − 𝑝𝑦 ≤ 0
𝐻1: 𝑝𝑥 − 𝑝𝑦 > 0
{
𝐻0: 𝑝𝑥 − 𝑝𝑦 ≥ 0
𝐻1: 𝑝𝑥 − 𝑝𝑦 < 0
{
𝐻0: 𝑝𝑥 − 𝑝𝑦 = 0
𝐻1: 𝑝𝑥 − 𝑝𝑦 ≠ 0
2. Giá trị kiểm định
Z =
(𝑝𝑥̅̅ ̅ − 𝑝𝑦̅̅ ̅)
√�̅�(1 − �̅�)(
1
𝑛𝑥
+
1
𝑛𝑦
)
3. Bác bỏ H0 khi Z > 𝑍α Z 𝑍α/2 hay Z < -𝑍α/2
Trong đó: �̅� =
𝑛𝑥𝑝𝑥̅̅̅̅ +𝑛𝑦𝑝𝑦̅̅ ̅̅
𝑛𝑥+𝑛𝑦
55
5.4.2.2 Chệnh lệch hai tổng thể khác 0 ( p0 ≠ 0)
Một đuôi phải Một đuôi trái Hai đuôi
1. Đặt giả thuyết
{
𝐻0: 𝑝𝑥 − 𝑝𝑦 ≤ 𝑃0
𝐻1: 𝑝𝑥 − 𝑝𝑦 > 𝑃0
{
𝐻0: 𝑝𝑥 − 𝑝𝑦 ≥ 𝑃0
𝐻1: 𝑝𝑥 − 𝑝𝑦 < 𝑃0
{
𝐻0: 𝑝𝑥 − 𝑝𝑦 = 𝑃0
𝐻1: 𝑝𝑥 − 𝑝𝑦 ≠ 𝑃0
2. Giá trị kiểm định
𝐙 =
(𝑝𝑥̅̅ ̅ − 𝑝𝑦̅̅ ̅) − 𝑃0
√
𝑝𝑥̅̅ ̅(1 − 𝑝𝑥̅̅ ̅)
𝑛𝑥
+
𝑝𝑦̅̅ ̅(1 − 𝑝𝑦̅̅ ̅)
𝑛𝑦
3. Bác bỏ H0 khi Z > 𝑍α Z 𝑍α/2 hay Z < -𝑍α/2
Ví dụ 5.10: Một công ty nước giải khát đang nghiên cứu việc đưa vào một công
thức mới để cải tiến sản phẩm của mình.
-Với công thức cũ, khi cho 500 người dùng thử thì có 120 người tỏ ra ưa thích nó.
-Với công thức mới, khi cho 1000 người khác dùng thử thì có 300 người tỏ ra
ưa thích nó.
-Hãy kiểm định xem công thức mới đưa vào có làm tăng tỷ lệ những người ưa
thích nước giải khát hay không với α =5%?
Giải: Gọi px , py là tỷ lệ người ưa thích sản phẩm cũ, mới.
Ta có: nx = 500; ny = 1000; α = 5%
𝑝𝑥̅̅ ̅ =
120
500
= 0,14 ; 𝑝𝑦̅̅ ̅ =
300
1.000
= 0,3; p0 =0
1. Đặt giả thuyết: {
𝐻0: 𝑝𝑥 − 𝑝𝑦 ≥ 0
𝐻1: 𝑝𝑥 − 𝑝𝑦 < 0
; �̅� =
𝑛𝑥𝑝𝑥̅̅̅̅ +𝑛𝑦𝑝𝑦̅̅ ̅̅
𝑛𝑥+𝑛𝑦
=
500 𝑥0,14+1.000𝑥0,3
500+1.000
= 0,28
2. Giá trị kiểm định:
Z =
(𝑝𝑥̅̅̅̅ − 𝑝𝑦̅̅ ̅̅ )
√�̅�(1−�̅�)(
1
𝑛𝑥
+
1
𝑛𝑦
)
=
(0,14− 0,3)
√0,28(1−0,28)(
1
500
+
1
1.000
)
= −2,44
3. Quyết định: |𝑍| = 2,44 > 𝑍α= 1,645 => bác bỏ giả thuyết H0.
4. KL: Với α =5%, ta có thể kết luận khách hàng có xu hướng ưa chuộng sản
phẩm với công thức mới hơn.
56
CÂU HỎI ÔN TẬP CHƯƠNG 5
Câu 1: Kiểm định giả thuyết là gì? Trình bày quy tắc đặt giả thuyết
Câu 2: Trình bày các bước kiểm định giả thuyết.
Câu 3: Trình bày công thức tính tiêu chuẩn kiểm định khi kiểm định giả thuyết về số
trung bình một tổng thể
- Trường hợp biết phương sai
- Trường hợp chưa biết phương sai
Câu 4: Trình bày công thức tính tiêu chuẩn kiểm định khi kiểm định tỷ lệ của tổng thể
Câu 5: Trình bày công thức tính tiêu chuẩn kiểm định khi kiểm định về sự khác nhau
giữa 2 số trung bình của 2 tổng thể
- Trường hợp lấy mẫu từng cặp
- Trường hợp lấy mẫu độc lập
57
CHƯƠNG 6: PHÂN TÍCH PHƯƠNG SAI (ANOVA) MỘT YẾU TỐ
Phân tích phương sai thực chất là bài toán kiểm định về sự bằng nhau của
nhiều trung bình tổng thể. Phân tích phương sai được dùng như là một công cụ để
xem xét ảnh hưởng của một hay một số yếu tố nguyên nhân (định tính) đến một yếu tố
kết quả kết quả (định lượng). Bài toán này được giải quyết trong điều kiện tổng thể có
phân phối chuẩn và phương sai bằng nhau. Đây là điều kiện làm cho bài toán này khó
ứng dụng. Bài toán này gọi là phân tích phương sai bởi vì khi giải quyết bài toán này
người ta chủ yếu dựa vào tính chất của phương sai.
6.1 ANOVA một yếu tố
Phân tích phương sai một yếu tố là phân tích ảnh hưởng của một yếu tố nguyên
nhân (thường là yếu tố định tính) đến một yếu tố kết quả (thường là yếu tố định lượng)
đang nghiên cứu.
a) Bài toán:
Giả sử chúng ta cần so sánh số trung bình của k tổng thể độc lập. Người ta lấy
k mẫu có số quan sát là 𝑛1; 𝑛2 𝑛𝑘; tuân theo phân phối chuẩn. Trung bình của các
tổng thể được ký hiệu là 𝜇1; 𝜇2.𝜇𝑘 thì mô hình phân tích phương sai một yếu tố ảnh
hưởng được mô tả dưới dạng kiểm định giả thuyết có dạng như sau:
𝐻0: Yếu tố kết quả không bị ảnh hưởng bởi yếu tố đang xét
𝐻1: Yếu tố kết quả có bị ảnh hưởng bởi yếu tố đang xét
Hay: 𝐻0: 𝜇1 = 𝜇2 = ⋯ 𝜇𝑘
𝐻1: Tồn tại ít nhất 1 cặp có 𝜇1 ≠ 𝜇2; 𝜇2 ≠ 𝜇𝑘
Để kiểm định ta đưa ra 2 giả thiết sau:
1) Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
2) Ta lấy k mẫu độc lập từ k tổng thể. Mỗi mẫu được quan sát nj lần.
b) Các bước tiến hành:
Bước 1: Tính các trung bình mẫu và trung bình chung của k mẫu
Trung bình mẫu 𝑥1̅; 𝑥2̅̅ ̅; 𝑥𝑘̅̅ ̅ được tính theo công thức:
𝑥�̅� =
∑ 𝑋𝑖𝑗
𝑛𝑖
𝑗=1
𝑛𝑖
(𝑖 = 1,2 𝑘)
Trung bình chung của k mẫu được tính theo công thức:
58
�̅� =
∑ 𝑛𝑖 × 𝑥�̅�
𝑘
𝑖=1
∑ 𝑛𝑖
𝑘
𝑖=1
(𝑖 = 1,2 𝑘)
Bước 2: Tính các tổng độ lệch bình phương
- Tổng các độ lệch bình phương trong nội bộ từng mẫu (SSW):
𝑆𝑆𝑊 = ∑ ∑(𝑋𝑖𝑗 − 𝑋�̅�)
2
𝑛𝑗
𝑗=1
𝑡
𝑖=1
- Tổng các độ lệch bình phương giữa các mẫu (SSB).
𝑆𝑆𝐵 = ∑(𝑋𝑖 − �̅�)
2 × 𝑛𝑖
𝑡
𝑖=1
- Tổng các độ lệch bình phương của toàn bộ tổng thể (SST):
TSS = SSW + SSB = ∑ ∑ (𝑋𝑖𝑗 − �̅�)
2𝑛𝑗
𝑗=1
𝑡
𝑖=1
Như vậy, toàn bộ biến thiên của yếu tố kết quả (SST) được phân tích thành 2
phần: phần biến thiên do yếu tố nguyên nhân đang nghiên cứu (SSW); phần biến thiên
còn lại do yếu tố khác không nghiên cứu ở đây (MSB). Nếu phần biến thiên do yếu tố
nguyên nhân đang nghiên cứu tạo ra càng nhiều so với phần biến thiên do yếu tố khác
tạo ra, thì ta càng có cơ sở để bác bỏ Ho và đi đến kết luận yếu tố nguyên nhân có ảnh
hưởng có ý nghĩa đến yếu tố kết quả.
Bước 3: Tính các phương sai (phương sai của nội bộ mẫu và phương sai giữa
các mẫu)
- Phương sai của nội bộ mẫu (MSW)
𝑀𝑆𝑊 =
𝑆𝑆𝑊
𝑛 − 𝑘
;
- Phương sai giữa các mẫu (MSB)
𝑀𝑆𝐵 =
𝑆𝑆𝐵
𝑘 − 1
Bước 4: Kiểm định giả thuyết
- Tính tiêu chuẩn kiểm định F (F thực nghiệm):
F =
MSB
MSW
Tìm F lý thuyết (F tiêu chuẩn = F (k-1; n-k; α)):
59
F lý thuyết là giá trị giới hạn tra từ bảng phân phối F với k-1 bậc tự do của
phương sai ở tử số và ; n-k bậc tự do của phương sai ở mẫu số với mức ý nghĩa α.
Nếu F thực nghiệm > F lý thuyết, bác bỏ Ho, nghĩa là các số trung bình của k
tổng thể không bằng nhau.
Bảng phân tích phương sai 1 yếu tố khi sử dụng phần mềm EXCEL hoặc SPSS
tóm tắt như sau:
Bảng gốc bằng tiếng Anh
Source of variation
Sum of
squares(SS)
Degree of
freedom (df)
Mean
squares (MS)
F- ratio
Between - groups SSB (k-1) MSB
F =
MSB
MSW
Within - groups SSW (n-k) MSW
Total SST (n-1)
Bảng phân tích phương sai tổng quát dịch ra tiếng việt – ANOVA
Nguồn biến động
Tổng độ lệch bình
phương (SS)
Bậc tự do(df)
Phương sai
(MS)
F- Tỷ số
Giữa các mẫu SSB (k-1) MSB
F =
MSB
MSW
Trong nội bộ các mẫu SSW (n-k) MSW
Tổng số SST (n-1)
Ví dụ 6.1: Ban Giám hiệu một trường đại học muốn nghiên cứu ảnh hưởng của
việc đi làm thêm đối với kết quả học tập của sinh viên. Một sinh viên đã thu thập thời
gian đi làm thêm và kết quả học tập của một số sinh viên trong trường. Sinh viên có đi
làm thêm được chia thành ba nhóm. Nhóm thứ nhất gồm 7 sinh viên có thời gian làm
thêm ít, dưới 6 giờ / tuần. Nhóm thứ hai gồm 7 sinh viên có thời gian làm thêm vừa
phải, từ 6 đến 12 giờ / tuần. Nhóm thứ ba gồm 8 sinh viên có thời gian làm thêm
nhiều, trên 12 giờ / tuần. Điểm trung bình học tập của các sinh viên đó như sau.
60
Nhóm 1: làm thêm ít
(<6 giờ /tuần)
Nhóm 2: làm thêm TB
(6-12 giờ/tuần)
Nhóm 3: làm thêm nhiều
(>12 giờ/tuần)
6,3 7,2 6,3
7,0 6,6 5,8
6,5 6,1 6,0
6,6 5,8 5,5
7,2 6,8 5,2
6,9 7,1 6,5
6,4 5,9 5,3
6,2
Yêu cầu: Kiểm định phát biểu giả thuyết: thời gian đi làm thêm không ảnh
hưởng đến kêt qủa học tập của sinh viên, nghĩa là điểm trung bình học tập của ba
nhóm trên là như nhau:
Giải:
- Đặt giả thuyết
𝐻0: yếu tố kết quả học tập không bị ảnh hưởng bởi thời gian đi làm thêm
𝐻1: yếu tố kết quả học tập bị ảnh hưởng bởi thời gian đi làm thêm
𝐻0: 𝐻0: 𝜇1 = 𝜇2 = ⋯ 𝜇𝑘
𝐻1: Tồn tại ít nhất 1 cặp có 𝜇1 ≠ 𝜇2; 𝜇2 ≠ 𝜇𝑘
Bước 1. Tính trung bình của từng nhóm và trung bình chung của ba nhóm.
𝑥1̅ =
46,9
7
= 6,7; 𝑥2̅̅ ̅ =
45,5
7
= 6,5; 𝑥3̅̅ ̅ =
46,8
8
= 5,85
�̅� =
46,9+45,5+46,8
7+7+8
= 6,3273
Bước 2. Tính các tổng độ lệch bình phương
61
SS1 = 0,68; SS2 = 1,96; SS3 = 1,62
SSW = SS1 + SS2 + SS3 = 0,68+1,96+ 1,62 = 4,26
𝑆𝑆𝐵 = ∑ (𝑋𝑖 − �̅�)
2 × 𝑛𝑖
𝑡
𝑖=1 = (6,7 − 6,3273)
2𝑥7 + (6,5 − 6,3273)2𝑥7 +
(5,85 − 6,3273)2𝑥8 = 3,004
Bước 3: Tính các phương sai
+ Phương sai của nội bộ mẫu (MSW)
𝑀𝑆𝑊 =
𝑆𝑆𝑊
𝑛 − 𝑘
=
4,26
22 − 3
= 0,224
+ Phương sai giữa các mẫu (MSB)
𝑀𝑆𝐵 =
𝑆𝑆𝐵
𝑘 − 1
=
3,004
3 − 1
= 1,502
Bước 4: Kiểm định giả thuyết
- Tính F thực nghiệm:
F =
MSB
MSW
=
1,502
0,224
= 6,7
- Tra bảng F lý thuyết: F (k-1; n-k; α))= F (2; 19; 0,05)= 3,52
- So sánh F thực nghiệm với F lý thuyết ta thấy: F thực nghiệm > F lý thuyết:
bác bỏ Ho hay việc đi làm thêm có ảnh hưởng đến kết quả học tập của sinh viên
Sử dụng kết quả của máy tính, phần mềm EXCEL chúng ta cũng có kết quả
tương tự
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Nhóm 1: làm thêm ít (<6 giờ /tuần) 7 46,9 6,7 0,113333
Nhóm 2: làm thêm TB (6-12 giờ/tuần) 7 45,5 6,5 0,326667
Nhóm 3: làm thêm nhiều (>12
giờ/tuần) 8 46,8 5,85 0,231429
ANOVA
62
Source of Variation SS df MS F P-value F crit
Between Groups 3,003636364 2 1,501818 6,69825 0,006287 3,521893
Within Groups 4,26 19 0,224211
Total 7,263636364 21
6.2. Kiểm định TUKEY.
Từ phần nghiên cứu ở trên, nếu chấp nhận giả thuyết H0 thì việc phân tích
phương sai kết thúc. Nếu bác bỏ H0 có nghĩa không phải trung bình của các tổng thể
bằng nhau. Vì vậy cần phân tích sâu: Trung bình của những tổng thể nào thì khác
nhau, tổng thể nào có trung bình lớn hơn, hoặc nhỏ hơn.
Có nhiều phương pháp để tiếp tục phân tích sâu. Ở đây chỉ giới thiệu phương
pháp khá thông dụng là phương pháp TUKEY
Với cùng mức ý nghĩa 𝛼, ta so sánh từng cặp trung bình để phát hiện những
nhóm khác nhau.
{
𝐻0: 𝜇1 = 𝜇2
𝐻1: 𝜇1 ≠ 𝜇2
, {
𝐻0: 𝜇1 = 𝜇3
𝐻1: 𝜇1 ≠ 𝜇3
,. {
𝐻0: 𝜇𝑘−1 = 𝜇𝑘
𝐻1: 𝜇𝑘−1 ≠ 𝜇𝑘
Khi có k nhóm, số cặp cần phải kiểm định là tổ hợp chập 2 của k nhóm 𝐶𝑘
2
Bước 1: tính Dij = |xi̅ − xj̅|
Bước 2: tính T = q(k,n−k),α√
𝑀𝑆𝑊
𝑛𝑚𝑖𝑛
𝑛𝑚𝑖𝑛 = 𝑚𝑖𝑛{𝑛1, 𝑛2 , 𝑘 }
trong đó q: phân phối Turkey
Bước 3: Bác bỏ H0 nếu Dij >T
Ví dụ 6.2: Sử dụng ví dụ 6.1
Trong ví dụ 1 ta có k=3, vậy ta cần kiểm định 𝐶3
2 = 3 cặp
{
𝐻0: 𝜇1 = 𝜇2
𝐻1: 𝜇1 ≠ 𝜇2
, {
𝐻0: 𝜇2 = 𝜇3
𝐻1: 𝜇2 ≠ 𝜇3
, {
𝐻0: 𝜇1 = 𝜇3
𝐻1: 𝜇1 ≠ 𝜇3
D12 = |x1̅ − x2̅| = 0,2; D23 = 0,65; D31 = 0,85
63
T = 3,59√
0,224
7
= 0,6422
D12 < 𝑇 → 𝜇1 = 𝜇2,
D23 > 𝑇 → 𝜇2 ≠ 𝜇3,
D31 > 𝑇 → 𝜇1 ≠ 𝜇3,
Vì x1̅, x2̅ > x3̅ → 𝜇2 > 𝜇3, 𝜇1 > 𝜇3,
CÂU HỎI ÔN TẬP CHƯƠNG 6
Câu 1: Phân tích phương sai một yếu tố để làm gì
Câu 2: Trình bày các bước phân tích phương sai một yếu tố
Câu 3: Kiểm định Tukey để làm gì. Trình bày các bước
64
CHƯƠNG 7: KIỂM ĐỊNH PHI THAM SỐ
Ở chương 5 chúng ta đã nói đến kiểm định giả thuyết về các đặc trưng (trung
bình, tỷ lệ, phương sai) của tổng thể và thường giả định tổng thể có phân phối chuẩn.
Trong chương này, cũng với giả thuyết H0 về tham số tổng thể, chúng ta sẽ đề cập đến
các kiểm định mà phần lớn không gắn liền với tham số nào của mẫu, và vì vậy, chúng
được gọi là kiểm định phi tham số. Kiểm định phi tham số có thể được sử dụng với
các loại dữ liệu mà việc đo lường được thực hiện trên các thang đo không chặt chẽ,
hoặc không đáp ứng các điều kiện về phân phối chặt chẽ của kiểm định phi tham số.
Kiểm định phi tham số được sử dụng rộng rãi vì dùng được với nhiều loại dữ liệu và
không đòi hỏi các điều kiện nghiêm ngặt về phân phối tổng thể. Tuy nhiên kiểm định
phi tham số thường có độ chính xác thấp hơn kiểm định tham số do đó không nên quá
lạm dụng
6.1 Kiểm định Wilcoxon.
Kiểm định Wilcoxon được áp dụng trong trường hợp kiểm định sự bằng nhau
của hai trung bình tổng thể, mẫu phối hợp từng cặp
Chọn mẫu cặp quan sát (xi, yi). Với mức ý nghĩa 𝛼 ta có các bước kiểm định
như sau:
(1) Đặt giả thuyết về sự giống nhau của hai tổng thể:
Một đuôi phải Một đuôi trái Hai đuôi
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≤ 0
𝐻1: 𝜇𝑥 − 𝜇𝑦 > 0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 ≥ 0
𝐻1: 𝜇𝑥 − 𝜇𝑦 < 0
{
𝐻0: 𝜇𝑥 − 𝜇𝑦 = 0
𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 0
a) Trường hợp mẫu nhỏ (n ≤ 20):
(2) Giá trị kiểm định:
- Tính các chênh lệch giữa các cặp: di = xi - yi
- Xếp hạng giá trị tuyệt đối các chệch lệch |𝑑𝑖| theo thứ tự tăng dần, các giá trị
bằng nhau sẽ nhận hạng trung bình, bỏ qua trường hợp chênh lệch bằng 0
- Tìm tổng các hạng được xếp của di mang dấu dương (T+)
𝑇+ = ∑ 𝑟𝑎𝑛𝑘(|𝑑𝑖|
𝑑𝑖>0
)
65
- Tìm tổng các hạng được xếp của di mang dấu (T-)
𝑇− = ∑ 𝑟𝑎𝑛𝑘(|𝑑𝑖|
𝑑𝑖<0
)
(3) Quy tắc kiểm định: Ta kết luận ở mức ý nghĩa 𝛼 như sau:
- Kiểm định hai phía: Tiêu chuẩn kiểm định T= min(T+, T-)
+ T ≤ 𝑇𝑛+,𝛼/2 : Bác bỏ H0, chấp nhận H1
+ T > 𝑇𝑛+,𝛼/2: Chưa đủ cơ sở bác bỏ H0
- Kiểm định phía phải: Tiêu chuẩn kiểm định T = T+
+ T ≤ 𝑇𝑛+,𝛼 : Bác bỏ H0, chấp nhận H1
+ T > 𝑇𝑛+,𝛼: Chưa đủ cơ sở bác bỏ H0
- Kiểm định phía trái: Tiêu chuẩn kiểm định T = T+
+ T ≤ 𝑇𝑛+,𝛼 : Bác bỏ H0, chấp nhận H1
+ T > 𝑇𝑛+,𝛼: Chưa đủ cơ sở bác bỏ H0
Với 𝑇𝑛+,𝛼 là giá trị của kiểm định Willcoxon, n+ là số cặp quan sát có 𝑑𝑖 ≠ 0
Ví dụ 6.1: Mẫu 9 khách hàng được chọn ngẫu nhiên và yêu cầu họ cho biết sở thích
về 2 loại kem đánh răng A, B thông qua thang điểm từ 1 (thấp nhất) đến 5 (cao nhất).
Khách hàng 1 2 3 4 5 6 7 8 9
Kem đánh răng A 4 5 2 3 3 1 3 2 2
Kem đánh răng B 3 5 5 2 5 5 3 5 5
Hãy kiểm định giả thuyết cho rằng không có xu hướng nghiêng về loại nào
trong sở thích đối với 2 loại kem đánh răng A, B với 𝛼 =5%.
Gọi 𝜇𝑥 và 𝜇𝑦 là điểm trung bình sở thích của khách hàng về kem đánh răng A và B.
1. Đặt giả thuyết: {
𝐻0: 𝜇𝑥 − 𝜇𝑦 = 0
𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 0
2. Giá trị kiểm định:
66
Khách hàng 1 2 3 4 5 6 7 8 9 Tổng
Kem đánh răng A 4 5 2 3 3 1 3 2 2
Kem đánh răng B 3 5 5 2 5 5 3 5 5
Chênh lệch 1 0 -3 1 -2 -4 0 -3 -3
Hạng + 1,5 1,5 3
Hạng - 5 3 7 5 5 25
3. Quyết định: T = min(T+, T-) = min(3, 25) = 3 ; n+ =7
T = 3 Bác bỏ giả thuyết H0.
4. Kết luận: Với 𝛼 =5%, có thể cho rằng có sự khác biệt trong việc ưa chuộng
hai loại kem đánh răng A và B.
b) Trường hợp mẫu lớn (n>20):
1. Giả thuyết: có thể đặt ở dạng 1 đuôi hoặc 2 đuôi
2. Giá trị kiểm định:
𝑍 =
𝑇 − 𝜇𝑇
𝜎𝑇
;
Nếu n lớn thì phân phối Willcoxon gần như phân phối chuẩn, lúc này trung
bình và phương sai được tính như sau:
+ Trung bình: 𝜇𝑇 =
𝑛(𝑛+1)
4
+ Phương sai: 𝜎𝑇
2 =
𝑛(𝑛+1)(2𝑛+1)
24
3. Quyết định bác bỏ H0:
- 1 đuôi: |𝑍| > 𝑍𝛼
- 2 đuôi: |𝑍| > 𝑍𝛼/2
6.2 Kiểm định Mann-Whitney (Kiểm định U)
Cũng như kiểm định T nhưng kiểm định U xem xét trường hợp các mẫu độc lập
Chọn 2 mẫu ngẫu nhiên độc lập có n1, n2 quan sát từ hai tổng thể có trung bình
là 𝜇1, 𝜇2. Với mức ý nghĩa 𝛼, các bước kiểm định:
67
a/ Trường hợp mẫu nhỏ (n1, n2 < 10):
1. Đặt giả thuyết: {
𝐻0: 𝜇𝑥 − 𝜇𝑦 = 0
𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 0
2. Giá trị kiểm định:
- Xếp hạng tất cả các giá trị của 2 mẫu theo thứ tự tăng dần. Những giá trị bằng
nhau sẽ nhận hạng trung bình của hai hạng liên tiếp
- Cộng các hạng của tất cả các giá trị ở mẫu thứ nhất. Ký hiệu 𝑅1
- Giá trị kiểm định:
𝑈1 = 𝑛1. 𝑛2 +
𝑛1(𝑛1+1)
2
− 𝑅1 ; 𝑈2 = 𝑛1. 𝑛2 − 𝑈1
𝑈 = min( 𝑈1, 𝑈2)
- Tra bảng phân phối để tìm F(U) = Fn1,n2(U)
3. Quyết định bác bỏ H0 khi: α > 2F(U)
b/ Trường hợp mẫu lớn (n1, n2 ≥ 10): Phân phối U được xem là phân phối chuẩn
1. Đặt giả thuyết: Giả thuyết có thể đặt ở dạng 1 đuôi hoặc 2 đuôi.
2. Giá trị kiểm định:
𝑍 =
𝑈 − 𝜇𝑢
𝜎𝑢
Với : + Trung bình: 𝜇𝑢 =
𝑛1.𝑛2
2
+ Phương sai: 𝜎𝑇
2 =
𝑛1.𝑛2 (𝑛1+𝑛2+1)
12
3. Quyết định bác bỏ H0:
- 1 đuôi: |𝑍| > 𝑍𝛼
- 2 đuôi: |𝑍| > 𝑍𝛼/2
Ví dụ 6.2: Tại một trang trại nuôi lợn người ta thử áp dụng một loại thuốc tăng
trọng bổ sung vào khẩu phần thức ăn của 10 con lợn, sau 3 tháng người ta thu thập số
liệu về trọng lượng của lợn (X). Đồng thời người ta cũng thu thập số liệu về 15 con
lợn khác không dùng thuốc tăng trọng (Y). Hãy kiểm tra xem trọng lượng có như nhau
hay không khi thử nghiệm với 𝛼 =5%.
68
Lợn 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Tổng
X 60 61 62 62 63 63 68 64 64 65
Y 56 56 57 57 58 58 58 59 59 60 60 60 61 61 62
Rank(X) 11,5 15 18 18 20,5 20,5 25 22,5 22,5 24 197,5
Rank(Y) 1,5 1,5 3,5 3,5 6 6 6 8,5 8,5 11,5 11,5 11,5 15 15 18 127,5
Gọi 𝜇1 và 𝜇2là trọng lượng của lợn có sử dụng và không sử dụng thức ăn tăng trọng.
1. Đặt giả thuyết: {
𝐻0: 𝜇𝑥 − 𝜇𝑦 = 0
𝐻1: 𝜇𝑥 − 𝜇𝑦 ≠ 0
2. Giá trị kiểm định:
𝑈 = 𝑛1. 𝑛2 +
𝑛1(𝑛1+1)
2
− 𝑅1 = 10𝑥15 +
10𝑥(10+1)
2
− 197,5 = 7,5
𝜇𝑢 =
𝑛1.𝑛2
2
=
10𝑥15
2
= 75
𝜎𝑇
2 =
𝑛1. 𝑛2 (𝑛1 + 𝑛2 + 1)
12
=
10𝑥15𝑥(10 + 15 + 1)
12
= 325
𝑍 =
𝑈 − 𝜇𝑢
𝜎𝑢
=
7,5 − 75
√325
= −3,744
3. Quyết định: |𝑍|= 3,744 > Z 2,5% = 1,96 => Bác bỏ H0.
4. Kết luận: Với 𝛼 =5%, trọng lượng của lợn có thay đổi khi sử dụng thuốc
tăng trọng.
6.3 Kiểm định Kruskal-Wallis.
Đây là trường hợp mở rộng của kiểm định Mann-Whitney, chúng ta sẽ thực
hiện bài toán kiểm định về sự bằng nhau của k trung bình tổng thể
Chọn k mẫu ngẫu nhiên độc lập có n1, n2,nk quan sát, gọi 𝑛 = ∑ 𝑛𝑖. Xếp
hạng tất cả các quan sát theo thứ tự tăng dần, những giá trị bằng nhau sẽ nhận hạng
trung bình. Gọi R1, R2Rk là tổng hạng của từng mẫu
1. Giả thuyết: {
𝐻0: 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
𝐻1: 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘
2. Giá trị kiểm định: 𝑊 =
12
𝑛(𝑛+1)
∑
𝑅𝑖
2
𝑛𝑖
− 3(𝑛 + 1)𝑘𝑖=1
3. Quyết định bác bỏ H0 khi 𝑊 > 𝝌𝑘−1,𝛼
2
69
Ví dụ 6.3: Một nhà nghiên cứu muốn xem xét tổng giá trị sản phẩm sản xuất
của 3 ngành A, B, C có giống nhau không. Người ta chọn một số xí nghiệp hoạt động
trong các ngành này và có bảng số liệu như bên dưới. Có thể kết luận gì ở 𝛼 = 0,5%?
ĐVT: Triệu đồng
Xí nghiệp 1 2 3 4 5 6 7 8
Ngành A 1,38 1,55 1,9 2,0 1,22 2,11 1,98 1,61
Ngành B 2,33 2,5 2,79 3,01 1,99 2,45
Ngành C 1.06 1,37 1,09 1,65 1,44 1,11
1. Giả thuyết: {
𝐻0: 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶
𝐻1: 𝜇𝐴 ≠ 𝜇𝐵 ≠ 𝜇𝐶
2. Giá trị kiểm định:
Xí nghiệp 1 2 3 4 5 6 7 8 Tổng
Ngành A 1,38 1,55 1,9 2,0 1,22 2,11 1,98 1,61
Ngành B 2,33 2,5 2,79 3,01 1,99 2,45
Ngành C 1.06 1,37 1,09 1,65 1,44 1,11
Rank (A) 6 8 11 14 4 15 12 9 79
Rank (B) 16 18 19 20 13 17 103
Rank (C) 1 5 2 10 7 3 28
𝑊 =
12
𝑛(𝑛+1)
∑
𝑅𝑖
2
𝑛𝑖
− 3(𝑛 + 1) =
12
20(20+1)
(
792
8
+
1032
6
+
282
6
) − 3(20 + 1) = 13,54𝑘𝑖=1
3. Quyết định: 𝑊 = 13,54 > 𝝌𝑘−1,𝛼
2 = 𝑋2,0,05
2 = 10,579 => Bác bỏ H0
4. Kết luận, với 𝛼 =0,5%, tổng giá trị sản phẩm trung bình của các ngành là
khác nhau.
70
6.4 Kiểm định Chi bình phương
6.4.1 Kiểm định Chi bình phương (𝛘𝟐) về sự phù hợp
Kiểm định sự phù hợp là kiểm định xem giả thuyết về phân phối của tổng thể
và số liệu thực tế phù hợp (thích hợp) đến mức độ nào với giả định về phân phối của
tổng thể
a) Kiểm định sự phù hợp trong trường hợp giả định đã biết các tham số của tổng thể
Chọn một mẫu ngẫu nhiên n quan sát, được chia thành k nhóm khác nhau: mỗi
quan sát chỉ thuộc vào một nhóm thứ i nào đó (i = 1,,k). Oi là số lượng quan sát ở
nhóm thứ i. pi xác suất giả thuyết để 1 quan sát rơi vào nhóm thứ i. Vấn đề đặt ra là
kiểm định giả thuyế H0 về phân phối của tổng thể
1. Giả thuyết H0: Tổng thể có phân phối xác suất pi
H1: Tổng thể không có phân phối xác suất pi
2. Giá trị kiểm định: χ2 = ∑
( Oi−Ei)
2
Ei
k
i=1 ; Ei = 𝑛 × pi
Điều kiện: kiểm định có ý nghĩa khi Ei ≥ 5
3. Quyết định bác bỏ H0 khi 𝝌2 > 𝝌(𝑘−1),𝛼
2
Ví dụ 6.4.1: Ở một bar có 4 nhãn hiệu bia khác nhau. 160 khách hàng được
chọn ngẫu nhiên cho thấy sự lựa chọn về các nhãn hiệu như sau:
Nhãn hiệu Bia A Bia B Bia C Bia D
Số khách hàng 34 46 29 51
Có thể kết luận sự ưa chuộng của khách hàng về 4 loại bia là như nhau được
không ở mức ý nghĩa 2,5%?
Nhãn hiệu (x) Bia A Bia B Bia C Bia D Tổng
Số khách hàng (Oi) 34 46 29 51 160
Giả thuyết H0 (pi) 0,25 0,25 0,25 0,25 1
Ei = 𝑛 × pi 40 40 40 40
( Oi − Ei)
2
Ei
0,9 0,9 3,03 3,03 7,86
1. Giả thuyết: H0: pA= pB = pC = pD = 0,25
71
H1: pA ≠ pB ≠ pC ≠ pD
2. Giá trị kiểm định: χ2 = 7,86; 𝐸𝑖 = 40 > 5: kiểm định có ý nghĩa
χ2 = 7,86 < 𝝌(𝑘−1),𝛼
2 = 𝝌3,0,025
2 = 9,384
3. Quyết định:=> Chấp nhận giả thuyết H0.
4. Kết luận: Ở mức ý nghĩa 2,5% sự ưa chuộng của khách hàng về 4 nhãn hiệu
bia là như nhau.
b) Kiểm định sự phù hợp trong trường hợp chưa biết các tham số của tổng thể
Ở phần a) là phương pháp kiểm định sự phù hợp với xác suất để một quan sát
rơi vào nhóm thứ I (pi) đã được định rõ trong giả thuyết H0
Phần này ta nghiên cứu việc kiểm định giả thuyết các quan sát tuân theo một
quy luật phân phối nào đó. Trong trường hợp này ta phải xác định pi xác suất để một
quan sát rơi vào nhóm thứ i. Sau đó áp dụng phương pháp tương tự như phần a)
6.4.2 Kiểm định Chi bình phương (𝝌𝟐) về tính độc lập của hai biến định tính
Đây là bài toán xét đồng thời hai dấu hiệu định tính (2 mẫu ngẫu nhiên độc lập
được xét) trên 1 tổng thể. Kiểm định xem giữa hai tiêu thức (định tính) của tổng thể có
mối liên hệ hay không. Ví dụ mối liên hệ giữa giới tính với hành vi tiêu dùng
Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp thành 2
tiêu thức với nhau, hình thành nên bảng phân nhóm kết hợp gồm r hàng và c cột. Gọi
nij là số lượng quan sát tương ứng với hàng i và cột j, n là tổng quan sát của r hàng
đồng thời cũng là tổng quan sát c cột
Phân nhóm theo
tiêu thức thứ hai
Phân nhóm theo tiêu thức thứ nhất
1 2 c ∑
1 n11 n12 n1c R1
2 n21 n22 n2c R2
. ... .. .
R nr1 nr2 . nr2 Rr
∑ C 1 C2 . CC Cn
1. Đặt giả thuyết:
72
𝐻0: không có mối liên hệ giữa hai tiêu thức
𝐻1: Tồn tại mối liên hệ giữa hai tiêu thức
2. Giá trị kiểm định:
χ2 = ∑ ∑
( nij − Eij)
2
Eij
c
j=1
r
i=1
Eij = 𝐶𝑗
𝑅𝑖
𝑛
3. Quyết định bác bỏ H0 khi 𝝌2 > 𝝌(𝑟−1)(𝑐−1),𝛼
2
Ví dụ 6.4.2: Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa
giới tính và sự ưa thích các nhãn hiệu nước giải khát, một mẫu ngẫu nhiên 2.425
người tiêu dùng với các nhãn hiệu nước giải khát được ưa thích như sau:
Giới tính Nhãn hiệu ưa thích
Coca Pepsi 7Up
Nam 308 177 114
Nữ 502 627 697
Kiểm định giả thuyết không có mối liên hệ nào giữa giới tính và sự ưa thích
nhãn hiệu nước giải khát ở mức ý nghĩa 𝛼 = 0,5%.
1. Đặt giả thuyết:
𝐻0: Không có mối liên hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát
H1: Có mối liên hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát.
3. Giá trị kiểm định:
73
Giới tính Nhãn hiệu ưa thích
Coca Pepsi 7Up Ri 𝝌𝟐
Nam 308 177 114 599
E1j 200,08 198,60 200,33 -
( n1j − E1j)
2
E1j
58,21 2,35 37,2 - 97,76
Nữ 502 627 697 1826
E2j 609,92 605,4 610,67 -
( n2j − E2j)
2
E2j
19,1 0,77 12,2 32,07 32,07
Cj 810 804 811 2425
χ2 = ∑ ∑
( nij − Eij)
2
Eij
= 97,76 + 32,07 = 129,83
c
j=1
r
i=1
Eij = 𝐶𝑗
𝑅𝑖
𝑛
3. Quyết định: 129,83 = χ2> 𝝌(𝑟−1)(𝑐−1),𝛼
2 = 𝝌(2−1)(3−1),5%
2 = 𝝌2,5%
2 = 10,597
=> bác bỏ giả thuyết H0.
4. Kết luận: Ở mức ý nghĩa 𝛼 = 0,5%, giả thuyết H0 bị bác bỏ, có nghĩa là có mối liên
hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát.
CÂU HỎI ÔN TẬP CHƯƠNG 7
Câu 1: Trình bày các bước kiểm định Wilcoxon.
Câu 2: Trình bày các bước kiểm định Mann-Whitney
Câu 3: Trình bày các bước kiểm định Kruskal-Wallis.
Câu 4: Trình bày các bước kiểm định Chi bình phương
74
MỤC LỤC
CHƯƠNG 1: GIỚI THIỆU VỀ THỐNG KÊ KINH TẾ ................................................ 1
1.1 Thống kê và các phân nhánh của thống kê .......................................................... 1
1.1.1 Định nghĩa thống kê ...................................................................................... 1
1.1.2 Các phân nhánh của thống kê. ...................................................................... 1
1.2 Các khái niệm căn bản. ........................................................................................ 2
1.2.1 Tổng thể thống kê và đơn vị tổng thể ........................................................... 2
1.2.2 Mẫu ............................................................................................................... 3
1.2.3 Tiêu thức (biến) thống kê ............................................................................. 3
1.2.4 Chỉ tiêu thống kê .......................................................................................... 4
1.3 Các loại thang đo trong thống kê ......................................................................... 5
1.3.1 Thang đo định danh: ...................................................................................... 5
1.3.2 Thang đo thứ bậc: ......................................................................................... 5
1.3.3 Thang đo khoảng: ......................................................................................... 6
1.3.4 Thang đo tỷ lệ: .............................................................................................. 6
1.4 Dữ liệu dùng trong thống kê ................................................................................ 6
CÂU HỎI ÔN TẬP CHƯƠNG 1 ................................................................................... 8
CHƯƠNG 2: THỐNG KÊ MÔ TẢ ................................................................................ 9
2.1 Mô tả dữ liệu cho một tiêu thức định tính bằng bảng phân phối và biểu đồ ........ 9
2.1.1 Lập bảng phân phối ...................................................................................... 9
2.1.2 Trình bày bằng biểu đồ ................................................................................. 9
2.2 Mô tả dữ liệu cho một tiêu thức định lượng bằng bảng phân phối và biểu đồ ..... 9
2.2.1 Lập bảng phân phối ....................................................................................... 9
2.2.2 Trình bày bằng biểu đồ ............................................................................... 13
2.3 Mô tả một tiêu thức định lượng bằng các chỉ tiêu thống kê ............................... 13
2.3.1 Các chỉ tiêu đo lường khuynh hướng tập trung. ......................................... 13
2.3.1.1 Số trung bình ....................................................................................... 13
2.3.1.2 Mode (Mo) ........................................................................................... 16
2.3.1.3 Số trung vị (Me) .................................................................................... 18
2.3.2. Các chỉ tiêu đo lường độ phân tán. ............................................................. 20
2.3.2.1. Khoảng biến thiên của tiêu thức (toàn cự): (R) ................................... 20
2.3.2.2. Độ lệch tuyệt đối bình quân (𝒅) .......................................................... 20
2.3.2.3. Phương sai ........................................................................................... 21
75
2.3.2.4. Độ lệch tiêu chuẩn ............................................................................... 22
2.3.2.5. Hệ số biến thiên (V) ............................................................................ 23
2.4 Các chỉ tiêu mô tả hình dáng phân phối 1 tiêu thức định lượng......................... 23
CÂU HỎI ÔN TẬP CHƯƠNG 2 ................................................................................. 25
CHƯƠNG 3: PHÂN PHỐI CHUẨN VÀ PHÂN PHỐI MẪU .................................... 26
3.1 Phân phối chuẩn................................................................................................. 26
3.1.1 Định nghĩa ................................................................................................... 26
3.1.2. Phân phối chuẩn tắc (đơn giản): ................................................................. 27
3.1.3. Khái niệm 𝒁𝜶: ............................................................................................ 27
3.2 Phân phối của một vài đại lượng thống kê: ....................................................... 28
3.2.1. Phân phối “Khi bình phương”: ................................................................... 28
3.2.2. Phân phối Student (𝐭- t distribution) ........................................................... 28
3.2.3. Phân phối Fisher (𝐅 distribution) ................................................................ 29
3.3 Phân phối mẫu ................................................................................................... 29
CÂU HỎI ÔN TẬP CHƯƠNG 3 ................................................................................. 30
CHƯƠNG 4: ƯỚC LƯỢNG THAM SỐ CỦA TỔNG THỂ ...................................... 31
4.1 Các khái niệm .................................................................................................... 31
4.1.1 Khái niệm ước lượng: .................................................................................. 31
4.1.2 Khái niệm ước lượng điểm .......................................................................... 31
4.1.3 Khái niệm ước lượng khoảng: ..................................................................... 32
4.1.4 Khái niệm về khoảng tin cậy ....................................................................... 33
4.2 Tham số tổng thể và thống kê mẫu ..................................................................... 33
4.3 Ước lượng điểm .................................................................................................. 33
4.4 Ước lượng khoảng .............................................................................................. 34
4.4.1 Ước lượng khoảng của số trung bình tổng thể ........................................... 34
4.4.1.1 Khi đã biết phương sai của tổng thể 𝛿2 ............................................... 34
4.4.1.2 Khi chưa biết phương sai của tổng thể 𝛿2 ........................................... 35
4.4.2 Ước lượng khoảng của tỉ lệ tổng thể ........................................................... 36
4.4.3 Ước lượng khoảng của phương sai tổng thể ............................................... 37
4.5 Ước lượng cở mẫu. ............................................................................................. 38
4.5.1 Kích thước mẫu khi ước lượng số trung bình tổng thể .............................. 38
4.5.2 Kích thước mẫu khi ước lượng tỷ lệ tổng thể ............................................. 39
CÂU HỎI ÔN TẬP CHƯƠNG 4 ................................................................................. 39
CHƯƠNG 5: KIỂM ĐỊNH THAM SỐ VÀ KIỂM ĐỊNH SỰ KHÁC BIỆT .............. 40
5.1 Các khái niệm ..................................................................................................... 40
76
5.1.1 Giả thuyết và kiểm định giả thuyết.............................................................. 40
5.1.2 Các loại sai lầm trong kiểm định gia thuyết ................................................ 41
5.1.3 Quy trình tổng quát trong kiểm định giả thuyết .......................................... 42
5.1.4 Miền bác bỏ và miền xác định trong kiểm định: ......................................... 42
5.2 Kiểm định tham số .............................................................................................. 43
5.2.1 Kiểm định giả thuyết về số trung bình một tổng thể .................................. 43
5.2.1.1 Trường hợp biết phương sai tổng thể -𝜎2 ........................................... 43
5.2.1.2 Trường hợp chưa biết phương sai tổng thể -𝜎2 ................................... 45
5.2.2 Kiểm định giả thuyết về tỷ lệ p của tổng thể ............................................... 46
5.2.3 Kiểm định giả thuyết về phương sai của tổng thể ...................................... 47
5.3 Giá trị p của kiểm định ....................................................................................... 48
5.4 Kiểm định sự khác biệt ....................................................................................... 50
5.4.1 Kiểm định giả thuyết về sự khác nhau giữa 2 số trung bình của 2 tổng thể 50
5.4.1.1 Trường hợp lấy mẫu từng cặp .............................................................. 50
5.4.1.2 Trường hợp lấy mẫu độc lập: ............................................................... 52
5.4.2 Kiểm định sự khác biệt của hai tỷ lệ tổng thể (với cỡ mẫu lớn >=40) ........ 54
5.4.2.1 Chệnh lệch hai tổng thể bằng 0 ( p0 = 0) .............................................. 54
5.4.2.2 Chệnh lệch hai tổng thể khác 0 ( p0 ≠ 0)............................................. 55
CÂU HỎI ÔN TẬP CHƯƠNG 5 ................................................................................. 56
CHƯƠNG 6: PHÂN TÍCH PHƯƠNG SAI (ANOVA) MỘT YẾU TỐ ..................... 57
6.1 ANOVA một yếu tố ........................................................................................... 57
6.2. Kiểm định TUKEY. ......................................................................................... 62
CÂU HỎI ÔN TẬP CHƯƠNG 6 ................................................................................. 63
CHƯƠNG 7: KIỂM ĐỊNH PHI THAM SỐ ................................................................ 64
6.1 Kiểm định Wilcoxon. ....................................................................................... 64
6.2 Kiểm định Mann-Whitney (Kiểm định U) ........................................................ 66
6.3 Kiểm định Kruskal-Wallis. ............................................................................... 68
6.4 Kiểm định Chi bình phương ............................................................................. 70
6.4.1 Kiểm định Chi bình phương (𝛘𝟐) về sự phù hợp ........................................ 70
6.4.2 Kiểm định Chi bình phương (𝝌𝟐) về tính độc lập của hai biến định tính ... 71
CÂU HỎI ÔN TẬP CHƯƠNG 7 ................................................................................. 73
Các file đính kèm theo tài liệu này:
- giao_trinh_thong_ke_kinh_te_nguyen_thi_phuong_hao.pdf