Điều tra chọn mẫu là một loại điều tra không toàn bộ trong đó người ta chỉ chọn ra một số
đơn vị thuộc đối tượng nghiên cứu để tiến hành điều tra thực tế (tổng thể mẫu). Các đơn vị
này được chọn theo những quy tắc nhất định để đảm bảo tính đại biểu. Kết quả của điều tra
chọn mẫu được dùng để suy rộng cho toàn bộ hiện tượng (tổng thể chung).
Với nhiều ưu điểm và cả những nhược điểm, điều tra chọn mẫu được sử dụng rộng rãi trong
nhiều trường hợp khác nhau, ở các lĩnh vực khác nhau với các tổng thể khác nhau. Hiện nay,
có hai phương pháp chọn mẫu cơ bản được sử dụng phổ biến trong các cuộc điều tra là chọn
mẫu ngẫu nhiên và chọn mẫu phi ngẫu nhiên.
Trong điều tra chọn mẫu ngẫu nhiên, người ta thường hay sử dụng hai phương pháp chọn là
chọn hoàn lại và chọn không hoàn lại. Dù chọn theo cách nào thì số mẫu có thể hình thành là
rất lớn. Mẫu được chọn ra để điều tra thực tế chỉ là một trong số đó.
Từ các tham số của tổng thể mẫu, người ta suy rộng hay ước lượng ra các tham số của tổng
thể chung. Khi đó, việc suy rộng thường có sai số và được gọi là sai số chọn mẫu. Khái niệm
sai số bình quân chọn mẫu nói lên mức sai số đại diện cho các sai số chọn mẫu có thể có.
Khái niệm phạm vi sai số chọn mẫu nói lên khi suy rộng thì sai số chọn mẫu không được
vượt quá phạm vi đó với một xác suất nhất định.
22 trang |
Chia sẻ: huyhoang44 | Lượt xem: 879 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Toán học - Bài 7: Điều tra chọn mẫu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bài 7: Điều tra chọn mẫu
v1.0 139
0
Nội dung Mục tiêu
Những vấn đề chung về điều tra chọn mẫu.
Đi sâu nghiên cứu một số vấn đề của
điều tra chọn mẫu ngẫu nhiên.
Giới thiệu một số phương pháp chọn mẫu.
Tóm lược quy trình của một cuộc điều
tra chọn mẫu.
Trang bị các kiến thức cơ bản về điều tra
chọn mẫu. Trên cơ sở đó, đi sâu nghiên cứu
điều tra chọn mẫu ngẫu nhiên qua đó giúp
học viên có thể nắm bắt được cách suy
rộng kết quả điều tra mẫu, xác định số đơn
vị tiến hành điều tra và trình tự tiến hành
một cuộc điều tra.
Thời lượng học Hướng dẫn học
9 tiết Đọc tài liệu và thảo luận.
Trả lời các câu hỏi ôn tập ở cuối bài và
làm bài tập.
BÀI 7: ĐIỀU TRA CHỌN MẪU
Bài 7: Điều tra chọn mẫu
140 v1.0
TÌNH HUỐNG DẪN NHẬP
Tên tình huống: Điều tra để thực hiện điều chỉnh tiền lương
Do ảnh hưởng của suy thoái kinh tế, trong năm vừa qua, doanh
nghiệp của bạn làm ăn thua lỗ, lợi nhuận âm. Để đảm bảo việc
làm cho công nhân, doanh nghiệp phải thực hiện điều chỉnh tiền
lương. Với tư cách là người tư vấn cho lãnh đạo doanh nghiệp
về mức điều chỉnh, bạn thực hiện một cuộc điều tra nhằm đánh
giá mức năng suất lao động bình quân của công nhân trong
doanh nghiệp. Đây là cơ sở để bạn đưa ra mức giảm trừ tiền
lương là bao nhiêu cho phù hợp. Nhưng để điều tra trên khoảng
3.000 công nhân của doanh nghiệp thì mất khá nhiều thời gian
và tốn kém, bạn quyết định thực hiện điều tra ngẫu nhiên trên
một mẫu gồm 300 lao động. Với kết quả tính toán được từ mẫu điều tra này, bạn sẽ suy rộng
kết quả cho toàn bộ doanh nghiệp.
Câu hỏi
Bạn sẽ thực hiện trình tự cuộc điều tra đó thế nào? Làm thế nào để có thể suy rộng kết quả
điều tra?
Bài học này sẽ cung cấp cho bạn những kiến thức cơ bản nhất về một cuộc điều tra chọn mẫu
và cách sử dụng kết quả điều tra để đánh giá, nhìn nhận toàn bộ hiện tượng.
Bài 7: Điều tra chọn mẫu
v1.0 141
7.1. Một số khái niệm chung về điều tra chọn mẫu
7.1.1. Khái niệm, ưu nhược điểm và trường hợp vận dụng điều tra chọn mẫu
7.1.1.1. Khái niệm
Điều tra chọn mẫu là một loại điều tra không toàn bộ
trong đó người ta chỉ chọn ra một số đơn vị thuộc đối
tượng nghiên cứu để tiến hành điều tra thực tế. Các
đơn vị này được chọn theo những quy tắc nhất định để
đảm bảo tính đại biểu. Kết quả của điều tra chọn mẫu
được dùng để suy rộng cho tổng thể chung.
Tại sao chỉ điều tra một số đơn vị tổng thể mà suy ra
kết quả của cả tổng thể chung? Cơ sở khoa học của điều tra chọn mẫu là sử dụng quy
luật số lớn và lý thuyết xác suất thống kê để tính toán trong thực tế. Quy luật số lớn đã
chỉ ra rằng, nếu chỉ nghiên cứu một số đủ lớn các đơn vị, phần tử cá biệt thì những
biểu hiện ngẫu nhiên của các đơn vị này sẽ bù trừ và triệt tiêu lẫn nhau, tính quy luật
sẽ được thể hiện rõ. Mặt khác, lý thuyết xác suất cũng chứng minh rằng sự sai lệch
giữa số bình quân của một số rất lớn các đại lượng ngẫu nhiên với kỳ vọng toán của
nó là một đại lượng nhỏ tuỳ ý.
Khi chọn đơn vị để điều tra mẫu, người ta có thể chọn theo những quy tắc khác nhau,
ngẫu nhiên hoặc không ngẫu nhiên.
Suy rộng (ước lượng): từ các tham số (mức độ) tính toán được trên các đơn vị điều tra
suy ra các tham số tương ứng của toàn bộ hiện tượng, có hai loại:
Suy rộng bình quân theo một tiêu thức.
Suy rộng tỷ lệ theo một tiêu thức.
7.1.1.2. Ưu, nhược điểm của điều tra chọn mẫu
Ưu điểm
o Tiết kiệm hơn cả về mặt thời gian lẫn chi phí so với điều tra toàn bộ.
o Do điều tra ít đơn vị nên có thể mở rộng nội dung điều tra đi sâu nghiên cứu
chi tiết nhiều mặt của hiện tượng.
o Tài liệu thu được trong điều tra chọn mẫu có độ chính xác cao hơn do giảm
được sai số phi chọn mẫu:
Do phạm vi điều tra nhỏ hơn nên được chuẩn bị và kiểm tra kỹ lưỡng tỷ mỉ
hơn cả trước, trong và sau cuộc điều tra;
Do số đơn vị điều tra ít nên cần ít điều tra viên, do đó có điều kiện chọn
được người có trình độ chuyên môn cao.
Dựa trên cơ sở khoa học của lý thuyết xác suất thống kê và quy luật số lớn
nên có thể tính được sai số và độ tin cậy của tài liệu.
o Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê. Mặt khác,
điều tra chọn mẫu không đòi hỏi phải có tổ chức lớn, chỉ cần một cơ quan hoặc
một nhóm người cũng có thể tiến hành điều tra được.
Bài 7: Điều tra chọn mẫu
142 v1.0
Nhược điểm
o Không cho biết thông tin đầy đủ, chi tiết về từng đơn vị tổng thể, không cho
biết quy mô tổng thể.
o Do chỉ tiến hành điều tra một số đơn vị rồi dùng kết quả để suy rộng cho toàn
bộ tổng thể nên chắc chắn không tránh khỏi sai số khi suy rộng.
o Kết quả điều tra chọn mẫu không thể tiến hành phân nhỏ theo phạm vi và tiêu
thức nghiên cứu như điều tra toàn bộ mà chỉ có thể thực hiện ở một mức độ
nhất định tuỳ thuộc vào quy mô mẫu và cách rải mẫu.
7.1.1.3. Trường hợp vận dụng điều tra chọn mẫu
Sử dụng để thay thế điều tra toàn bộ trong trường
hợp đối tượng nghiên cứu cho phép vừa có thể điều
tra toàn bộ vừa có thể điều tra chọn mẫu hoặc với
những trường hợp không cho phép điều tra toàn bộ,
hoặc do quy mô điều tra toàn bộ quá lớn, cần thu
thập nhiều chỉ tiêu nhưng không đủ kinh phí và
nhân lực để tiến hành điều tra toàn bộ.
Kết hợp với điều tra toàn bộ để mở rộng nội dung
điều tra và đánh giá kết quả của điều tra toàn bộ.
Ví dụ: Tổng điều tra dân số năm 2009, chọn 15% tổng số hộ để tiến hành điều tra
chọn mẫu; trong đó mở rộng nội dung nghiên cứu về các mặt như đời sống, sức
khoẻ, giáo dục,... đồng thời cũng để đánh giá kết quả của điều tra toàn bộ.
Sử dụng để tổng hợp nhanh tài liệu của điều tra toàn bộ phục vụ kịp thời yêu cầu
thông tin cho các đối tượng sử dụng.
Ví dụ: Trong tổng điều tra dân số việc tổng hợp tài liệu đòi hỏi phải có thời gian
dài, vì vậy để kịp thời phục vụ cho công tác lãnh đạo và kế hoạch hoá có thể sử
dụng điều tra chọn mẫu để có được tài liệu một cách nhanh chóng.
Sử dụng trong trường hợp muốn so sánh các hiện tượng với nhau hoặc muốn đưa
ra một nhận định nào đó mà chưa có tài liệu cụ thể (để kiểm tra giả thiết thống kê).
Ví dụ: Sau một thời gian thử nghiệm hai phương pháp đào tạo nghề mới, có ý kiến
cho rằng, phương pháp A tốt hơn phương pháp B. Để kiểm tra giả thiết đó có đúng
hay không, người ta tiến hành chọn hai mẫu gồm những người công nhân được
đào tạo theo hai phương pháp trên. Sau đó, sử dụng phương pháp thống kê phù
hợp để kết luận xem liệu có cơ sở nào để bác bỏ giả thiết đặt ra ở trên hay không.
7.1.2. Tổng thể chung và tổng thể mẫu
Trong bất kỳ cuộc điều tra nào, khi tiến hành điều tra
ngoài việc xác định được mục đích, đối tượng và nội
dung điều tra còn phải xác định phạm vi tiến hành điều
tra. Với điều tra chọn mẫu, phạm vi đó có thể là tổng
thể chung và tổng thể mẫu. Trong đó:
Tổng thể chung là tổng thể bao gồm toàn bộ các
đơn vị thuộc đối tượng điều tra.
Bài 7: Điều tra chọn mẫu
v1.0 143
Tổng thể mẫu là tổng thể bao gồm một số đơn vị nhất định được chọn ra từ tổng thể
chung để tiến hành điều tra thực tế.
Khi đó, ta có một số ký hiệu thường dùng với tổng thể chung và tổng thể mẫu như sau:
Chỉ tiêu Tổng thể chung Tổng thể mẫu
Quy mô N n
Số bình quân μ x
Tỷ lệ theo một tiêu thức p f
Phương sai 2 2 2x 2 2 20 x x
7.1.3. Phương pháp chọn mẫu
Hiện nay, có hai phương pháp chọn mẫu cơ bản được sử dụng phổ biến trong các cuộc
điều tra là chọn mẫu ngẫu nhiên và chọn mẫu phi ngẫu nhiên.
Chọn ngẫu nhiên: là phương pháp chọn hoàn toàn ngẫu nhiên không phụ thuộc vào ý
muốn chủ quan của con người. Khi đó, người ta gọi là điều tra chọn mẫu ngẫu nhiên.
Ví dụ: Rút thăm, dùng bảng số ngẫu nhiên.
Chọn mẫu phi ngẫu nhiên: là phương pháp chọn đơn vị điều tra phụ thuộc vào ý
muốn chủ quan của người chọn. Khi đó, ta có điều tra chọn mẫu phi ngẫu nhiên.
Ví dụ: Chọn đơn vị trung bình, chọn chuyên gia.
Chọn mẫu phi ngẫu nhiên được sử dụng trong trường hợp việc chọn mẫu ngẫu nhiên
gặp khó khăn như những cuộc điều tra mới hoàn toàn chưa có một thông tin tiên
nghiệm nào về đối tượng điều tra, hoặc có những hiện tượng kinh tế phức tạp, sự phân
tán không ổn định, biến động thất thường hoặc nhiều tầng lớp,... Phương pháp này
không hoàn toàn dựa trên cơ sở toán học như điều tra chọn mẫu ngẫu nhiên mà đòi hỏi
phải kết hợp chặt chẽ giữa phân tích lý luận và thực tiễn xã hội. Do đó, phần nhiều
mang tính chất cảm tính, chủ quan của người chọn thông qua kinh nghiệm và sự hiểu
biết về tổng thể nghiên cứu. Chính vì vậy, trong phạm vi và nội dung bài giảng chỉ đề
cập đến các vấn đề thuộc điều tra chọn mẫu ngẫu nhiên.
7.2. Điều tra chọn mẫu ngẫu nhiên
7.2.1. Chọn hoàn lại và chọn không hoàn lại
Có nhiều kỹ thuật chọn mẫu khác nhau dựa trên cơ sở tiêu
thức phân loại. Thông thường trong thống kê căn cứ vào
sự thay đổi của tổng thể chung trong quá trình chọn và xác
suất lấy mẫu, người ta chia thành các loại sau đây:
Chọn hoàn lại (chọn lặp, chọn nhiều lần): Mỗi khi
đơn vị được chọn ra để điều tra sau đó sẽ được trả lại
tổng thể chung và có cơ hội được chọn lại.
Đặc điểm của phương pháp chọn này là quy mô của
tổng thể chung không thay đổi trong quá trình chọn và
số đơn vị trong tổng thể mẫu không hoàn toàn là các đơn vị khác nhau. Chính vì
quy mô không thay đổi nên xác suất được chọn của mỗi đơn vị là như nhau
(đều bằng 1/N). Khi đó, số mẫu có thể hình thành là: k = Nn.
Bài 7: Điều tra chọn mẫu
144 v1.0
Chọn không hoàn lại (chọn một lần): Mỗi khi các đơn vị được chọn ra để điều tra
sau đó sẽ được xếp riêng ra không trả lại tổng thể chung và không có cơ hội được
chọn lại.
Chính vì vậy mà đặc điểm của phương pháp chọn này là quy mô tổng thể giảm
trong quá trình chọn. Số đơn vị trong tổng thể mẫu là hoàn toàn khác nhau và xác
suất được chọn của các đơn vị là hoàn toàn khác nhau, xác suất này tăng dần trong
quá trình chọn. Khi đó, số mẫu có thể hình thành:
n
N
N!k C
n!(N n)!
Với hai cách chọn trên, dù chọn theo cách nào thì số mẫu có thể hình thành là rất lớn.
Mẫu được chọn ra điều tra thực tế chỉ là một trong số rất nhiều mẫu có thể hình thành
đó. Do đó, các mức độ được tính trên mẫu (như bình quân, tỷ lệ, phương sai...) là
những biến ngẫu nhiên tuân theo những quy luật phân phối xác suất nhất định. Với số
lượng đơn vị tổng thể mẫu từ 30 đơn vị trở lên thì bình quân mẫu và tỷ lệ mẫu được
xem như phân phối theo quy luật chuẩn.
7.2.2. Sai số trong điều tra chọn mẫu
7.2.2.1. Khái niệm và các loại sai số trong điều tra chọn mẫu
Sai số thống kê là phần chênh lệch giữa kết quả thu được qua điều tra và giá trị thực tế
của nó trong tổng thể chung, tức là:
= ’ M 0M
Trong đó:
: Tham số của tổng thể chung.
’: Thống kê của tổng thể mẫu.
M: Sai số chọn mẫu (sai số do tính đại biểu).
0M: Sai số phi chọn mẫu (sai số do ghi chép).
Như vậy, sai số chọn mẫu là chênh lệch giữa mức độ được tính ra từ tổng thể mẫu và
mức độ tương ứng của tổng thể chung, tức là (x ) và (f – p).
Đây là vấn đề không thể tránh khỏi trong bất kỳ cuộc điều tra nào. Sai số ảnh hưởng
rất lớn đến kết quả điều tra, thậm chí trong trường hợp sai số quá lớn có thể dẫn đến
huỷ bỏ kết quả của cuộc điều tra. Vậy có những loại sai số nào? Trong một cuộc điều
tra chọn mẫu, thường xuất hiện hai loại sai số chủ yếu sau:
Sai số phi chọn mẫu: Sai số này xảy ra ở tất cả
các cuộc điều tra. Nguyên nhân là do điều tra viên
cân đong đo đếm sai, ghi chép sai, đơn vị điều tra
cung cấp sai sự thật. Sai số này không thể xoá bỏ
được mà chỉ giảm bằng cách huấn luyện nhân viên
điều tra cẩn thận hơn.
Sai số chọn mẫu: Sai số này chỉ xảy ra trong điều tra chọn mẫu, do chỉ điều tra
một số ít đơn vị nhưng kết quả lại ước lượng cho cả tổng thể. Sai số chọn mẫu
được biểu hiện dưới hai hình thức:
Bài 7: Điều tra chọn mẫu
v1.0 145
o Sai số hệ thống: xảy ra do vi phạm nguyên tắc chọn, chọn một số đơn vị không
đủ lớn để đảm bảo tính chất đại biểu, chọn mẫu không khách quan.
o Sai số ngẫu nhiên: chỉ xuất hiện trong trường hợp các đơn vị của tổng thể
chung được chọn theo nguyên tắc ngẫu nhiên, không lường trước được lệch về
hướng nào, nhiều hơn hay ít hơn so với thực tế. Sai số này được giảm dần khi
điều tra một số đủ lớn các đơn vị.
Sai số chọn mẫu không phải là một trị số cố định. Với cùng một hiện tượng nhưng nếu
tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu của tổng thể
mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau. Do đó, để tính sai số nhằm
đánh giá mức độ chính xác của ước lượng thì phải tính sai số bình quân chọn mẫu.
7.2.2.2. Sai số bình quân chọn mẫu
Khái niệm
Sai số bình quân chọn mẫu là một trị số sai số chọn mẫu đại diện cho các giá trị
của sai số chọn mẫu, nói cách khác, đó là bình quân của tất cả các sai số chọn mẫu
do việc lựa chọn mẫu có kết cấu thay đổi.
Trong thống kê, cùng một hiện tượng nghiên cứu nếu áp dụng các phương pháp tổ
chức chọn mẫu khác nhau sẽ có sai số bình quân chọn mẫu khác nhau. Thống kê
toán đã xác định công thức tính sai số bình quân chọn mẫu trong các trường hợp
như sau:
Cách chọn
Suy rộng
Chọn hoàn lại
(chọn nhiều lần)
Chọn không hoàn lại
(chọn một lần)
Bình quân
2
x n
hoặc
2
0
x n 1
2
x
n
(1 )
n N
hoặc
2
0
x
n
(1 )
n 1 N
Tỷ lệ
p p(1 p)n
hoặc
p
f(1 f)
n 1
p p(1 p) n(1 )n N
hoặc
p
f(1 f) n
(1 )
n 1 N
Trong đó:
N, n: Số đơn vị tổng thể chung và tổng thể mẫu.
x , σp: Các sai số bình quân chọn mẫu khi ước lượng số bình quân và tỷ lệ.
2: Phương sai của tổng thể chung.
σ02: Phương sai của tổng thể mẫu.
p, f: Tỷ lệ theo một tiêu thức nào đó của tổng thể chung và tổng thể mẫu.
Bài 7: Điều tra chọn mẫu
146 v1.0
Từ cách tính sai số bình quân chọn mẫu ở trên, có thể thấy có rất nhiều nhân tố ảnh
hưởng đến độ lớn của sai số chọn mẫu. Trong đó, ba nhân tố chủ yếu nhất, đó là:
o Số đơn vị tổng thể mẫu n: Khi số đơn vị điều tra tăng lên, tổng thể mẫu sẽ gần
với tổng thể chung, sai số chọn mẫu sẽ giảm.
Khi n N thì x 0 , p f 0 .
o Phương pháp tổ chức chọn mẫu: Các phương pháp chọn mẫu khác nhau, tính
đại diện của mẫu chọn ra khác nhau cũng sẽ dẫn đến những sai số chọn mẫu
khác nhau.
o Độ đồng đều của tổng thể chung: Nếu tổng thể có độ đồng đều cao tức phương
sai tổng thể 2 tương đối nhỏ thì sai số chọn mẫu sẽ nhỏ.
Ý nghĩa của việc tính toán sai số chọn mẫu
o Dùng để ước lượng chỉ tiêu nghiên cứu theo khoảng.
o Dùng để đánh giá tính đại diện của chỉ tiêu nghiên cứu qua tính toán tỷ lệ sai số
chọn mẫu (H) như sau:
H 100
x
H càng nhỏ thì chỉ tiêu có tính đại diện càng cao và ngược lại.
o Là cơ sở để xác định cỡ mẫu cho các cuộc điều tra được tiến hành về sau.
Chú ý
Sự khác biệt giữa hai phương pháp chọn hoàn lại và chọn không hoàn lại chính là
(1 – n/N). Do đó, ta luôn có sai số bình quân chọn mẫu theo cách chọn hoàn lại lớn
hơn sai số bình quân chọn mẫu theo cách chọn không hoàn lại.
Khi n nhỏ hơn rất nhiều so với N thì khi đó n/N nhỏ và (1– n/N) gần với 1. Do vậy,
có thể chọn theo cách không hoàn lại nhưng sử dụng công thức của chọn hoàn lại để
tính sai số bình quân chọn mẫu cho đơn giản.
Sai số bình quân chọn mẫu không phải là một trị số xác định. Khi ta tiến hành nhiều
lần điều tra khác nhau với cùng một hiện tượng, ta sẽ nhận được các sai số khác nhau
và chúng đều dao động xung quanh μ. Do đó, không thể xác định chính xác sai số
chọn mẫu cho mỗi lần điều tra mà chỉ có thể dựa vào sai số bình quân chọn mẫu để
ước lượng phạm vi sai số chọn mẫu.
7.2.2.3. Phạm vi sai số chọn mẫu
Khái niệm
Phạm vi sai số chọn mẫu hay độ chính xác của suy
rộng là chênh lệch giữa các chỉ tiêu của tổng thể
mẫu và các chỉ tiêu tương ứng của tổng thể chung
với độ tin cậy nhất định.
Nói cách khác, để ước lượng được tham số của
tổng thể chung từ tham số của tổng thể mẫu thì
phải xác định được phạm vi sai số chọn mẫu.
Bài 7: Điều tra chọn mẫu
v1.0 147
Trong thống kê phạm vi sai số chọn mẫu được ký hiệu là và được xác định bằng
công thức:
= z σ
Trong đó:
σ: Sai số bình quân chọn mẫu.
z: Hệ số tin cậy.
Theo chứng minh của toán học thì z tương ứng với hàm xác suất (z) đã được
Liapunốp tính sẵn thành bảng riêng. Ý nghĩa của hàm xác suất này được biểu hiện
như sau:
xP( x (z) 1
pP( p f (z) 1
Với là xác suất sai lầm; (1 – ) gọi là độ tin cậy ước lượng.
Sau đây là một vài trị số tiêu biểu của z:
z = 1 thì (z) = 0,6827
z = 2 thì (z) = 0,9545
z = 3 thì (z) = 0,9973
Ý nghĩa
o Với xác suất là 0,6827 các tham số của tổng thể chung và tổng thể mẫu chênh
lệch nhau không quá σ, hay = ’ σ.
o Với xác suất là 0,9545 các tham số của tổng thể chung và tổng thể mẫu chênh
lệch nhau không quá 2σ, hay = ’ 2σ.
o Với xác suất là 0,9973 các tham số của tổng thể chung và tổng thể mẫu chênh
lệch nhau không quá 3σ, hay = ’ 3σ.
Sau khi xác định được phạm vi sai số chọn mẫu, công việc tiếp theo là phải ước lượng
các tham số của tổng thể chung.
7.2.3. Suy rộng kết quả điều tra chọn mẫu
Dù chọn lặp hay không lặp thì số mẫu có thể hình thành
là một con số rất lớn. Mẫu được chọn ra để tiến hành điều
tra thực tế chỉ là một trong số rất nhiều mẫu có thể hình
thành. Qua điều tra chọn mẫu chúng ta tính toán được các
tham số x , f, σ02 của tổng thể mẫu. Nhưng mục đích của
chúng ta là xác định các tham số của tổng thể chung μ, p,
2. Do đó, ta phải ước lượng, nghĩa là từ các tham số của
tổng thể mẫu suy ra các tham số của tổng thể chung.
Trong thống kê có hai phương pháp ước lượng là ước lượng điểm và ước lượng
khoảng. Tuy nhiên, khi kích thước mẫu nhỏ ước lượng điểm cho sai số lớn và
Bài 7: Điều tra chọn mẫu
148 v1.0
thường không đánh giá được khả năng mắc sai lầm khi ước lượng. Do đó, phương
pháp được sử dụng phổ biến nhất để ước lượng kết quả điều tra là phương pháp
ước lượng khoảng.
Dựa vào tham số của tổng thể mẫu và phạm vi sai số chọn mẫu tính toán được, các
tham số của tổng thể chung được thống kê toán ước lượng như sau:
Khi ước lượng số bình quân:
x xx x z
hay x xx z x z
Khi ước lượng tỷ lệ theo một tiêu thức nào đấy:
p = f p = f z σp
hay f – z σp p f + z σp
7.2.4. Xác định số đơn vị mẫu cần điều tra
7.2.4.1. Yêu cầu
Chúng ta đã biết, sai số chọn mẫu tỷ lệ nghịch với số đơn vị mẫu chọn để điều tra. Do
đó, để giảm sai số chọn mẫu người ta phải tăng số đơn vị mẫu đến mức tối đa có thể
thực hiện được.
Tuy nhiên, việc tăng số đơn vị điều tra lại liên quan đến vấn đề kinh phí. Vì vậy, cũng
phải chọn số đơn vị điều tra sao cho các chi phí là thấp nhất.
Hai yêu cầu này luôn khó thực hiện cùng một lúc do đó người ta ưu tiên sai số nhỏ để
xác định số đơn vị mẫu điều tra.
7.2.4.2. Phương pháp xác định số đơn vị mẫu cần điều tra
Trên thực tế, có rất nhiều phương pháp xác định cỡ mẫu khác nhau tuỳ thuộc vào từng
điều kiện cụ thể. Xét về mặt lý thuyết, người ta thường căn cứ vào độ chính xác khi
suy rộng kết quả điều tra chọn mẫu. Biểu hiện tập trung nhất của độ chính xác là phạm
vi sai số chọn mẫu.
Từ công thức tính phạm vi sai số chọn mẫu, suy ra công thức tính số đơn vị mẫu cần
điều tra như sau:
Cách chọn
Suy rộng
Chọn hoàn lại
(chọn nhiều lần)
Chọn không hoàn lại
(chọn một lần)
Bình quân
2 2
2
x
z
n
2 2
2 2 2
x
Nz
n
N z
Tỷ lệ
2
2
p
z p(1 p)
n
2
2 2
p
Nz p(1 p)
n
N z p(1 p)
Để xác định số đơn vị cần điều tra chúng ta phải biết đầy đủ các yếu tố trong công
thức trên. Trong thực tế điều tra, người ta thường cho trước hệ số tin cậy và phạm vi
sai số chọn mẫu nhưng phương sai thì chưa biết. Khi đó, ta có thể xác định phương sai
của tổng thể chung bằng một trong những cách sau:
Lấy phương sai lớn nhất trong những lần điều tra trước (nếu có) hoặc chọn p nào
gần với 0,5 nhất.
Lấy phương sai của các cuộc điều tra khác có tính chất tương tự.
Bài 7: Điều tra chọn mẫu
v1.0 149
Điều tra thí điểm để xác định phương sai.
Ước lượng phương sai nhờ khoảng biến thiên. Thống kê toán đã chứng minh trong
trường hợp hiện tượng phân phối chuẩn thì:
max minx xR
6 6
7.2.4.3. Các nhân tố tác động đến kích thước mẫu điều tra
Từ công thức tính cỡ mẫu ở trên, có thể xác định
được các nhân tố ảnh hưởng đến cỡ mẫu, gồm có:
Hệ số tin cậy z: Nếu yêu cầu trình độ tin cậy của
ước lượng là lớn, tức hệ số tin cậy z lớn thì số
đơn vị mẫu điều tra nhiều và ngược lại.
Độ đồng đều của tổng thể chung (2): Nếu tổng
thể biến thiên lớn thì 2 tính ra lớn vì thế số đơn vị mẫu điều tra nhiều và ngược lại.
Phạm vi sai số chọn mẫu : Nếu phạm vi sai số chọn mẫu lớn thì số đơn vị mẫu
điều tra nhỏ và ngược lại.
Ngoài ra trong trường hợp chọn không hoàn lại, quy mô của tổng thể chung có thể
ảnh hưởng đến cỡ mẫu khi mà quy mô tổng thể không lớn lắm.
7.2.4.4. Các dạng bài toán cơ bản trong điều tra chọn mẫu
Bài toán 1: Suy rộng kết quả điều tra chọn mẫu
Để giải bài toán này thì phải cho trước xác suất hay độ tin cậy khi suy rộng tài liệu.
Sau đó tiến hành suy rộng số bình quân hay tỷ lệ theo công thức.
Bài toán 2: Tính xác suất khi suy rộng tài liệu.
Với bài toán này, phải cho trước phạm vi sai số chọn mẫu ε.
Bài toán 3: Tính số đơn vị mẫu cần điều tra.
Để giải bài toán này, cần cho trước xác suất khi suy rộng và phạm vi sai số chọn
mẫu. Sau đó tính số đơn vị mẫu cần điều tra theo các công thức tuỳ theo loại suy
rộng và cách chọn.
Ví dụ: Doanh nghiệp A có 3.000 lao động. Người ta tiến hành chọn ngẫu nhiên 300 lao
động theo cách chọn không lặp để điều tra về năng suất lao động bình quân của công
nhân trong doanh nghiệp và thu được kết quả sau (cột một và cột hai):
a NSLĐ
(1.000 đồng)
Số lao động
(người) xi xifi xi
2fi
40 – 50 25 45 1.125 50.625
50 – 60 40 55 2.200 121.000
60 – 70 70 65 4.550 295.750
70 – 80 85 75 6.375 478.125
80 – 90 60 85 5.100 433.500
Từ 90 trở lên 20 95 1.900 180.500
Tổng 300 21.250 1.559.500
Bài 7: Điều tra chọn mẫu
150 v1.0
Yêu cầu:
a) Tính năng suất lao động bình quân của công nhân toàn doanh nghiệp với xác
suất bằng 0,9544.
Trước hết ta phải tính được NSLĐ bình quân của công nhân trong mẫu điều tra.
i i
i
x f 21.250x 70,83
x 300
(nghìn đồng)
Phương sai của mẫu:
22
i i i i 2
i i
x f x f 1.559.500x (70,83) 181, 44
f f 300
Sai số bình quân chọn mẫu theo cách chọn không lặp:
2
0
x
n 181,44 300(1 ) (1 ) 0,739
n 1 N 300 1 3.000
(nghìn đồng)
Công thức để suy rộng năng suất lao động bình quân của công nhân toàn doanh
nghiệp với xác suất bằng 0,9544 hay hệ số tin cậy z = 2 là:
x xx z x z
Thay số: 70,83 2 0,739 70,83 2 0,739
69,352 72,308 (nghìn đồng)
Vậy năng suất lao động bình quân của công nhân toàn doanh nghiệp nằm trong
khoảng 69,352 đến 72,308 (nghìn đồng) với xác suất 0,9544.
b) Tính xác suất khi suy rộng tài liệu về năng suất lao động bình quân một công
nhân trong doanh nghiệp với phạm vi sai số chọn mẫu không vượt quá 2,22
nghìn đồng.
x
x
2, 22z 3
0,739
Với z = 3 thì xác suất Φ(z) = 0,9973.
c) Với xác suất bằng 0,9544 và phạm vi sai số chọn mẫu khi suy rộng về NSLĐ
bình quân không vượt quá 2 nghìn đồng. Tính số công nhân cần điều tra theo
cách chọn không lặp.
Áp dụng công thức tính số mẫu cần điều tra khi ước lượng số trung bình và
theo cách chọn không lặp:
2 2 2
2 2 2 2 2
x
Nz 3.000 2 181,44n 171,1
N z 3.000 2 2 181,44
hay 172 (người)
(trong trường hợp này lấy phương sai của tổng thể chung là phương sai của
mẫu trong lần điều tra trước bằng 181,44 vừa tính được ở câu a).
Vậy số công nhân cần điều tra là 172 người.
Bài 7: Điều tra chọn mẫu
v1.0 151
d) Với xác suất 0,9545, hãy xác định tỷ lệ công nhân có mức NSLĐ từ 80 nghìn
đồng trở lên trong doanh nghiệp.
Tỷ lệ công nhân có mức NSLĐ từ 80 nghìn đồng trở lên ở mẫu điều tra là:
60 20f 0,267
300
(lần)
Sai số bình quân chọn mẫu khi ước lượng tỷ lệ theo cách chọn không lặp:
p
f (1 f ) n 0, 267(1 0, 267) 300(1 ) (1 ) 0,024
n 1 N 300 1 3.000
(lần)
Công thức để suy rộng tỷ lệ công nhân có mức NSLĐ từ 80 nghìn đồng trở lên
trong toàn doanh nghiệp với hệ số tin cậy z = 2 là:
f – z σp p f + z σp
Thay số: 0,267 – 2 0,024 p 0,267 + 2 0,024
0,219 p 0,315 (lần)
e) Tính xác suất khi suy rộng tài liệu về tỷ lệ số công nhân có mức NSLĐ từ
80 nghìn đồng trở lên với phạm vi sai số chọn mẫu không vượt quá 7,21%.
p
p
0,721z 3
0,024
Vậy xác suất khi suy rộng là 0,9973.
f) Với xác suất bằng 0,9545 và phạm vi sai số chọn mẫu không vượt quá 5% khi
suy rộng về tỷ lệ số công nhân có mức NSLĐ từ 80 nghìn đồng trở lên, hãy
tính số công nhân cần điều tra theo cách chọn không lặp.
2 2
2 2 2 2
p
Nz p(1 p) 3.000 2 0,267(1 0,267)n 283,54
N z p(1 p) 3.000 0,05 2 0,267(1 0,267)
hay 284 người
Lưu ý: Khi tính cỡ mẫu, phải luôn làm tròn lên.
7.3. Một số phương pháp tổ chức chọn mẫu ngẫu nhiên thường dùng trong
thống kê
Việc lựa chọn các đơn vị mẫu từ tổng thể chung có thể có nhiều phương pháp khác
nhau. Trong thống kê hiện nay phổ biến có 5 phương pháp dưới đây.
7.3.1. Chọn mẫu ngẫu nhiên đơn giản
Khái niệm: Là phương pháp tổ chức chọn mẫu một cách hoàn toàn ngẫu nhiên
không qua một sự sắp xếp nào và có thể dùng phương pháp chọn một lần hoặc
chọn nhiều lần.
Ví dụ: Bốc thăm, quay số hoặc chọn theo bảng số ngẫu nhiên hay chọn bất kỳ.
Bài 7: Điều tra chọn mẫu
152 v1.0
Đánh giá phương pháp
o Ưu điểm: Đơn giản, dễ làm.
o Nhược điểm: gặp khó khăn khi tổng thể chung có quy mô lớn hoặc kết cấu
phức tạp. Nếu gặp tổng thể không đồng đều thì tính chất đại biểu của mẫu
không cao do các đơn vị được lựa chọn có thể phân bố không đều, tập trung
vào một chỗ.
Điều kiện vận dụng: Chỉ thích hợp với những tổng thể tương đối đồng đều và
không quá lớn.
7.3.2. Chọn mẫu hệ thống (máy móc)
Khái niệm: Là phương pháp tổ chức chọn mẫu
trong đó mỗi đơn vị được chọn căn cứ vào từng
khoảng cách nhất định từ danh sách đã được sắp
xếp sẵn của tổng thể chung. Các đơn vị được
chọn lần lượt, đơn vị sau cách đơn vị trước một
khoảng xác định d = N/n.
Ví dụ: Từ tổng thể chung có 1.000 công nhân,
người ta chọn ra 100 công nhân để tiến hành điều
tra, khi đó d = 1.000/100 = 10. Và cứ 10 người
theo danh sách thì sẽ chọn ra 1 người để điều tra. Người đầu tiên được chọn ra
trong số 10 người đầu tiên của danh sách bằng cách ngẫu nhiên đơn thuần. Giả sử
trong 10 người này rút thăm được người thứ 5 thì những người được chọn tiếp theo
là 15, 25...
Đánh giá phương pháp
o Ưu điểm: Thủ tục đơn giản, rút ngắn được thời gian cũng như chi phí; các đơn
vị rải đều ra trong toàn bộ tổng thể nên tính chất đại biểu của mẫu cao.
o Nhược điểm: Có khả năng xảy ra sai số hệ thống (sai số luôn lệch về một phía
đối với số thực tế) do mẫu lấy ra phụ thuộc vào đơn vị đầu tiên được chọn từ
nhóm đầu tiên. Do đó, khi tổng thể chung không đồng đều, đây chưa phải là
cách cho chúng ta mẫu tốt nhất. Mặt khác, khi tổng thể chung lớn thì việc sắp
xếp các đơn vị theo một thứ tự nào đó để chọn mẫu cũng gặp nhiều khó khăn.
Điều kiện vận dụng: Trước khi tiến hành chọn phải sắp xếp các đơn vị trong tổng
thể vào danh sách theo một thứ tự nào đó của tiêu thức nghiên cứu hoặc tiêu thức
bất kỳ.
7.3.3. Chọn mẫu phân loại (phân tổ)
Khái niệm: Là việc tiến hành chọn các đơn vị mẫu khi tổng thể chung đã được
phân chia thành các tổ theo tiêu thức liên quan trực tiếp đến mục đích nghiên cứu.
Việc chọn các đơn vị từ các tổ được tiến hành theo phương pháp chọn ngẫu nhiên.
Số đơn vị của mỗi tổ được chọn vào mẫu có thể tỷ lệ với quy mô tổ (chọn theo
tỷ lệ) hoặc không tỷ lệ với quy mô tổ (chọn không theo tỷ lệ).
Bài 7: Điều tra chọn mẫu
v1.0 153
Đánh giá phương pháp
o Ưu điểm: Chọn được tổng thể mẫu có kết cấu gần giống với kết cấu của tổng
thể chung (trong trường hợp chọn theo tỷ lệ) nên tính đại biểu cao, sai số chọn
mẫu nhỏ.
o Nhược điểm: Phức tạp và khó thực hiện hơn, đòi hỏi phải có nhiều thông tin về
tổng thể chung.
Điều kiện vận dụng: Thường sử dụng khi tổng thể phức tạp, phân bố không đồng đều.
7.3.4. Chọn mẫu cả khối (mẫu chùm)
Khái niệm: Theo phương pháp chọn mẫu này,
các đơn vị của tổng thể chung được chia thành
các khối (chùm) với số lượng đơn vị có thể bằng
hoặc không bằng nhau. Từ các khối đó, người ta
chọn ngẫu nhiên một số khối để điều tra. Các
đơn vị mẫu lúc này không phải là từng đơn vị lẻ
tẻ mà từng khối đơn vị.
Ví dụ: Kiểm tra chất lượng sản phẩm đã đóng thùng của nhà máy cơ khí chính xác.
Đánh giá phương pháp
o Ưu điểm: Tổ chức gọn nhẹ, giảm được chi phí.
o Nhược điểm: Do số đơn vị được chọn chỉ tập trung vào một số khối nên có thể
dẫn đến sai số lớn nếu giữa các khối có sự khác biệt nhau nhiều.
Điều kiện vận dụng: Chỉ nên áp dụng trong trường hợp giữa các đơn vị trong một
khối có sự khác nhau đáng kể song giữa các khối lại giống nhau về bản chất.
7.3.5. Chọn mẫu phân tầng (chọn nhiều cấp)
Khái niệm: Là phương pháp tổ chức chọn mẫu phải thông qua ít nhất hai cấp chọn
trung gian. Đầu tiên xác định các đơn vị mẫu cấp I sau đó các đơn vị mẫu cấp I
lại được phân chia thành các đơn vị chọn mẫu cấp II và cứ như thế cho đến cấp
cuối cùng.
Về bản chất, phương pháp này là sự biến thể của của phương pháp chọn mẫu cả
khối. Vì khi điều tra chọn mẫu hai cấp thì ở cấp I tổng thể được chia thành các
khối sau đó chọn ngẫu nhiên một số khối nhất định. Ở cấp II, thay vì điều tra toàn
bộ các đơn vị của các chùm được chọn ra, người ta chỉ chọn và điều tra một số đơn
vị của các chùm được chọn.
Điều kiện vận dụng: Sử dụng trong trường hợp các đơn vị của tổng thể phân tán
quá rộng và thiếu thông tin về tổng thể.
Tóm lại: Trong các phương pháp tổ chức chọn mẫu ngẫu nhiên được trình bày ở trên
thì phương pháp tổ chức chọn mẫu phân loại (phân tổ) – đặc biệt là phương pháp chọn
theo tỷ lệ, thường cho sai số chọn mẫu nhỏ nhất, đồng thời là phương pháp tổ chức
chọn mẫu phức tạp nhất.
7.4. Quy trình tiến hành điều tra chọn mẫu ngẫu nhiên
Thông thường một cuộc điều tra chọn mẫu được tiến hành qua các giai đoạn dưới đây:
Bài 7: Điều tra chọn mẫu
154 v1.0
7.4.1. Xác định mục đích nghiên cứu
Xác định mục đích nghiên cứu tức là phải xác định một cách rõ ràng: cuộc điều tra đó
nhằm tìm hiểu những vấn đề gì, phục vụ cho các yêu cầu cụ thể nào?
Xác định mục đích nghiên cứu là bước khởi đầu rất quan trọng, là tiền đề cho các giai
đoạn sau.
7.4.2. Xác định tổng thể nghiên cứu
Tổng thể nghiên cứu là tổng thể chung bao gồm tất cả
các đơn vị của hiện tượng nghiên cứu – tức xác định
N. Để xác định tổng thể nghiên cứu thì phải dựa vào
mục đích nghiên cứu, mục đích nghiên cứu khác nhau
thì tổng thể nghiên cứu khác nhau. Thực chất của việc
xác định tổng thể nghiên cứu là đi xác định các đơn vị
của nó. Muốn vậy, ngoài việc dựa vào mục đích
nghiên cứu còn phải dựa vào lý luận kinh tế – xã hội,
tình hình thực tế để đưa ra định nghĩa, những tiêu chuẩn làm căn cứ để xem xét một
cách cụ thể.
7.4.3. Xác định nội dung điều tra
Xác định nội dung điều tra là xác định danh mục các tiêu thức cần điều tra trên các
đơn vị của tổng thể mẫu và được cụ thể hoá bằng phiếu (biểu) điều tra. Để xác định
nội dung điều tra thì phải dựa vào mục đích nghiên cứu. Mục đích nghiên cứu đòi hỏi
phải giải quyết nhiều vấn đề thì nội dung điều tra phải bao gồm nhiều tiêu thức.
7.4.4. Xác định số lượng đơn vị của tổng thể mẫu và phương pháp tổ chức chọn mẫu
Xác định số lượng đơn vị của tổng thể mẫu – tức là xác định n (hay kích thước mẫu,
quy mô mẫu). Để xác định số lượng đơn vị của tổng thể mẫu cần phải cho trước
phạm vi sai số chọn mẫu và xác suất suy rộng tài liệu (khi nghiên cứu các hiện tượng
kinh tế – xã hội thường lấy xác suất 0,9544 hay 95,44%).
Sau khi đã xác định được số lượng đơn vị của tổng thể mẫu, dựa vào đặc điểm của hiện
tượng nghiên cứu và khả năng tổ chức điều tra để áp dụng các phương pháp tổ chức
chọn mẫu thích hợp nhằm xác định các đơn vị của tổng thể mẫu (lập dàn chọn mẫu).
7.4.5. Tiến hành thu thập tài liệu ở các đơn vị của tổng thể mẫu
Dựa vào phiếu điều tra để tiến hành thu thập tài liệu ở các đơn vị của tổng thể mẫu. Có
nhiều phương pháp thu thập tài liệu như: phương pháp đăng ký trực tiếp, phương pháp
phỏng vấn trực tiếp, Tuỳ thuộc vào điều kện và tính chất của cuộc điều tra để áp
dụng phương pháp thu thập tài liệu cho phù hợp.
7.4.6. Suy rộng kết quả điều tra chọn mẫu
Sau khi đã thu thập được đầy đủ tài liệu ở các đơn vị của tổng thể mẫu, căn cứ vào đó
để tiến hành tính toán và suy rộng (ước lượng) ra các đặc điểm của tổng thể chung. Có
hai phương pháp suy rộng là: suy rộng trực tiếp và suy rộng khoảng.
Bài 7: Điều tra chọn mẫu
v1.0 155
Suy rộng trực tiếp là coi các mức độ của tổng thể mẫu
cũng là các mức độ của tổng thể chung. Chẳng hạn,
coi số bình quân mẫu, tỷ lệ của tổng thể mẫu cũng là
số bình quân, tỷ lệ của tổng thể chung.
Suy rộng khoảng là các mức độ của tổng thể chung
được xác định nhận giá trị trong một khoảng nào đó
với xác suất cho trước.
7.4.7. Đưa ra kết luận về tổng thể chung
Đây là giai đoạn cuối cùng thể hiện kết quả của quá trình nghiên cứu. Các vấn đề cần
giải quyết như: “Có thể có các kết luận gì về tổng thể chung?”, “Các kết luận đó có
đáp ứng được mục đích nghiên cứu đã được đặt ra hay không? Có phản ánh được đặc
điểm, bản chất của hiện tượng hay không?”. Từ đó, cần đưa ra những giải pháp, kiến
nghị cụ thể để thúc đẩy sự phát triển của hiện tượng.
Các kết quả nghiên cứu đạt được cần được trình bày thông qua các bảng thống kê, các
đồ thị thống kê và báo cáo phân tích.
Bài 7: Điều tra chọn mẫu
156 v1.0
TÓM LƯỢC CUỐI BÀI
Điều tra chọn mẫu là một loại điều tra không toàn bộ trong đó người ta chỉ chọn ra một số
đơn vị thuộc đối tượng nghiên cứu để tiến hành điều tra thực tế (tổng thể mẫu). Các đơn vị
này được chọn theo những quy tắc nhất định để đảm bảo tính đại biểu. Kết quả của điều tra
chọn mẫu được dùng để suy rộng cho toàn bộ hiện tượng (tổng thể chung).
Với nhiều ưu điểm và cả những nhược điểm, điều tra chọn mẫu được sử dụng rộng rãi trong
nhiều trường hợp khác nhau, ở các lĩnh vực khác nhau với các tổng thể khác nhau. Hiện nay,
có hai phương pháp chọn mẫu cơ bản được sử dụng phổ biến trong các cuộc điều tra là chọn
mẫu ngẫu nhiên và chọn mẫu phi ngẫu nhiên.
Trong điều tra chọn mẫu ngẫu nhiên, người ta thường hay sử dụng hai phương pháp chọn là
chọn hoàn lại và chọn không hoàn lại. Dù chọn theo cách nào thì số mẫu có thể hình thành là
rất lớn. Mẫu được chọn ra để điều tra thực tế chỉ là một trong số đó.
Từ các tham số của tổng thể mẫu, người ta suy rộng hay ước lượng ra các tham số của tổng
thể chung. Khi đó, việc suy rộng thường có sai số và được gọi là sai số chọn mẫu. Khái niệm
sai số bình quân chọn mẫu nói lên mức sai số đại diện cho các sai số chọn mẫu có thể có.
Khái niệm phạm vi sai số chọn mẫu nói lên khi suy rộng thì sai số chọn mẫu không được
vượt quá phạm vi đó với một xác suất nhất định.
Có nhiều phương pháp tổ chức chọn mẫu khác nhau tuỳ theo đặc điểm của hiện tượng và khả
năng tổ chức điều tra. Đó có thể là phương pháp chọn mẫu ngẫu nhiên giản đơn, chọn mẫu hệ
thống (chọn máy móc), chọn mẫu phân tổ (phân loại), chọn mẫu chùm hay chọn mẫu phân
tầng. Trong đó, chọn mẫu phân loại thường cho sai số chọn mẫu nhỏ nhất và đây cũng là
phương pháp tổ chức chọn mẫu phức tạp nhất.
Để thực hiện tốt một cuộc điều tra chọn mẫu, cần phải tiến hành theo đúng trình tự nhất định
như xác định mục đích nghiên cứu, xác định tổng thể nghiên cứu, xác định nội dung điều tra,
xác định số lượng đơn vị tổng thể mẫu và phương pháp tổ chức chọn mẫu, thu thập số liệu ở
mẫu, suy rộng kết quả mẫu và rút ra kết luận chung.
Bài 7: Điều tra chọn mẫu
v1.0 157
CÂU HỎI ÔN TẬP
1. Điều tra chọn mẫu là gì và được vận dụng trong trường hợp nào?
2. Trình bày ưu, nhược điểm của điều tra chọn mẫu.
3. Thế nào là chọn hoàn lại và chọn không hoàn lại? Đặc điểm của từng cách chọn.
4. Sai số chọn mẫu là gì? Có những loại sai số nào trong điều tra chọn mẫu?
5. Phân tích các yếu tố ảnh hưởng đến sai số chọn mẫu.
6. Sai số bình quân chọn mẫu là gì? Nêu cách tính.
7. Phân tích các nhân tố ảnh hưởng đến số đơn vị mẫu được chọn để điều tra.
8. Trình bày các phương pháp tổ chức chọn mẫu ngẫu nhiên thường dùng. Nêu rõ ưu, nhược
điểm và điều kiện áp dụng của từng phương pháp.
9. Nêu trình tự tiến hành một cuộc điều tra chọn mẫu.
Bài 7: Điều tra chọn mẫu
158 v1.0
BÀI TẬP
1. Để nghiên cứu tình hình kinh doanh của 40 cửa hàng có tổng số 920 nhân viên kinh doanh
trong chuỗi cửa hàng của Made in Vietnam, người ta đã chọn ra 6 cửa hàng để điều tra thực
tế bằng phương pháp chọn ngẫu nhiên đơn thuần không hoàn lại. Kết quả điều tra như sau:
Cửa hàng Doanh số trung bình 1 nhân
viên kinh doanh (triệu đồng)
Doanh số
(triệu đồng)
A 40 520
B 35 595
C 45 945
D 40 640
E 50 500
F 48 720
a) Với độ tin cậy bằng 95,45%, hãy xác định doanh số trung bình chung một nhân viên kinh
doanh của toàn bộ các cửa hàng Made in Vietnam. Từ đó, hãy tính tổng doanh số của toàn
bộ 40 cửa hàng trên.
b) Tính xác suất khi suy rộng doanh số trung bình chung một nhân viên kinh doanh của toàn
bộ các cửa hàng khi phạm vi sai số chọn mẫu không vượt quá 1,49 triệu đồng.
2. Một trường tiểu học có 1.120 học sinh. Người ta chọn ra 112 em để tiến hành điều tra chọn
mẫu ngẫu nhiên theo phương pháp chọn không lặp nhằm đánh giá mức IQ của học sinh trong
trường. Kết quả như sau:
IQ Số trẻ em (người)
60 – 70 1
70 – 80 5
80 – 90 13
90 – 100 22
100 – 110 28
110 – 120 23
120 – 130 14
130 – 140 3
140 – 150 2
150 – 160 1
a) Tính chỉ số IQ bình quân của học sinh trường tiểu học nói trên với xác suất 0,9545.
b) Tính xác suất khi suy rộng chỉ số IQ bình quân của học sinh trường tiểu học nói trên biết
rằng phạm vi sai số chọn mẫu không vượt quá 1,47.
c) Nếu thực hiện một cuộc điều tra khác để đánh giá chỉ số IQ bình quân của học sinh
trường tiểu học nói trên. Với xác suất 0,9545 và phạm vi sai số chọn mẫu khi suy rộng
không vượt quá 2,5. Hãy tính số học sinh cần điều tra theo phương pháp chọn lặp và chọn
không lặp.
3. Theo kết quả điều tra chọn mẫu ngẫu nhiên không lặp 200 bệnh nhân về số ngày nằm viện
của họ, người ta thu được kết quả sau:
Bài 7: Điều tra chọn mẫu
v1.0 159
Số ngày nằm viện (ngày) Số người (người)
1 – 3 24
4 – 6 83
7 – 9 52
10 – 12 22
13 – 15 11
16 – 18 5
19 – 21 2
22 – 24 1
a) Tính tỷ lệ những người nằm viện từ 10 ngày trở lên với xác suất 0,9544. Biết rằng, toàn
bệnh viện có tổng số 2.000 bệnh nhân. Từ đó, hãy xác định số bệnh nhân phải nằm viện
từ 10 ngày trở lên ở cả bệnh viện.
b) Tính xác suất khi suy rộng tỷ lệ bệnh nhân nằm viện từ 10 ngày trở lên biết rằng phạm vi
sai số chọn mẫu không vượt quá 8,15%.
c) Người ta tiến hành một cuộc điều tra chọn mẫu mới để xác định tỷ lệ bệnh nhân nằm viện từ
10 ngày trở lên. Hãy tính số bệnh nhân cần điều tra theo phương pháp chọn lặp và chọn
không lặp với xác suất 0,9545 và phạm vi sai số chọn mẫu khi suy rộng không vượt quá 5%.
4. Một ngân hàng hiện đang có 300 khoản đầu tư ngắn hạn. Họ thực hiện điều tra chọn mẫu
ngẫu nhiên đơn thuần không lặp trên 40 khoản đầu tư nhằm thu thập thông tin về số ngày đến
hạn thanh toán của chúng. Kết quả như sau:
Số ngày đến hạn thanh toán Số khoản đầu tư ngắn hạn
30 – 40 3
40 – 50 1
50 – 60 8
60 – 70 10
70 – 80 7
80 – 90 7
90 – 100 4
Tổng 40
a) Hãy xác định số ngày đến hạn thanh toán bình quân của tất cả các khoản đầu tư trên với
xác suất 0,9544.
b) Biết phạm vi sai số chọn mẫu khi suy rộng số ngày đến hạn thanh toán bình quân của tất
cả các khoản đầu tư trên không vượt quá 7,25 ngày, hãy tính xác suất khi suy rộng.
c) Xác định tỷ lệ số khoản đầu tư có ngày đến hạn thanh toán dưới 2 tháng với xác suất
0,9545.
5. Trong một cuộc điều tra về chất lượng lao động ở khu công nghiệp có 10.000 lao động, người
ta chọn ra 1.000 lao động để điều tra về tuổi theo phương pháp chọn mẫu ngẫu nhiên đơn
thuần không hoàn lại. Kết quả thu được như sau:
Bài 7: Điều tra chọn mẫu
160 v1.0
Tuổi Số lao động (người)
16 – 18 50
18 – 20 163
20 – 24 280
24 – 30 214
30 – 40 150
40 – 50 88
50 – 60 45
≥ 60 10
a) Tính tuổi trung bình của lao động toàn khu công nghiệp với xác suất 0,9546.
b) Tính tỷ lệ lao động trong khu công nghiệp có độ tuổi từ 20 – 29 với xác suất 0,9546.
Từ đó, xác định số công nhân trong khu công nghiệp có độ tuổi từ 20 – 29.
c) Người ta tiến hành một cuộc điều tra chọn mẫu mới nhằm xác định tỷ lệ lao động trong
khu công nghiệp có độ tuổi từ 20 – 29. Hãy xác định số công nhân cần điều tra theo
phương pháp chọn không hoàn lại với xác suất khi suy rộng là 0,9545 và phạm vi sai số
chọn mẫu khi suy rộng không vượt quá 5%.
Các file đính kèm theo tài liệu này:
- 10_sta302_bai_7_v1_0_4163.pdf