Điều tra chọn mẫu nhỏ và điều tra chọn mẫu ngẫu nhiên thời điểm
- Điều tra chọn mẫu nhỏ
Trong những trường hợp không thể điều tra một số đơn vị tương đối lớn vì
nó liên quan đến việc hủy bỏ đơn vị điều tra như: kiểm tra chất lượng đồ hộp, thử
độ bền của bóng đèn, của sợi thì người ta tiến hành điều tra chọn mẫu nhỏ với số
lượng điều tra không quá 30 (n<30). Trong thống kê toán người ta đã chứng minh
rằng ngay trong chọn mẫu nhỏ, với phương pháp tính toán thích hợp vẫn có thể đảm
bảo độ chính xác để suy rộng tài liệu
- Điều tra chọn mẫu ngẫu nhiên thời điểm
Điều tra chọn mẫu ngẫu nhiên thời điểm là phương pháp điều tra chọn mẫu
đặc biệt, theo đó tại những thời điểm nhất định, người ta quan sát sự tồn tại của các
phần tử thuộc quá trình nghiên cứu.
Ví dụ: Khi nghiên cứu thời gian làm việc của công nhân trong một phân
xưởng, có thể chia thời gian ra làm hai thành phần: làm việc và ngừng việc. Trong
suốt một ca làm việc, cứ sau một khoảng thời gian nhất định lại đi kiểm tra các công
nhân một lần. Mỗi lần kiểm tra ghi chép thời gian làm việc của từng công nhân vào
lúc đó (làm việc hay ngừng việc). Giả sử trong phân xưởng có 40 công nhân làm
việc, cứ cách 30 phút lại đi kiểm tra một lần. Như vậy trong suốt ca làm việc (8 giờ)
ta sẽ đi kiểm tra 16 lần và tổng số trường hợp ghi chép là: 16 x 40 = 640 trường
hợp. Trong 640 trường hợp này, giả sử có 576 trường hợp công nhân đang làm việc
và 64 trường hợp ngừng việc.
27 trang |
Chia sẻ: hachi492 | Ngày: 15/01/2022 | Lượt xem: 438 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Giáo trình Nguyên lý thống kê (Phần 2), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
45
CHƢƠNG 5: DÃY SỐ BIẾN ĐỘNG THEO THỜI GIAN
Phân tích dãy số biến động theo thời gian giúp quan sát hiện tượng biến đổi
theo thời gian rồi tìm ra quy luật và dùng quy luật đó để phân tích và dự đoán
thống kê. Chương này trình bày một số vấn đề chung về dãy số thời gian, giới thiệu
các chỉ tiêu phân tích dãy số thời gian và các phương pháp biểu diễn xu hướng biến
động của hiện tượng qua thời gian
5.1 Khái niệm, phân loại và ý nghĩa của dãy số biến động theo thời gian
5.1.1. Khái niệm dãy số biến động theo thời gian
Dãy số biến động theo thời gian là dãy các trị số của một chỉ tiêu thống kê
đƣợc sắp xếp theo thứ tự thời gian. Một dãy số thời gian gồm có 2 phần:
- Thời gian: là những thời điểm hay thời kỳ nhƣ ngày, tuần, tháng, quý,
năm....Độ dài giữa hai thời gian gần nhau đƣợc gọi là khoảng cách thời gian.
- Mức độ của dãy số: là các trị số của chỉ tiêu về hiện tƣợng nghiên cứu, mức
độ này có thể là số tuyệt đối, số tƣơng đối, số bình quân.
5.1.2. Các loại dãy số biến động theo thời gian
Căn cứ vào đặc điểm tồn tại về quy mô của hiện tƣợng qua thời gian, có thể
phân dãy số thời gian thành hai loại:
- Dãy số thời kỳ: là dãy số mà các trị số của chỉ tiêu phản ánh mức độ của
hiện tƣợng trong từng khoảng thời gian nhất định.
Ví dụ 1: Doanh thu của công ty X giai đoạn 2013 - 2017
Năm 2013 2014 2015 2016 2017
Doanh thu (tỷ đồng) 500 520 546 570 600
Đặc điểm của dãy số thời kỳ là có thể cộng các mức độ lại với nhau để có
một mức độ mới với khoảng thời gian dài hơn.
- Dãy số thời điểm: là dãy số mà các trị số của chỉ tiêu phản ánh mức độ của
hiện tƣợng tại những thời điểm nhất định.
Ví dụ 2: Có tài liệu về giá trị hàng tồn kho của công ty X vào quý I/năm N
nhƣ sau:
Ngày đầu tháng 1/1 1/2 1/3 1/4
Giá trị hàng tồn kho (triệu đồng) 800 850 900 750
46
Đặc điểm của dãy số thời điểm là không thể cộng các mức độ lại với nhau vì
mức độ của hiện tƣợng ở thời điểm sau thƣờng bao gồm toàn bộ hoặc một bộ phận
mức độ của hiện tƣợng ở thời điểm trƣớc đó, cho nên việc cộng các trị số của chỉ
tiêu không phản ánh quy mô của hiện tƣợng.
5.1.3 Ý nghĩa của dãy số biến động theo thời gian
- Cho thấy sự biến động của hiện tƣợng qua thời gian.
- Cho phép tính toán đƣợc các chỉ tiêu phân tích dãy số.
- Giúp nghiên cứu quy luật phát triển của hiện tƣợng, dựa vào đó dự đoán
đƣợc mức độ của hiện tƣợng ở tƣơng lai.
5.2. Các chỉ tiêu phân tích dãy số biến động theo thời gian
5.2.1. Mức độ bình quân theo thời gian
Mức độ bình quân theo thời gian là chỉ tiêu phản ánh mức độ đại biểu của
các mức độ tuyệt đối trong một dãy số biến động theo thời gian.
* Đối với dãy số thời kỳ.
Công thức tính: ̅
∑
Trong đó: - ̅ : mức độ bình quân theo thời gian của dãy số thời kỳ
- yi : các mức độ của dãy số thời kỳ (i = 1, 2,...., n)
- n là số thời kỳ
Ví dụ: Từ số liệu ví dụ 1 ta tính doanh thu bình quân hàng năm của công ty X
giai đoạn 2013 – 2017 nhƣ sau:
̅
(ngàn tấn/năm)
* Đối với dãy số thời điểm: Có 2 trƣờng hợp sau:
- Dãy thời điểm có khoảng cách thời gian đều nhau
Công thức tính: ̅
Ví dụ: Từ ví dụ 2 ta tính giá trị hàng tồn kho bình quân quý I/năm N của
công ty X: ̅
triệu đồng
- Dãy số thời điểm có khoảng cách thời gian không đều nhau
47
Công thức tính: ̅
∑
∑
Trong đó: - ti : là độ dài thời gian có mức độ yi ( i = 1, 2,..., n)
- yi : các mức độ của dãy số thời điểm (i = 1, 2,...., n)
Ví dụ 3: Có tài liệu về số công nhân trong danh sách của một doanh nghiệp Y
trong quý I/2018 nhƣ sau:
- Ngày 1/1 doanh nghiệp có 200 công nhân
- Ngày 5/2 doanh nghiệp nhận thêm 5 công nhân
- Ngày 5/3 doanh nghiệp nhận thêm 3 công nhân
- Ngày 20/3 doanh nghiệp cho thôi việc 2 công nhân và từ đó đến cuối tháng
3 không có gì thay đổi.
Tính số công nhân bình quân quý I/2018 của doanh nghiệp trên.
Từ tài liệu trên ta lập bảng sau:
Thời gian Số ngày (ti) Số công nhân (yi)
Từ 1/1 đến 4/2 35 200
Từ ngày 5/2 đến 4/3 28 205
Từ 5/3 đến 19/3 15 208
Từ 20/3 đến 31/3 12 206
Số công nhân bình quân trong quý I/2018
̅
∑
∑
(ngƣời)
- Dãy số thời điểm chỉ có 2 thời điểm đầu và cuối, thì
̅
Ví dụ 4: Số công nhân đầu tháng 01/2018 của doanh nghiệp A là 100 ngƣời,
số công nhân cuối tháng 01/2018 của doanh nghiệp A là 140 ngƣời. Vậy số công
nhân bình quân trong tháng 01/2018 là
̅
(ngƣời)
48
5.2.2. Lƣợng tăng (giảm) tuyệt đối
Lƣợng tăng (giảm) tuyết đối là chỉ tiêu phản ánh sự chênh lệch về số tuyệt
đối giữa 2 mức độ của dãy số ở hai thời gian khác nhau. Nếu mức độ của hiện tƣợng
tăng lên thì trị số của chỉ tiêu mang dấu dƣơng (+), ngƣợc lại thì mang dấu âm (-).
Tùy vào mức độ làm gốc so sánh mà ta có các lƣợng tăng (giảm) tuyệt đối nhƣ sau:
a) Lượng tăng (giảm) tuyệt đối liên hoàn (Ký hiệu là ).
Lƣợng tăng (giảm) tuyết đối liên hoàn là chênh lệch giữa mức độ kỳ nghiên
cứu và mức độ của kỳ đứng liền trƣớc đó.
Công thức tính: (i = 2, 3,..., n) ; (j = 1, 2,.., n-1)
Trong đó: - : lƣợng tăng (giảm) tuyệt đối liên hoàn
- yi : mức độ kỳ nghiên cứu
- yi-1: mức độ của kỳ đứng liền trƣớc kỳ nghiên cứu yi.
Ví dụ: Từ số liệu ví dụ 1, ta tính lƣợng tăng (giảm) tuyệt đối liên hoàn nhƣ sau:
Năm 2013 2014 2015 2016 2017
Doanh thu (tỷ đồng) 500 520 546 570 600
Lƣợng tăng (giảm) tuyệt đối liên hoàn +20 +26 +24 +30
b) Lượng tăng (giảm) tuyệt đối định gốc (Ký hiệu là Δj )
Lƣợng tăng (giảm) tuyệt đối định gốc là chênh lệch giữa mức độ kỳ nghiên
cứu và mức độ của một kỳ đƣợc chọn làm gốc cố định, thƣờng là mức độ đầu tiên
của dãy số.
Công thức tính: Δj = yi - y1 (i = 2, 3,.., n); (j = 1, 2,.., n-1)
Với y1 là mức độ kỳ gốc đƣợc cố định cho mọi lần so sánh.
Ví dụ: Từ số liệu ví dụ 1, ta tính lƣợng tăng giảm tuyệt đối định gốc nhƣ sau:
Năm 2013 2014 2015 2016 2017
Doanh thu (tỷ đồng) 500 520 546 570 600
Lƣợng tăng (giảm) tuyệt đối định gốc - +20 +46 +70 +100
* Mối quan hệ giữa lượng tăng (giảm) tuyệt đối liên hoàn và định gốc:
49
Tổng lƣợng tăng (giảm) tuyệt đối liên hoàn bằng lƣợng tăng (giảm) tuyệt đối
định gốc tức là: ∑ (j = 1, 2,.., n-1).
Ví dụ: Theo số liệu trên thì ∑ tức là (20 + 26 + 24 + 30) = 100
c) Lượng tăng (giảm) tuyệt đối bình quân liên hoàn (Ký hiệu ̅ )
Công thức tính: ̅
∑
Chỉ tiêu này chỉ nên tính khi các mức độ của dãy số có cùng xu hƣớng cùng
tăng hoặc cùng giảm.
Ví dụ: Theo số liệu ví dụ 1 thì
̅
∑
5.2.3. Tốc độ phát triển
Tốc độ phát triển là số tƣơng đối động thái phản ánh quan hệ so sánh giữa hai
mức độ trong dãy số biến động theo thời gian. Chỉ tiêu này phản ánh tốc độ và xu
hƣớng biến động của hiện tƣợng theo thời gian.
a) Tốc độ phát triển liên hoàn (Ký hiệu tj)
Tốc độ phát triển liên hoàn là tỷ số giữa mức độ kỳ nghiên cứu và mức độ
của kỳ đứng liền trƣớc đó.
Công thức tính:
̅̅ ̅̅ ̅̅ ̅̅ ̅̅
Trong đó: - tj : tốc độ phát triển liên hoàn
- yi : mức độ của hiện tƣợng ở kỳ nghiên cứu (i = 2, 3,..., n)
- yi-1 : mức độ của hiện tƣợng ở kỳ đứng liền trƣớc kỳ nghiên cứu.
Ví dụ: Từ số liệu ví dụ 1, ta tính tốc độ phát triển liên hoàn nhƣ sau:
Năm 2013 2014 2015 2016 2017
Doanh thu (tỷ đồng) 500 520 546 570 600
Tốc độ phát triển liên hoàn (lần) 1,04 1,05 1,044 1,053
b) Tốc độ phát triển định gốc (Ký hiệu Tj )
Tốc độ phát triển định gốc là tỉ số giữa mức độ kỳ nghiên cứu và mức độ của
một kỳ đƣợc chọn làm gốc cố định, thƣờng là mức độ đầu tiên của dãy số.
50
Công thức tính:
̅̅ ̅̅ ̅̅ ̅̅ ̅̅ ̅; (i = 2, 3,..., n)
Ví dụ: Từ số liệu ví dụ 1, ta tính tốc độ phát triển định gốc nhƣ sau:
Năm 2013 2014 2015 2016 2017
Doanh thu (tỷ đồng) 500 520 546 570 600
Tốc độ phát triển định gốc (lần) - 1,04 1,092 1,14 1,2
* Mối quan hệ giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gốc:
- Tích số của các tốc độ phát triển liên hoàn bằng tốc độ phát triển định gốc
trong một khoản thời gian tƣơng ứng.
Tức là: ∏ (∏ là dấu tích số)
Ví dụ: Theo số liệu ví dụ trên: 1,04 x 1,05 x 1,044 x 1,053 = 1,2
- Thƣơng của hai tốc độ phát triển định gốc liền nhau bằng tốc độ phát triển
liên hoàn giữa hai thời gian đó.
Theo ví dụ trên thì
tức là
;
tức là
c) Tốc độ phát triển bình quân ( Ký hiệu ̅ )
Tốc độ phát triển bình quân là mức độ đại biểu của các tốc độ phát triển liên
hoàn của hiện tƣợng trong suốt thời gian nghiên cứu và đƣợc tính theo công thức số
bình quân nhân.
̅ √
√∏
Ví dụ: Theo ví dụ 1 thì tốc độ phát triển bình quân
̅ √
lần
Chỉ tiêu này chỉ nên tính với những hiện tƣợng phát triển theo một xu hƣớng
nhất định.
5.2.4. Tốc độ tăng (giảm)
a) Tốc độ tăng (giảm) liên hoàn (Ký hiệu là aj)
51
Tốc độ tăng (giảm) liên hoàn là tỉ số so sánh giữa lƣợng tăng (giảm) liên
hoàn với mức độ kỳ gốc liên hoàn.
Công thức tính:
̅̅ ̅̅ ̅̅ ̅̅ ̅̅ ̅ ̅̅ ̅̅ ̅̅ ̅
hay (nếu tj là tốc độ phát triển liên hoàn, tính bằng số lần);
(nếu tj tính bằng phần trăm).
Ví dụ: Theo số liệu ví dụ 1 thì tốc độ tăng liên hoàn là:
Năm 2013 2014 2015 2016 2017
Doanh thu (tỷ đồng) 500 520 546 570 600
Tốc độ tăng (giảm)
liên hoàn (lần)
- 0,04
Hay 4%
0,05
Hay 5%
0,044
Hay 4,4%
0,053
Hay 5,3%
b) Tốc độ tăng (giảm) định gốc (Ký hiệu là Aj )
Tốc độ tăng (giảm) định gốc là tỉ số giữa lƣợng tăng (giảm) định gốc với
mức độ kỳ gốc cố định (y1).
̅̅ ̅̅ ̅̅ ̅̅ ̅̅ ̅
Hay Aj = Tj - 1 (nếu Tj là tốc độ phát triển định gốc, tính bằng số lần)
Aj = Tj - 100% (nếu Tj tính bằng phần trăm).
Ví dụ: theo số liệu ví dụ 1 thì tốc độ tăng (giảm) định gốc
Năm 2013 2014 2015 2016 2017
Doanh thu (tỷ đồng) 500 520 546 570 600
Tốc độ tăng (giảm)
định gốc (lần)
- 0,04
Hay 4%
0,092
Hay 9,2%
0,14
Hay 14%
0,2
Hay 20%
c) Tốc độ tăng (giảm) bình quân (Ký hiệu ̅ )
Tốc độ tăng (giảm) bình quân là chỉ tiêu phản ánh tốc độ tăng (giảm) đại biểu
của hiện tƣợng trong suốt thời gian nghiên cứu.
̅ ̅ (nếu ̅ tính bằng số lần). Trong đó ̅ là tốc độ phát triển bình quân
Hoặc ̅ ̅ (nếu ̅ tính bằng phần trăm).
52
Ví dụ: Theo ví dụ 1 thì tốc độ tăng bình quân: a = t - 1 = 1,047 – 1 = 0,047
lần hay 4,7%.
5.2.5. Giá trị tuyệt đối của 1% tăng (giảm)
a) Giá trị tuyệt đối của 1% tăng (giảm) liên hoàn (ký hiệu là gj )
Chỉ tiêu này phản ánh cứ 1% tăng (giảm) của tốc độ tăng (giảm) liên hoàn thì
tƣơng ứng với một trị số tuyệt đối là bao nhiêu.
̅̅ ̅̅ ̅̅ ̅̅ ̅̅ ̅
(
)
̅̅ ̅̅ ̅̅
Ví dụ: Theo số liệu ví dụ trên thì giá trị tuyệt đối của 1% tăng liên hoàn là:
;
;
b)Giá trị tuyệt đối của 1% tăng (giảm) định gốc (ký hiệu là Gj )
Giá trị tuyệt đối của 1% tăng (giảm) định gốc luôn luôn là một số không đổi
và bằng
( )
Ví dụ: Theo ví dụ 1 thì giá trị tuyệt đối của 1% tăng định gốc luôn là:
5.3. Các phƣơng pháp biểu hiện xu hƣớng phát triển cơ bản của hiện tƣợng.
Biến động của hiện tƣợng theo thời gian chịu sự tác động của nhiều nhân tố,
ngoài các nhân tố chủ yếu quyết định xu hƣớng biến động của hiện tƣợng còn có
những nhân tố ngẫu nhiên gây ra những sai lệch khỏi xu hƣớng đó. Vì vậy, cần sử
dụng những phƣơng pháp thích hợp loại bỏ phần nào tác động của những nhân tố
ngẫu nhiên để nêu lên xu hƣớng và tính quy luật về sự biến động của hiện tƣợng.
5.3.1. Phƣơng pháp mở rộng khoảng cách thời gian
Phƣơng pháp này đƣợc sử dụng khi dãy số thời kỳ có khoảng cách thời gian
tƣơng đối ngắn và có nhiều mức độ mà qua đó chƣa phản ánh đƣợc xu hƣớng biến
53
động của hiện tƣợng. Vì thế ta cần tính toán lại các mức độ trong dãy số bằng cách
mở rộng khoảng cách thời gian nhƣ: biến đổi các mức độ hàng ngày thành mức độ
hàng tuần, mức độ hàng tuần thành mức độ hàng tháng, mức độ hàng tháng thành
quý....
Ví dụ: Có tài liệu về sản lƣợng hàng tháng ở một doanh nghiệp nhƣ sau:
Tháng Sản lƣợng (1.000 tấn) Tháng Sản lƣợng (1.000 tấn)
1 37,4 7 40,8
2 36,8 8 44,8
3 40,6 9 49,4
4 38,0 10 48,9
5 42,2 11 49,2
6 48,5 12 47,2
Dãy số trên cho thấy sản lƣợng khi tăng, khi giảm một cách thất thƣờng, khó
đánh giá rõ xu hƣớng biến động. Để đánh giá đƣợc tình hình sản xuất của doanh nghiệp
trong năm, ta có thể mở rộng khoảng cách thời gian từ tháng sang quý nhƣ sau:
Quý Sản lƣợng (1.000.tấn)
I 114,8
II 128,7
III 135,0
IV 145,3
Sau khi khoảng cách thời gian đƣợc mở rộng ta thấy rõ xu hƣớng biến động
cơ bản là tình hình sản xuất của doanh nghiệp tăng dần từ quý I đến quý IV
5.3.2. Phƣơng pháp số bình quân trƣợt
Số bình quân trƣợt là số bình quân cộng của một nhóm nhất định các mức độ
của dãy số, đƣợc tính bằng cách loại dần các mức độ đầu đồng thời thêm vào các
mức độ tiếp theo, sao cho tổng số lƣợng các mức độ tham gia tính số bình quân
trƣợt không thay đổi.
Giả sử các mức độ của một dãy số thời gian: y1, y2, y3, ........, yn-1, yn
Nếu tính bình quân trƣợt cho nhóm ba mức độ, ta sẽ có:
54
̅̅ ̅
̅̅ ̅
Thông thƣờng ta tính số bình quân trƣợt theo từng nhóm lẻ các mức độ (3, 5,
7,... các mức độ) để thuận tiện cho việc sắp xếp số bình quân trƣợt trùng với trung
tâm của khoảng cách san bằng. Nếu sự biến động của hiện tƣợng tƣơng đối đều đặn
và số lƣợng các mức độ dãy số không nhiều thì có thể tính số bình quân trƣợt từ 3
mức độ. Nếu sự biến động của hiện tƣợng lớn và dãy số có nhiều mức độ thì có thể
tính số bình quân trƣợt từ 5 hoặc 7 mức độ. Số bình quân trƣợt càng đƣợc tính từ
nhiều mức độ thì càng có tác dụng san bằng ảnh hƣởng của các nhân tố ngẫu nhiên.
Từ số liệu ở ví dụ trên, ta tính số bình quân trƣợt cho nhóm 3 mức độ nhƣ sau:
Tháng Sản lƣợng
(1.000.tấn)
Số bình quân
trƣợt
Tháng Sản lƣợng
(1.000.tấn)
Số bình quân
trƣợt
1 37,4 - 7 40,8 44,7
2 36,8 38,3 8 44,8 45,0
3 40,6 38,5 9 49,4 47,7
4 38,0 40,3 10 48,9 48,2
5 42,2 42,9 11 49,2 48,4
6 48,5 43,8 12 47,2 -
5.3.3. Phƣơng pháp hồi quy
Trong một số trƣờng hợp trên cơ sở dãy số thời gian, ngƣời ta tìm một hàm
số (gọi là phƣơng trình hồi quy) phản ánh sự biến động của hiện tƣợng qua thời gian
có dạng tổng quát nhƣ sau: ̅
Trong đó: ̅ là mức độ lý thuyết (tiêu thức kết quả)
- t là thứ tự thời gian (tiêu thức nguyên nhân)
Để lựa chọn đúng đắn dạng của phƣơng trình hồi quy đòi hỏi phải dựa vào sự
phân tích biến động của hiện tƣợng qua thời gian. Phƣơng trình hồi quy có thể là
tuyến tính hoặc phi tuyến tính với các dạng khác nhau.
55
5.3.4. Phƣơng pháp biểu hiện quy luật biến động thời vụ
Một số hiện tƣợng kinh tế xã hội thƣờng biến động có tính chất thời vụ. Biểu
hiện của sự biến động này là hầu nhƣ hàng năm cứ đến một thời kỳ nhất định thì
hiện tƣợng sẽ tăng lên hoặc giảm đi một cách rõ rệt. Nguyên nhân của sự biến động
này chủ yếu là do ảnh hƣởng của các điều kiện tự nhiên hoặc do phong tục, tập quán
sinh hoạt của con ngƣời.
Để nghiên cứu biến động thời vụ thống kê thƣờng tính chỉ số thời vụ:
̅
̅
Trong đó:- : chỉ số thời vụ của thời gian i
- :bình quân các mức độ của các thời gian cùng tên i qua các năm
- ̅: bình quân chung của tất cả các mức độ trong dãy số
Tháng
Số lƣợng hàng tiêu thụ (tấn)
Itv (%)
2005 2006 2007 Cộng các tháng SBQ các tháng
(1) (2) (3) (4) (5) (6)=(5)/3 7=(6)/ y
1 1.495 1.500 1.490 4.485 1.495 62,9
2 1.461 1.490 1.480 4.431 1.477 62,2
3 1.533 1.599 1.604 4.736 1.578 66,4
4 1.922 2.210 2.005 6.137 2.046 86,1
5 2.746 2.804 2.745 8.295 2.765 116,4
6 3.289 3.282 3.250 9.821 3.274 137,8
7 3.523 3.620 3.700 10.843 3.614 152,1
8 3.330 3.300 3.215 9.845 3.282 138,2
9 2.597 2.604 2.590 7.791 2.597 109,3
10 2.249 2.205 2.304 6.758 2.253 84,8
11 2.144 2.200 2.190 6.534 2.178 91,7
12 1.983 1.889 1.950 5.822 1.941 81,7
Tổng 28.272 28.703 28.523 85.498
56
CÂU HỎI ÔN TẬP
1. Dãy số thời gian là gì? Có bao nhiêu loại dãy số thời gian?
2. Trình bày các các chỉ tiêu phân tích dãy số thời gian? Ý nghĩa của từng chỉ
tiêu và mối liên hệ giữa chúng?
57
CHƢƠNG 6: ĐIỀU TRA CHỌN MẪU
Như đã trình bày ở chương 2, để thu thập tài liệu ban đầu, thống kê sử dụng
hai hình thức: báo cáo thống kê định kỳ và điều tra chuyên môn. Báo cáo thống kê
định kỳ được quy định thành chế độ báo cáo do cơ quan có thẩm quyền quyết định
và áp dụng cho nhiều năm. Điều tra chuyên môn áp dụng để thu thập thông tin đối
với những hiện tượng và quá trình kinh tế xã hội không thể hoặc không nhất thiết
phải thực hiện báo cáo thống kê định kỳ. Điều tra chuyên môn có thể tiến hành trên
toàn bộ các đơn vị tổng thể (điều tra toàn bộ) hoặc chỉ tiến hành trên một số đơn vị
tổng thể (điều tra không toàn bộ, trong đó điều tra chọn mẫu được áp dụng phổ
biến nhất).
6.1 Khái niệm và ý nghĩa của điều tra chọn mẫu
a) Khái niệm
Điều tra chọn mẫu là một loại điều tra không toàn bộ, ngƣời ta chỉ chọn ra
một số đơn vị từ tổng thể chung để điều tra, rồi sau đó bằng phƣơng pháp khoa học,
tính toán suy rộng cho toàn bộ tổng thể.
Ví dụ: Điều tra tỷ lệ phế phẩm của một hãng sản xuất mì tôm. Ngƣời ta
thƣờng chọn ra một số gói mì nhất định, xác định tỷ lệ phế phẩm của số gói đƣợc
chọn (giả sử tỷ lệ phế phẩm của mẫu đã chọn là 2%). Sử dụng kết quả này tính toán
và suy rộng thành tỷ lệ phế phẩm của toàn bộ khối lƣợng mì mà hàng đã sản xuất.
Tại sao chỉ điều tra một số đơn vị tổng thể mà suy ra kết quả của cả tổng thể
chung? Cơ sở khoa học của điều tra chọn mẫu là sử dụng quy luật số lớn và lý
thuyết xác suất thống kê để tính toán trong thực tế. Quy luật số lớn đã chỉ ra rằng,
nếu chỉ nghiên cứu một số đủ lớn các đơn vị, phần tử cá biệt thì những biểu hiện
ngẫu nhiên của các đơn vị này sẽ bù trừ và triệt tiêu lẫn nhau, tính quy luật sẽ đƣợc
thể hiện rõ
Nhƣ vậy, trong điều tra chọn mẫu ngƣời ta đặc biệt lƣu ý tới hai vấn đề cơ bản:
+ Quy tắc lựa chọn các đơn vị sao cho có thể đại diện cho toàn bộ tổng thể.
+ Dùng công thức suy rộng thành các đặc điểm của tổng thể.
* Khái niệm tổng thể chung và tổng thể mẫu
- Tổng thể chung là tổng thể bao gồm toàn bộ các đơn vị thuộc đối tƣợng
nghiên cứu. Số đơn vị tổng thể chung đƣợc ký hiệu bằng N.
58
- Tổng thể mẫu là tổng thể bao gồm một số đơn vị đƣợc chọn ra từ tổng thể
chung để điều tra thực tế. Số đơn vị của tổng thể mẫu đƣợc ký hiệu bằng n.
* Bình quân mẫu: Là lƣợng biến bình quân của các đơn vị mẫu.
Kí hiệu: Bình quân mẫu x , bình quân chung X
* Phương pháp chọn mẫu
Hiện nay, có hai phƣơng pháp chọn mẫu cơ bản đƣợc sử dụng phổ biến trong
các cuộc điều tra là chọn mẫu ngẫu nhiên và chọn mẫu phi ngẫu nhiên.
- Chọn ngẫu nhiên: Chọn mẫu ngẫu nhiên là chọn mẫu phải hoàn toàn khách
quan. Tất cả các đơn vị tổng thể đều có cơ hội chọn mẫu nhƣ nhau, không phụ thuộc
vào ý muốn chủ quan của ngƣời lựa chọn mẫu.
Ví dụ: Rút thăm, dùng bảng số ngẫu nhiên
- Chọn mẫu phi ngẫu nhiên: là phƣơng pháp chọn đơn vị điều tra phụ thuộc
vào ý muốn chủ quan của ngƣời chọn
Ví dụ: Chọn đơn vị trung bình, chọn chuyên gia
Chọn mẫu phi ngẫu nhiên đƣợc sử dụng trong trƣờng hợp việc chọn mẫu ngẫu
nhiên gặp khó khăn nhƣ những cuộc điều tra mới hoàn toàn chƣa có một thông tin
tiên nghiệm nào về đối tƣợng điều tra, hoặc có những hiện tƣợng kinh tế phức tạp, sự
phân tán không ổn định, biến động thất thƣờng hoặc nhiều tầng lớp,... Phƣơng pháp
này không hoàn toàn dựa trên cơ sở toán học nhƣ điều tra chọn mẫu ngẫu nhiên mà
đòi hỏi phải kết hợp chặt chẽ giữa phân tích lý luận và thực tiễn xã hội. Do đó, phần
nhiều mang tính chất cảm tính, chủ quan của ngƣời chọn thông qua kinh nghiệm và
sự hiểu biết về tổng thể nghiên cứu. Chính vì vậy, trong phạm vi và nội dung bài
giảng chỉ đề cập đến các vấn đề thuộc điều tra chọn mẫu ngẫu nhiên
b) Ý nghĩa:
+ Điều tra chọn mẫu có thể đƣợc sử dụng linh hoạt trong nhiều trƣờng hợp
với mục đích khác nhau.
+Tiến độ công việc nhanh hơn, có thể đáp ứng đƣợc tính khẩn cấp của thông
tin cần thu thập.
+ Tiết kiệm đƣợc chi phí, thời gian.
59
6.2 Trình tự tiến hành điều tra chọn mẫu
Khi tiến hành điều tra chọn mẫu, ngƣời ta thƣờng tiến hành theo các bƣớc nhƣ sau:
Sơ đồ 6.1. Các bước trong điều tra chọn mẫu
Bƣớc 1: Xác định mục đích điều tra
Do nhu cầu thực tế ta cần thông tin về một hiện tƣợng nào đó mà không có
sẵn và không thể thu thập bằng điều tra toàn bộ đƣợc thì ta chọn điều tra chọn mẫu.
Xác định mục đích điều tra là nhằm thu thập thông tin gì, phục vụ cho mục đích
nghiên cứu nào. Việc xác định rõ mục đích điều tra có ý nghĩa quan trong trong việc
lựa chọn số lƣợng và phƣơng pháp lấy mẫu.
Bƣớc 2: Xác định tổng thể có liên quan
Mẫu đƣợc chọn ra phải mang tính chất đại diện cho tổng thể, do đó cần xác
định tổng thể nào có chứa mẫu. Xác định tổng thể có liên quan nghĩa là xác định
phạm vi, tính chất của tổng thể phù hợp với mục đích nghiên cứu.
Bƣớc 3: Xác định kích thƣớc mẫu và phƣơng pháp chọn mẫu
Số lƣợng mẫu cần chọn là bao nhiêu? Phƣơng pháp chọn mẫu nhƣ thế nào là
bƣớc rất quan trọng có liên quan đến kết quả suy rộng cho tổng thể. Nội dung cụ thể
của bƣớc này đƣợc trình bày chi tiết ở mục sau.
Bƣớc 4: Phƣơng pháp thu thập và tính toán thông tin
6. Kết luận về
tổng thể
1. Xác định mục
đích nghiên cứu
2. Xác định tổng
thể nghiên cứu
3. Xác định phƣơng pháp
chọn mẫu, kích thƣớc mẫu
4. Lựa chọn phƣơng
pháp thu thập thông tin
5. Suy rộng các đặc
trƣng của mẫu thành các
đặc trung của tổng thể
60
Sau khi đã chọn đƣợc mẫu đại diện, công việc tiếp theo là thu thập các thông
tin của từng đơn vị mẫu. Phƣơng pháp thu thập thông tin của các đơn vị mẫu thƣờng
áp dụng nhƣ các phƣơng pháp thu thập thông tin đã đƣợc trình bày ở chƣơng II (số
trung bình mẫu, tỷ lệ mẫu).
Cách xử lý, trình bày và tính toán các đặc trƣng của mẫu giống nhƣ các
phƣơng pháp đã trình bày ở các chƣơng III và IV.
Bƣớc 5: Suy rộng các đặc trƣng của tổng thể
Từ các đặc trƣng của mẫu nhƣ số trung bình mẫu, tỷ lệ mẫu, sử dụng các
phƣơng pháp thống kê để suy rộng thành các đặc trƣng của tổng thể.
Bƣớc 6: Rút ra kết luận về tổng thể
Nội dung của bƣớc này là xem xét các kết luận rút ra từ kết quả suy rộng trên
cơ sở các đặc trƣng của mẫu có đáp ứng yêu cầu đặt ra trong mục tiêu nghiên cứu hay
không? Nhận xét này cũng cần đối chiếu với nội dung bƣớc 1 xem có phù hợp
không?
6.3 Điều tra chọn mẫu ngẫu nhiên
6.3.1 Các phƣơng pháp tổ chức điều tra chọn mẫu ngẫu nhiên
a) Phương pháp chọn mẫu ngẫu nhiên đơn giản
- Khái niệm: Chọn mẫu ngẫu nhiên đơn giản là phƣơng pháp tổ chức chọn
mẫu từ tổng thể chung một cách hết sức ngẫu nhiên không qua một sự sắp xếp nào
và có thể chọn một lần (không lặp), chọn nhiều lần (chọn có lặp).
Ví dụ: Bốc thăm, quay số hoặc chọn theo bảng số ngẫu nhiên hay chọn bất kỳ.
Chọn 1 lần là sau khi rút ra 1 thăm ngƣời ta không bỏ lại vào tổng thể để
chọn lần sau. Nhƣ vậy, mỗi đơn vị tổng thể chỉ có thể đƣợc chọn ra 1 lần và tổng
thể mẫu gồm các đơn vị hoàn toàn khác nhau, sẽ đại biểu cho tổng thể cao hơn.
Chọn nhiều lần là cách chọn sau khi rút ra 1 thăm ngƣời ta ghi lại đơn vị
đƣợc chọn rồi trả lại cái thăm vào tổng thể cũ. Nhƣ vậy, lần sau chọn vẫn có khả
năng chọn đúng vào cái thăm đó chọn lần trƣớc. Trong trƣờng hợp này tổng thể
mẫu có thể có một số đơn vị đƣợc chọn lại nhiều lần và mức độ đại biểu cho tổng
thể chung sẽ không cao.
- Đánh giá phương pháp
+ Ƣu điểm: Đơn giản, dễ làm.
61
+ Nhƣợc điểm: gặp khó khăn khi tổng thể chung có quy mô lớn hoặc kết cấu
phức tạp. Nếu gặp tổng thể không đồng đều thì tính chất đại biểu của mẫu không
cao do các đơn vị đƣợc lựa chọn có thể phân bố không đều, tập trung vào một chỗ.
- Điều kiện vận dụng: Chỉ thích hợp với những tổng thể tƣơng đối đồng đều
và không quá lớn.
b) Phương pháp chọn mẫu máy móc (chọn hế thống)
- Khái niệm: Là phƣơng pháp tổ chức chọn mẫu trong đó mỗi đơn vị đƣợc
chọn căn cứ vào từng khoảng cách nhất định từ danh sách đã đƣợc sắp xếp sẵn của
tổng thể chung. Các đơn vị đƣợc chọn lần lƣợt, đơn vị sau cách đơn vị trƣớc một
khoảng xác định d = N/n.
Ví dụ: Từ tổng thể chung có 1.000 công nhân, ngƣời ta chọn ra 100 công nhân
để tiến hành điều tra, khi đó d = 1.000/100 = 10. Và cứ 10 ngƣời theo danh sách thì sẽ
chọn ra 1 ngƣời để điều tra. Ngƣời đầu tiên đƣợc chọn ra trong số 10 ngƣời đầu tiên
của danh sách bằng cách ngẫu nhiên đơn thuần. Giả sử trong 10 ngƣời này rút thăm
đƣợc ngƣời thứ 5 thì những ngƣời đƣợc chọn tiếp theo là 15, 25...
- Đánh giá phương pháp
+ Ƣu điểm: Thủ tục đơn giản, rút ngắn đƣợc thời gian cũng nhƣ chi phí; các
đơn vị rải đều ra trong toàn bộ tổng thể nên tính chất đại biểu của mẫu cao.
+ Nhƣợc điểm: Có khả năng xảy ra sai số hệ thống (sai số luôn lệch về một
phía đối với số thực tế) do mẫu lấy ra phụ thuộc vào đơn vị đầu tiên đƣợc chọn từ
nhóm đầu tiên. Do đó, khi tổng thể chung không đồng đều, đây chƣa phải là cách
cho chúng ta mẫu tốt nhất. Mặt khác, khi tổng thể chung lớn thì việc sắp xếp các
đơn vị theo một thứ tự nào đó để chọn mẫu cũng gặp nhiều khó khăn.
- Điều kiện vận dụng: Trƣớc khi tiến hành chọn phải sắp xếp các đơn vị
trong tổng thể vào danh sách theo một thứ tự nào đó của tiêu thức nghiên cứu hoặc
tiêu thức bất kỳ.
c) Phương pháp chọn mẫu phân tổ:
- Khái niệm: Chọn mẫu phân tổ là tiến hành chọn các đơn vị mẫu khi tổng
thể chung đã đƣợc phân chia thành các tổ. Việc chọn đơn vị từ các tổ đƣợc tiến
hành theo phƣơng pháp chọn mẫu ngẫu nhiên đơn thuần hay hệ thống.
- Đánh giá phương pháp
62
+ Ƣu điểm: Chọn đƣợc tổng thể mẫu có kết cấu gần giống với kết cấu của
tổng thể chung (trong trƣờng hợp chọn theo tỷ lệ) nên tính đại biểu cao, sai số chọn
mẫu nhỏ.
+ Nhƣợc điểm: Phức tạp và khó thực hiện hơn, đòi hỏi phải có nhiều thông
tin về tổng thể chung.
- Điều kiện vận dụng: Thƣờng sử dụng khi tổng thể phức tạp, phân bố không
đồng đều.
d) Phương pháp chọn mẫu cả khối (mẫu chùm)
- Khái niệm: Chọn mẫu cả khối là phƣơng pháp tổ chức chọn mẫu trong đó
số đơn vị mẫu đƣợc rút ra để điều tra không phải là từng đơn vị riêng lẻ mà là từng
khối (chùm) đơn vị.
- Đánh giá phương pháp
+ Ƣu điểm: Tổ chức gọn nhẹ, giảm đƣợc chi phí.
+ Nhƣợc điểm: Do số đơn vị đƣợc chọn chỉ tập trung vào một số khối nên có
thể dẫn đến sai số lớn nếu giữa các khối có sự khác biệt nhau nhiều.
- Điều kiện vận dụng: Chỉ nên áp dụng trong trƣờng hợp giữa các đơn vị trong
một khối có sự khác nhau đáng kể song giữa các khối lại giống nhau về bản chất
đ) Phương pháp chọn mẫu nhiều cấp.
- Khái niệm: Trong trƣờng hợp các đơn vị của tổng thể phân tán quá rộng và thiếu
thông tin về chúng, ngƣời ta thƣờng chọn mẫu theo nhiều cấp: cấp 1, cấp 2, cấp3....
Ví dụ: Để điều tra mức sống dân cƣ trong cả nƣớc có thể chọn mẫu theo ba
cấp nhƣ sau:
+ Đơn vị mẫu cấp 1: Chọn các tỉnh, thành phố.
+ Đơn vị mẫu cấp 2: Trong các đơn vị mẫu cấp 1 đã chọn (các tỉnh, thành
phố) chọn ra một số quận, huyện.
+ Đơn vị mẫu cấp 3: Trong các đơn vị mẫu cấp 2 đã chọn (các quận, huyện)
chọn một số hộ để điều tra.
Điều kiện vận dụng: Sử dụng trong trƣờng hợp các đơn vị của tổng thể phân
tán quá rộng và thiếu thông tin về tổng thể.
63
Tóm lại: Trong các phƣơng pháp tổ chức chọn mẫu ngẫu nhiên đƣợc trình
bày ở trên thì phƣơng pháp tổ chức chọn mẫu phân tổ , đặc biệt là phƣơng pháp
chọn hệ thống, thƣờng cho sai số chọn mẫu nhỏ nhất, đồng thời là phƣơng pháp tổ
chức chọn mẫu phức tạp nhất.
6.3.2 Những vấn đề trong điều tra chọn mẫu ngẫu nhiên
a) Sai số bình quân chọn mẫu và phạm vi sai số chọn mẫu:
* Khái niệm về sai số chọn mẫu
Sai số trong điều tra chọn mẫu ngẫu nhiên là sự chênh lệch giữa trị số mà
điều tra mẫu thu thập đƣợc so với trị số thật của nó trong tổng thể chung.
Do cuộc điều tra chọn mẫu chỉ tiến hành ở một số đơn vị tổng thể mà kết quả
lại suy rộng ra cho cả tổng thể nên tất yếu nảy sinh sai số (gọi là sai số chọn mẫu).
Đây là vấn đề không thể tránh khỏi trong bất kỳ cuộc điều tra nào
Sai số chọn mẫu không phải là một trị số cố định. Với cùng một hiện tƣợng
nhƣng nếu tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu
của tổng thể mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau.
Ví dụ: 1 tổng thể gồm 10 đơn vị ABCDMNPQRV. Chọn mẫu 3 đơn vị để
điều tra.
C1: ABC ta tính đƣợc sai số chọn mẫu thứ nhất (s1);
C2: ABD ta tính đƣợc sai số chọn mẫu thứ nhất (s2);
C1: MNP ta tính đƣợc sai số chọn mẫu thứ nhất (s3);
..
Do đó, để tính sai số nhằm đánh giá mức độ chính xác của ƣớc lƣợng thì phải
tính sai số bình quân chọn mẫu.
* Sai số bình quân chọn mẫu: Bình quân tất cả các sai số chọn mẫu do việc
lựa chọn mẫu có kết cấu thay đổi
Thống kê toán đã xác định đƣợc công thức tính sai số bình quân chọn mẫu
nhƣ sau:
64
Phƣơng pháp chọn
Dùng suy rộng cho số
bình quân
Dùng suy rộng cho tỷ lệ
Chọn nhiều lần √
√
Chọn một lần √
√
Ký kiệu : là sai số bình quân chọn mẫu;
n là số đơn vị mẫu;
N là số đơn vị tổng thể
là phƣơng sai
p là tỷ lệ của tổng thể
Một số lưu ý:
- Sự khác biệt giữa hai phƣơng pháp chọn hoàn lại và chọn không hoàn lại
chính làm(1 – n/N). Do đó, ta luôn có sai số bình quân chọn mẫu theo cách chọn
hoàn lại lớn hơn sai số bình quân chọn mẫu theo cách chọn không hoàn lại.
- Khi n nhỏ hơn rất nhiều so với N thì khi đó n/N nhỏ và (1– n/N) gần với 1.
Do vậy, có thể chọn theo cách không hoàn lại nhƣng sử dụng công thức của chọn
hoàn lại để tính sai số bình quân chọn mẫu cho đơn giản.
- Theo lý thuyết và p phải tính từ tổng thể nhƣng thực tế chƣa xác định
đƣợc. Để giải quyết khó khăn nμy có thể sử dụng các phƣơng pháp sau đây:
+ Lấy phƣơng sai lớn nhất trong những lần điều tra trƣớc (nếu có) hoặc chọn
p nào gần với 0,5 nhất.
+ Lấy phƣơng sai của các cuộc điều tra khác có tính chất tƣơng tự.
+ Điều tra thí điểm để xác định phƣơng sai.
+ Ƣớc lƣợng phƣơng sai nhờ khoảng biến thiên. Thống kê toán đã chứng
minh trong trƣờng hợp hiện tƣợng phân phối chuẩn thì:
Nhƣ trên đã biết, sai số bình quân chọn mẫu này không phải là một trị số xác
định, nếu ta tiến hành nhiều lần điều tra khác nhau sẽ nhận đƣợc các sai số khác
65
nhau và đều dao động quanh . Vì vậy, không thể xác định chính xác sai số chọn
mẫu cho mỗi lần điều tra mà chỉ có thể dựa vào sai số bình quân chọn mẫu để ƣớc
lƣợng phạm vi sai số.
* Phạm vi sai số chọn mẫu ( ): Là phạm vi chênh lệch giữa các chỉ tiêu của
mẫu với các chỉ tiêu tƣơng ứng của tổng thể ứng với độ tin cậy nhất định.
- Thống kê toán đã xác định đƣợc công thức: = ± t.
Trong đó: t: hệ số tin cậy)
: Sai số bình quân chọn mẫu.
- Ứng với mỗi trị số của t có một độ tin cậy tƣơng ứng (t) (hàm xác suất).
Quan hệ giữa hệ số tin cậy và độ tin cậy đƣợc thể hiện qua hàm tích phân xác suất
do nhà toán học Liapunốp xây dựng nên.
Hệ số tin cậy (t) Độ tin cậy Φ(t)
1,0 0,6827
1,5 0,8664
2,0 0,9545
2,5 0,9876
3,0 0,9973
Nếu kết quả điều tra tính đƣợc phạm vi sai số chọn mẫu theo công thức Δ =
±1.μ với độ tin cậy của việc suy rộng tài liệu là 0,6827. Điều này có nghĩa là trong
10000 lần điều tra chỉ có 6827 lần chắc chắn có sai số chọn mẫu không vƣợt quá
±1.μ (hệ số tin cậy t = 1) còn 3173 lần chắc chắn có sai mẫu vƣợt quá ±1. μ.
Ví dụ: Trong một doanh nghiệp gồm có 1600 công nhân, ngƣời ta tiến hành
điều tra chọn mẫu về tình hình tiền lƣơng. Số công nhân đƣợc chọn ra là 400 ngƣời
theo phƣơng pháp chọn ngẫu nhiên đơn thuần có trả lại. Kết quả điều tra cho thấy:
- Tiền lƣơng trung bình của công nhân là 650.000 đồng.
- Độ lệch chuẩn là 80.000 đồng.
Hãy tính:
1, Sai số bình quân chọn mẫu và phạm vi sai số chọn mẫu về tiền lƣơng bình
quân với xác suất là 0,997.
2, Nếu cuộc điều tra đƣợc tiến hành theo phƣơng pháp chọn ngẫu nhiên đơn
thuần (không trả lại) thì sai số bình quân chọn mẫu và phạm vi sai số bình quân
9chọn mẫu sẽ là bao nhiêu?
66
Giải:
- Câu 1: √
; Δ= t.
- Câu 2: √
=3,46; Δ= t.
b) Suy rộng tài liệu điều tra:
Kết quả điều tra các đơn vị mẫu tính đƣợc ̅ và p. Nhƣng mục đích của
chúng ta là xác định các tham số của tổng thể chung. Do đó, phải ƣớc lƣợng, nghĩa
là từ các tham số của tổng thể mẫu suy ra các tham số của tổng thể chung. Các tham
số của tổng thể chung đƣợc thống kê toán ƣớc lƣợng nhƣ sau:
Dùng suy rộng cho số bình quân Dùng suy rộng cho tỷ lệ
Ƣớc lƣợng ̅ ̅ ̅ ̅ ̅
Ví dụ: Giả sử sau khi điều tra chọn 1.000 chiếc điện thoại di động, tính đƣợc
tỷ lệ những chiếc điện thoại di động gọi đi bị rè là 2,1%. Với độ tin cậy 95% tính ra
phạm vi sai số 0,02. Hãy xác định tỷ lệ những chiếc điện thoại không đạt tiêu chuẩn
của cả đợt sản xuất
Giải: Tỷ lệ những chiếc điện thoại không đạt tiêu chuẩn của cả đợt sản xuất
sẽ nằm trong phạm vi: 0,021 – 0,02 < p < 0,021 + 0,02
0,001 < p < 0,041
c) Số đơn vị mẫu cần chọn:
Nhƣ ta đã biết, sai số chọn mẫu tỷ lệ nghịch với đơn vị mẫu chọn để điều tra.
Vì vậy, muốn giảm sai số chọn mẫu ngƣời ta cần tăng số đơn vị mẫu với khả năng
tối đa. Mặt khác, việc tăng số đơn vị mẫu lên lại liên quan tới những chi phí tốn
kém mà kết quả điều tra phải chịu. Do đó, để đáp ứng yêu cầu đảm bảo kết quả điều
tra và giảm bớt tốn kém chi phí ngƣời ta chỉ cần xác định số đơn vị mẫu cần thiết
theo các điều kiện đã cho để điều tra. Từ công thức tính phạm vi sai số chọn mẫu,
suy ra công thức tính số đơn vị mẫu cần điều tra nhƣ sau:
Phƣơng pháp chọn Dùng cho số bình quân Dùng cho tỷ lệ
Chọn nhiều lần
Chọn một lần
67
Ví dụ : Năm 2014 trƣờng đại học tổ chức điều tra chọn mẫu để xác định tỷ lệ
sinh viên ra trƣờng không tìm đƣợc việc làm với yêu cầu phạm vi sai số nhỏ hơn
3%, độ tin cậy 95% . Biết rằng ở năm trƣớc tỷ lệ sinh viên ra trƣờng không tìm
đƣợc việc làm của trƣờng này là 20%. Hãy xác định kích thƣớc mẫu cần điều tra.
Ta có: = 0,03; p = 0, 2; 1- p = 0,8
0,95 1,96
sinh viên
6.3.3 Điều tra chọn mẫu nhỏ và điều tra chọn mẫu ngẫu nhiên thời điểm
- Điều tra chọn mẫu nhỏ
Trong những trƣờng hợp không thể điều tra một số đơn vị tƣơng đối lớn vì
nó liên quan đến việc hủy bỏ đơn vị điều tra nhƣ: kiểm tra chất lƣợng đồ hộp, thử
độ bền của bóng đèn, của sợithì ngƣời ta tiến hành điều tra chọn mẫu nhỏ với số
lƣợng điều tra không quá 30 (n<30). Trong thống kê toán ngƣời ta đã chứng minh
rằng ngay trong chọn mẫu nhỏ, với phƣơng pháp tính toán thích hợp vẫn có thể đảm
bảo độ chính xác để suy rộng tài liệu
- Điều tra chọn mẫu ngẫu nhiên thời điểm
Điều tra chọn mẫu ngẫu nhiên thời điểm là phƣơng pháp điều tra chọn mẫu
đặc biệt, theo đó tại những thời điểm nhất định, ngƣời ta quan sát sự tồn tại của các
phần tử thuộc quá trình nghiên cứu.
Ví dụ: Khi nghiên cứu thời gian làm việc của công nhân trong một phân
xƣởng, có thể chia thời gian ra làm hai thành phần: làm việc và ngừng việc. Trong
suốt một ca làm việc, cứ sau một khoảng thời gian nhất định lại đi kiểm tra các công
nhân một lần. Mỗi lần kiểm tra ghi chép thời gian làm việc của từng công nhân vào
lúc đó (làm việc hay ngừng việc). Giả sử trong phân xƣởng có 40 công nhân làm
việc, cứ cách 30 phút lại đi kiểm tra một lần. Nhƣ vậy trong suốt ca làm việc (8 giờ)
ta sẽ đi kiểm tra 16 lần và tổng số trƣờng hợp ghi chép là: 16 x 40 = 640 trƣờng
hợp. Trong 640 trƣờng hợp này, giả sử có 576 trƣờng hợp công nhân đang làm việc
và 64 trƣờng hợp ngừng việc.
Nhƣ vậy tỉ lệ thời gian công nhân làm việc là: P = 576/640 = 0,9
68
6.3 Điều tra chọn mẫu phi ngẫu nhiên
Muốn cho chất lƣợng điều tra trong điều tra chọn mẫu phi ngẫu nhiên tốt
phải giải quyết các vấn đề sau:
6.3.1 Phân tổ chính xác đối tƣọng điều tra
Phân tổ chính xác đối tƣợng điều tra thì mới tập hợp đƣợc các đơn vị điển
hình của nhiều bộ phận, từ đó các đơn vị điển hình đƣợc chọn ra này sẽ có đại diện
cho cả tổng thể phức tạp.
6.3.2 Vấn đề chọn đơn vị điều tra
Chọn những đơn vị điều tra có mức độ tiêu thức gần với số trung bình của
từng bộ phận, đồng thời cũng là mức độ phổ biến nhất trong bộ phận đó.
6.3.3 Xác định số đơn vị điều tra
Muốn xác định số đơn vị mẫu cho phù hợp thì cần phải căn cứ vào tính chất
phức tạp của tổng thể nghiên cứu, căn cứ vào kinh nghiệm của các lần điều tra
trƣớc, căn cứ vào mức độ đòi hỏi của việc nghiên cứu, lực lƣợng cán bộ và khả
năng vật chất để quyết định tăng thêm hay giảm bớt số đơn vị điều tra.
6.3.4 Sai số chọn mẫu phi ngẫu nhiên
Sai số chọn mẫu phi ngẫu nhiên phải thông qua nhận xét, so sánh để ƣớc
lƣợng. Nếu thấy sai số không lớn lắm (chênh lệch không nhiều so với thực tế) thì có
thể dùng kết quả điều tra mẫu để suy ra kết quả chung. Nếu thấy nghi ngờ kết quả
có thể chọn lại và điều tra lại.
CÂU HỎI ÔN TẬP
1. Điều tra chọn mẫu là gì và đƣợc vận dụng trong trƣờng hợp nào?
2. Nêu trình tự tiến hành một cuộc điều tra chọn mẫu.
3. Trình bày các phƣơng pháp tổ chức chọn mẫu ngẫu nhiên thƣờng dùng.
Nêu rõ ƣu, nhƣợc điểm và điều kiện áp dụng của từng phƣơng pháp.
4. Sai số bình quân chọn mẫu là gì? Phạm vi sai số chọn mẫu. Nêu cách tính.
5. Suy rộng tài liệu điều tra là gì? Nêu cách tính
6. Nêu công thức xác định số đơn vị mẫu đƣợc chọn để điều tra.
69
MỤC LỤC
CHƢƠNG 1: ĐỐI TƢỢNG NGHIÊN CỨU CỦA THỐNG KÊ HỌC ...................... 1
1.1 Đối tƣợng nghiên cứu của thống kê học .......................................................... 1
1.1.1 Sơ lƣợc về sự ra đời và phát triển của thống kế học ................................. 1
1.1.2 Đối tƣợng nghiên cứu của thống kê học .................................................... 1
1.2 Một số khái niệm thƣờng dùng trong thống kê học ......................................... 3
1.2.1 Tổng thể thống kê và đơn vị tổng thể ....................................................... 3
1.2.2 Tiêu thức thống kê .................................................................................... 4
1.2.3 Chỉ tiêu thống kê ....................................................................................... 5
1.2.4 Thang đo thống kê ..................................................................................... 6
CHƢƠNG 2: QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ ......................................... 8
2.1 Xác định hệ thống chỉ tiêu thống kê ................................................................ 8
2.1.1 Khái niệm hệ thống chỉ tiêu thống kê ....................................................... 8
2.1.2 Các yêu cầu cơ bản để xác định hệ thống chỉ tiêu thống kê ..................... 8
2.2 Điều tra thống kê .............................................................................................. 8
2.2.1 Khái niệm, ý nghĩa và nhiệm vụ điều tra thống kê ................................... 8
2.2.2 Các loại điều tra thống kê ....................................................................... 10
2.2.3 Các phƣơng pháp điều tra thống kê ........................................................ 11
2.2.4 Các hình thức tổ chức điều tra thống kê ................................................. 11
2.2.5 Sai số trong điều tra thống kê .................................................................. 12
2.3 Tổng hợp thống kê ......................................................................................... 13
2.3.1 Khái niệm và nhiệm vụ của tổng hợp thống kê ...................................... 13
2.3.2 Những vấn đề chủ yếu của tổng hợp thống kê ........................................ 13
2.3.3 Bảng thống kê và đồ thị thống kê ........................................................... 14
2.4 Phân tích và dự đoán thống kê ...................................................................... 15
2.4.1 Khái niệm, ý nghĩa, nhiệm vụ của phân tích và dự đoán thống kê ......... 15
2.4.2 Các yêu cầu có tính chất nguyên tắc cần đƣợc tuân thủ trong phân tích
và dự đoán thống kê. ......................................................................................... 15
2.4.3 Những vấn đề chủ yếu của phân tích và dự đoán thống kê .................... 15
CHƢƠNG 3: PHÂN TỔ THỐNG KÊ ...................................................................... 17
3.1 Khái niệm, ý nghĩa và nhiệm vụ phân tổ thống kê ........................................ 17
3.2 Tiêu thức phân tổ............................................................................................ 17
3.2.1 Khái niệm ................................................................................................. 18
3.2.2 Các căn cứ để lựa chọn tiêu thức phân tổ ................................................ 18
70
3.3 Phân tổ thống kê ............................................................................................. 18
3.3.1 Phân tổ theo tiêu thức thuộc tính ............................................................ 18
3.3.2 Phân tổ theo tiêu thức số lƣợng ................................................................ 19
3.3.3 Phân tổ liên hệ ......................................................................................... 21
3.4 Chỉ tiêu giải thích. .......................................................................................... 22
3.4.1 Khái niệm ................................................................................................ 22
3.4.2 Tác dụng của chỉ tiêu giải thích ............................................................... 22
3.5 Dãy số phân phối ............................................................................................. 23
3.5.1 Khái niệm ................................................................................................ 23
3.5.2 Tác dụng .................................................................................................. 23
3.5.3 Các loại dãy số phân phối ....................................................................... 23
CHƢƠNG 4: CÁC MỨC ĐỘ CỦA HIỆN TƢỢNG KINH TẾ - XÃ HỘI ............. 25
4.1 Số tuyệt đối trong thống kê ............................................................................ 25
4.2 Số tƣơng đối trong thống kê ............................................................................ 26
4.3 Các chỉ tiêu đo lƣờng khuynh hƣớng tập trung .............................................. 29
4.3.1. Số bình quân trong thống kê ................................................................... 29
4.3.2 Mode (Mo) ............................................................................................... 35
4.3.3 Số trung vị (Me) ........................................................................................ 37
4.4 Các chỉ tiêu đánh giá độ biến thiên của tiêu thức ........................................... 39
4.4.1. Khoảng biến thiên của tiêu thức (toàn cự): (R) ...................................... 40
4.4.2. Độ lệch tuyệt đối bình quân ( .............................................................. 40
4.4.3. Phƣơng sai ( ...................................................................................... 41
4.4.4. Độ lệch tiêu chuẩn ( ............................................................................ 42
4.4.5. Hệ số biến thiên (V) ................................................................................ 42
4.4.6. Một số vấn đề tính toán và vận dụng phƣơng sai ................................... 43
CHƢƠNG 5: DÃY SỐ BIẾN ĐỘNG THEO THỜI GIAN ..................................... 45
5.1 Khái niệm, phân loại và ý nghĩa của dãy số biến động theo thời gian .......... 45
5.1.1. Khái niệm dãy số biến động theo thời gian............................................. 45
5.1.2. Các loại dãy số biến động theo thời gian ................................................ 45
5.1.3 Ý nghĩa của dãy số biến động theo thời gian .......................................... 46
5.2. Các chỉ tiêu phân tích dãy số biến động theo thời gian ................................. 46
5.2.1. Mức độ bình quân theo thời gian ............................................................ 46
5.2.2. Lƣợng tăng (giảm) tuyệt đối ................................................................... 48
5.2.3. Tốc độ phát triển ..................................................................................... 49
71
5.2.4. Tốc độ tăng (giảm) .................................................................................. 50
5.2.5. Giá trị tuyệt đối của 1% tăng (giảm) ....................................................... 52
5.3. Các phƣơng pháp biểu hiện xu hƣớng phát triển cơ bản của hiện tƣợng. ..... 52
5.3.1. Phƣơng pháp mở rộng khoảng cách thời gian ........................................ 52
5.3.2. Phƣơng pháp số bình quân trƣợt ............................................................. 53
5.3.3. Phƣơng pháp hồi quy .............................................................................. 54
5.3.4. Phƣơng pháp biểu hiện quy luật biến động thời vụ ................................ 55
CHƢƠNG 6: ĐIỀU TRA CHỌN MẪU .................................................................. 57
6.1 Khái niệm và ý nghĩa của điều tra chọn mẫu ............................................. 57
6.2 Trình tự tiến hành điều tra chọn mẫu ......................................................... 59
6.3 Điều tra chọn mẫu ngẫu nhiên ................................................................... 60
6.3.1 Các phƣơng pháp tổ chức điều tra chọn mẫu ngẫu nhiên ...................... 60
6.3.2 Những vấn đề trong điều tra chọn mẫu ngẫu nhiên ................................. 63
6.3.3 Điều tra chọn mẫu nhỏ và điều tra chọn mẫu ngẫu nhiên thời điểm ...... 67
6.3 Điều tra chọn mẫu phi ngẫu nhiên ............................................................. 68
6.3.1 Phân tổ chính xác đối tƣọng điều tra ........................................................ 68
6.3.2 Vấn đề chọn đơn vị điều tra ..................................................................... 68
6.3.3 Xác định số đơn vị điều tra ..................................................................... 68
6.3.4 Sai số chọn mẫu phi ngẫu nhiên .............................................................. 68
Các file đính kèm theo tài liệu này:
- giao_trinh_nguyen_ly_thong_ke_phan_2.pdf