Giáo trình Nguyên lý thống kê (Phần 2)

Điều tra chọn mẫu nhỏ và điều tra chọn mẫu ngẫu nhiên thời điểm - Điều tra chọn mẫu nhỏ Trong những trường hợp không thể điều tra một số đơn vị tương đối lớn vì nó liên quan đến việc hủy bỏ đơn vị điều tra như: kiểm tra chất lượng đồ hộp, thử độ bền của bóng đèn, của sợi thì người ta tiến hành điều tra chọn mẫu nhỏ với số lượng điều tra không quá 30 (n<30). Trong thống kê toán người ta đã chứng minh rằng ngay trong chọn mẫu nhỏ, với phương pháp tính toán thích hợp vẫn có thể đảm bảo độ chính xác để suy rộng tài liệu - Điều tra chọn mẫu ngẫu nhiên thời điểm Điều tra chọn mẫu ngẫu nhiên thời điểm là phương pháp điều tra chọn mẫu đặc biệt, theo đó tại những thời điểm nhất định, người ta quan sát sự tồn tại của các phần tử thuộc quá trình nghiên cứu. Ví dụ: Khi nghiên cứu thời gian làm việc của công nhân trong một phân xưởng, có thể chia thời gian ra làm hai thành phần: làm việc và ngừng việc. Trong suốt một ca làm việc, cứ sau một khoảng thời gian nhất định lại đi kiểm tra các công nhân một lần. Mỗi lần kiểm tra ghi chép thời gian làm việc của từng công nhân vào lúc đó (làm việc hay ngừng việc). Giả sử trong phân xưởng có 40 công nhân làm việc, cứ cách 30 phút lại đi kiểm tra một lần. Như vậy trong suốt ca làm việc (8 giờ) ta sẽ đi kiểm tra 16 lần và tổng số trường hợp ghi chép là: 16 x 40 = 640 trường hợp. Trong 640 trường hợp này, giả sử có 576 trường hợp công nhân đang làm việc và 64 trường hợp ngừng việc.

pdf27 trang | Chia sẻ: hachi492 | Ngày: 15/01/2022 | Lượt xem: 467 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Giáo trình Nguyên lý thống kê (Phần 2), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
45 CHƢƠNG 5: DÃY SỐ BIẾN ĐỘNG THEO THỜI GIAN Phân tích dãy số biến động theo thời gian giúp quan sát hiện tượng biến đổi theo thời gian rồi tìm ra quy luật và dùng quy luật đó để phân tích và dự đoán thống kê. Chương này trình bày một số vấn đề chung về dãy số thời gian, giới thiệu các chỉ tiêu phân tích dãy số thời gian và các phương pháp biểu diễn xu hướng biến động của hiện tượng qua thời gian 5.1 Khái niệm, phân loại và ý nghĩa của dãy số biến động theo thời gian 5.1.1. Khái niệm dãy số biến động theo thời gian Dãy số biến động theo thời gian là dãy các trị số của một chỉ tiêu thống kê đƣợc sắp xếp theo thứ tự thời gian. Một dãy số thời gian gồm có 2 phần: - Thời gian: là những thời điểm hay thời kỳ nhƣ ngày, tuần, tháng, quý, năm....Độ dài giữa hai thời gian gần nhau đƣợc gọi là khoảng cách thời gian. - Mức độ của dãy số: là các trị số của chỉ tiêu về hiện tƣợng nghiên cứu, mức độ này có thể là số tuyệt đối, số tƣơng đối, số bình quân. 5.1.2. Các loại dãy số biến động theo thời gian Căn cứ vào đặc điểm tồn tại về quy mô của hiện tƣợng qua thời gian, có thể phân dãy số thời gian thành hai loại: - Dãy số thời kỳ: là dãy số mà các trị số của chỉ tiêu phản ánh mức độ của hiện tƣợng trong từng khoảng thời gian nhất định. Ví dụ 1: Doanh thu của công ty X giai đoạn 2013 - 2017 Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Đặc điểm của dãy số thời kỳ là có thể cộng các mức độ lại với nhau để có một mức độ mới với khoảng thời gian dài hơn. - Dãy số thời điểm: là dãy số mà các trị số của chỉ tiêu phản ánh mức độ của hiện tƣợng tại những thời điểm nhất định. Ví dụ 2: Có tài liệu về giá trị hàng tồn kho của công ty X vào quý I/năm N nhƣ sau: Ngày đầu tháng 1/1 1/2 1/3 1/4 Giá trị hàng tồn kho (triệu đồng) 800 850 900 750 46 Đặc điểm của dãy số thời điểm là không thể cộng các mức độ lại với nhau vì mức độ của hiện tƣợng ở thời điểm sau thƣờng bao gồm toàn bộ hoặc một bộ phận mức độ của hiện tƣợng ở thời điểm trƣớc đó, cho nên việc cộng các trị số của chỉ tiêu không phản ánh quy mô của hiện tƣợng. 5.1.3 Ý nghĩa của dãy số biến động theo thời gian - Cho thấy sự biến động của hiện tƣợng qua thời gian. - Cho phép tính toán đƣợc các chỉ tiêu phân tích dãy số. - Giúp nghiên cứu quy luật phát triển của hiện tƣợng, dựa vào đó dự đoán đƣợc mức độ của hiện tƣợng ở tƣơng lai. 5.2. Các chỉ tiêu phân tích dãy số biến động theo thời gian 5.2.1. Mức độ bình quân theo thời gian Mức độ bình quân theo thời gian là chỉ tiêu phản ánh mức độ đại biểu của các mức độ tuyệt đối trong một dãy số biến động theo thời gian. * Đối với dãy số thời kỳ. Công thức tính: ̅ ∑ Trong đó: - ̅ : mức độ bình quân theo thời gian của dãy số thời kỳ - yi : các mức độ của dãy số thời kỳ (i = 1, 2,...., n) - n là số thời kỳ Ví dụ: Từ số liệu ví dụ 1 ta tính doanh thu bình quân hàng năm của công ty X giai đoạn 2013 – 2017 nhƣ sau: ̅ (ngàn tấn/năm) * Đối với dãy số thời điểm: Có 2 trƣờng hợp sau: - Dãy thời điểm có khoảng cách thời gian đều nhau Công thức tính: ̅ Ví dụ: Từ ví dụ 2 ta tính giá trị hàng tồn kho bình quân quý I/năm N của công ty X: ̅ triệu đồng - Dãy số thời điểm có khoảng cách thời gian không đều nhau 47 Công thức tính: ̅ ∑ ∑ Trong đó: - ti : là độ dài thời gian có mức độ yi ( i = 1, 2,..., n) - yi : các mức độ của dãy số thời điểm (i = 1, 2,...., n) Ví dụ 3: Có tài liệu về số công nhân trong danh sách của một doanh nghiệp Y trong quý I/2018 nhƣ sau: - Ngày 1/1 doanh nghiệp có 200 công nhân - Ngày 5/2 doanh nghiệp nhận thêm 5 công nhân - Ngày 5/3 doanh nghiệp nhận thêm 3 công nhân - Ngày 20/3 doanh nghiệp cho thôi việc 2 công nhân và từ đó đến cuối tháng 3 không có gì thay đổi. Tính số công nhân bình quân quý I/2018 của doanh nghiệp trên. Từ tài liệu trên ta lập bảng sau: Thời gian Số ngày (ti) Số công nhân (yi) Từ 1/1 đến 4/2 35 200 Từ ngày 5/2 đến 4/3 28 205 Từ 5/3 đến 19/3 15 208 Từ 20/3 đến 31/3 12 206 Số công nhân bình quân trong quý I/2018 ̅ ∑ ∑ (ngƣời) - Dãy số thời điểm chỉ có 2 thời điểm đầu và cuối, thì ̅ Ví dụ 4: Số công nhân đầu tháng 01/2018 của doanh nghiệp A là 100 ngƣời, số công nhân cuối tháng 01/2018 của doanh nghiệp A là 140 ngƣời. Vậy số công nhân bình quân trong tháng 01/2018 là ̅ (ngƣời) 48 5.2.2. Lƣợng tăng (giảm) tuyệt đối Lƣợng tăng (giảm) tuyết đối là chỉ tiêu phản ánh sự chênh lệch về số tuyệt đối giữa 2 mức độ của dãy số ở hai thời gian khác nhau. Nếu mức độ của hiện tƣợng tăng lên thì trị số của chỉ tiêu mang dấu dƣơng (+), ngƣợc lại thì mang dấu âm (-). Tùy vào mức độ làm gốc so sánh mà ta có các lƣợng tăng (giảm) tuyệt đối nhƣ sau: a) Lượng tăng (giảm) tuyệt đối liên hoàn (Ký hiệu là ). Lƣợng tăng (giảm) tuyết đối liên hoàn là chênh lệch giữa mức độ kỳ nghiên cứu và mức độ của kỳ đứng liền trƣớc đó. Công thức tính: (i = 2, 3,..., n) ; (j = 1, 2,.., n-1) Trong đó: - : lƣợng tăng (giảm) tuyệt đối liên hoàn - yi : mức độ kỳ nghiên cứu - yi-1: mức độ của kỳ đứng liền trƣớc kỳ nghiên cứu yi. Ví dụ: Từ số liệu ví dụ 1, ta tính lƣợng tăng (giảm) tuyệt đối liên hoàn nhƣ sau: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Lƣợng tăng (giảm) tuyệt đối liên hoàn +20 +26 +24 +30 b) Lượng tăng (giảm) tuyệt đối định gốc (Ký hiệu là Δj ) Lƣợng tăng (giảm) tuyệt đối định gốc là chênh lệch giữa mức độ kỳ nghiên cứu và mức độ của một kỳ đƣợc chọn làm gốc cố định, thƣờng là mức độ đầu tiên của dãy số. Công thức tính: Δj = yi - y1 (i = 2, 3,.., n); (j = 1, 2,.., n-1) Với y1 là mức độ kỳ gốc đƣợc cố định cho mọi lần so sánh. Ví dụ: Từ số liệu ví dụ 1, ta tính lƣợng tăng giảm tuyệt đối định gốc nhƣ sau: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Lƣợng tăng (giảm) tuyệt đối định gốc - +20 +46 +70 +100 * Mối quan hệ giữa lượng tăng (giảm) tuyệt đối liên hoàn và định gốc: 49 Tổng lƣợng tăng (giảm) tuyệt đối liên hoàn bằng lƣợng tăng (giảm) tuyệt đối định gốc tức là: ∑ (j = 1, 2,.., n-1). Ví dụ: Theo số liệu trên thì ∑ tức là (20 + 26 + 24 + 30) = 100 c) Lượng tăng (giảm) tuyệt đối bình quân liên hoàn (Ký hiệu ̅ ) Công thức tính: ̅ ∑ Chỉ tiêu này chỉ nên tính khi các mức độ của dãy số có cùng xu hƣớng cùng tăng hoặc cùng giảm. Ví dụ: Theo số liệu ví dụ 1 thì ̅ ∑ 5.2.3. Tốc độ phát triển Tốc độ phát triển là số tƣơng đối động thái phản ánh quan hệ so sánh giữa hai mức độ trong dãy số biến động theo thời gian. Chỉ tiêu này phản ánh tốc độ và xu hƣớng biến động của hiện tƣợng theo thời gian. a) Tốc độ phát triển liên hoàn (Ký hiệu tj) Tốc độ phát triển liên hoàn là tỷ số giữa mức độ kỳ nghiên cứu và mức độ của kỳ đứng liền trƣớc đó. Công thức tính: ̅̅ ̅̅ ̅̅ ̅̅ ̅̅ Trong đó: - tj : tốc độ phát triển liên hoàn - yi : mức độ của hiện tƣợng ở kỳ nghiên cứu (i = 2, 3,..., n) - yi-1 : mức độ của hiện tƣợng ở kỳ đứng liền trƣớc kỳ nghiên cứu. Ví dụ: Từ số liệu ví dụ 1, ta tính tốc độ phát triển liên hoàn nhƣ sau: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Tốc độ phát triển liên hoàn (lần) 1,04 1,05 1,044 1,053 b) Tốc độ phát triển định gốc (Ký hiệu Tj ) Tốc độ phát triển định gốc là tỉ số giữa mức độ kỳ nghiên cứu và mức độ của một kỳ đƣợc chọn làm gốc cố định, thƣờng là mức độ đầu tiên của dãy số. 50 Công thức tính: ̅̅ ̅̅ ̅̅ ̅̅ ̅̅ ̅; (i = 2, 3,..., n) Ví dụ: Từ số liệu ví dụ 1, ta tính tốc độ phát triển định gốc nhƣ sau: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Tốc độ phát triển định gốc (lần) - 1,04 1,092 1,14 1,2 * Mối quan hệ giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gốc: - Tích số của các tốc độ phát triển liên hoàn bằng tốc độ phát triển định gốc trong một khoản thời gian tƣơng ứng. Tức là: ∏ (∏ là dấu tích số) Ví dụ: Theo số liệu ví dụ trên: 1,04 x 1,05 x 1,044 x 1,053 = 1,2 - Thƣơng của hai tốc độ phát triển định gốc liền nhau bằng tốc độ phát triển liên hoàn giữa hai thời gian đó. Theo ví dụ trên thì tức là ; tức là c) Tốc độ phát triển bình quân ( Ký hiệu ̅ ) Tốc độ phát triển bình quân là mức độ đại biểu của các tốc độ phát triển liên hoàn của hiện tƣợng trong suốt thời gian nghiên cứu và đƣợc tính theo công thức số bình quân nhân. ̅ √ √∏ Ví dụ: Theo ví dụ 1 thì tốc độ phát triển bình quân ̅ √ lần Chỉ tiêu này chỉ nên tính với những hiện tƣợng phát triển theo một xu hƣớng nhất định. 5.2.4. Tốc độ tăng (giảm) a) Tốc độ tăng (giảm) liên hoàn (Ký hiệu là aj) 51 Tốc độ tăng (giảm) liên hoàn là tỉ số so sánh giữa lƣợng tăng (giảm) liên hoàn với mức độ kỳ gốc liên hoàn. Công thức tính: ̅̅ ̅̅ ̅̅ ̅̅ ̅̅ ̅ ̅̅ ̅̅ ̅̅ ̅ hay (nếu tj là tốc độ phát triển liên hoàn, tính bằng số lần); (nếu tj tính bằng phần trăm). Ví dụ: Theo số liệu ví dụ 1 thì tốc độ tăng liên hoàn là: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Tốc độ tăng (giảm) liên hoàn (lần) - 0,04 Hay 4% 0,05 Hay 5% 0,044 Hay 4,4% 0,053 Hay 5,3% b) Tốc độ tăng (giảm) định gốc (Ký hiệu là Aj ) Tốc độ tăng (giảm) định gốc là tỉ số giữa lƣợng tăng (giảm) định gốc với mức độ kỳ gốc cố định (y1). ̅̅ ̅̅ ̅̅ ̅̅ ̅̅ ̅ Hay Aj = Tj - 1 (nếu Tj là tốc độ phát triển định gốc, tính bằng số lần) Aj = Tj - 100% (nếu Tj tính bằng phần trăm). Ví dụ: theo số liệu ví dụ 1 thì tốc độ tăng (giảm) định gốc Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Tốc độ tăng (giảm) định gốc (lần) - 0,04 Hay 4% 0,092 Hay 9,2% 0,14 Hay 14% 0,2 Hay 20% c) Tốc độ tăng (giảm) bình quân (Ký hiệu ̅ ) Tốc độ tăng (giảm) bình quân là chỉ tiêu phản ánh tốc độ tăng (giảm) đại biểu của hiện tƣợng trong suốt thời gian nghiên cứu. ̅ ̅ (nếu ̅ tính bằng số lần). Trong đó ̅ là tốc độ phát triển bình quân Hoặc ̅ ̅ (nếu ̅ tính bằng phần trăm). 52 Ví dụ: Theo ví dụ 1 thì tốc độ tăng bình quân: a = t - 1 = 1,047 – 1 = 0,047 lần hay 4,7%. 5.2.5. Giá trị tuyệt đối của 1% tăng (giảm) a) Giá trị tuyệt đối của 1% tăng (giảm) liên hoàn (ký hiệu là gj ) Chỉ tiêu này phản ánh cứ 1% tăng (giảm) của tốc độ tăng (giảm) liên hoàn thì tƣơng ứng với một trị số tuyệt đối là bao nhiêu. ̅̅ ̅̅ ̅̅ ̅̅ ̅̅ ̅ ( ) ̅̅ ̅̅ ̅̅ Ví dụ: Theo số liệu ví dụ trên thì giá trị tuyệt đối của 1% tăng liên hoàn là: ; ; b)Giá trị tuyệt đối của 1% tăng (giảm) định gốc (ký hiệu là Gj ) Giá trị tuyệt đối của 1% tăng (giảm) định gốc luôn luôn là một số không đổi và bằng ( ) Ví dụ: Theo ví dụ 1 thì giá trị tuyệt đối của 1% tăng định gốc luôn là: 5.3. Các phƣơng pháp biểu hiện xu hƣớng phát triển cơ bản của hiện tƣợng. Biến động của hiện tƣợng theo thời gian chịu sự tác động của nhiều nhân tố, ngoài các nhân tố chủ yếu quyết định xu hƣớng biến động của hiện tƣợng còn có những nhân tố ngẫu nhiên gây ra những sai lệch khỏi xu hƣớng đó. Vì vậy, cần sử dụng những phƣơng pháp thích hợp loại bỏ phần nào tác động của những nhân tố ngẫu nhiên để nêu lên xu hƣớng và tính quy luật về sự biến động của hiện tƣợng. 5.3.1. Phƣơng pháp mở rộng khoảng cách thời gian Phƣơng pháp này đƣợc sử dụng khi dãy số thời kỳ có khoảng cách thời gian tƣơng đối ngắn và có nhiều mức độ mà qua đó chƣa phản ánh đƣợc xu hƣớng biến 53 động của hiện tƣợng. Vì thế ta cần tính toán lại các mức độ trong dãy số bằng cách mở rộng khoảng cách thời gian nhƣ: biến đổi các mức độ hàng ngày thành mức độ hàng tuần, mức độ hàng tuần thành mức độ hàng tháng, mức độ hàng tháng thành quý.... Ví dụ: Có tài liệu về sản lƣợng hàng tháng ở một doanh nghiệp nhƣ sau: Tháng Sản lƣợng (1.000 tấn) Tháng Sản lƣợng (1.000 tấn) 1 37,4 7 40,8 2 36,8 8 44,8 3 40,6 9 49,4 4 38,0 10 48,9 5 42,2 11 49,2 6 48,5 12 47,2 Dãy số trên cho thấy sản lƣợng khi tăng, khi giảm một cách thất thƣờng, khó đánh giá rõ xu hƣớng biến động. Để đánh giá đƣợc tình hình sản xuất của doanh nghiệp trong năm, ta có thể mở rộng khoảng cách thời gian từ tháng sang quý nhƣ sau: Quý Sản lƣợng (1.000.tấn) I 114,8 II 128,7 III 135,0 IV 145,3 Sau khi khoảng cách thời gian đƣợc mở rộng ta thấy rõ xu hƣớng biến động cơ bản là tình hình sản xuất của doanh nghiệp tăng dần từ quý I đến quý IV 5.3.2. Phƣơng pháp số bình quân trƣợt Số bình quân trƣợt là số bình quân cộng của một nhóm nhất định các mức độ của dãy số, đƣợc tính bằng cách loại dần các mức độ đầu đồng thời thêm vào các mức độ tiếp theo, sao cho tổng số lƣợng các mức độ tham gia tính số bình quân trƣợt không thay đổi. Giả sử các mức độ của một dãy số thời gian: y1, y2, y3, ........, yn-1, yn Nếu tính bình quân trƣợt cho nhóm ba mức độ, ta sẽ có: 54 ̅̅ ̅ ̅̅ ̅ Thông thƣờng ta tính số bình quân trƣợt theo từng nhóm lẻ các mức độ (3, 5, 7,... các mức độ) để thuận tiện cho việc sắp xếp số bình quân trƣợt trùng với trung tâm của khoảng cách san bằng. Nếu sự biến động của hiện tƣợng tƣơng đối đều đặn và số lƣợng các mức độ dãy số không nhiều thì có thể tính số bình quân trƣợt từ 3 mức độ. Nếu sự biến động của hiện tƣợng lớn và dãy số có nhiều mức độ thì có thể tính số bình quân trƣợt từ 5 hoặc 7 mức độ. Số bình quân trƣợt càng đƣợc tính từ nhiều mức độ thì càng có tác dụng san bằng ảnh hƣởng của các nhân tố ngẫu nhiên. Từ số liệu ở ví dụ trên, ta tính số bình quân trƣợt cho nhóm 3 mức độ nhƣ sau: Tháng Sản lƣợng (1.000.tấn) Số bình quân trƣợt Tháng Sản lƣợng (1.000.tấn) Số bình quân trƣợt 1 37,4 - 7 40,8 44,7 2 36,8 38,3 8 44,8 45,0 3 40,6 38,5 9 49,4 47,7 4 38,0 40,3 10 48,9 48,2 5 42,2 42,9 11 49,2 48,4 6 48,5 43,8 12 47,2 - 5.3.3. Phƣơng pháp hồi quy Trong một số trƣờng hợp trên cơ sở dãy số thời gian, ngƣời ta tìm một hàm số (gọi là phƣơng trình hồi quy) phản ánh sự biến động của hiện tƣợng qua thời gian có dạng tổng quát nhƣ sau: ̅ Trong đó: ̅ là mức độ lý thuyết (tiêu thức kết quả) - t là thứ tự thời gian (tiêu thức nguyên nhân) Để lựa chọn đúng đắn dạng của phƣơng trình hồi quy đòi hỏi phải dựa vào sự phân tích biến động của hiện tƣợng qua thời gian. Phƣơng trình hồi quy có thể là tuyến tính hoặc phi tuyến tính với các dạng khác nhau. 55 5.3.4. Phƣơng pháp biểu hiện quy luật biến động thời vụ Một số hiện tƣợng kinh tế xã hội thƣờng biến động có tính chất thời vụ. Biểu hiện của sự biến động này là hầu nhƣ hàng năm cứ đến một thời kỳ nhất định thì hiện tƣợng sẽ tăng lên hoặc giảm đi một cách rõ rệt. Nguyên nhân của sự biến động này chủ yếu là do ảnh hƣởng của các điều kiện tự nhiên hoặc do phong tục, tập quán sinh hoạt của con ngƣời. Để nghiên cứu biến động thời vụ thống kê thƣờng tính chỉ số thời vụ: ̅ ̅ Trong đó:- : chỉ số thời vụ của thời gian i - :bình quân các mức độ của các thời gian cùng tên i qua các năm - ̅: bình quân chung của tất cả các mức độ trong dãy số Tháng Số lƣợng hàng tiêu thụ (tấn) Itv (%) 2005 2006 2007 Cộng các tháng SBQ các tháng (1) (2) (3) (4) (5) (6)=(5)/3 7=(6)/ y 1 1.495 1.500 1.490 4.485 1.495 62,9 2 1.461 1.490 1.480 4.431 1.477 62,2 3 1.533 1.599 1.604 4.736 1.578 66,4 4 1.922 2.210 2.005 6.137 2.046 86,1 5 2.746 2.804 2.745 8.295 2.765 116,4 6 3.289 3.282 3.250 9.821 3.274 137,8 7 3.523 3.620 3.700 10.843 3.614 152,1 8 3.330 3.300 3.215 9.845 3.282 138,2 9 2.597 2.604 2.590 7.791 2.597 109,3 10 2.249 2.205 2.304 6.758 2.253 84,8 11 2.144 2.200 2.190 6.534 2.178 91,7 12 1.983 1.889 1.950 5.822 1.941 81,7 Tổng 28.272 28.703 28.523 85.498 56 CÂU HỎI ÔN TẬP 1. Dãy số thời gian là gì? Có bao nhiêu loại dãy số thời gian? 2. Trình bày các các chỉ tiêu phân tích dãy số thời gian? Ý nghĩa của từng chỉ tiêu và mối liên hệ giữa chúng? 57 CHƢƠNG 6: ĐIỀU TRA CHỌN MẪU Như đã trình bày ở chương 2, để thu thập tài liệu ban đầu, thống kê sử dụng hai hình thức: báo cáo thống kê định kỳ và điều tra chuyên môn. Báo cáo thống kê định kỳ được quy định thành chế độ báo cáo do cơ quan có thẩm quyền quyết định và áp dụng cho nhiều năm. Điều tra chuyên môn áp dụng để thu thập thông tin đối với những hiện tượng và quá trình kinh tế xã hội không thể hoặc không nhất thiết phải thực hiện báo cáo thống kê định kỳ. Điều tra chuyên môn có thể tiến hành trên toàn bộ các đơn vị tổng thể (điều tra toàn bộ) hoặc chỉ tiến hành trên một số đơn vị tổng thể (điều tra không toàn bộ, trong đó điều tra chọn mẫu được áp dụng phổ biến nhất). 6.1 Khái niệm và ý nghĩa của điều tra chọn mẫu a) Khái niệm Điều tra chọn mẫu là một loại điều tra không toàn bộ, ngƣời ta chỉ chọn ra một số đơn vị từ tổng thể chung để điều tra, rồi sau đó bằng phƣơng pháp khoa học, tính toán suy rộng cho toàn bộ tổng thể. Ví dụ: Điều tra tỷ lệ phế phẩm của một hãng sản xuất mì tôm. Ngƣời ta thƣờng chọn ra một số gói mì nhất định, xác định tỷ lệ phế phẩm của số gói đƣợc chọn (giả sử tỷ lệ phế phẩm của mẫu đã chọn là 2%). Sử dụng kết quả này tính toán và suy rộng thành tỷ lệ phế phẩm của toàn bộ khối lƣợng mì mà hàng đã sản xuất. Tại sao chỉ điều tra một số đơn vị tổng thể mà suy ra kết quả của cả tổng thể chung? Cơ sở khoa học của điều tra chọn mẫu là sử dụng quy luật số lớn và lý thuyết xác suất thống kê để tính toán trong thực tế. Quy luật số lớn đã chỉ ra rằng, nếu chỉ nghiên cứu một số đủ lớn các đơn vị, phần tử cá biệt thì những biểu hiện ngẫu nhiên của các đơn vị này sẽ bù trừ và triệt tiêu lẫn nhau, tính quy luật sẽ đƣợc thể hiện rõ Nhƣ vậy, trong điều tra chọn mẫu ngƣời ta đặc biệt lƣu ý tới hai vấn đề cơ bản: + Quy tắc lựa chọn các đơn vị sao cho có thể đại diện cho toàn bộ tổng thể. + Dùng công thức suy rộng thành các đặc điểm của tổng thể. * Khái niệm tổng thể chung và tổng thể mẫu - Tổng thể chung là tổng thể bao gồm toàn bộ các đơn vị thuộc đối tƣợng nghiên cứu. Số đơn vị tổng thể chung đƣợc ký hiệu bằng N. 58 - Tổng thể mẫu là tổng thể bao gồm một số đơn vị đƣợc chọn ra từ tổng thể chung để điều tra thực tế. Số đơn vị của tổng thể mẫu đƣợc ký hiệu bằng n. * Bình quân mẫu: Là lƣợng biến bình quân của các đơn vị mẫu. Kí hiệu: Bình quân mẫu x , bình quân chung X * Phương pháp chọn mẫu Hiện nay, có hai phƣơng pháp chọn mẫu cơ bản đƣợc sử dụng phổ biến trong các cuộc điều tra là chọn mẫu ngẫu nhiên và chọn mẫu phi ngẫu nhiên. - Chọn ngẫu nhiên: Chọn mẫu ngẫu nhiên là chọn mẫu phải hoàn toàn khách quan. Tất cả các đơn vị tổng thể đều có cơ hội chọn mẫu nhƣ nhau, không phụ thuộc vào ý muốn chủ quan của ngƣời lựa chọn mẫu. Ví dụ: Rút thăm, dùng bảng số ngẫu nhiên - Chọn mẫu phi ngẫu nhiên: là phƣơng pháp chọn đơn vị điều tra phụ thuộc vào ý muốn chủ quan của ngƣời chọn Ví dụ: Chọn đơn vị trung bình, chọn chuyên gia Chọn mẫu phi ngẫu nhiên đƣợc sử dụng trong trƣờng hợp việc chọn mẫu ngẫu nhiên gặp khó khăn nhƣ những cuộc điều tra mới hoàn toàn chƣa có một thông tin tiên nghiệm nào về đối tƣợng điều tra, hoặc có những hiện tƣợng kinh tế phức tạp, sự phân tán không ổn định, biến động thất thƣờng hoặc nhiều tầng lớp,... Phƣơng pháp này không hoàn toàn dựa trên cơ sở toán học nhƣ điều tra chọn mẫu ngẫu nhiên mà đòi hỏi phải kết hợp chặt chẽ giữa phân tích lý luận và thực tiễn xã hội. Do đó, phần nhiều mang tính chất cảm tính, chủ quan của ngƣời chọn thông qua kinh nghiệm và sự hiểu biết về tổng thể nghiên cứu. Chính vì vậy, trong phạm vi và nội dung bài giảng chỉ đề cập đến các vấn đề thuộc điều tra chọn mẫu ngẫu nhiên b) Ý nghĩa: + Điều tra chọn mẫu có thể đƣợc sử dụng linh hoạt trong nhiều trƣờng hợp với mục đích khác nhau. +Tiến độ công việc nhanh hơn, có thể đáp ứng đƣợc tính khẩn cấp của thông tin cần thu thập. + Tiết kiệm đƣợc chi phí, thời gian. 59 6.2 Trình tự tiến hành điều tra chọn mẫu Khi tiến hành điều tra chọn mẫu, ngƣời ta thƣờng tiến hành theo các bƣớc nhƣ sau: Sơ đồ 6.1. Các bước trong điều tra chọn mẫu Bƣớc 1: Xác định mục đích điều tra Do nhu cầu thực tế ta cần thông tin về một hiện tƣợng nào đó mà không có sẵn và không thể thu thập bằng điều tra toàn bộ đƣợc thì ta chọn điều tra chọn mẫu. Xác định mục đích điều tra là nhằm thu thập thông tin gì, phục vụ cho mục đích nghiên cứu nào. Việc xác định rõ mục đích điều tra có ý nghĩa quan trong trong việc lựa chọn số lƣợng và phƣơng pháp lấy mẫu. Bƣớc 2: Xác định tổng thể có liên quan Mẫu đƣợc chọn ra phải mang tính chất đại diện cho tổng thể, do đó cần xác định tổng thể nào có chứa mẫu. Xác định tổng thể có liên quan nghĩa là xác định phạm vi, tính chất của tổng thể phù hợp với mục đích nghiên cứu. Bƣớc 3: Xác định kích thƣớc mẫu và phƣơng pháp chọn mẫu Số lƣợng mẫu cần chọn là bao nhiêu? Phƣơng pháp chọn mẫu nhƣ thế nào là bƣớc rất quan trọng có liên quan đến kết quả suy rộng cho tổng thể. Nội dung cụ thể của bƣớc này đƣợc trình bày chi tiết ở mục sau. Bƣớc 4: Phƣơng pháp thu thập và tính toán thông tin 6. Kết luận về tổng thể 1. Xác định mục đích nghiên cứu 2. Xác định tổng thể nghiên cứu 3. Xác định phƣơng pháp chọn mẫu, kích thƣớc mẫu 4. Lựa chọn phƣơng pháp thu thập thông tin 5. Suy rộng các đặc trƣng của mẫu thành các đặc trung của tổng thể 60 Sau khi đã chọn đƣợc mẫu đại diện, công việc tiếp theo là thu thập các thông tin của từng đơn vị mẫu. Phƣơng pháp thu thập thông tin của các đơn vị mẫu thƣờng áp dụng nhƣ các phƣơng pháp thu thập thông tin đã đƣợc trình bày ở chƣơng II (số trung bình mẫu, tỷ lệ mẫu). Cách xử lý, trình bày và tính toán các đặc trƣng của mẫu giống nhƣ các phƣơng pháp đã trình bày ở các chƣơng III và IV. Bƣớc 5: Suy rộng các đặc trƣng của tổng thể Từ các đặc trƣng của mẫu nhƣ số trung bình mẫu, tỷ lệ mẫu, sử dụng các phƣơng pháp thống kê để suy rộng thành các đặc trƣng của tổng thể. Bƣớc 6: Rút ra kết luận về tổng thể Nội dung của bƣớc này là xem xét các kết luận rút ra từ kết quả suy rộng trên cơ sở các đặc trƣng của mẫu có đáp ứng yêu cầu đặt ra trong mục tiêu nghiên cứu hay không? Nhận xét này cũng cần đối chiếu với nội dung bƣớc 1 xem có phù hợp không? 6.3 Điều tra chọn mẫu ngẫu nhiên 6.3.1 Các phƣơng pháp tổ chức điều tra chọn mẫu ngẫu nhiên a) Phương pháp chọn mẫu ngẫu nhiên đơn giản - Khái niệm: Chọn mẫu ngẫu nhiên đơn giản là phƣơng pháp tổ chức chọn mẫu từ tổng thể chung một cách hết sức ngẫu nhiên không qua một sự sắp xếp nào và có thể chọn một lần (không lặp), chọn nhiều lần (chọn có lặp). Ví dụ: Bốc thăm, quay số hoặc chọn theo bảng số ngẫu nhiên hay chọn bất kỳ. Chọn 1 lần là sau khi rút ra 1 thăm ngƣời ta không bỏ lại vào tổng thể để chọn lần sau. Nhƣ vậy, mỗi đơn vị tổng thể chỉ có thể đƣợc chọn ra 1 lần và tổng thể mẫu gồm các đơn vị hoàn toàn khác nhau, sẽ đại biểu cho tổng thể cao hơn. Chọn nhiều lần là cách chọn sau khi rút ra 1 thăm ngƣời ta ghi lại đơn vị đƣợc chọn rồi trả lại cái thăm vào tổng thể cũ. Nhƣ vậy, lần sau chọn vẫn có khả năng chọn đúng vào cái thăm đó chọn lần trƣớc. Trong trƣờng hợp này tổng thể mẫu có thể có một số đơn vị đƣợc chọn lại nhiều lần và mức độ đại biểu cho tổng thể chung sẽ không cao. - Đánh giá phương pháp + Ƣu điểm: Đơn giản, dễ làm. 61 + Nhƣợc điểm: gặp khó khăn khi tổng thể chung có quy mô lớn hoặc kết cấu phức tạp. Nếu gặp tổng thể không đồng đều thì tính chất đại biểu của mẫu không cao do các đơn vị đƣợc lựa chọn có thể phân bố không đều, tập trung vào một chỗ. - Điều kiện vận dụng: Chỉ thích hợp với những tổng thể tƣơng đối đồng đều và không quá lớn. b) Phương pháp chọn mẫu máy móc (chọn hế thống) - Khái niệm: Là phƣơng pháp tổ chức chọn mẫu trong đó mỗi đơn vị đƣợc chọn căn cứ vào từng khoảng cách nhất định từ danh sách đã đƣợc sắp xếp sẵn của tổng thể chung. Các đơn vị đƣợc chọn lần lƣợt, đơn vị sau cách đơn vị trƣớc một khoảng xác định d = N/n. Ví dụ: Từ tổng thể chung có 1.000 công nhân, ngƣời ta chọn ra 100 công nhân để tiến hành điều tra, khi đó d = 1.000/100 = 10. Và cứ 10 ngƣời theo danh sách thì sẽ chọn ra 1 ngƣời để điều tra. Ngƣời đầu tiên đƣợc chọn ra trong số 10 ngƣời đầu tiên của danh sách bằng cách ngẫu nhiên đơn thuần. Giả sử trong 10 ngƣời này rút thăm đƣợc ngƣời thứ 5 thì những ngƣời đƣợc chọn tiếp theo là 15, 25... - Đánh giá phương pháp + Ƣu điểm: Thủ tục đơn giản, rút ngắn đƣợc thời gian cũng nhƣ chi phí; các đơn vị rải đều ra trong toàn bộ tổng thể nên tính chất đại biểu của mẫu cao. + Nhƣợc điểm: Có khả năng xảy ra sai số hệ thống (sai số luôn lệch về một phía đối với số thực tế) do mẫu lấy ra phụ thuộc vào đơn vị đầu tiên đƣợc chọn từ nhóm đầu tiên. Do đó, khi tổng thể chung không đồng đều, đây chƣa phải là cách cho chúng ta mẫu tốt nhất. Mặt khác, khi tổng thể chung lớn thì việc sắp xếp các đơn vị theo một thứ tự nào đó để chọn mẫu cũng gặp nhiều khó khăn. - Điều kiện vận dụng: Trƣớc khi tiến hành chọn phải sắp xếp các đơn vị trong tổng thể vào danh sách theo một thứ tự nào đó của tiêu thức nghiên cứu hoặc tiêu thức bất kỳ. c) Phương pháp chọn mẫu phân tổ: - Khái niệm: Chọn mẫu phân tổ là tiến hành chọn các đơn vị mẫu khi tổng thể chung đã đƣợc phân chia thành các tổ. Việc chọn đơn vị từ các tổ đƣợc tiến hành theo phƣơng pháp chọn mẫu ngẫu nhiên đơn thuần hay hệ thống. - Đánh giá phương pháp 62 + Ƣu điểm: Chọn đƣợc tổng thể mẫu có kết cấu gần giống với kết cấu của tổng thể chung (trong trƣờng hợp chọn theo tỷ lệ) nên tính đại biểu cao, sai số chọn mẫu nhỏ. + Nhƣợc điểm: Phức tạp và khó thực hiện hơn, đòi hỏi phải có nhiều thông tin về tổng thể chung. - Điều kiện vận dụng: Thƣờng sử dụng khi tổng thể phức tạp, phân bố không đồng đều. d) Phương pháp chọn mẫu cả khối (mẫu chùm) - Khái niệm: Chọn mẫu cả khối là phƣơng pháp tổ chức chọn mẫu trong đó số đơn vị mẫu đƣợc rút ra để điều tra không phải là từng đơn vị riêng lẻ mà là từng khối (chùm) đơn vị. - Đánh giá phương pháp + Ƣu điểm: Tổ chức gọn nhẹ, giảm đƣợc chi phí. + Nhƣợc điểm: Do số đơn vị đƣợc chọn chỉ tập trung vào một số khối nên có thể dẫn đến sai số lớn nếu giữa các khối có sự khác biệt nhau nhiều. - Điều kiện vận dụng: Chỉ nên áp dụng trong trƣờng hợp giữa các đơn vị trong một khối có sự khác nhau đáng kể song giữa các khối lại giống nhau về bản chất đ) Phương pháp chọn mẫu nhiều cấp. - Khái niệm: Trong trƣờng hợp các đơn vị của tổng thể phân tán quá rộng và thiếu thông tin về chúng, ngƣời ta thƣờng chọn mẫu theo nhiều cấp: cấp 1, cấp 2, cấp3.... Ví dụ: Để điều tra mức sống dân cƣ trong cả nƣớc có thể chọn mẫu theo ba cấp nhƣ sau: + Đơn vị mẫu cấp 1: Chọn các tỉnh, thành phố. + Đơn vị mẫu cấp 2: Trong các đơn vị mẫu cấp 1 đã chọn (các tỉnh, thành phố) chọn ra một số quận, huyện. + Đơn vị mẫu cấp 3: Trong các đơn vị mẫu cấp 2 đã chọn (các quận, huyện) chọn một số hộ để điều tra. Điều kiện vận dụng: Sử dụng trong trƣờng hợp các đơn vị của tổng thể phân tán quá rộng và thiếu thông tin về tổng thể. 63 Tóm lại: Trong các phƣơng pháp tổ chức chọn mẫu ngẫu nhiên đƣợc trình bày ở trên thì phƣơng pháp tổ chức chọn mẫu phân tổ , đặc biệt là phƣơng pháp chọn hệ thống, thƣờng cho sai số chọn mẫu nhỏ nhất, đồng thời là phƣơng pháp tổ chức chọn mẫu phức tạp nhất. 6.3.2 Những vấn đề trong điều tra chọn mẫu ngẫu nhiên a) Sai số bình quân chọn mẫu và phạm vi sai số chọn mẫu: * Khái niệm về sai số chọn mẫu Sai số trong điều tra chọn mẫu ngẫu nhiên là sự chênh lệch giữa trị số mà điều tra mẫu thu thập đƣợc so với trị số thật của nó trong tổng thể chung. Do cuộc điều tra chọn mẫu chỉ tiến hành ở một số đơn vị tổng thể mà kết quả lại suy rộng ra cho cả tổng thể nên tất yếu nảy sinh sai số (gọi là sai số chọn mẫu). Đây là vấn đề không thể tránh khỏi trong bất kỳ cuộc điều tra nào Sai số chọn mẫu không phải là một trị số cố định. Với cùng một hiện tƣợng nhƣng nếu tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu của tổng thể mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau. Ví dụ: 1 tổng thể gồm 10 đơn vị ABCDMNPQRV. Chọn mẫu 3 đơn vị để điều tra. C1: ABC ta tính đƣợc sai số chọn mẫu thứ nhất (s1); C2: ABD ta tính đƣợc sai số chọn mẫu thứ nhất (s2); C1: MNP ta tính đƣợc sai số chọn mẫu thứ nhất (s3); .. Do đó, để tính sai số nhằm đánh giá mức độ chính xác của ƣớc lƣợng thì phải tính sai số bình quân chọn mẫu. * Sai số bình quân chọn mẫu: Bình quân tất cả các sai số chọn mẫu do việc lựa chọn mẫu có kết cấu thay đổi Thống kê toán đã xác định đƣợc công thức tính sai số bình quân chọn mẫu nhƣ sau: 64 Phƣơng pháp chọn Dùng suy rộng cho số bình quân Dùng suy rộng cho tỷ lệ Chọn nhiều lần √ √ Chọn một lần √ √ Ký kiệu : là sai số bình quân chọn mẫu; n là số đơn vị mẫu; N là số đơn vị tổng thể là phƣơng sai p là tỷ lệ của tổng thể Một số lưu ý: - Sự khác biệt giữa hai phƣơng pháp chọn hoàn lại và chọn không hoàn lại chính làm(1 – n/N). Do đó, ta luôn có sai số bình quân chọn mẫu theo cách chọn hoàn lại lớn hơn sai số bình quân chọn mẫu theo cách chọn không hoàn lại. - Khi n nhỏ hơn rất nhiều so với N thì khi đó n/N nhỏ và (1– n/N) gần với 1. Do vậy, có thể chọn theo cách không hoàn lại nhƣng sử dụng công thức của chọn hoàn lại để tính sai số bình quân chọn mẫu cho đơn giản. - Theo lý thuyết và p phải tính từ tổng thể nhƣng thực tế chƣa xác định đƣợc. Để giải quyết khó khăn nμy có thể sử dụng các phƣơng pháp sau đây: + Lấy phƣơng sai lớn nhất trong những lần điều tra trƣớc (nếu có) hoặc chọn p nào gần với 0,5 nhất. + Lấy phƣơng sai của các cuộc điều tra khác có tính chất tƣơng tự. + Điều tra thí điểm để xác định phƣơng sai. + Ƣớc lƣợng phƣơng sai nhờ khoảng biến thiên. Thống kê toán đã chứng minh trong trƣờng hợp hiện tƣợng phân phối chuẩn thì: Nhƣ trên đã biết, sai số bình quân chọn mẫu này không phải là một trị số xác định, nếu ta tiến hành nhiều lần điều tra khác nhau sẽ nhận đƣợc các sai số khác 65 nhau và đều dao động quanh . Vì vậy, không thể xác định chính xác sai số chọn mẫu cho mỗi lần điều tra mà chỉ có thể dựa vào sai số bình quân chọn mẫu để ƣớc lƣợng phạm vi sai số. * Phạm vi sai số chọn mẫu ( ): Là phạm vi chênh lệch giữa các chỉ tiêu của mẫu với các chỉ tiêu tƣơng ứng của tổng thể ứng với độ tin cậy nhất định. - Thống kê toán đã xác định đƣợc công thức: = ± t. Trong đó: t: hệ số tin cậy) : Sai số bình quân chọn mẫu. - Ứng với mỗi trị số của t có một độ tin cậy tƣơng ứng (t) (hàm xác suất). Quan hệ giữa hệ số tin cậy và độ tin cậy đƣợc thể hiện qua hàm tích phân xác suất do nhà toán học Liapunốp xây dựng nên. Hệ số tin cậy (t) Độ tin cậy Φ(t) 1,0 0,6827 1,5 0,8664 2,0 0,9545 2,5 0,9876 3,0 0,9973 Nếu kết quả điều tra tính đƣợc phạm vi sai số chọn mẫu theo công thức Δ = ±1.μ với độ tin cậy của việc suy rộng tài liệu là 0,6827. Điều này có nghĩa là trong 10000 lần điều tra chỉ có 6827 lần chắc chắn có sai số chọn mẫu không vƣợt quá ±1.μ (hệ số tin cậy t = 1) còn 3173 lần chắc chắn có sai mẫu vƣợt quá ±1. μ. Ví dụ: Trong một doanh nghiệp gồm có 1600 công nhân, ngƣời ta tiến hành điều tra chọn mẫu về tình hình tiền lƣơng. Số công nhân đƣợc chọn ra là 400 ngƣời theo phƣơng pháp chọn ngẫu nhiên đơn thuần có trả lại. Kết quả điều tra cho thấy: - Tiền lƣơng trung bình của công nhân là 650.000 đồng. - Độ lệch chuẩn là 80.000 đồng. Hãy tính: 1, Sai số bình quân chọn mẫu và phạm vi sai số chọn mẫu về tiền lƣơng bình quân với xác suất là 0,997. 2, Nếu cuộc điều tra đƣợc tiến hành theo phƣơng pháp chọn ngẫu nhiên đơn thuần (không trả lại) thì sai số bình quân chọn mẫu và phạm vi sai số bình quân 9chọn mẫu sẽ là bao nhiêu? 66 Giải: - Câu 1: √ ; Δ= t. - Câu 2: √ =3,46; Δ= t. b) Suy rộng tài liệu điều tra: Kết quả điều tra các đơn vị mẫu tính đƣợc ̅ và p. Nhƣng mục đích của chúng ta là xác định các tham số của tổng thể chung. Do đó, phải ƣớc lƣợng, nghĩa là từ các tham số của tổng thể mẫu suy ra các tham số của tổng thể chung. Các tham số của tổng thể chung đƣợc thống kê toán ƣớc lƣợng nhƣ sau: Dùng suy rộng cho số bình quân Dùng suy rộng cho tỷ lệ Ƣớc lƣợng ̅ ̅ ̅ ̅ ̅ Ví dụ: Giả sử sau khi điều tra chọn 1.000 chiếc điện thoại di động, tính đƣợc tỷ lệ những chiếc điện thoại di động gọi đi bị rè là 2,1%. Với độ tin cậy 95% tính ra phạm vi sai số 0,02. Hãy xác định tỷ lệ những chiếc điện thoại không đạt tiêu chuẩn của cả đợt sản xuất Giải: Tỷ lệ những chiếc điện thoại không đạt tiêu chuẩn của cả đợt sản xuất sẽ nằm trong phạm vi: 0,021 – 0,02 < p < 0,021 + 0,02 0,001 < p < 0,041 c) Số đơn vị mẫu cần chọn: Nhƣ ta đã biết, sai số chọn mẫu tỷ lệ nghịch với đơn vị mẫu chọn để điều tra. Vì vậy, muốn giảm sai số chọn mẫu ngƣời ta cần tăng số đơn vị mẫu với khả năng tối đa. Mặt khác, việc tăng số đơn vị mẫu lên lại liên quan tới những chi phí tốn kém mà kết quả điều tra phải chịu. Do đó, để đáp ứng yêu cầu đảm bảo kết quả điều tra và giảm bớt tốn kém chi phí ngƣời ta chỉ cần xác định số đơn vị mẫu cần thiết theo các điều kiện đã cho để điều tra. Từ công thức tính phạm vi sai số chọn mẫu, suy ra công thức tính số đơn vị mẫu cần điều tra nhƣ sau: Phƣơng pháp chọn Dùng cho số bình quân Dùng cho tỷ lệ Chọn nhiều lần Chọn một lần 67 Ví dụ : Năm 2014 trƣờng đại học tổ chức điều tra chọn mẫu để xác định tỷ lệ sinh viên ra trƣờng không tìm đƣợc việc làm với yêu cầu phạm vi sai số nhỏ hơn 3%, độ tin cậy 95% . Biết rằng ở năm trƣớc tỷ lệ sinh viên ra trƣờng không tìm đƣợc việc làm của trƣờng này là 20%. Hãy xác định kích thƣớc mẫu cần điều tra. Ta có: = 0,03; p = 0, 2; 1- p = 0,8 0,95 1,96 sinh viên 6.3.3 Điều tra chọn mẫu nhỏ và điều tra chọn mẫu ngẫu nhiên thời điểm - Điều tra chọn mẫu nhỏ Trong những trƣờng hợp không thể điều tra một số đơn vị tƣơng đối lớn vì nó liên quan đến việc hủy bỏ đơn vị điều tra nhƣ: kiểm tra chất lƣợng đồ hộp, thử độ bền của bóng đèn, của sợithì ngƣời ta tiến hành điều tra chọn mẫu nhỏ với số lƣợng điều tra không quá 30 (n<30). Trong thống kê toán ngƣời ta đã chứng minh rằng ngay trong chọn mẫu nhỏ, với phƣơng pháp tính toán thích hợp vẫn có thể đảm bảo độ chính xác để suy rộng tài liệu - Điều tra chọn mẫu ngẫu nhiên thời điểm Điều tra chọn mẫu ngẫu nhiên thời điểm là phƣơng pháp điều tra chọn mẫu đặc biệt, theo đó tại những thời điểm nhất định, ngƣời ta quan sát sự tồn tại của các phần tử thuộc quá trình nghiên cứu. Ví dụ: Khi nghiên cứu thời gian làm việc của công nhân trong một phân xƣởng, có thể chia thời gian ra làm hai thành phần: làm việc và ngừng việc. Trong suốt một ca làm việc, cứ sau một khoảng thời gian nhất định lại đi kiểm tra các công nhân một lần. Mỗi lần kiểm tra ghi chép thời gian làm việc của từng công nhân vào lúc đó (làm việc hay ngừng việc). Giả sử trong phân xƣởng có 40 công nhân làm việc, cứ cách 30 phút lại đi kiểm tra một lần. Nhƣ vậy trong suốt ca làm việc (8 giờ) ta sẽ đi kiểm tra 16 lần và tổng số trƣờng hợp ghi chép là: 16 x 40 = 640 trƣờng hợp. Trong 640 trƣờng hợp này, giả sử có 576 trƣờng hợp công nhân đang làm việc và 64 trƣờng hợp ngừng việc. Nhƣ vậy tỉ lệ thời gian công nhân làm việc là: P = 576/640 = 0,9 68 6.3 Điều tra chọn mẫu phi ngẫu nhiên Muốn cho chất lƣợng điều tra trong điều tra chọn mẫu phi ngẫu nhiên tốt phải giải quyết các vấn đề sau: 6.3.1 Phân tổ chính xác đối tƣọng điều tra Phân tổ chính xác đối tƣợng điều tra thì mới tập hợp đƣợc các đơn vị điển hình của nhiều bộ phận, từ đó các đơn vị điển hình đƣợc chọn ra này sẽ có đại diện cho cả tổng thể phức tạp. 6.3.2 Vấn đề chọn đơn vị điều tra Chọn những đơn vị điều tra có mức độ tiêu thức gần với số trung bình của từng bộ phận, đồng thời cũng là mức độ phổ biến nhất trong bộ phận đó. 6.3.3 Xác định số đơn vị điều tra Muốn xác định số đơn vị mẫu cho phù hợp thì cần phải căn cứ vào tính chất phức tạp của tổng thể nghiên cứu, căn cứ vào kinh nghiệm của các lần điều tra trƣớc, căn cứ vào mức độ đòi hỏi của việc nghiên cứu, lực lƣợng cán bộ và khả năng vật chất để quyết định tăng thêm hay giảm bớt số đơn vị điều tra. 6.3.4 Sai số chọn mẫu phi ngẫu nhiên Sai số chọn mẫu phi ngẫu nhiên phải thông qua nhận xét, so sánh để ƣớc lƣợng. Nếu thấy sai số không lớn lắm (chênh lệch không nhiều so với thực tế) thì có thể dùng kết quả điều tra mẫu để suy ra kết quả chung. Nếu thấy nghi ngờ kết quả có thể chọn lại và điều tra lại. CÂU HỎI ÔN TẬP 1. Điều tra chọn mẫu là gì và đƣợc vận dụng trong trƣờng hợp nào? 2. Nêu trình tự tiến hành một cuộc điều tra chọn mẫu. 3. Trình bày các phƣơng pháp tổ chức chọn mẫu ngẫu nhiên thƣờng dùng. Nêu rõ ƣu, nhƣợc điểm và điều kiện áp dụng của từng phƣơng pháp. 4. Sai số bình quân chọn mẫu là gì? Phạm vi sai số chọn mẫu. Nêu cách tính. 5. Suy rộng tài liệu điều tra là gì? Nêu cách tính 6. Nêu công thức xác định số đơn vị mẫu đƣợc chọn để điều tra. 69 MỤC LỤC CHƢƠNG 1: ĐỐI TƢỢNG NGHIÊN CỨU CỦA THỐNG KÊ HỌC ...................... 1 1.1 Đối tƣợng nghiên cứu của thống kê học .......................................................... 1 1.1.1 Sơ lƣợc về sự ra đời và phát triển của thống kế học ................................. 1 1.1.2 Đối tƣợng nghiên cứu của thống kê học .................................................... 1 1.2 Một số khái niệm thƣờng dùng trong thống kê học ......................................... 3 1.2.1 Tổng thể thống kê và đơn vị tổng thể ....................................................... 3 1.2.2 Tiêu thức thống kê .................................................................................... 4 1.2.3 Chỉ tiêu thống kê ....................................................................................... 5 1.2.4 Thang đo thống kê ..................................................................................... 6 CHƢƠNG 2: QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ ......................................... 8 2.1 Xác định hệ thống chỉ tiêu thống kê ................................................................ 8 2.1.1 Khái niệm hệ thống chỉ tiêu thống kê ....................................................... 8 2.1.2 Các yêu cầu cơ bản để xác định hệ thống chỉ tiêu thống kê ..................... 8 2.2 Điều tra thống kê .............................................................................................. 8 2.2.1 Khái niệm, ý nghĩa và nhiệm vụ điều tra thống kê ................................... 8 2.2.2 Các loại điều tra thống kê ....................................................................... 10 2.2.3 Các phƣơng pháp điều tra thống kê ........................................................ 11 2.2.4 Các hình thức tổ chức điều tra thống kê ................................................. 11 2.2.5 Sai số trong điều tra thống kê .................................................................. 12 2.3 Tổng hợp thống kê ......................................................................................... 13 2.3.1 Khái niệm và nhiệm vụ của tổng hợp thống kê ...................................... 13 2.3.2 Những vấn đề chủ yếu của tổng hợp thống kê ........................................ 13 2.3.3 Bảng thống kê và đồ thị thống kê ........................................................... 14 2.4 Phân tích và dự đoán thống kê ...................................................................... 15 2.4.1 Khái niệm, ý nghĩa, nhiệm vụ của phân tích và dự đoán thống kê ......... 15 2.4.2 Các yêu cầu có tính chất nguyên tắc cần đƣợc tuân thủ trong phân tích và dự đoán thống kê. ......................................................................................... 15 2.4.3 Những vấn đề chủ yếu của phân tích và dự đoán thống kê .................... 15 CHƢƠNG 3: PHÂN TỔ THỐNG KÊ ...................................................................... 17 3.1 Khái niệm, ý nghĩa và nhiệm vụ phân tổ thống kê ........................................ 17 3.2 Tiêu thức phân tổ............................................................................................ 17 3.2.1 Khái niệm ................................................................................................. 18 3.2.2 Các căn cứ để lựa chọn tiêu thức phân tổ ................................................ 18 70 3.3 Phân tổ thống kê ............................................................................................. 18 3.3.1 Phân tổ theo tiêu thức thuộc tính ............................................................ 18 3.3.2 Phân tổ theo tiêu thức số lƣợng ................................................................ 19 3.3.3 Phân tổ liên hệ ......................................................................................... 21 3.4 Chỉ tiêu giải thích. .......................................................................................... 22 3.4.1 Khái niệm ................................................................................................ 22 3.4.2 Tác dụng của chỉ tiêu giải thích ............................................................... 22 3.5 Dãy số phân phối ............................................................................................. 23 3.5.1 Khái niệm ................................................................................................ 23 3.5.2 Tác dụng .................................................................................................. 23 3.5.3 Các loại dãy số phân phối ....................................................................... 23 CHƢƠNG 4: CÁC MỨC ĐỘ CỦA HIỆN TƢỢNG KINH TẾ - XÃ HỘI ............. 25 4.1 Số tuyệt đối trong thống kê ............................................................................ 25 4.2 Số tƣơng đối trong thống kê ............................................................................ 26 4.3 Các chỉ tiêu đo lƣờng khuynh hƣớng tập trung .............................................. 29 4.3.1. Số bình quân trong thống kê ................................................................... 29 4.3.2 Mode (Mo) ............................................................................................... 35 4.3.3 Số trung vị (Me) ........................................................................................ 37 4.4 Các chỉ tiêu đánh giá độ biến thiên của tiêu thức ........................................... 39 4.4.1. Khoảng biến thiên của tiêu thức (toàn cự): (R) ...................................... 40 4.4.2. Độ lệch tuyệt đối bình quân ( .............................................................. 40 4.4.3. Phƣơng sai ( ...................................................................................... 41 4.4.4. Độ lệch tiêu chuẩn ( ............................................................................ 42 4.4.5. Hệ số biến thiên (V) ................................................................................ 42 4.4.6. Một số vấn đề tính toán và vận dụng phƣơng sai ................................... 43 CHƢƠNG 5: DÃY SỐ BIẾN ĐỘNG THEO THỜI GIAN ..................................... 45 5.1 Khái niệm, phân loại và ý nghĩa của dãy số biến động theo thời gian .......... 45 5.1.1. Khái niệm dãy số biến động theo thời gian............................................. 45 5.1.2. Các loại dãy số biến động theo thời gian ................................................ 45 5.1.3 Ý nghĩa của dãy số biến động theo thời gian .......................................... 46 5.2. Các chỉ tiêu phân tích dãy số biến động theo thời gian ................................. 46 5.2.1. Mức độ bình quân theo thời gian ............................................................ 46 5.2.2. Lƣợng tăng (giảm) tuyệt đối ................................................................... 48 5.2.3. Tốc độ phát triển ..................................................................................... 49 71 5.2.4. Tốc độ tăng (giảm) .................................................................................. 50 5.2.5. Giá trị tuyệt đối của 1% tăng (giảm) ....................................................... 52 5.3. Các phƣơng pháp biểu hiện xu hƣớng phát triển cơ bản của hiện tƣợng. ..... 52 5.3.1. Phƣơng pháp mở rộng khoảng cách thời gian ........................................ 52 5.3.2. Phƣơng pháp số bình quân trƣợt ............................................................. 53 5.3.3. Phƣơng pháp hồi quy .............................................................................. 54 5.3.4. Phƣơng pháp biểu hiện quy luật biến động thời vụ ................................ 55 CHƢƠNG 6: ĐIỀU TRA CHỌN MẪU .................................................................. 57 6.1 Khái niệm và ý nghĩa của điều tra chọn mẫu ............................................. 57 6.2 Trình tự tiến hành điều tra chọn mẫu ......................................................... 59 6.3 Điều tra chọn mẫu ngẫu nhiên ................................................................... 60 6.3.1 Các phƣơng pháp tổ chức điều tra chọn mẫu ngẫu nhiên ...................... 60 6.3.2 Những vấn đề trong điều tra chọn mẫu ngẫu nhiên ................................. 63 6.3.3 Điều tra chọn mẫu nhỏ và điều tra chọn mẫu ngẫu nhiên thời điểm ...... 67 6.3 Điều tra chọn mẫu phi ngẫu nhiên ............................................................. 68 6.3.1 Phân tổ chính xác đối tƣọng điều tra ........................................................ 68 6.3.2 Vấn đề chọn đơn vị điều tra ..................................................................... 68 6.3.3 Xác định số đơn vị điều tra ..................................................................... 68 6.3.4 Sai số chọn mẫu phi ngẫu nhiên .............................................................. 68

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_nguyen_ly_thong_ke_phan_2.pdf
Tài liệu liên quan