Tác dụng của dãy số phân phối
o Cho biết tỉ mỉ, chi tiết tình hình phân phối các đơn vị
của hiện tượng nghiên cứu theo 1 tiêu thức cụ thể.
o Là cơ sở để tiến hành tính toán và phân tích thống kê.
Phân loại dãy số phân phối: Có 2 loại dãy số phân phối
tương ứng với loại tiêu thức phân tổ.
o Dãy số thuộc tính: là kết quả của phân tổ theo tiêu
thức thuộc tính.
o Dãy số lượng biến: là kết quả của phân tổ theo tiêu thức số lượng.
Trong thống kê, người ta thường sử dụng các dãy số lượng biến. Đặc điểm của
dãy số này là các lượng biến bao giờ cũng được sắp xếp theo thứ tự từ nhỏ đến
lớn hoặc ngược lại.
26 trang |
Chia sẻ: huyhoang44 | Lượt xem: 779 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Toán học - Bài 2: Quá trình nghiên cứu thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hực hiện theo
yêu cầu chung quy định trước cuộc điều tra như thống nhất về đối tượng, phạm vi,
thời gian, nội dung thu thập...
Một cuộc điều tra thống kê được tổ chức khoa học, thống nhất chắc chắn sẽ thu thập
được nhiều số liệu thống kê có chất lượng cao và có mối liên hệ tốt làm cơ sở cho quá
trình phân tích thống kê.
2.1.1.2. Ý nghĩa của điều tra thống kê
Đây là giai đoạn đầu tiên của quá trình nghiên cứu thống kê. Tài liệu về hiện tượng
nghiên cứu thu thập trong giai đoạn này nhằm phục vụ cho giai đoạn phân tích và tổng
hợp thống kê. Không có tài liệu thì không thể có nghiên cứu thống kê. Chất lượng của
tài liệu có ảnh hưởng trực tiếp tới độ tin cậy của kết quả nghiên cứu sau này.
Để đảm bảo chất lượng phục vụ cho quá trình nghiên cứu, điều tra thống kê phải đáp
ứng một số yêu cầu nhất định.
2.1.1.3. Một số yêu cầu cơ bản của điều tra thống kê
Tài liệu của điều tra thống kê phải đáp ứng 3 yêu cầu cơ bản sau:
Chính xác: Tài liệu phải được thu thập chính xác, khách quan, phản ánh đúng tình
hình thực tế của hiện tượng.
Đây là yêu cầu hết sức quan trọng, là cơ sở để phân tích, tính toán nhằm rút ra kết luận
đúng đắn về hiện tượng nghiên cứu. Tuy nhiên, độ chính xác trong thống kê không
mang ý nghĩa tuyệt đối như trong kế toán. Do thống kê nghiên cứu hiện tượng số lớn
nên chắc chắn sẽ có sai lệch. Độ sai lệch cho phép trong thống kê là ± 5%.
Bài 2: Quá trình nghiên cứu thống kê
18 v1.0
Kịp thời: Tài liệu phải được thu thập kịp thời, tức là theo đúng thời hạn qui định.
Bên cạnh đó, tính kịp thời còn thể hiện ở chỗ tài liệu phải được cung cấp đúng lúc
khi người sử dụng cần.
Tại sao phải kịp thời? Như bài 1 đã trình bày, mặt lượng của hiện tượng thường
xuyên thay đổi, nếu không thu thập kịp thời, nó sẽ thay đổi; khi đó không phản ánh
đúng hiện tượng được nữa. Ngoài ra còn có một ý nghĩa thực tiễn khác là kịp thời
để còn có chính sách phù hợp.
Ví dụ: Khi có thiên tai, lũ lụt,... phải kịp thời thống kê được thiệt hại cả về người
và của để có chính sách cứu trợ hợp lý.
Đầy đủ: Tài liệu phải được thu thập đầy đủ trên 2 phương diện:
o Về nội dung: phải theo đúng nội dung như trong kế hoạch và phương án điều tra.
o Về số đơn vị điều tra: đảm bảo số lượng đơn vị theo yêu cầu.
Ví dụ: Trong điều tra toàn bộ thì toàn bộ các đơn vị phải được điều tra. Còn trong
điều tra chọn mẫu thì phải chọn mẫu đủ lớn và đảm bảo tính đại diện.
Hàng năm, người ta tiến hành hàng trăm các cuộc điều tra khác nhau. Có cuộc điều tra
do ngành thống kê tổ chức nhưng cũng có cuộc điều tra do các ngành khác tổ chức.
Vậy có những loại điều tra nào trong thực tế?
2.1.2. Các loại điều tra thống kê
2.1.2.1. Điều tra thường xuyên và không thường xuyên
Nếu căn cứ vào tính liên tục của việc ghi chép tài liệu
ban đầu, điều tra thống kê được chia thành hai loại:
Điều tra thường xuyên: là việc thu thập tài liệu
được tiến hành thường xuyên, liên tục, gắn liền với
quá trình biến động của hiện tượng qua thời gian.
Ví dụ: doanh số ngày bán hàng, ghi chép tình hình
xuất nhập kho, khai sinh khai tử...
Điều tra không thường xuyên: là việc tiến hành
thu thập và ghi chép tài liệu ban đầu của hiện tượng
không gắn với quá trình biến động của hiện tượng
mà khi thấy cần thiết mới tiến hành thu thập tại một
thời điểm hay một thời kỳ nào đó.
Thế nào là cần thiết? Điều này xuất phát từ yêu cầu quản lý kinh tế và xây dựng
các kế hoạch phát triển kinh tế – xã hội của Nhà nước và khi có những hiện tượng
xảy ra bất thường như thiên tai, địch họa... thì phải tổ chức điều tra.
Ví dụ: Khi thấy sự việc hàm lượng canxi ở sữa không như công bố có thể ảnh
hưởng đến hình ảnh và doanh số bán hàng của hãng Mead Johnson, thì hãng quyết
định tổ chức điều tra về thị trường sữa nhằm có những quyết định phù hợp trong
quản lý sản xuất kinh doanh.
2.1.2.2. Điều tra toàn bộ và không toàn bộ
Nếu căn cứ vào phạm vi của đối tượng được điều tra thực tế, người ta chia điều tra
thống kê thành:
Bài 2: Quá trình nghiên cứu thống kê
v1.0 19
Điều tra toàn bộ: tiến hành thu thập tài liệu trên
tất cả các đơn vị của hiện tượng nghiên cứu.
Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009.
o Ưu điểm: Cung cấp tài liệu đầy đủ nhất về từng
đơn vị tổng thể, cho biết được quy mô tổng thể.
o Hạn chế: Chi phí lớn, thời gian dài, chất lượng
tài liệu thu được không cao do phạm vi rộng,
chỉ điều tra được những nội dung cơ bản, không
đi sâu vào chi tiết, đặc biệt có nhiều trường hợp
không thể tiến hành điều tra toàn bộ (vì là tổng thể tiềm ẩn hay tổng thể bộc lộ
nhưng việc điều tra gắn liền với việc phá huỷ đơn vị điều tra) hoặc không cần
thiết để điều tra toàn bộ (vì tổng thể là lớn và các đơn vị trong tổng thể không
khác nhau nhiều).
Ví dụ: Điều tra chất lượng sản phẩm đồ hộp, điều tra tuổi thọ bóng đèn, điều tra
trọng lượng hành khách đi đường hàng không...
Chính vì những nhược điểm trên mà hình thức điều tra này không phổ biến. Trên
thực tế người ta thường sử dụng điều tra không toàn bộ.
Điều tra không toàn bộ: tiến hành thu thập tài liệu trên một bộ phận các đơn vị
của hiện tượng nghiên cứu.
o Ưu điểm: Tiết kiệm chi phí, thời gian, chất lượng tài liệu thu được cao với
nhiều nội dung chi tiết, ứng dụng rộng rãi hơn trên các tổng thể, các lĩnh vực.
o Nhược điểm: Không cung cấp tài liệu chi tiết, đầy đủ về từng đơn vị tổng thể;
không biết được quy mô tổng thể; không tránh khỏi những sai số khi nhìn nhận
tổng thể chung trên cơ sở kết quả điều tra không toàn bộ.
Tuỳ theo mục đích nghiên cứu mà cách chọn đơn vị điều tra khác nhau, dẫn
đến có các loại điều tra không toàn bộ khác nhau. Thông thường, có 3 loại điều
tra không toàn bộ, gồm:
Điều tra chọn mẫu: chỉ tiến hành thu thập tài liệu ở một số đơn vị nhất định
được chọn ra từ tổng thể chung. Các đơn vị này được chọn theo những qui
tắc nhất định để đảm bảo tính đại biểu và kết quả của điều tra chọn mẫu
được dùng để suy rộng cho tổng thể chung.
Ví dụ: Điều tra mức sống hộ gia đình, điều tra năng suất, diện tích, sản
lượng cây trồng trong nông nghiệp, điều tra thị trường sữa trẻ em...
Đây là hình thức điều tra phổ biến nhất trong thực tế và rất phù hợp với các
tổng thể tiềm ẩn.
Điều tra trọng điểm: người ta tiến hành điều tra trên một bộ phận quan
trọng nhất, chủ yếu nhất của hiện tượng nghiên cứu.
Khác với điều tra chọn mẫu, kết quả của điều tra trọng điểm không dùng để
suy rộng cho tổng thể chung mà chỉ giúp chúng ta biết được tình hình cơ
bản của hiện tượng.
Ví dụ: Nghiên cứu tình hình vận tải hàng không ở Việt Nam, chỉ điều tra
trên 2 sân bay lớn nhất cả nước là Nội Bài và Tân Sơn Nhất.
Bài 2: Quá trình nghiên cứu thống kê
20 v1.0
Điều tra chuyên đề: chỉ tiến hành thu thập tài liệu trên một vài đơn vị, thậm
chí một đơn vị nhưng đi sâu nghiên cứu chi tiết nhiều khía cạnh.
Ví dụ: Điều tra các hộ nông dân chuyển đổi có hiệu quả...
Mục đích của loại điều tra này là nhằm tìm những nhân tố mới hay rút ra bài
học kinh nghiệm, từ đó có những kết luận cần thiết để chỉ đạo thực tế. Đây là
trường hợp đặc biệt của thống kê khi không nghiên cứu hiện tượng số lớn.
2.1.3. Các hình thức tổ chức điều tra
2.1.3.1. Báo cáo thống kê định kỳ
Báo cáo thống kê định kỳ là hình thức tổ chức điều tra thống kê thường xuyên, định
kỳ theo chế độ do Nhà nước quy định.
Đây là hình thức tổ chức điều tra theo con đường hành chính bắt buộc, thường vận dụng
chủ yếu ở các cơ quan nhà nước. Nội dung của các báo cáo thường liên quan đến lĩnh
vực quản lý vĩ mô toàn bộ nền kinh tế quốc dân nhằm quản lý tập trung nền kinh tế.
Chủ yếu áp dụng điều tra toàn bộ, thường xuyên và thu thập tài liệu một cách gián tiếp.
2.1.3.2. Điều tra chuyên môn
Điều tra chuyên môn là hình thức tổ chức điều tra không
thường xuyên, tiến hành theo một kế hoạch và phương
pháp quy định riêng cho mỗi lần điều tra.
Điều tra này chỉ được thực hiện khi cần thiết. Hình thức
điều tra này không mang tính pháp lệnh mà vận động đối
tượng cung cấp tài liệu điều tra.
Tài liệu thu được từ điều tra này rất phong phú, có ý
nghĩa nhiều mặt hơn do:
Thu thập tài liệu của hầu hết những hiện tượng báo
cáo thống kê định kỳ chưa hoặc không cung cấp được.
Thu thập tài liệu đối với khu vực ngoài quốc doanh.
Kết quả của điều tra chuyên môn được dùng để kiểm tra chất lượng tài liệu của
báo cáo thống kê định kỳ.
Về cơ bản, điều tra chuyên môn được áp dụng linh hoạt các loại điều tra và các
phương pháp thu thập tài liệu khác nhau.
2.1.4. Phương pháp thu thập thông tin trong điều tra thống kê
Các loại điều tra thống kê khác nhau sẽ sử dụng những phương pháp thu thập tài liệu
khác nhau. Căn cứ vào tính chất trực tiếp hay gián tiếp của việc thu thập tài liệu sẽ có
2 phương pháp sau:
2.1.4.1. Phương pháp thu thập trực tiếp
Khái niệm
Phương pháp thu thập trực tiếp là phương pháp mà người điều tra tự mình quan sát
hoặc trực tiếp hỏi đơn vị điều tra và tự ghi chép vào tài liệu.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 21
Đánh giá phương pháp
o Ưu điểm: Chất lượng tài liệu thu được cao; hạn chế được sai sót do đối tượng
điều tra hiểu sai câu hỏi, hoặc cung cấp sai thông tin, ...
o Nhược điểm: Tốn kém về thời gian và chi phí, người điều tra có ảnh hưởng chủ
quan tới đối tượng điều tra
2.1.4.2. Phương pháp thu thập gián tiếp
Khái niệm
Phương pháp thu thập gián tiếp là phương pháp thu
thập tài liệu qua bản viết của đơn vị điều tra như
chứng từ sổ sách và các tài liệu có liên quan.
Đánh giá phương pháp
o Ưu điểm: Tiết kiệm thời gian và chi phí, không
chịu ảnh hưởng của ý kiến người đi điều tra.
o Nhược điểm: Chất lượng tài liệu thu được không cao do đối tượng điều tra tự
điền vào mẫu phiếu điều tra nên nhiều câu hỏi không hiểu mà không có người
giải thích nên sẽ cung cấp thông tin sai, hoặc người trả lời cố ý cung cấp thông
tin sai..., mức độ phù hợp với nghiên cứu không cao.
Để tổ chức tốt một cuộc điều tra chuyên môn đòi hỏi phải xây dựng được phương
án điều tra thật chi tiết, tỉ mỉ, cụ thể và toàn diện.
2.1.5. Phương án điều tra thống kê
2.1.5.1. Khái niệm
Phương án điều tra thống kê là một văn bản được xây dựng trong bước chuẩn bị điều
tra; trong đó qui định rõ những vấn đề cần phải được giải quyết hoặc cần hiểu thống
nhất trước, trong và sau khi tiến hành điều tra thống kê.
Đây là loại văn bản mà bất cứ cuộc điều tra nào cũng phải xây dựng. Tính khoa học và
thống nhất của điều tra thống kê được thể hiện rõ nét thông qua văn bản này.
2.1.5.2. Nội dung chủ yếu của phương án điều tra thống kê
Tuỳ theo đặc điểm, tính chất của hiện tượng được nghiên cứu mà nội dung của
phương án điều tra sẽ khác nhau. Nhưng về cơ bản, một phương án điều tra thống kê
bao gồm những nội dung chủ yếu sau:
Xác định mục đích điều tra
Với nội dung này, chúng ta phải trả lời được câu
hỏi, cuộc điều tra đó nhằm mục tiêu gì và phục vụ
cho yêu cầu cụ thể nào.
Mục đích điều tra là nội dung quan trọng đầu tiên của
kế hoạch điều tra. Nó có tác dụng định hướng cho
toàn bộ quá trình điều tra và giúp chúng ta xác định
chính xác đối tượng, đơn vị và nội dung điều tra.
Xác định đối tượng điều tra và đơn vị điều tra
Đối tượng điều tra là tổng thể các đơn vị thuộc hiện tượng nghiên cứu có các
dữ liệu cần thiết khi tiến hành điều tra. Xác định đối tượng điều tra là xác định
Bài 2: Quá trình nghiên cứu thống kê
22 v1.0
phạm vi đối tượng cần nghiên cứu, cần điều tra nhằm thu thập tài liệu chính xác,
không nhầm lẫn với các hiện tượng khác.
Đơn vị điều tra là từng đơn vị cá biệt thuộc đối tượng điều tra và được xác định sẽ
điều tra thực tế. Trong điều tra toàn bộ, số đơn vị điều tra cũng chính là số đơn vị
thuộc đối tượng điều tra. Trong điều tra không toàn bộ, số đơn vị điều tra là những
đơn vị được chọn ra từ tổng thể các đơn vị thuộc đối tượng điều tra.
Xác định đơn vị điều tra tức là xác định tài liệu sẽ được thu thập ở đâu. Tuỳ theo
mục đích và đối tượng điều tra mà đơn vị điều tra được xác định khác nhau.
Ví dụ: Trong Tổng điều tra dân số và nhà ở 1/4/2009.
Mục đích điều tra: Phục vụ công tác nghiên cứu, phân tích và dự báo quá trình
phát triển dân số và nhà ở trên phạm vi cả nước và từng địa phương...
Đối tượng điều tra: Tất cả công dân Việt Nam.
Đơn vị điều tra: Hộ gia đình.
Ví dụ: Trong điều tra sản xuất và kinh doanh rau sạch, đơn vị điều tra có thể là
doanh nghiệp, hợp tác xã, hộ nông dân hoặc từng người dân có sản xuất và kinh
doanh rau sạch.
Ví dụ: Trong điều tra về thị trường sữa trẻ em ở Việt Nam, đơn vị điều tra là các
siêu thị, đại lý, cửa hàng... có kinh doanh sữa trẻ em.
Xác định nội dung điều tra
Mỗi đơn vị điều tra có rất nhiều tiêu thức khác nhau. Nhưng trong một cuộc điều
tra, không nhất thiết phải thu thập tất cả các tiêu thức, mà chỉ thu thập theo một số
tiêu thức chủ yếu, những tiêu thức quan trọng nhất đáp ứng cho mục đích điều tra
và mục đích nghiên cứu. Như vậy, nội dung điều tra là toàn bộ các đặc điểm cơ
bản của từng đối tượng, từng đơn vị điều tra mà ta cần thu được thông tin hay nói
cách khác, đó là danh mục các tiêu thức hay đặc trưng của các đơn vị điều tra cần
thu thập.
Để xác định nội dung điều tra, cần phải căn cứ vào các yếu tố sau:
o Mục đích điều tra.
o Đặc điểm của hiện tượng nghiên cứu.
o Năng lực, trình độ thực tế của đơn vị, người tổ chức điều tra.
Trong kế hoạch điều tra phải xác định và thống nhất danh mục các tiêu thức cần
thu thập. Các tiêu thức này phải được diễn đạt thành câu hỏi ngắn gọn, dễ hiểu, cụ
thể, rõ ràng để cả người điều tra và đơn vị điều tra đều hiểu một cách thống nhất.
Danh mục các tiêu thức này được thể hiện dưới dạng phiếu hỏi, phiếu điều tra,
bảng hỏi hay biểu mẫu điều tra.
Đi kèm theo phiếu hỏi phải có bảng giải thích cách ghi phiếu nhằm giải thích
cụ thể nội dung từng tiêu thức, cách thu thập và ghi chép số liệu. Mục đích giúp
người đi điều tra, đơn vị điều tra hiểu và thực hiện chính xác, thu thập số liệu
cho đúng.
Xác định thời điểm điều tra, thời kỳ điều tra và thời hạn điều tra
Trong đó:
o Thời điểm điều tra là mốc thời gian (ngày, giờ cụ thể) được xác định để
tiến hành thu thập tài liệu một cách thống nhất trên tất cả các đơn vị của hiện
tượng nghiên cứu.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 23
Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009,
thời điểm điều tra là 0 giờ ngày 1/4/2009.
Tuỳ theo tính chất, đặc điểm của hiện tượng
nghiên cứu mà xác định thời điểm điều tra. Tuy
nhiên, thời điểm điều tra thường được xác định
vào lúc hiện tượng ít biến động nhất và gắn kết
với những kế hoạch của địa phương.
Ví dụ: Điều tra về du lịch biển ở Sầm Sơn thì
không nên chọn vào mùa đông.
o Thời kỳ điều tra là độ dài (khoảng) thời gian có sự
tích luỹ về mặt lượng của hiện tượng nghiên cứu.
Ví dụ: Điều tra tình hình xuất khẩu gạo của địa
phương A trong quý 1 năm 2008.
Thời kỳ điều tra dài hay ngắn phụ thuộc vào mục đích nghiên cứu.
o Thời hạn điều tra là khoảng thời gian kể từ lúc bắt đầu tiến hành điều tra cho
đến khi hoàn thành việc thu thập tài liệu trên tất cả các đơn vị điều tra.
Ví dụ: Tổng điều tra dân số và nhà ở 1/4/2009, thời hạn điều tra trong vòng 20
ngày từ sáng 1/4 đến tối 20/4...
Như vậy, thời hạn điều tra dài hay ngắn phụ thuộc vào qui mô, tính chất phức
tạp của hiện tượng, nội dung nghiên cứu và lực lượng tham gia nhưng nhìn
chung, thời hạn điều tra không nên quá lâu vì sẽ dẫn đến việc thu thập tài liệu
thiếu chính xác.
Ngoài 4 vấn đề chính ở trên, trong phương án điều tra thống kê còn đề cập tới
một số vấn đề về nguồn nhân lực, kinh phí, thời gian thực hiện, điều tra thử,
thành lập các cơ quan điều tra và tuyên truyền trong nhân dân...
Trong tiến hành điều tra thống kê, dù khoa học đến mấy nhưng vẫn có sai số.
Vậy sai số là gì? Liệu có thể khắc phục được sai số hay không?
2.1.6. Sai số trong điều tra thống kê
2.1.6.1. Khái niệm
Sai số trong điều tra thống kê là chênh lệch giữa các trị
số của tiêu thức điều tra thu thập được so với trị số thực
tế của hiện tượng nghiên cứu.
Ví dụ: Trong điều tra dân số, sai số hay mắc phải là về
tiêu thức tuổi do một số nguyên nhân: Người già không
nhớ chính xác tuổi, tâm lý trẻ muốn già hơn và ngược
lại; trong điều tra về mức sống, đối tượng điều tra
nhiều khi không nhớ chính xác về các khoản đã chi
trong thời gian nghiên cứu...
Sai số trong điều tra thống kê là sai số vốn có. Phạm vi
sai số cho phép trong điều tra thống kê là ± 5%. Tuy nhiên, sai số càng lớn thì chất
lượng của kết quả điều tra càng giảm và gây ảnh hưởng đến chất lượng của cả quá
trình nghiên cứu thống kê. Vấn đề đặt ra là phải xác định được sai số do nguyên nhân
nào để từ đó chủ động tìm biện pháp khắc phục.
Bài 2: Quá trình nghiên cứu thống kê
24 v1.0
2.1.6.2. Các loại sai số
Căn cứ vào nguyên nhân dẫn đến sai số mà người ta chia sai số trong điều tra thống kê
thành các loại sau:
Sai số do ghi chép tài liệu (do đăng ký lần đầu): đây là loại sai số mà tất cả các
cuộc điều tra đều mắc phải, xảy ra do các nguyên nhân:
o Người điều tra vô tình cân, đo, đong, đếm và ghi chép sai.
o Đơn vị điều tra không hiểu câu hỏi dẫn đến trả lời sai.
o Cả đơn vị điều tra và người điều tra cố tình ghi chép sai.
Sai số do tính chất đại biểu của số đơn vị được chọn: chỉ xảy ra trong điều tra
chọn mẫu, do các nguyên nhân:
o Cỡ mẫu không đủ lớn.
o Do cố tình vi phạm nguyên tắc chọn mẫu.
o Do bản thân nguyên tắc chọn mẫu.
2.1.6.3. Các biện pháp khắc phục sai số
Sai số trong thống kê là một vấn đề không thể tránh khỏi. Để khắc phục sai số, cần
phải thực hiện tốt các biện pháp sau:
Làm tốt công tác chuẩn bị điều tra
o Lập phương án điều tra khoa học, chi tiết.
o Chuẩn bị cán bộ điều tra đảm bảo chất lượng.
o Coi trọng công tác tuyên truyền sâu rộng về mục đích cuộc điều tra.
Làm tốt công tác kiểm tra điều tra
o Kiểm tra tài liệu thu thập được có đầy đủ về nội dung và số đơn vị điều tra
không, có chính xác về con số và logic không.
o Kiểm tra tính đại biểu của số đơn vị được chọn trong điều tra chọn mẫu.
Sau khi kết thúc điều tra, chúng ta thu được một số lượng lớn các tài liệu. Nhưng
những tài liệu này mới chỉ ở dạng thô, mang tính chất rời rạc, chưa cho thấy đặc trưng
chung của hiện tượng nghiên cứu. Công việc tiếp theo là phải tổng hợp những tài liệu
đó lại để tìm ra các đặc trưng của hiện tượng làm cơ sở cho quá trình phân tích và dự
đoán thống kê.
2.2. Tổng hợp thống kê
2.2.1. Khái niệm chung về tổng hợp thống kê
2.2.1.1. Khái niệm
Tổng hợp thống kê là tiến hành tập trung chỉnh lý và hệ thống hóa một cách khoa học
toàn bộ tài liệu thu thập được trong điều tra thống kê.
Ví dụ: Sau khi điều tra về thị trường sữa trẻ em ở Việt Nam hiện nay, chúng ta thu
được một tập số liệu nhưng chưa biết được hiện có bao nhiêu chủng loại sữa, giá bán
mỗi loại, thị phần... Tổng hợp thống kê sẽ giúp giải quyết những câu hỏi đó.
Chỉnh lý, hệ thống hoá là việc kiểm tra lại và sắp xếp tài liệu theo một trật tự nào đó
chứ không sửa trực tiếp vào phiếu điều tra.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 25
2.2.1.2. Ý nghĩa và nhiệm vụ của tổng hợp thống kê
Tổng hợp thống kê là giai đoạn trung gian, xử lý sơ bộ
tài liệu, làm căn cứ cho phân tích và dự đoán thống kê.
Nếu tài liệu điều tra tỉ mỉ chi tiết nhưng tổng hợp
không đúng thì tính toán phân tích sẽ sai. Mặt khác,
bản thân việc tổng hợp thống kê này đã là một phương
pháp trong phân tích thống kê.
Ví dụ: Phương pháp trình bày dữ liệu, phương pháp
phân tích kết cấu của tổng thể trong trạng thái tĩnh, phương pháp phân tích chuyển
dịch cơ cấu của tổng thể trong trạng thái động...
Qua tổng hợp, có thể làm cho các đặc trưng riêng của từng đơn vị tổng thể bước đầu
chuyển thành các đặc trưng chung của cả tổng thể (từ các tiêu thức xây dựng nên các
chỉ tiêu). Hệ thống hóa là nhiệm vụ chủ yếu của tổng hợp thống kê.
Sau đây là một số phương pháp tổng hợp thống kê cơ bản.
2.2.2. Phân tổ thống kê
2.2.2.1. Một số vấn đề chung về phân tổ thống kê
Khái niệm: Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để
tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ và các tiểu
tổ có tính chất khác nhau.
Ví dụ: Trong nghiên cứu dân số, căn cứ vào tiêu
thức giới tính, người ta chia dân số thành 2 tổ: nam
và nữ; căn cứ vào tiêu thức tuổi, chia dân số thành
các tổ: 0; 1 – 4; 5 – 9, 10 – 14, 15 – 19...
Ví dụ: Trong điều tra về thị trường sữa ở nước ta
hiện nay, căn cứ theo tiêu thức loại sữa để phân
chia tổng thể điều tra thành các loại sữa với nhãn
hiệu khác nhau; hoặc căn cứ vào tiêu thức giá bán để phân chia thành các loại sữa
với mức giá bán khác nhau...
Ý nghĩa: Phân tổ thống kê là một trong những phương pháp thường được sử dụng
trong nghiên cứu thống kê.
o Giai đoạn điều tra thống kê: Trong điều tra toàn bộ và điều tra không toàn bộ,
người ta phải phân tổ trước các hiện tượng cần nghiên cứu nhằm giúp cho việc
điều tra được dễ dàng, thuận tiện; trong điều tra chọn mẫu, phương pháp phân
tổ được sử dụng để đảm bảo tính đại diện của mẫu.
o Giai đoạn tổng hợp thống kê: Phân tổ là phương pháp cơ bản nhất dùng để
chỉnh lý và hệ thống hóa toàn bộ tài liệu thu thập được trong điều tra thống kê.
o Giai đoạn phân tích thống kê: Phân tổ là một trong những phương pháp quan
trọng, là cơ sở để vận dụng các phương pháp thống kê khác một cách có hiệu
quả. Bản thân phân tổ thống kê cũng đã là một phương pháp phân tích thống kê
quan trọng, đó là phân tích kết cấu của hiện tượng ở trạng thái tĩnh và chuyển
dịch cơ cấu ở trạng thái động.
Nhiệm vụ: Nó cho phép giải quyết ba nhiệm vụ cơ bản sau:
Bài 2: Quá trình nghiên cứu thống kê
26 v1.0
o Thứ nhất, phân chia các loại hình kinh tế – xã hội theo đúng với sự tồn tại
khách quan của nó. Trên cơ sở đó, nghiên cứu mối quan hệ giữa các loại hình
kinh tế – xã hội nhằm nhận thức được quá trình vận động và phát triển của
hiện tượng.
Ví dụ: Phân tổ các cơ sở sản xuất công nghiệp ở nước ta theo thành phần
kinh tế: Nhà nước, ngoài Nhà nước và có vốn đầu tư nước ngoài.
o Thứ hai, biểu hiện kết cấu của hiện tượng nghiên cứu, qua đó nêu lên đặc điểm
cơ bản của hiện tượng trong điều kiện thời gian và địa điểm cụ thể. Mặt khác,
khi nghiên cứu sự biến động kết cấu của hiện tượng qua thời gian ta sẽ thấy
được xu hướng phát triển cơ bản của hiện tượng nghiên cứu.
Ví dụ: Khi nghiên cứu kết cấu của các cơ sở sản xuất công nghiệp ở nước ta
trong một khoảng thời gian, có thể thấy sự chuyển dịch theo hướng: tỷ trọng
các cơ sở sản xuất công nghiệp trong khu vực Nhà nước giảm dần, tỷ trọng các
cơ sở sản xuất công nghiệp trong khu vực ngoài Nhà nước và có vốn đầu tư
nước ngoài tăng dần.
o Thứ ba, biểu hiện mối liên hệ giữa các tiêu thức. Ta chia tiêu thức thành tiêu
thức nguyên nhân (tiêu thức gây ảnh hưởng) và tiêu thức kết quả (tiêu thức bị
ảnh hưởng), sau đó sẽ tiến hành phân tổ theo tiêu thức nguyên nhân.
Ví dụ: Mối liên hệ giữa tuổi nghề và năng suất lao động, giữa năng suất lao
động và tiền lương, giữa lượng phân bón và năng suất cây trồng, giữa thu nhập
và loại sữa dùng cho trẻ
Các loại phân tổ thống kê
o Căn cứ vào số lượng tiêu thức phân tổ: Phân
tổ theo 1 tiêu thức (phân tổ giản đơn, ví dụ:
phân tổ dân số theo riêng tiêu thức độ tuổi,
giới tính...) và phân tổ theo nhiều tiêu thức.
Phân tổ theo nhiều tiêu thức được chia thành
hai loại:
Phân tổ kết hợp: là phân tổ lần lượt theo
từng tiêu thức, tiêu thức nào trước, tiêu thức nào sau phụ thuộc vào mục
đích nghiên cứu. Nó cho phép nhìn nhận hiện tượng trên nhiều góc độ,
nhiều khía cạnh khác nhau.
Ví dụ: Tổng thể dân số khi được phân chia theo tiêu thức giới tính thì hình
thành hai tổ: nam và nữ. Ở mỗi tổ dân số nam và dân số nữ này lại được
phân chia tiếp theo tiêu thức nhóm tuổi.
Phân tổ kết hợp tuy có nhiều ưu điểm nhưng chúng ta cũng không nên quá
lạm dụng, kết hợp quá nhiều tiêu thức sẽ làm cho việc phân tổ trở nên phức
tạp, tổng thể bị chia nhỏ gây khó khăn cho việc nghiên cứu.
Phân tổ nhiều chiều: cùng một lúc phân tổ theo nhiều tiêu thức khác nhau
nhưng có vai trò ngang nhau trong phản ánh hiện tượng.
Ví dụ: Khi phân tổ các doanh nghiệp xây dựng theo qui mô nhưng không
nói rõ qui mô gì, người ta sẽ phân tổ đồng thời theo các tiêu thức: vốn, lao
động, tài sản cố định, giá trị xây lắp, doanh thu... Các tiêu thức này có vai
trò ngang nhau khi phản ánh qui mô của doanh nghiệp.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 27
o Căn cứ vào mục đích phân tổ, người ta chia thành:
Phân tổ phân loại: để chia tổng thể thành các loại hình khác nhau, thường
phân tổ theo tiêu thức thuộc tính.
Phân tổ kết cấu: để nghiên cứu kết cấu của tổng thể, có thể phân tổ theo tiêu
thức thuộc tính, có thể theo tiêu thức số lượng.
Phân tổ liên hệ: để nghiên cứu mối liên hệ giữa các tiêu thức, phải đặt trong
những điều kiện thời gian, không gian khác nhau.
2.2.2.2. Tiêu thức phân tổ và chỉ tiêu giải thích
Khái niệm: Tiêu thức phân tổ là tiêu thức thống kê
được chọn làm căn cứ để phân tổ thống kê.
Ví dụ: Phân tổ dân số theo giới tính thì giới tính là
tiêu thức phân tổ.
Mỗi đơn vị tổng thể đều bao gồm nhiều tiêu thức, tiêu
thức nào cũng có thể dùng để phân tổ được. Tuy nhiên,
mỗi tiêu thức lại có ý nghĩa khác nhau nhưng tiêu thức
phân tổ sẽ phản ánh đúng bản chất của hiện tượng nhất
theo mục đích nghiên cứu.
Với cùng một tài liệu, nếu chọn tiêu thức phân tổ khác
nhau có thể đưa đến kết luận khác nhau. Và nếu chọn
tiêu thức phân tổ không đúng theo mục đích nghiên cứu sẽ dẫn đến nhận xét đánh
giá khác nhau về thực tế của một hiện tượng. Vậy làm thế nào để chọn tiêu thức
phân tổ cho chính xác?
Những căn cứ để lựa chọn tiêu thức phân tổ: Có ba căn cứ sau:
o Phải tiến hành phân tích lý luận kinh tế – xã hội để hiểu được đặc điểm, bản
chất của hiện tượng, từ đó mới chọn ra tiêu thức nói rõ bản chất nhất, phù hợp
với mục đích nghiên cứu để làm tiêu thức phân tổ.
Ví dụ: Để nghiên cứu về mức sống dân cư, ở thành thị chúng ta có thể sử dụng
tiêu thức thu nhập, chi tiêu hay diện tích nhà ở bình quân nhưng nếu nghiên
cứu ở nông thôn, tiêu thức diện tích nhà ở bình quân lại không có ý nghĩa.
o Phải dựa vào điều kiện lịch sử cụ thể của hiện tượng (thời gian và địa điểm cụ
thể) để lựa chọn tiêu thức thích hợp.
Ví dụ: Ngày nay, việc phân tổ các cơ sở sản xuất kinh doanh theo tiêu thức
thành phần kinh tế mới có ý nghĩa; trong thời kỳ trước đổi mới, tiêu thức này là
không phù hợp vì đa phần các cơ sở sản xuất kinh doanh đều thuộc sở hữu của
Nhà nước.
o Tuỳ theo tính chất phức tạp của hiện tượng và mục đích yêu cầu nghiên cứu, có
thể lựa chọn phân tổ theo một hay nhiều tiêu thức khác nhau.
Sau khi đã lựa chọn được tiêu thức phân tổ, người ta còn phải xác định các chỉ
tiêu giải thích để nói rõ đặc trưng của các tổ cũng như của toàn bộ tổng thể.
Mỗi chỉ tiêu giải thích có ý nghĩa quan trọng riêng giúp ta thấy rõ các đặc trưng
số lượng của từng tổ cũng như cả tổng thể, làm căn cứ để so sánh các tổ với
nhau và tính ra các chỉ tiêu khác. Tuy nhiên, cũng không nên đề ra quá nhiều
Bài 2: Quá trình nghiên cứu thống kê
28 v1.0
chỉ tiêu, mà phải lựa chọn một số chỉ tiêu thích hợp nhất đối với mục đích
nghiên cứu.
Ví dụ: Mục tiêu phân tích thực trạng của các doanh nghiệp hiện nay, chúng ta
có thể lựa chọn những chỉ tiêu phản ánh rõ nét thực trạng đó nhất như: qui mô
lao động, qui mô vốn, doanh thu, lợi nhuận...
Sau khi đã chọn được tiêu thức phân tổ, chúng ta tiến hành phân tổ. Nhưng
phân ra thành bao nhiêu tổ là phù hợp?
2.2.2.3. Xác định số tổ
Có các trường hợp sau:
Nếu tiêu thức phân tổ là tiêu thức thuộc tính: Các tổ được hình thành theo các
loại hình khác nhau, tuy nhiên không nhất thiết mỗi loại hình phải hình thành một tổ.
o Trường hợp đơn giản (tiêu thức có ít biểu hiện): Mỗi biểu hiện của tiêu thức có
thể hình thành 1 tổ.
Ví dụ: 2 giới tính, 5 thành phần kinh tế...
o Trường hợp phức tạp (tiêu thức có nhiều biểu
hiện): Ghép một số tổ nhỏ thành tổ lớn tùy theo
đặc điểm hiện tượng và yêu cầu về mức độ chi
tiết khi phân tổ. Cần bảo đảm yêu cầu các tổ
nhỏ được ghép phải giống nhau hoặc gần giống
nhau về đặc điểm và tính chất.
Việc ghép tổ này đạt được hai mục đích, làm cho số tổ ít đi và đảm bảo giữa
các tổ có sự khác nhau về đặc điểm, tính chất.
Ví dụ: Mặc dù chỉ có 5 thành phần kinh tế nhưng theo mục đích nghiên cứu, ta
chỉ cần phân tổ theo 2 thành phần: Nhà nước và ngoài Nhà nước.
Ví dụ: Trong công nghiệp, có thể phân thành 3 nhóm ngành lớn: công nghiệp
khai thác, công nghiệp chế biến và công nghiệp điện, ga, nước.
Ví dụ: Phân chỗ ngồi ở chợ theo các nhóm ngành hàng: hàng khô, hàng rau
quả, hàng thịt,...
Nếu tiêu thức phân tổ là tiêu thức số lượng: Tùy theo số lượng biến của tiêu
thức nhiều hay ít mà có cách giải quyết khác nhau.
o Số lượng các lượng biến ít: Với trường hợp này, lượng biến thay đổi ít, mỗi
lượng biến có thể hình thành nên 1 tổ. Khi đó gọi là phân tổ không có khoảng
cách tổ.
Ví dụ: Phân tổ công nhân doanh nghiệp A theo bậc thợ.
Bậc thợ Số công nhân (người)
1 10
2 20
3 45
4 60
5 35
6 25
7 5
Tổng 200
Bài 2: Quá trình nghiên cứu thống kê
v1.0 29
Trong nhiều trường hợp, với mục đích nghiên cứu khác nhau, tuy số lượng các
lượng biến ít, người ta vẫn ghép một số lượng biến thành 1 tổ.
Ví dụ: Trong nghiên cứu dân số, khi nghiên cứu về qui mô hộ gia đình. Một hộ gia
đình có thể có 1, 2, 3, 4... người. Cùng với sự phát triển của xã hội, qui mô hộ thu
hẹp lại; khi đó làm nảy sinh khái niệm “gia đình hạt nhân” chỉ có bố mẹ và con cái
và “gia đình truyền thống” gồm 3, 4 thế hệ. Ngày nay, số lượng các gia đình hạt
nhân tăng lên, số lượng gia đình truyền thống giảm xuống.
o Số lượng các lượng biến nhiều: phải căn cứ vào quan hệ lượng – chất xem
lượng biến tích lũy đến một mức độ nào đó thì chất thay đổi và làm nảy sinh
một tổ mới. Mỗi tổ sẽ bao gồm 1 phạm vi lượng biến với 2 giới hạn: giới hạn
dưới: lượng biến nhỏ nhất để hình thành tổ; giới hạn trên: lượng biến lớn nhất,
nếu vượt qua giới hạn này thì chất đổi, dẫn đến hình thành 1 tổ mới. Phân tổ
như trên gọi là phân tổ có khoảng cách tổ. Chênh lệch giữa giới hạn trên và
giới hạn dưới gọi là khoảng cách tổ.
h = Giới hạn trên – Giới hạn dưới
Có các trường hợp:
Trường hợp phân tổ có khoảng cách tổ bằng nhau:
Xác định trị số khoảng cách tổ:
max minX Xh
n
Trong đó:
Xmax, Xmin: Lượng biến lớn nhất và nhỏ nhất của tiêu thức nghiên cứu.
n: Số tổ định chia.
Ví dụ: Khi nghiên cứu thu nhập bình quân một tháng (triệu đồng) tại một
phòng giao dịch của Ngân hàng ACB có 20 nhân viên, người ta thu được
kết quả sau:
3,0 4,6 5,8 15,0 6,5
9,0 7,7 9,5 3,4 8,5
5,2 7,0 5,5 11,0 10,0
12,5 8,8 7,5 5,8 8,2
Theo tiêu thức thu nhập bình quân một tháng, người ta muốn chia số nhân
viên nói trên thành 6 tổ có khoảng cách tổ bằng nhau.
Sau khi sắp xếp số liệu theo thứ tự tăng dần, nhận thấy, mức thu nhập thấp
nhất là 3 triệu đồng, mức thu nhập cao nhất là 15 triệu đồng. Khi đó,
khoảng cách tổ sẽ được tính như sau:
15 3h 2
6
(triệu đồng)
Các tổ được thiết lập như sau:
Bài 2: Quá trình nghiên cứu thống kê
30 v1.0
Thu nhập bình quân một tháng
(triệu đồng) Số nhân viên (người)
3 – 5 3
5 – 7 5
7 – 9 6
9 – 11 3
11 – 13 2
13 – 15 1
Tổng 20
Chú ý:
Giới hạn trên của tổ đứng trước được lấy làm giới hạn dưới của tổ đứng sau với mục
đích làm cho dãy số kín hay liên tục.
Khi 1 đơn vị có lượng biến đúng bằng giới hạn trên và giới hạn dưới của 2 tổ liền
nhau thì thường được xếp vào tổ đứng sau.
o Trường hợp phân tổ có khoảng cách tổ không bằng nhau: Dựa vào ý nghĩa kinh
tế – xã hội của hiện tượng mà xác định nội dung và phạm vi của tổ.
Ví dụ: Phân tổ số học sinh của địa phương A theo lớp học như sau:
Lớp Số học sinh
1 – 5 320
6 – 9 270
10 – 12 180
Tổng 770
o Trường hợp phân tổ mở: là trường hợp tổ đầu tiên không có giới hạn dưới hay
tổ cuối cùng không có giới hạn trên.
Ví dụ: Phân tổ các cơ sở sản xuất công nghiệp của địa phương A theo số
lao động:
Số lao động (người) Số cơ sở công nghiệp
20 10
21 – 50 30
51 – 100 20
100 10
Tổng 70
Chú ý:
Quy ước: Khoảng cách tổ của tổ gần nhất được sử dụng làm khoảng cách tổ cho tổ
mở khi xác định trị số giữa.
Sau khi phân tổ hiện tượng nghiên cứu theo một tiêu thức nào đó thì các đơn vị của
hiện tượng được sắp xếp vào các tổ tương ứng với các biểu hiện của tiêu thức mà đơn
vị đó có, khi đó sẽ hình thành nên một dãy số phân phối.
2.2.2.4. Dãy số phân phối
Khái niệm: Dãy số phân phối là một dãy số được lập nên do phân phối các đơn vị
tổng thể vào các tổ theo một tiêu thức phân tổ nào đó và được sắp xếp theo trình tự
biến động của lượng biến tiêu thức phân tổ.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 31
Ví dụ : Các ví dụ nêu trên đều là dãy số phân phối.
Tác dụng của dãy số phân phối
o Cho biết tỉ mỉ, chi tiết tình hình phân phối các đơn vị
của hiện tượng nghiên cứu theo 1 tiêu thức cụ thể.
o Là cơ sở để tiến hành tính toán và phân tích thống kê.
Phân loại dãy số phân phối: Có 2 loại dãy số phân phối
tương ứng với loại tiêu thức phân tổ.
o Dãy số thuộc tính: là kết quả của phân tổ theo tiêu
thức thuộc tính.
o Dãy số lượng biến: là kết quả của phân tổ theo tiêu thức số lượng.
Trong thống kê, người ta thường sử dụng các dãy số lượng biến. Đặc điểm của
dãy số này là các lượng biến bao giờ cũng được sắp xếp theo thứ tự từ nhỏ đến
lớn hoặc ngược lại.
Dạng tổng quát của một dãy số lượng biến:
Lượng biến
xi
Tần số
fi
Tần suất
di
Tần số tích lũy
Si
Tần suất tích lũy
Si’
x1 f1 d1 S1 = f1 S1’= d1
x2 f2 d2 S2 = S1 + f2 S2’= S1’ + d2
xn fn dn Sn = Sn-1 + fn Sn’= Sn-1’ + dn
∑fi ∑di
Trong đó lượng biến xi (i = 1,n ) là các trị số biểu hiện mức độ cụ thể của tiêu
thức số lượng.
Căn cứ vào tính chất liên tục hay không liên tục của lượng biến có thể chia ra:
Lượng biến liên tục: các trị số của nó có thể được biểu hiện bằng số nguyên
hay số thập phân (ví dụ: tiền lương). Khi đó, dãy số lượng biến phải có
khoảng cách tổ.
Lượng biến không liên tục (rời rạc): các trị số của dãy số chỉ có thể biểu
hiện bằng các số nguyên (ví dụ: tuổi). Dãy số lượng biến có thể có hoặc
không có khoảng cách tổ.
Đối với phân tổ có khoảng cách tổ, lượng biến xi là trị số giữa của từng tổ và
được tính:
xi =
Giới hạn dưới + Giới hạn trên
2
Tần số fi (i = 1,n ): Là số lượng biến của từng tổ được sắp xếp vào trong
từng tổ hay là số lần lặp lại của các lượng biến.
∑fi: Tổng số đơn vị trong tổng thể.
Tần suất di (i = 1,n ): Là tỷ trọng từng bộ phận trong tổng thể, là tần số
được biểu hiện bằng số tương đối. Vai trò của fi và di là tương đương nhau,
có thể thay thế cho nhau. Công thức: ii
i
fd =
f (lần, %).
Bài 2: Quá trình nghiên cứu thống kê
32 v1.0
Tần số tích lũy tiến Si (i = 1,n ): Là cộng dồn tần số, có 2 tác dụng: cho biết
số lượng các đơn vị có lượng biến nhỏ hơn hay lớn hơn 1 lượng biến cụ thể
nào đó và cho phép xác định 1 đơn vị đứng ở vị trí nào đó trong dãy số có
lượng biến là bao nhiêu.
Ví dụ: Có tài liệu về NSLĐ của 40 công nhân như sau:
NSLĐ (kg)
(xi)
Số lao động
(người) (fi) di (%) Si
50 3 7,5 3
55 5 12,5 8
60 10 25,0 18
65 12 30,0 30
70 7 17,5 37
72 3 7,5 40
∑ 40 100,0
Si = 18 khi xi = 60: Nó cho biết có 18 người có NSLĐ từ 60 sản phẩm trở
xuống và có 40 – 18 = 22 người có NSLĐ từ 60 sản phẩm trở lên. Vậy người
thứ 20 có NSLĐ là bao nhiêu?
Người thứ 20 nằm trong khoảng 18 – 30 nên có NSLĐ là 65 sản phẩm.
Tần suất tích lũy tiến iS (i = 1,n ): là cộng dồn tần suất.
Mật độ phân phối (mi): Trong dãy số lượng biến có các tổ với khoảng cách
tổ không bằng nhau thì tần số trong các khoảng cách tổ không trực tiếp so
sánh với nhau được, vì các tần số đó phụ thuộc vào trị số khoảng cách tổ.
Để có thể so sánh được các tần số đó, người ta tính mật độ phân phối là tỷ
số giữa tần số (hoặc tần suất) với trị số khoảng cách tổ.
i
i
i
fm
h
Sau khi phân tổ thống kê, để tài liệu phát huy hết tác dụng trong phân tích thì
phải trình bày kết quả phân tổ sao cho thuận tiện, dễ sử dụng, đảm bảo mỹ quan.
Khi đó, người ta thường sử dụng bảng thống kê và đồ thị thống kê.
2.2.3. Bảng thống kê và đồ thị thống kê
2.2.3.1. Bảng thống kê
Khái niệm: Bảng thống kê là hình thức biểu hiện
các tài liệu thống kê một cách có hệ thống, hợp lý
và rõ ràng nhằm nêu lên các đặc trưng về lượng
của hiện tượng nghiên cứu.
Ý nghĩa: Trong bảng thống kê có những con số bộ
phận và con số chung có liên quan mật thiết tới
nhau do đó bảng thống kê phản ánh đặc trưng cơ
bản của từng tổ và của cả tổng thể.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 33
Tác dụng: Giúp tiến hành so sánh, phân tích, đối chiếu và nghiên cứu số liệu
thống kê theo các phương pháp khác nhau.
Cấu thành bảng thống kê
o Theo hình thức:
Hàng ngang, cột dọc phản ánh quy mô của bảng.
Tiêu đề phản ánh nội dung của bảng, gồm: Tiêu đề chung: nội dung chung của
cả bảng thống kê. Tiêu đề nhỏ (tiêu mục): nội dung từng bộ phận trong bảng.
Các tài liệu và con số: Phản ánh đặc trưng về lượng của hiện tượng nghiên cứu.
o Theo nội dung:
Phần chủ đề (chủ từ): Giải thích đối tượng nghiên cứu gồm những đơn vị
nào, loại hình nào, thuộc cột trái.
Phần giải thích (tân từ): Gồm các chỉ tiêu giải thích đặc điểm của từng đối
tượng, thuộc cột phải.
Tên bảng thống kê (tiêu đề chung)
Đơn vị tính:
Các chỉ tiêu giải thích
1 2 n
Tổng số
Tên chủ đề
Tổng số
Các loại bảng thống kê:
o Bảng giản đơn: phần chủ đề không phân tổ mà chỉ liệt kê các đơn vị theo tên
địa phương, thời gian
o Bảng phân tổ: đối tượng nghiên cứu ở phần chủ đề được phân chia thành các tổ
theo 1 tiêu thức.
o Bảng kết hợp: đối tượng nghiên cứu ở phần chủ đề được phân chia thành các tổ
theo 2, 3 hay nhiều tiêu thức.
Những yêu cầu đối với việc xây dựng bảng thống kê:
o Quy mô của bảng không nên quá lớn. Nếu bảng thống kê mà có quá nhiều
hàng, nhiều cột, nên tách thành 2 hoặc 3 bảng nhỏ hơn.
o Các tiêu đề, tiêu mục cần chính xác, gọn gàng, dễ hiểu.
o Các hàng, cột cần được ký hiệu.
o Các chỉ tiêu giải thích cần được sắp xếp hợp lý, phù hợp với mục đích nghiên
cứu.
o Phải có đơn vị tính cụ thể cho từng chỉ tiêu hoặc cho cả bảng.
o Cách ghi số liệu vào bảng thống kê:
“–”: Không có số liệu.
“”: Số liệu thiếu sẽ bổ sung sau.
“x”: Không có liên quan, nếu viết số liệu sẽ vô nghĩa.
Phần giải
thích Phần
chủ đề
Bài 2: Quá trình nghiên cứu thống kê
34 v1.0
Các số liệu phải ghi theo độ chính xác như nhau (bao nhiêu số thập phân
sau dấu phẩy theo nguyên tắc làm tròn số).
o Phải có phần ghi chú ở cuối bảng để giải thích nội dung một số chỉ tiêu (nếu
cần) hoặc ghi nguồn số liệu (nếu có).
Bên cạnh bảng thống kê, còn một công cụ nữa cũng rất hay được sử dụng trong trình
bày số liệu thống kê, đó là đồ thị thống kê.
2.2.3.2. Đồ thị thống kê
Khái niệm: Đồ thị thống kê là các hình vẽ hay đường nét để miêu tả có tính chất
quy ước các tài liệu thống kê.
Đặc điểm: Khác với bảng thống kê, đồ thị thống kê sử dụng con số kết hợp với
hình vẽ, đường nét và màu để trình bày các đặc trưng về số lượng của hiện tượng
nghiên cứu hay trình bày khái quát các đặc điểm chủ yếu về bản chất và xu hướng
phát triển của hiện tượng.
Tác dụng: Đồ thị thống kê có hai tác dụng sau:
o Hình tượng hóa sự phát triển kết cấu, mối quan hệ so sánh hay mối liên hệ giữa
các bộ phận trong tổng thể hoặc giữa các tiêu thức với nhau, giúp người đọc
nắm được đặc điểm cơ bản của hiện tượng một cách dễ dàng, nhanh chóng.
o Là phương tiện để tuyên truyền, biểu dương kết quả của hoạt động sản xuất
kinh doanh cũng như các hoạt động xã hội.
Các loại đồ thị thống kê
o Theo hình thức biểu hiện:
Biểu đồ hình cột.
Biểu đồ diện tích.
Biểu đồ tượng hình.
Các loại đồ thị, đường gấp khúc.
Các loại bản đồ thống kê.
o Theo nội dung phản ánh:
Đồ thị so sánh.
Đồ thị kết cấu.
Đồ thị phát triển.
Đồ thị biểu thị mối liên hệ.
Những yêu cầu chung đối với việc xây dựng đồ thị
o Lựa chọn loại đồ thị phù hợp với nội dung, tính chất của số liệu cần diễn đạt.
o Quy mô đồ thị phải vừa phải tuỳ theo mục đích sử dụng.
o Các thang đo tỷ lệ và độ rộng của đồ thị phải được xác định chính xác.
o Phần giải thích tên đồ thị, các con số và ghi chú dọc theo thang đo tỷ lệ, các
con số bên cạnh từng bộ phận của đồ thị, giải thích các ký hiệu qui ước... cần
được ghi rõ, ngắn gọn và dễ hiểu.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 35
2.2.4. Một số vấn đề chủ yếu của tổng hợp thống kê
Xác định được mục đích của tổng hợp: Nhằm khái quát hoá những đặc trưng hoặc
những cơ cấu tồn tại khách quan theo các mặt của tổng thể bằng các chỉ tiêu thống kê.
Kiểm tra tài liệu tổng hợp: Thường gọi là làm sạch dữ liệu, gồm:
o Kiểm tra phát hiện tiêu thức bị lỗi trong bảng hỏi.
o Đánh dấu lỗi phát hiện được và đánh dấu phiếu có mắc lỗi.
o Hiệu đính.
Xác định phương pháp tổng hợp: Gồm 3 phương pháp:
o Sắp xếp số liệu và phân tổ thống kê.
o Bảng thống kê.
o Đồ thị thống kê.
Chuẩn bị tài liệu dùng để tổng hợp
o Đóng các câu hỏi mở: đọc nhiều phiếu để đưa ra các nhóm ý kiến và mã hoá
các ý kiến trả lời.
o Lượng hoá các biểu hiện của tiêu thức thuộc tính thông qua các thang đo (mã
hoá số liệu: là việc thay thế một giá trị thông tin bằng lời của tiêu thức nào đó
bằng các con số quy ước).
Sau khi đã có kết quả tổng hợp dưới dạng các bảng biểu, đồ thị..., chúng ta bước sang
giai đoạn phân tích và dự đoán.
2.3. Phân tích và dự đoán thống kê
2.3.1. Khái niệm chung về phân tích và dự đoán thống kê
2.3.1.1. Khái niệm
Phân tích và dự đoán thống kê là nêu lên một cách tổng hợp bản chất cụ thể và tính
quy luật của các hiện tượng và quá trình kinh tế xã hội trong điều kiện nhất định qua
biểu hiện bằng số lượng và tính toán các mức độ trong tương lai, nhằm đưa ra những
căn cứ cho quyết định quản lý.
Thế nào là điều kiện nhất định? Tùy thuộc vào tính
chất, đặc điểm cũng như xu hướng phát triển của
hiện tượng đã được phân tích trong quá khứ để có
căn cứ sử dụng mô hình dự đoán thích hợp.
Thế nào là biểu hiện bằng số lượng? Tất cả các xu
hướng phát triển của hiện tượng đều phải được
lượng hóa bằng con số. Từ đó, nói lên bản chất và
quy luật vận động của hiện tượng, đồng thời làm cơ
sở lượng hóa, tìm hiểu sự biến động của hiện tượng trong tương lai.
2.3.1.2. Ý nghĩa và nhiệm vụ của phân tích và dự đoán thống kê
Đây là khâu cuối cùng của quá trình nghiên cứu thống kê. Nó biểu hiện tập trung kết
quả của toàn bộ quá trình nghiên cứu thống kê. Qua đó, ta có thể nêu rõ bản chất và tính
quy luật của hiện tượng. Trên cơ sở đó, dự đoán được sự phát triển của hiện tượng trong
tương lai.
Bài 2: Quá trình nghiên cứu thống kê
36 v1.0
Phân tích, dự đoán thống kê không chỉ có ý nghĩa nhận thức mà còn góp phần cải tạo
hiện tượng: đưa ra các quyết định quản lý tác động đối với hiện tượng nhằm thúc đẩy
sự phát triển của hiện tượng theo qui luật.
Ví dụ: Dân số nước ta đông và xếp hạng 13 trên thế giới, từ đó đưa ra giải pháp là
chính sách sinh đẻ có kế hoạch.
2.3.2. Các yêu cầu trong phân tích và dự đoán thống kê
Phải dựa trên cơ sở phân tích lý luận kinh tế xã hội để từ đó hiểu rõ được đặc
điểm, bản chất của hiện tượng nghiên cứu. Khi đó, mới lựa chọn ra những chỉ tiêu
phân tích phù hợp.
Phải dựa vào tài liệu đã điều tra và tổng hợp được (dựa vào tình hình thực tế) để
tiến hành tính toán và phân tích.
Tuỳ thuộc vào mục đích phân tích cụ thể và đặc điểm của hiện tượng nghiên cứu
mà sử dụng các phương pháp phân tích cho phù hợp.
2.3.3. Một số vấn đề chủ yếu của phân tích và dự đoán thống kê
Xác định nhiệm vụ cụ thể của phân tích thống kê,
tức là phân tích đó nhằm giải quyết vấn đề gì.
Lựa chọn và đánh giá tài liệu dùng để phân tích.
Tính toán các chỉ tiêu cần thiết để phân tích.
So sánh đối chiếu các chỉ tiêu, từ đó phát hiện ra vấn
đề tồn tại trong bản thân hiện tượng nghiên cứu.
Dự đoán về mức độ của hiện tượng trong tương lai.
Kết luận những vấn đề đã được phân tích và đưa ra giải pháp.
Bài 2: Quá trình nghiên cứu thống kê
v1.0 37
TÓM LƯỢC CUỐI BÀI
Một quá trình nghiên cứu thống kê gồm có 3 giai đoạn chính: điều tra thống kê – tổng hợp
thống kê – phân tích và dự đoán thống kê.
Điều tra thống kê là việc tổ chức thu thập tài liệu về các hiện tượng và quá trình kinh tế –
xã hội một cách khoa học, theo một kế hoạch thống nhất. Tính khoa học và thống nhất này
được thể hiện rất rõ trong phương án điều tra thống kê.
Có các loại điều tra thống kê khác nhau tuỳ theo cách phân loại: điều tra thường xuyên và
điều tra không thường xuyên; điều tra toàn bộ và điều tra không toàn bộ. Trong điều tra
không toàn bộ, tuỳ theo cách chọn đơn vị điều tra mà có 3 loại điều tra không toàn bộ khác
nhau: điều tra chọn mẫu, điều tra trọng điểm và điều tra chuyên đề. Có hai hình thức tổ chức
điều tra thống kê khác nhau: báo cáo thống kê định kỳ và điều tra chuyên môn. Các loại điều
tra này thường sử dụng phương pháp thu thập thông tin trực tiếp hoặc gián tiếp. Mặc dù được
thực hiện rất khoa học nhưng trong điều tra thống kê vẫn tồn tại hai loại sai số thống kê: sai
số do ghi chép tài liệu và sai số do tính chất đại biểu.
Sau khi kết thúc điều tra, chúng ta thu được một số lượng lớn các tài liệu ở dạng thô. Công
việc tiếp theo là phải tổng hợp những tài liệu đó lại để tìm ra các đặc trưng của hiện tượng
làm cơ sở cho quá trình phân tích thống kê. Tổng hợp thống kê là tiến hành tập trung chỉnh lý
và hệ thống hóa một cách khoa học toàn bộ tài liệu thu thập được trong điều tra thống kê.
Có 3 phương pháp tổng hợp: phân tổ thống kê, bảng thống kê và đồ thị thống kê. Trong đó,
phân tổ thống kê theo một tiêu thức nào đó là phương pháp chủ yếu nhất. Kết quả của phân tổ
thống kê sẽ cho một dãy số phân phối – được sử dụng trong giai đoạn phân tích và dự đoán
thống kê.
Phân tích và dự đoán thống kê là nêu lên một cách tổng hợp bản chất và tính quy luật của các
hiện tượng và quá trình kinh tế xã hội trong điều kiện nhất định qua biểu hiện bằng số lượng
và tính toán các mức độ trong tương lai, nhằm đưa ra những căn cứ cho quyết định quản lý.
Bài 2: Quá trình nghiên cứu thống kê
38 v1.0
CÂU HỎI ÔN TẬP
1. Điều tra thống kê là gì? Ý nghĩa và các yêu cầu của điều tra thống kê.
2. Trình bày các loại điều tra thống kê. Phân biệt các loại điều tra thống kê.
3. Phương án điều tra thống kê là gì? Trình bày các nội dung cơ bản của phương án điều tra
thống kê.
4. Thế nào là sai số thống kê? Có những loại sai số thống kê nào?
5. Tổng hợp thống kê là gì? Ý nghĩa, nhiệm vụ của tổng hợp thống kê?
6. Phân tổ thống kê là gì? Vai trò của phân tổ trong nghiên cứu thống kê?
7. Trình bày các loại phân tổ thống kê.
8. Trình bày khái niệm, tác dụng và các loại bảng thống kê, các yêu cầu khi xây dựng bảng
thống kê.
9. Trình bày khái niệm, tác dụng và các loại đồ thị thống kê, các yêu cầu khi xây dựng đồ thị
thống kê.
10. Phân tích và dự đoán thống kê là gì? Ý nghĩa, nhiệm vụ và các yêu cầu của phân tích và dự
đoán thống kê?
Bài 2: Quá trình nghiên cứu thống kê
v1.0 39
BÀI TẬP
1. Từ điều tra tiêu dùng năng lượng ở Mỹ, người ta thu được một tập hợp số liệu về tiêu dùng
năng lượng trong 1 năm (triệu BTU) của 50 hộ gia đình ở miền Nam nước Mỹ, như sau:
130 55 54 64 145 66 60 80 102 62
58 101 75 111 141 139 81 55 66 90
97 77 51 67 125 50 136 55 83 91
54 86 100 78 93 113 111 104 96 113
96 87 129 109 60 94 99 97 83 97
Hãy xây dựng bảng tần số phân bố và tính tần suất. Sử dụng khoảng cách tổ là 10.
2. Khi điều tra về lượng sắt dung nạp tính theo mg trong 24 giờ của một mẫu gồm 45 phụ nữ,
người ta thu được kết quả như sau:
15,0 18,1 14,4 14,6 10,9 18,1 18,2 18,3 15,0
16,0 12,6 16,6 20,7 19,8 11,6 12,8 15,6 11,0
15,3 9,4 19,5 18,3 14,5 16,6 11,5 16,4 12,5
14,6 11,9 12,5 18,6 13,1 12,1 10,7 17,3 12,4
17,0 6,3 16,8 12,5 16,3 14,7 12,7 16,3 11,5
a) Hãy xây dựng dãy số phân phối về hàm lượng sắt dung nạp. Sử dụng các khoảng cách
tổ bằng nhau, bắt đầu từ tổ 6 – 8.
b) Theo khuyến nghị của Uỷ ban dinh dưỡng và lương thực thuộc Viện khoa học quốc gia
Mỹ thì hàm lượng sắt cho phép dung nạp hàng ngày của phụ nữ dưới 51 tuổi là không
vượt quá 18mg. Vậy với mẫu ở trên, có bao nhiêu phần trăm số phụ nữ đã dung nạp quá
mức lượng sắt cho phép.
3. Bảng điểm của các sinh viên tham gia kỳ thi môn thống kê như sau:
88 82 89 70 85
63 100 86 67 39
90 96 76 34 81
64 75 84 89 96
a) Xây dựng bảng tần số phân bố về điểm của sinh viên với các tổ có khoảng cách tổ là 10.
b) Vẽ biểu đồ tần số và biểu đồ tần suất.
c) Vẽ đồ thị tần số và tần số tích luỹ.
4. Bảng tần số dưới đây cho biết số ngày đến hạn phải thanh toán của 40 khoản đầu tư ngắn hạn.
Số ngày đến hạn thanh toán Số khoản đầu tư ngắn hạn
30 – 40 3
40 – 50 1
50 – 60 8
60 – 70 10
70 – 80 7
80 – 90 7
90 – 100 4
Tổng 40
Bài 2: Quá trình nghiên cứu thống kê
40 v1.0
a) Tính tần suất của bảng trên.
b) Hãy cho biết khoản đầu tư thứ 23 có số ngày đến hạn phải thanh toán là bao nhiêu?
c) Có bao nhiêu khoản đầu tư có số ngày phải thanh toán dưới 70 ngày.
d) Vẽ đồ thị biểu diễn mối liên hệ trên.
5. Người chiến thắng trong cuộc thi sắc đẹp ở một trường đại học trong thời gian từ 1993 –
2008 có nguồn gốc từ các địa phương sau:
Quê quán Số người
Thái Nguyên 2
Hải Dương 4
Hà Nội 7
Lai Châu 1
Cao Bằng 11
Nam Định 1
a) Tính tần suất của số liệu trên.
b) Vẽ biểu đồ hình cột (bar chart) cho tần suất.
c) Vẽ biểu đồ hình bánh (pie chart) cho tần suất.
Các file đính kèm theo tài liệu này:
- 05_sta302_bai_2_v1_0_694.pdf