Phương pháp nghiên cứu khoa học - Cách tính cỡ mẫu
Sau đó chọn Samle size bằng cách dùng chuột hay nhấn Alt-S rồi di chuyển con trỏ vào sample size rổi nhấn .
Chương trình Epi Info cho phép tính cỡ mẫu trong 4 trường hợp: Ước lượng một tỉ lệ (single proportion); So sánh 2 tỉ lệ trong hai nhóm (Two proportions); Nghiên cứu đoàn hệ (cohort study) và nghiên cứu bệnh chứng (Case-control study). Chọn loại thích hợp bằng cách di chuyển trỏ rồi nhấn . Khi đó màn hình sẽ hiện lên một cửa số có nhiều trường. Trong cửa số này chúng ta có thể di chuyển con trỏ giữa các trường bằng cách nhấn phím hoặc phím . Nhập các giả định cần thiết vào các trường thích hợp. Di chuyển con trỏ đến ô Calculate, nhấn để xem kết quả tính toán.
Lưu ý: Trong cách tính cỡ mẫu ước lượng một tỉ lệ, chúng ta thấy có một tham số Design effect. Tham số dùng để điều chỉnh nếu chúng ta lấy mẫu theo cụm. Do đó nếu ta lấy mẫu ngẫu nhiên đơn thì Design effect=1. Nếu chúng ta lấy mẫu theo cụm thì tham số này sẽ lớn hơn 1 và độ lớn cụ thể thì phụ thuộc vào mức độ không đồng nhất giữa các cụm.
Nếu chúng ta lấy mẫu theo cụm thì chọn Design effect là bao nhiêu? Thông thường chúng ta có thể tham khảo các nghiên cứu trước hoặc làm nghiên cứu pilot để xác định mức độ không đồng nhất. Nếu chúng ta có kinh nghiệm chúng ta có thể dùng trực giác để phán đoán design effect. Nếu chúng ta không có kinh nghiệm, không tìm được tài liệu tham khảo và không thể tiến hành nghiên cứu pilot, chúng ta chọn Design effect = 2 để có cỡ mẫu đảm bảo an toàn (Design effect hiếm khi nào lớn hơn 2).
8 trang |
Chia sẻ: huyhoang44 | Lượt xem: 1047 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Phương pháp nghiên cứu khoa học - Cách tính cỡ mẫu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Cách tính cỡ mẫu
Mục tiêu
Sau khi nghiên cứu bài này, hội thảo viên có khả năng:
(i) Hiểu được hai cách tiếp cận trong cách tính cỡ mẫu, bao gồm khái niệm về năng lực nghiên cứu
(ii) Biết được những yếu tố nào ảnh hưởng đến việc tính toán cỡ mẫu và ảnh hưởng như thế nào
(iiI) Biết được cách tính cỡ mẫu cho những tình huống khác nhau
(iv) Biết được ảnh hưởng của cỡ mẫu lên những khía cạnh thiết kế khác.
(v) Ðánh giá được những vấn đề khác của cỡ mẫu
Giới thiệu
Cỡ mẫu sẽ có ảnh hưởng lớn đến độ chính xác của ước lượng thống kê. Từ định lí giới hạn trung tâm chúng ta hi vọng rằng con số trung bình được ước lượng từ một mẫu sẽ tập trung tại trung bình của dân số đó. Tuy vậy chúng ta cũng biết rằng con số ước lượng sẽ không chính xác bằng trung bình của dân số đó mà mức độ phân tán phụ thuộc vào cỡ mẫu: Nếu cỡ mẫu nhỏ độ phân tán lớn, nếu cỡ mấu lớn thì độ phân tán nhỏ và ta hi vọng số trung bình của mẫu sẽ bằng trung bình của dân số. Người ta có thể trình bày mức độ phân tán theo khoảng tin cậy 95%. Nếu độ phân tán lớn thì khoảng tin cậy 95% sẽ rộng và chúng ta khó lòng thực sự biết được trung bình của dân số sẽ nằm ở đâu trong khoảng này. Nói rộng ra, nếu cỡ mẫu nhỏ chúng ta không thể ước lượng một cách chính xác, chúng ta không thể chứng minh sự khác biệt giữa hai nhóm là không có ý nghĩa.
Vấn đề xác định cỡ mẫu trong nghiên cứu khoa học là một vấn đề quan trọng. Nếu chúng ta lấy mẫu quá nhỏ, đến giai đoạn phân tích ta có thể thấy được điều đó qua sự không chính xác của uớc lượng, sự thất bại trong chứng minh giả thuyết. Tuy vậy khi chúng ta đã đi vào giai đoạn phân tích số liệu thì lúc đó là quá chậm trễ để có thể thay đổi được cỡ mẫu. Ngược lại nếu chúng ta lấy một cỡ mẫu quá lớn thì chúng ta rõ ràng lãng phì tiền bạc và thời gian.
Hai cách tiếp cận trong tính cỡ mẫu
Trên cơ bản có hai cách tiếp cận trong tính cỡ mẫu:
(a) dựa tên sự ước lượng của một tỉ lệ, một trung bình, hiệu số, nguy cơ tương đối với một mức độ chính xác nhất định. Thí dụ, để ước lượng tỉ leẹ trẻ em trong lứa từ 12-23 tháng tuổi được tiêm chủng đầy đủ (với độ chính xác) trong vòng 10%. Câu hỏi chìa khóa của cách tiếp cận này là khoảng tin cậy sẽ là bao nhiêu?
(b) Dựa trên kiểm định giả thuyết. Thí dụ,so sánh thời gian bú sữa mẹ hoàn toàn ở 2 nhóm có giáo dục sức khỏe và nhóm chứng.Câu hỏi chìa khóa trong cách tiếp cận này là xác suất kết luận sai lầm trong kiểm định giả thuyết là bao nhiêu?
Ước lượng một hậu quả với một độ chính xác nhất định
Ðộ chính xác của một ước lượng (với khoảng tin cậy 95%) = d có nghĩa là sai số tối đa của ước lượng là d (với độ tin cậy 95% hay xác suất điều trên không bị sai là 95%)
Công thức tính cỡ mẫu để ước lượng khoảng tin cậy (1-a) của một tỉ lệ p với sai số d là như sau:
Một thắc mắc hay nẩy sinh trong khi nghiên cứu công thức này là trong khi chúng ta muốn nghiên cứu ước lượng p nhưng trong khi tính toán để tính cỡ mẫu chúng ta phải có giá trị của tỉ lệ p! Toàn bộ logic của vấn đề là ở chỗ chúng ta có thể ước lượng p trước lúc nghiên cứu một cách không chính xác, sau nghiên cứu chúng ta có thể ước lượng p một cách chính xác hơn nhiều. Ta có thể ước lượng p sử dụng phán đoán của chúng ta, sử dụng những nghiên cứu trước đó, có thể tiến hành nghiên cứu dẫn đường. Trong trường hợp chúng ta không thể ước đoán p, ta có thể ước đoán p =0,5, một ước đoán an toàn nhất và sẽ cho một cỡ mẫu an toàn nhất (lớn nhất).
Không có quy tắc cứng nhắc độ chính xác d, điều này phụ thuộc vào mục đích của nghiên cứu và vào tài nguyên hiện có.
Lưu ý:
- Công thức được trình bày là dành cho phép lấy mẫu ngẫu nhiên đơn. Nếu nghiên cứu sử dụng phương pháp lấy mẫu cụm cần phải hiệu chỉnh tác động làm giảm độ chính xác của việc chọn cụm bằng cách tăng cỡ mẫu. Cỡ mẫu trong nghiên cứu lấy mẫu cụm thường được nhân lên với một hệ số (được gọi là hệ số thiết kế) có giá trị từ 2 đến 4. Hệ số thiết kế có thể tính được từ việc nghiên cứu thử. Nếu không có điều kiện tính hệ số thiết kế có thể chọn hệ số thiết kế là 3.
- Công thức tính cỡ mẫu trên là dành lấy mẫu từ một dân số vô hạn hay khá lớn. Nếu cỡ mẫu vào khoảng từ 10% dân số trở lên, ta có thể điều chỉnh để có cỡ mẫu nhỏ hơn.
Với N là cỡ mẫu chưa hiệu chỉnh, P là kích thước của dân số đích và Nhc là cỡ mẫu sau khi đã hiệu chỉnh.
- Chúng ta cũng nên phải trù liệu cho những số liệu bị mất, những trường hợp từ chối nghiên cứư bằng cách tăng cỡ mẫu.
Kiểm định một giả thuyết, so sánh 2 nhóm
Giả sử chúng ta muốn so sánh hai tỉ lệ (thí dụ tỉ lệ trẻ em được bú sữa non trong hai nhóm bà mẹ: một nhóm được giáo dục sức khỏe và một nhóm không). Chúng ta có thể kiểm định xem hai tỉ lệnày có khác nhau đáng kể hay không, nói cách khác kiểm định xem hiệu số của hai tỉ lệ này có khác một cách có ý nghĩa với zero khay không. Sau khi tiến hành phân tích chúng ta có thể bác bỏ hay không bác bỏ giả thuyết này. Về phương diện thống kê, dù khi chúng ta bác bỏ hay không bác bỏ, chúng ta đều có khả năng bị sai lầm: sai lầm mà chúng ta mắc phải khi bác bỏ giả thuyết được gọi là sai lầm loại I, sai lầm chúng ta mắc phải khi không bác bỏ được gọi là sai lầm loại II.
Khi kiểm định H0: Không có sự khác biệt (p1=p2; OR=1 ; RR=1 ; b=0)
Chân lí là Ho đúng
(Không có sự khác biệt)
Chân lí là Ha đúng
(Không có sự khác biệt)
Bác bỏ giả thuyết H0
Sai lầm loại 1
(Xác suất = a)
Kết luận đúng
(Xác suất = 1-b =
Power của nghiên cứu)
Không bác bỏ giả thuyết H0
Kết luận đúng
(Xác suất = 1-a)
Sai lầm loại II
(Xác suất = b)
Lí tưởng, chúng ta muốn giảm thiểu cả hai loại sai lầm trong nghiên cứu. Lưu ý rằng chúng ta đã định nghĩa cái gọi là năng lực (power) của nghiên cứu=1-sai lầm loại II. Năng lực là xác suất đạt được kết quả có ý nghĩa thống kê nếu thực sự có sự khác biệt giữa p1 và p2. Mục tiêu của chúng ta khi chọn cỡ mẫu là nếu có sự khác biệt về lâm sàng quan trọng giữa hai nhóm, chúng ta có cơ hội tốt để tìm thấy sự khác biệt có ý nghĩa thống kê trong 2 nhóm. Ðiều này là một ý niệm hết sức quan trọng trong thiết kế nghiên cứu và lí giải. Nếu trong giai đoạn phân tích nếu kết quả là có ý nghĩa thống kê, thì hầu hết mọi người đều thỏa mãn. Mặt khác nếu kết quả không có ý nghĩa thông kê thì điều này có thể xảy ra do (a) không có sự khác biệt thực sự giữa hai nhóm và (b) có sự khác biệt nhưng mẫu của chúng ta không cho thấy sự khác biệt bởi vì năng lực của mẫu thấp (cỡ mẫu nhỏ) do đó chúng ta không có kết luận rõ ràng. Do đó, nếu chúng ta chọn mẫu để có năng lực cao và kết quả không có ý nghĩa thống kê thì chúng ta có thể chắc hơn về sự khác biệt.
Ðể chọn cỡ mẫu (trong trường hợp cỡ mẫu của 2 nhóm so sánh bằng nhau), chúng ta phải có 4 tham số
- Sai lầm loại I hay còn gọi là mức ý nghĩa mà chúng ta muốn có trong nghiên cứu (thường là 5%)
- Sai lầm loại II chúng ta muốn có trong nghiên cứu (Sai lầm loại hai khoảng 10-20% tương ứng với năng lực từ 80-90%)
- Tỉ lệ trong một nhóm cơ bản (thí dụ tỉ lệ tiếp xúc với yếu tố nguy cơ trong nhóm chứng của một nghiên cứu bệnh chứng)
- Tỉ lệ trong một nhóm khác (thí dụ tỉ lệ tiếp xúc với yếu tố nguy cơ trong nhóm bệnh của một nghiên cứu bệnh chứng). Đôi khi chúng ta không trình bày tỉ lệ của nhóm này một cách cụ thể mà trình bày nguy cơ tương đối hay tỉ số số chênh mà chúng ta mong muốn phát hiện trong một nghiên cứu đoàn hệ hay nghiên cứu bệnh chứng.
Công thức tính cỡ mẫu (cho mỗi nhóm) để so sánh hai tỉ lệ p1 và p2 của hai nhóm:
Các điểm cần lưu ý trong tính cỡ mẫu
- Như đã nói ở trên, cách tính cỡ mẫu chỉ cho chúng ta một ước lượng thô của cõ mẫu cần thiết bởi vì nó dựa trên sự ước đoán về giá trị của thông số, quyết định chủ quan của chúng ta về hậu quả mà chúng ta muốn phát hiện và công thức được sử dụng là công thức gần đúng. Do đó con số tính ra giúp chúng ta phân biệt giữa cỡ mẫu 50 và 100 chứ không phân biệt cỡ mẫu 50 và 53.
- Chúng ta phải cân đối giữa điều chúng ta mong muốn và tính khả thi. Ðôi khi có thể dùng công thức tính cỡ mẫu để đi ngược lại năng lực của nghiên cứu. Thí dụ nếu chúng ta có một kinh phí hạn chế để thực hiện một nghiên cứu nên chỉ có một cỡ mẫu nhất định. Chúng ta có thể tính ngược lại từ cỡ mẫu để biết năng lực của nghiên cứu. Nếu hóa ra năng lực của nghiên cứu rất thấp (thí dụ như 20%) tốt nhất chung ta không nên tiến hành nghiên cứu vì chúng ta đã nắm chắc kết quả thất bại.
- Nếu một nghiên cứu có nhiều mục tiêu thì cỡ mẫu đủ cho một mục tiêu này có thể không đủ cho mục tiêu khác. Ðể tính cỡ mẫu, tốt nhất phải chú trọng vào biến số (hoặc những biến số quan trọng nhất).
- Tính cỡ mẫu không khó, cái khó là phải cung cấp những giả định của nghiên cứu: sai lầm loại một, năng lực, sự khác biệt mà chúng ta muốn phát hiện.
Tính cỡ mẫu bằng phần mềm Epi Info:
Ðầu tiên ta vào phần mềm Epitable bằng 1 trong 2 cách (giả sử thư mục chứa Epi Info trong là c:\epi6)
- Vào trực tiếp:
c:\>c:\epi6\epitable
- Thông qua trình đơn chính của epi6
c:\>c:\epi6\epi6
Khi đã vào trình đơn chính của Epi6 chọn program Epitable trong trình đơn Programs bằng cách dùng chuột hoặc nhấn Alt-P rồi kéo con trỏ xuống EPITABLE Calculator rồi nhấn
_ Describe Compare Study Sample Probability Setup
_____________________________ +----------------------+ _________________________
_____________________________ ¦ Sample size > ¦ _________________________
_____________________________ ¦ Power calculation > ¦ _________________________
_____________________________ ¦ Random number table ¦ _________________________
_____________________________ ¦ Random number list ¦ _________________________
_________+------------------- +----------------------+ -------------+___________
_________¦ ¦___________
_________¦ _____¦ _¦ _¦ __¦ __¦ ¦___________
_________¦ _¦ _¦ _¦ _¦ ¦___________
_________¦ _¦ _¦___¦ __¦ ____¦ ___¦ _¦ _¦ ___¦ ¦___________
_________¦ ___¦ _¦ _¦ _¦ _¦ _¦ ____¦ _¦ _¦ _¦ ¦___________
_________¦ _¦ _¦ _¦ _¦ _¦ ____¦ _¦ _¦ _¦ _____¦ ¦___________
_________¦ _¦ ____¦ _¦ _¦_¦ _¦ _¦ _¦ _¦ _¦ _¦ ¦___________
_________¦ _____¦ _¦ ___¦ _¦ ___¦_¦ _¦___¦ ___¦ ___¦ ¦___________
_________¦ ___¦ ¦___________
_________¦ ¦___________
_________+----------------------------------------------------------+___________
________________________________________________________________________________
________________________________________________________________________________
____________________________________________________________________¦¦__________
___________________________________________________________________¦¦¦¦_________
__________________________________________________________________¦¦¦¦¦¦________
_________________________________________________________________¦¦¦¦¦¦¦¦_______
F1-Help F3-Move F4-Zoom F5-Print F6-Next F9-_ F10-Quit Mem:228552
Sau đó chọn Samle size bằng cách dùng chuột hay nhấn Alt-S rồi di chuyển con trỏ vào sample size rổi nhấn .
Chương trình Epi Info cho phép tính cỡ mẫu trong 4 trường hợp: Ước lượng một tỉ lệ (single proportion); So sánh 2 tỉ lệ trong hai nhóm (Two proportions); Nghiên cứu đoàn hệ (cohort study) và nghiên cứu bệnh chứng (Case-control study). Chọn loại thích hợp bằng cách di chuyển trỏ rồi nhấn . Khi đó màn hình sẽ hiện lên một cửa số có nhiều trường. Trong cửa số này chúng ta có thể di chuyển con trỏ giữa các trường bằng cách nhấn phím hoặc phím . Nhập các giả định cần thiết vào các trường thích hợp. Di chuyển con trỏ đến ô Calculate, nhấn để xem kết quả tính toán.
Lưu ý: Trong cách tính cỡ mẫu ước lượng một tỉ lệ, chúng ta thấy có một tham số Design effect. Tham số dùng để điều chỉnh nếu chúng ta lấy mẫu theo cụm. Do đó nếu ta lấy mẫu ngẫu nhiên đơn thì Design effect=1. Nếu chúng ta lấy mẫu theo cụm thì tham số này sẽ lớn hơn 1 và độ lớn cụ thể thì phụ thuộc vào mức độ không đồng nhất giữa các cụm.
Nếu chúng ta lấy mẫu theo cụm thì chọn Design effect là bao nhiêu? Thông thường chúng ta có thể tham khảo các nghiên cứu trước hoặc làm nghiên cứu pilot để xác định mức độ không đồng nhất. Nếu chúng ta có kinh nghiệm chúng ta có thể dùng trực giác để phán đoán design effect. Nếu chúng ta không có kinh nghiệm, không tìm được tài liệu tham khảo và không thể tiến hành nghiên cứu pilot, chúng ta chọn Design effect = 2 để có cỡ mẫu đảm bảo an toàn (Design effect hiếm khi nào lớn hơn 2).
Thí dụ
Thí dụ 1: Cho một nghiên cứu bệnh chứng, sử dụng những giả định sau để tính cỡ mẫu cho từng trường hợp
Năng lực của nghiên cứu = 90%; mức ý nghĩa = 5%; 1 bệnh cho một chứng
% chứng tiếp xúc với yếu tố nguy cơ
OR
5%
20%
50%
70%
90%
1.5
2346
2
244
5
46
10
50
1. Dựa trên phép tính cỡ mẫu hãy đưa ra khuyến cáo khi nào nên dùng nghiên cứu bệnh chứng và khi nào không.
2. Hãy tính cỡ mẫu trong một nghiên cứu bệnh chứng có năng lực =90%, mức ý nghĩa =5% OR= 2 và tỉ lệ tiếp xúc với yếu tố nguy cơ là 30%. Hãy tính cỡ mẫu khi có 1 chứng: 1 bệnh; 2 chứng: 1 bệnh; 3 chứng: 1 bệnh.
Thí dụ 2: Cho một nghiên cứu đoàn hệ, sử dụng những giả định sau để tính cỡ mẫu cho từng trường hợp
Năng lực của nghiên cứu = 90%; mức ý nghĩa = 5%; nhóm có tiếp xúc= nhóm không tiếp xúc
tỉ suất mắc bệnh trong nhóm không tiếp xúc với yếu tố nguy cơ
RR
0,1%
1%
5%
15%
30%
1.5
108,904
2
3300
3
207
5
15
1. Dựa trên phép tính cỡ mẫu hãy đưa ra khuyến cáo khi nào nên dùng nghiên cứu đoàn hệ và khi nào không.
2. Hãy tính cỡ mẫu trong một nghiên cứu bệnh chứng có năng lực =90%, mức ý nghĩa =5% OR= 2 và tỉ suất mắc bệnh là 5%. Hãy tính cỡ mẫu khi có nhóm không tiếp xúc = nhóm tiếp xúc; nhóm không tiếp xúc = 2 nhóm tiếp xúc; nhóm không tiếp xúc = 3 nhóm tiếp xúc
Thí dụ 3: Phòng y tế huyện A. muốn kiểm tra báo cáo về tỉ lệ tiêm chủng của một xã là 80% bằng cách tiến hành một cuộc điều tra (với sai số tuyệt đối dưới 5%, độ tin cậy = 95%). Nếu phòng y tế quyết định chọn mẫu bằng phương pháp chọn mẫu ngẫu nhiên thì cỡ mẫu cần thiết là bao nhiêu? Nếu chọn theo cụm thì cỡ mẫu cần thiết là bao nhiêu?
Các file đính kèm theo tài liệu này:
- phuongphapnghiencuukhoahoc15_cach_tinh_co_mau_0484.doc