Bài giảng Chọn mẫu và cỡ mẫu trong nghiên cứu y học
Một số nguyên tắc tính cỡ mẫu
" Cỡ mẫu chỉ tính cho biến phụ thuộc, trừ
nghiên cứu bệnh chứng.
" Khi 1 nghiên cứu có nhiều biến phụ thuộc
thì phải tính cỡ mẫu cho tất cả các biến,
sau đó chọn cỡ mẫu lớn nhất.
Cỡ mẫu trong nghiên cứu bệnh chứng
- p1: Tỷ lệ phơi nhiễm với yếu tố nguy cơ đợc ớc lợng
cho nhóm bệnh.
- p0: Tỷ lệ phơi nhiễm với yếu tố nguy cơ đợc ớc lợng
cho nhóm chứng (p1 và p0 đợc lấy từ kết quả của
nghiên cứu trớc hoặc nghiên cứu thử).
- ε: %Mức độ chính xác mong muốn (chênh lệch cho phép
giữa tỷ suất chênh (OR) thực của quần thể OR thu
đợc từ mẫu).
Cỡ mẫu trong nghiên cứu thuần tập
p1: Tỷ lệ mắc bệnh đợc ớc lợng trong nhóm tiếp
xúc với yếu tố nguy cơ
p0: Tỷ lệ mắc bệnh đợc ớc lợng cho nhóm không
tiếp xúc với yếu tố nguy cơ. Tỷ lệ p1 và p0 đợc lấy
từ kết quả của NC trớc hoặc NC thử.
ε: Mức độ chính xác mong muốn (chênh lệch cho
phép giữa nguy cơ tơng đối (RR) thực của quần
thể và RR thu đợc từ mẫu).
11 trang |
Chia sẻ: hachi492 | Ngày: 09/02/2022 | Lượt xem: 5 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Chọn mẫu và cỡ mẫu trong nghiên cứu y học, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
12/15/14
1
CHỌN MẪU VÀ CỠ MẪU TRONG
NGHIấN CỨU Y HỌC
PGS.TS. Lưu Ngọc Hoạt
Viện ĐT YHDP và Y tế Cụng cộng
Đại học Y Hà Nội
Mục tiờu bài học
Kết thỳc khúa học, học viờn cú khả năng:
1. Phõn biệt được cỏc phương phỏp chọn mẫu cơ
bản ỏp dụng trong nghiờn cứu khoa học;
2. Nếu được ưu, nhược điểm của từng phương
phỏp chọn mẫu và chỉ định ỏp dụng trong từng
nghiờn cứu cụ thể;
3. Phõn biệt được cỏc loại cụng thức tớnh cỡ mẫu
thường ỏp dụng và cỏc thành phần cơ bản nờu
trong cụng thức tớnh cỡ mẫu.
4. Lựa chọn được cụng thức tớnh cỡ mẫu thớch hợp
cho một nghiờn cứu cụ thể.
Quần thể
Mẫu!
Lựa chọn
ngẫu nhiên!
Ngoại suy
ra quần thể
thông qua
các tham
số mẫu !
Quần thể !
Mẫu!
Lựa chọn
có chủ
đích!
Kết luận về
quần thể
thông qua ý
kiến của các
đối tượng NC !
Định lượng Định tính
(Bao nhiêu? Bằng nào?) Cái gì? Như thế nào? Tại sao?
Khác nhau về chọn mẫu QUẦN THỂ ĐÍCH
Quần thể
nghiờn cứu
Mẫu
Tham số quần thể
(à, σ, P...)
Mẫu xỏc suất
Ngẫu nhiờn đơn
Ngẫu nhiờn hệ thống
Mẫu phõn tầng
Mẫu chựm
Mẫu nhiều bậc
Mẫu khụng xỏc suất
Mẫu kinh nghiệm
Mẫu thuận tiện
Mẫu chỉ tiờu
Mẫu cú mục đớch.
Chọn
mẫu
Ước lượng
• Điểm
• Khoảng
Kiểm định
giả thuyết
Suy luận
thống
kờ(chỉ ỏp
dụng cho
mẫu xỏc
suất với
cỡ mẫu
đủ lớn)
Kết luận ngoại suy
Cỏc test
thống kờ
Gớa trị p
Lựa chọn
Mụ tả cỏc tham số mẫu
(trỡnh bày kết quả nghiờn cứu)
Tham số mẫu
( , s, p...) Biến số
Thống kờ
mụ tả
Thống kờ suy luận Vai trũ của chọn mẫu và cơ mẫu trong NC
12/15/14
2
Mẫu trong nghiên cứu định tính
Quần thể !
Vấn đề !
Mẫu 1 ! Mẫu 4 !
Mẫu 2 ! Mẫu 3 !
Kiểm tra chéo
để hiểu sâu
sắc về vấn đề
và ý kiến của
các đối tượng!
Tại sao?!
Kiểm tra chộo thụng tin bằng cỏc phương
phỏp thu thập số liệu khỏc nhau
Quần thể !
1 vấn đề !
Phỏng!
vấn! Vẽ bản đồ!
Quan sát! Thảo luận!
Kiểm tra tính
trung thực của
thông tin!
Tại sao?!
Các khái niệm liên quan đến quần thể
và mẫu.
" Quần thể đích.
" Quần thể nghiên cứu. !
" Mẫu nghiên cứu. !
" Đơn vị mẫu.
" Đơn vị nghiên cứu.!
" Khung mẫu.
" Một số khái niệm khác.!
Quần thể !
Là 1 tập hợp của nhiều đơn vị hay nhiều
cá thể có cùng 1 đặc trưng nào đó
Quần thể đích !
Là quần thể mà người nghiên cứu muốn
kết luận cho kết quả nghiên cứu của mình
Quần thể nghiên cứu!
Là quần thể mà từ đó 1 mẫu nghiên cứu
được lấy ra.
12/15/14
3
Mẫu nghiên cứu !
Là 1 tập hợp con của 1 quần thể nghiên
cứu.
Có các đặc điểm đại diện cho quần thể
nghiên cứu !
Một mẫu tốt là mẫu có thể cho phép ngoại
suy (ước lượng) các đặc điểm cần quan tâm
của quần thể từ mẫu với độ chính xác và tính
kinh tế cao nhất.
Đơn vị mẫu !
Là 1 tập hợp hay 1 cá thể thuộc quần thể
nghiên cứu mà là cơ sở cho việc chọn mẫu.
Đơn vị nghiên cứu: !
Là chủ thể mà các đo lường, nghiên cứu
triển khai trên chủ thể đó.
Khung mẫu!
Là 1 tập hợp các đơn vị mẫu.
Nó có thể là 1 danh sách hay 1 bản đồ.
được chuẩn bị trước cho một số kỹ thuật
chọn mẫu.
Bốn yêu cầu khi lấy mẫu nghiên cứu. !
Tính đại diện.!
Thực hiện nhanh
Thực thi được.!
Kinh tế !
!
Thiết kế chọn mẫu nghiên cứu ! Bốn tiêu chuẩn khi lấy mẫu nghiên cứu.!
!
Mỗi đơn vị hay cá thể trong quần thể có
cùng cơ hội như nhau được chọn vào
mẫu (same opportunity).
Phương phỏp chọn mẫu cú thể mụ tả
được (describable).
Phương pháp ít có sai số (unbiased).!
Thích hợp với thiết kế nghiên cứu
(appropriate).
12/15/14
4
Hai thiết kế chọn mẫu cơ bản.!
Mẫu xác suất,
Mẫu không xác suất
PP chọn mẫu xác suất chủ yếu:!
1. Ngẫu nhiên đơn.
2. Ngẫu nhiên hệ thống.
3. Ngẫu nhiên phân tầng.
4. Ngẫu nhiên theo chùm.
5. Ngẫu nhiên nhiều giai đoạn
Chọn mẫu theo phương pháp PPS
(Probability Proportionate to Size)
Phân biệt chọn mẫu và phân bổ mẫu
Quần thể
nghiên cứu
(10,000)
Mẫu NC
(500)
Chọn
mẫu
Mẫu NC
(500)
Nhóm
NC (250)
Chứng
(250)
Phân
bổ mẫu
Bài
tập
" Một
người
nghiờn
cứu
muốn
điều
tra
tỡnh
trạng
dinh
dưỡng
của
trẻ
em
dưới
5
tuổi
tại
huyện
A
mà
tại
đú
cú
2
thị
trấn
một
số
xó
miền
nỳi,
một
số
xó
đồng
bằng,
một
số
xó
ven
biển.
Hỏi:
Theo
Anh/Chị
cỏch
chọn
mẫu
nào
là
thớch
hợp
nhất?
Tại
sao?
1. Mẫu ngẫu nhiên đơn (simple random sampling)
Là mẫu mà mỗi cá thể trong quần thể có cùng cơ hội
như nhau được chọn vào mẫu.
Phương pháp:
Quyết định đơn vị mẫu là gì?
Lập danh sách đơn vị mẫu (khung mẫu) và
đánh số từng đơn vị mẫu .
Xác định số đơn vị mẫu cần có.
Xác định một số ngẫu nhiên (= PP ngẫu nhiên)
Lấy đơn vị mẫu có số trùng số ngẫu nhiên
vào mẫu.
Chọn mẫu xác xuất !
12/15/14
5
Sơ đồ chọn mẫu ngẫu nhiên đơn!
Chọn ngẫu nhiên!
Quần thể với cỡ N !
Mẫu với cỡ n
p
s
P!
à !
σ !
X
Vớ dụ về bảng số ngẫu nhiờn
1. Mẫu ngẫu nhiên đơn (tiếp)
Ưu điểm:
Đơn giản, dễ làm.
Có tính ngẫu nhiên và đại diện cao.
Là kỹ thuật chọn mẫu xác suất cơ bản sử
dụng ở các kỹ thuật chọn mẫu khác.
Hạn chế:
Cần cú khung mẫu và đơn vị mẫu
Đơn vị mẫu phõn tỏn nờn phải đi lại nhiều
Do yếu tố may rủi nờn nhiều khi số cỏ thể
chọn vào mẫu khụng đại diện cho dõn số
2. Mẫu hệ thống!
Đơn vị mẫu đầu được chọn ngẫu nhiên. Đơn vị
mẫu tiếp theo được chọn có hệ thống (một khoảng
hằng định theo sau 1 sự bắt đầu ngẫu nhiên)
Phương pháp:
Xác định và đánh số đơn vị mẫu (khung mẫu)
Khoảng cách mẫu k, k = Số cá thể trong quần thể
N/ cỡ mẫu n, (k= N/n).
Đơn vị mẫu đầu tiên (i) nằm giữa 1 và k bằng PP
ngẫu nhiên đơn.
Đơn vị mẫu tiếp theo: Cộng k với đơn vị mẫu đầu
tiên, tiếp tục cho đến khi đủ số mẫu:
i + 1k; i + 2k; i + 3k...
12/15/14
6
Sơ đồ chọn mẫu ngẫu nhiên hệ thống!
Số ngẫu nhiên được
chọn giữa 1 và k
i
i + k
i + 2k
i + 3k
i + (n-1)k
k k k k k k
2. Mẫu hệ thống (tiếp) !
Ưu điểm:
Nhanh và dễ áp dụng.
Không cần có khung mẫu trước.
Đơn giản trong điều kiện thực địa
Hạn chế:
Số liệu có tính chu kỳ, ước tính sẽ hạn
chế.
Đơn vị mẫu không xếp ngẫu nhiên hoặc
trùng với k, thiếu đại diện.
3. Chọn mẫu ngẫu nhiên phân tầng!
• Chia cá thể từ quần thể thành các nhóm được
gọi là tầng (strata) hay lớp (layer) có chung
các đặc điểm và chọn 1 mẫu ngẫu nhiên
trong mỗi tầng.
Phương pháp:
Phân quần thể thành tầng đồng nhất tùy đặc
điểm.
Chọn đơn vị mẫu trong mỗi tầng bằng PP
ngẫu nhiên đơn.
Sơ đồ chọn mẫu phân tầng!
Tất cả
bệnh viện!
B/V lớn! B/V vừa ! B/V nhỏ!
n1 n2 n3
12/15/14
7
3. Chọn mẫu ngẫu nhiên phân tầng (tiếp)!
Ưu điểm:
Dễ phân các tầng với các yếu tố đồng nhất.
Tham số mẫu dễ tính
Có tính đại diện cao
Hạn chế:
Thiếu chính xác khi đơn vị mẫu ít ở mỗi
tầng.
Phải có trước danh sách cá thể mỗi tầng.
4. Mẫu ngẫu nhiên theo chùm!
Một quần thể đã được nhóm thành các chùm theo các
tiêu thức khác nhau, đơn vị mẫu là chùm, từ đó N/C
trên cá thể của chùm đã được chọn ngẫu nhiên.
Phương pháp
Xác định chùm thích hợp.
Lập danh sách chùm (khung mẫu).
Chọn chùm ngẫu nghiên từ danh sách.
Chọn các cá thể bằng 2 cách:
- Lấy tất cả các cá thể (nếu không có danh sách)
của các chùm (chùm 1 bậc)!
- Lập danh sách, chọn cá thể bằng PP ngẫu
nhiên đơn hoặc hệ thống (chùm 2 bậc).!
!
Sơ đồ chọn mẫu chùm !
n1
n2
n3
4. Mẫu ngẫu nhiên theo chùm (tiếp) !
Ưu điểm:
Có thể điều tra phạm vi rộng, phân tán, không
có được danh sách các đơn vị nghiên cứu.
Khung mẫu đơn giản (danh sách các chùm),
dễ lập.
điều tra dễ & nhanh vì đối tượng nghiên cứu
được nhóm lại theo cụm.
Có hiệu quả kinh tế (kinh phí, thời gian).
WHO khuyến cáo dùng trong TCMR, CDD,
lao và sốt rét.
12/15/14
8
4. Mẫu ngẫu nhiên theo chùm (tiếp) !
!
Hạn chế:
Tính chính xác và tính đại diện thấp
Cỡ chùm lớn tính đại diện thấp, đặc biệt
bệnh hiếm.
Số chùm > 30 là tốt nhất.
Khó xác định mối quan hệ căn nguyên
Không phù hợp trong đo lường thay đổi về
tình trạng SK, dịch vụ y tế, nguồn lực...
Phương pháp WHO khuyến nghị (PPS)
áp dụng trong N/C cộng đồng khi P lớn và không đều.
1. Chọn huyện
Liệt kê đơn vị huyện cần nghiên cứu.
Chọn huyện = PP ngẫu nhiên hoặc không ngẫu nhiên.
2. Chọn xã
Danh sách và dân số xã của huyện đã chọn.
Tính dân số cộng dồn (tích lũy) của các xã.
Tính khoảng cách mẫu (k) = Dân số / 30 chùm.
Chọn 1 số ngẫu nhiên (i) nằm từ 1 đến (k), (i < k).
Chọn xã chứa chùm thứ nhất có dân số cộng dồn ≥ i.
Xã chứa chùm thứ 2 có dân số cộng dồn ≥ (i) + (k).
Xã chứa chùm tiếp theo bằng cách cộng liên tiếp
i + 2k; i + 3k;...) đến khi đạt 30 chùm.
Phương phỏp PPS (tiếp)
3. Chọn cá thể.!
Xác định số cá thể cần cho mỗi chùm =
Cỡ mẫu/ 30
Chọn các cá thể bằng 2 cách:
- Lấy tất cả các cá thể (nếu không có
danh sách) của các chùm!
- Lập danh sách, chọn cá thể bằng PP
ngẫu nhiên đơn hoặc hệ thống.!
5. Mẫu ngẫu nhiên nhiều giai đọan!
!
Nhóm tất cả các đơn vị mẫu trong quần thể
thành các nhóm có thứ bậc.
Ví dụ: Các hộ gia đình, các thôn, các huyện,
các tỉnh...
Lấy ra: %1 mẫu tỉnh
1 mẫu huyện
1 mẫu thôn,
1 mẫu hộ gia đình,
1 mẫu các cá thể.
12/15/14
9
II/ Cỡ mẫu và cỏch ước tớnh cỡ mẫu
cho một nghiờn cứu cụ thể
Yếu tố ảnh hưởng đến cỡ mẫu
" Loại thiết kế nghiên cứu, nghiên cứu dọc hay ngang.
" Cách chọn mẫu: mẫu chùm có cỡ mẫu lớn hơn.
" Vấn đề nghiên cứu càng hiếm thì cỡ mẫu càng lớn.
" Số liệu càng phân tán thì cỡ mẫu càng lớn.
" Mức độ sai lệch cho phép giữa tham số mẫu và
tham số quần thể càng nhỏ thì cỡ mẫu càng lớn.
" Phân tích đa biến, phân tích tầng cần mẫu lớn hơn.
" Khả năng thực thi của nghiên cứu:
Một số nguyên tắc tính cỡ mẫu
" Cỡ mẫu chỉ tính cho biến phụ thuộc, trừ
nghiên cứu bệnh chứng.
" Khi 1 nghiên cứu có nhiều biến phụ thuộc
thì phải tính cỡ mẫu cho tất cả các biến,
sau đó chọn cỡ mẫu lớn nhất.
Cỡ mẫu ước lượng 1 tỷ lệ
• n: Cỡ mẫu nghiên cứu cần có !
• p: Tỷ lệ đối tượng có bệnh (từ NC trước hoặc NC thử)
• (1-p): Tỷ lệ đối tượng không có bệnh
• Δ: Khoảng sai lệch mong muốn giữa tham số mẫu
và tham số quần thể.!
• α: Mức ý nghĩa thống kê thường là 0,05 hoặc 0,01. !
• Giá trị Z thu được từ bảng Z ứng với giá trị α.
• ε Mức chính xác tương đối
hoặc
12/15/14
10
Cỡ mẫu ước lượng 1 giá trị trung bình
• n: Cỡ mẫu nghiên cứu cần có!
• s: Độ lệch chuẩn (từ NC trước hoặc NC thử)!
• Δ: Khoảng sai lệch mong muốn giữa tham số mẫu
và tham số quần thể.!
• α: Mức ý nghĩa thống kê thường là 0,05 hoặc 0,01.!
• Giá trị Z thu được từ bảng Z ứng với giá trị α.
• Giá trị trung bình (từ NC trước hoặc NC thử)
• ε Mức chính xác tương đối
hoặc
• n1 = n2 = n: Cỡ mẫu nghiên cứu cần có !
• p1,p2: Tỷ lệ mắc bệnh tương tự như nhóm 1 và 2
(theo NC trước hoặc nghiên cứu thử)
• Δ: Khoảng sai lệch mong muốn giữa 2 tham số quần
• thể (P1 – P2) !
• α: Mức ý nghĩa thống kê thường là 0,05 hoặc 0,01. !
• Mức sai lầm loại 2 cho phép
• Giá trị Z thu được từ bảng Z ứng với giá trị
Cỡ mẫu kiểm định 2 tỷ lệ
hoặc
Cỡ mẫu kiểm định 2 giá trị trung bình
• n1=n2=n: Cỡ mẫu nghiên cứu cần có !
• s: Độ lệch chuẩn từ NC trước hoặc NC thử = [(s1+s2)/2]!
• Δ: Khoảng sai lệch mong muốn giữa 2 tham số quần
• thể !
• α: Mức ý nghĩa thống kê thường là 0,05 hoặc 0,01. !
• Mức sai lầm loại 2 cho phép
• Giá trị Z thu được từ bảng Z ứng với giá trị
hoặc
Điều chỉnh cỡ mẫu với QT hữu hạn
" Cần lưu ý rằng, cỡ mẫu tớnh được từ cỏc cụng thức
nờu trờn là cỡ mẫu tớnh cho cỏc nghiờn cứu khi
quần thể nghiờn cứu lớn (cũn gọi là quần thể vụ
hạn). Trong trường hợp cỡ mẫu này vượt quỏ 5%
kớch thước của quần thể thỡ khi đú quần thể được
gọi là hữu hạn và cỡ mẫu trờn cần được điều chỉnh
cho hợp lý hơn.
" Cụng thức điều chỉnh như sau:
" Trong đú: nf = (n*N)/(n+N)
– nf: Cỡ mẫu điều chỉnh cho quần thể hữu hạn
– N: Kớch thước của quần thể hữu hạn
– n: Cỡ mẫu tớnh theo cụng thức
12/15/14
11
Cỡ mẫu trong nghiên cứu bệnh chứng
- p1: Tỷ lệ phơi nhiễm với yếu tố nguy cơ được ước lượng
cho nhóm bệnh.
- p0: Tỷ lệ phơi nhiễm với yếu tố nguy cơ được ước lượng
cho nhóm chứng (p1 và p0 được lấy từ kết quả của
nghiên cứu trước hoặc nghiên cứu thử).
- ε: %Mức độ chính xác mong muốn (chênh lệch cho phép
giữa tỷ suất chênh (OR) thực của quần thể OR thu
được từ mẫu).
Cỡ mẫu trong nghiên cứu thuần tập
p1: Tỷ lệ mắc bệnh được ước lượng trong nhóm tiếp
xúc với yếu tố nguy cơ
p0: Tỷ lệ mắc bệnh được ước lượng cho nhóm không
tiếp xúc với yếu tố nguy cơ. Tỷ lệ p1 và p0 được lấy
từ kết quả của NC trước hoặc NC thử.
ε: Mức độ chính xác mong muốn (chênh lệch cho
phép giữa nguy cơ tương đối (RR) thực của quần
thể và RR thu được từ mẫu).
Các file đính kèm theo tài liệu này:
- bai_giang_chon_mau_va_co_mau_trong_nghien_cuu_y_hoc.pdf