Giáo trình Hệ quản trị cơ sở dữ liệu - Chương 5: Xử lý truy xuất đồng thời - Lê Thị Minh Nguyên
• Đồ thị chờ
• Khi có trình trạng deadlock xảy ra, hệ thống hủy trình
trạng deadlock.
• Dùng đồ thị chờ để phát hiện deadlock
• Cho S là lịch giao tác của các giao tác T1, T2,., Tn.
• Đồ thị có đỉnh là các giao tác.
• Cung có hướng Ti Tj nếu Ti phải chờ Tj
• Đồ thị có chu trình Deadlock
• Để giải quyết: hủy đỉnh (ứng với giao tác) có nhiều cung vào ra
nhất.
9 trang |
Chia sẻ: huongthu9 | Lượt xem: 521 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Giáo trình Hệ quản trị cơ sở dữ liệu - Chương 5: Xử lý truy xuất đồng thời - Lê Thị Minh Nguyên, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
8/25/2017
1
Chương 5.
Xử lý truy xuất đồng thời
GV: Lê Thị Minh Nguyện
Email: nguyenltm@huflit.edu.vn
Nội dung
1. Các vấn đề trong truy xuất đồng thời
2. Cách giải quyết vấn đề
3. Chế độ khóa
Hệ quản trị Cơ sở dữ liệu 2
1. Các vấn đề trong truy xuất đồng thời
1.1. Mất dữ liệu đã cập nhật (lost updated)
1.2. Không thể đọc lại (unrepeatable read)
1.3. “Bóng ma” (phantom)
1.4. Đọc dữ liệu chưa chính xác (dirty read)
Hệ quản trị Cơ sở dữ liệu 3
1.1. Mất dữ liệu đã cập nhật (lost updated)
Hệ quản trị Cơ sở dữ liệu 4
Xét 2 giao tác
Giả sử T1 và T2 được thực hiện đồng thời
Dữ liệu đã cập nhật tại t4 của T1
bị mất vì đã bị ghi chồng lên ở
thời điểm t6
t1
t2
t3
t4
t5
t6
Read(A)
A=50 T2T1
Read(A)
A:=A+10
Write(A)
A:=A+20
Write(A)
A=60 A=70
T2
Read(A)
A:=A+20
Write(A)
T1
Read(A)
A:=A+10
Write(A)
8/25/2017
2
1.1. Mất dữ liệu đã cập nhật (lost updated) (tt)
Hệ quản trị Cơ sở dữ liệu 5
Tình trạng xảy ra khi hai hay nhiều thao tác của các giao tác
khác nhau cùng yêu cầu truy cập một mục dữ liệu. Các dữ
liệu đã được các thao tác trước cập nhật nhưng lại bị các thao
tác sau cập nhật lại làm thay đổi kết quả mong muốn.
1.1. Mất dữ liệu đã cập nhật (lost updated) (tt)
Hệ quản trị Cơ sở dữ liệu 6
• Ví dụ: nhà sách còn 500 cuốn sách:
Từ lúc T1 nhân viên A yêu cầu mua 400 cuốn sách từ khách hàng X.
Cũng từ T1 nhân viên B yêu cầu mua 300 cuốn từ khách hàng Y.
A và B đọc dữ liệu thấy 500 cuốn nên đều đồng ý bán.
Vào lúc T2 nhân viên A sẽ thực hiện cập nhật số sách từ 500 thành 100.
Vào lúc T3 nhân viên B sẽ cập nhật số sách từ 500 thành 200
• Như vậy thao tác cập nhật của A không có tác dụng hay dữ liệu của A cập
nhật sẽ bị mất vì B cập nhật sau.
1.2. Không thể đọc lại (unrepeatable read)
Hệ quản trị Cơ sở dữ liệu 7
• Xét 2 giao tác
• Giả sử T1 và T2 được thực hiện đồng thời
• T2 tiến hành đọc A hai lần thì
cho hai kết quả khác nhau
T2
Read(A)
Print(A)
Read(A)
Print(A)
T1
Read(A)
A:=A+10
Write(A)
t1
t2
t3
t4
t5
t6
Read(A)
A=50 T2T1
Read(A)
A:=A+10
Write(A)
Print(A)
Read(A)
t7 Print(A)
A=50
A=50
A=60
A=60
1.2. Không thể đọc lại (unrepeatable read) (tt)
Hệ quản trị Cơ sở dữ liệu 8
• Ví dụ: giả sử nhà sách còn 200 cuốn sách.
Vào lúc T1 nhân viên A bán cho khách 150 cuốn, sẽ thực hiện cập nhật sách từ
200 thành 50. (giao dịch chưa hoàn thành chẳng hạn vì việc giao nhận tiền chưa
xong).
Sau đó lúc T2, B nhận được yêu cầu mua 100 cuốn sách, nếu B đọc được dữ liệu
chưa hoàn tất thì B sẽ từ chối bán 100 cuốn sách này.
Nếu vào lúc T3 vì lý do nào đó chẳng hạn không đủ tiền khách hàng của A
không mua 150 cuốn sách nữa. Giao tác bán hàng của A sẽ không thực hiện nên
quay về trạng thái số sách còn lại là 200
Nhưng B từ chối khách hàng.
Nếu B không đọc được dữ liệu từ lúc T1 đến T3 thì sẽ như thế nào?
8/25/2017
3
1.3. “Bóng ma” (phantom)
Hệ quản trị Cơ sở dữ liệu 9
• Xét 2 giao tác T1 và T2 được xử lý đồng thời
• A và B là 2 tài khoản
• T1 rút 1 số tiền ở tài khoản A rồi đưa vào tài khoản B
• T2 kiểm tra đã nhận đủ tiền hay chưa?
mất 50 ???
t1
t2
t3
t4
t5
t6
Read(A)
T2T1
Read(A)
A:=A-50
Write(A)
Read(B)
Print(A+B)
t7 Read(B)
A=70
A=20
A+B=70
A=70, B=50
A=20
B=50
B:=B+50
Write(B)
t8
t9
Đọc dữ liệu chưa chính xác (dirty read)
Hệ quản trị Cơ sở dữ liệu 10
• Xét 2 giao tác T1 và T2 được xử lý đồng thời
• T2 đã đọc dữ liệu được ghi
bởi T1 nhưng sau đó T1 yêu
cầu hủy việc ghi
t1
t2
t3
t4
t5
t6
Read(A)
T2T1
Read(A)
A:=A+10
Write(A)
Print(A)
Abort
2. Cách giải quyết vấn đề
• Các hệ quản trị CSDL thương mại đã làm hết rồi!!!!!!
• Thực hiện cơ chế Transaction và cơ chế khoa
• Trước khi transaction đọc hoặc chỉnh sửa dữ liệu, nó cần
được bảo vệ và tránh ảnh hưởng của các transaction khác
đang chỉnh sửa cùng dữ liệu.
Hệ quản trị Cơ sở dữ liệu 11
3. Chế độ khóa
3.1. Các cấp độ khóa
3.2. Các mức cô lập cho giao tác
3.3. Live lock
3.4. Dead lock
Hệ quản trị Cơ sở dữ liệu 12
8/25/2017
4
3.1. Các cấp độ khóa
Hệ quản trị Cơ sở dữ liệu 13
• Các mức Locking
• Database level
• Table level
• Page level
• Row level
• Field (attribute) level
Bất kể mức khóa nào DBMS có thể
dùng 2 loại khóa khác nhau: Binary và
Shared / Exclusive
3.1. Các cấp độ khóa (tt)
Hệ quản trị Cơ sở dữ liệu 14
14
• Các kiểu lock
• Binary Locks
• Có 2 trạng thái: locked (1) or unlocked (0).
• Nếu 1 object bị lock bởi 1 transaction, không transaction nào
được sử dụng object đó
• Nếu 1 object là unlocked, bất kỳ transaction nào cũng có thể
lock object đó để sử dụng
• 1 transaction phải “unlock”object sau khi hoàn tất.
Ví dụ
Hệ quản trị Cơ sở dữ liệu 15
T2T1
Read(A,s)
s:=s*2
t:=t+100
Read(A,t)
t:=t+100
Write(A,t)
Read(B,t)
Write(B,t)
s:=s*2
Write(A,s)
Read(B,s)
Write(B,s)
S
Lock(A)
Unlock(A)
Lock(A)
Unlock(A)
Lock(B)
Unlock(B)
Lock(B)
Unlock(B)
3.1. Các cấp độ khóa (tt)
Hệ quản trị Cơ sở dữ liệu 16
• Các kiểu lock
• Shared Locks
• Một shared lock tồn tại khi các transaction đồng thời đọc dữ
liệu
• Một shared lock không làm đụng độ dữ liệu khi các transaction
đồng thời chỉ đọc dữ liệu
• Một shared lock được gán khi transaction muốn đọc dữ liệu và
dữ liệu đó không tồn tại exclusive lock.
8/25/2017
5
3.1. Các cấp độ khóa (tt)
Hệ quản trị Cơ sở dữ liệu 17
• Các kiểu lock
• Exclusive Locks
• Tồn tại khi transaction ghi dữ liệu
• Được sử dụng khi có khả năng đụng độ dữ liệu
• Một exclusive lock sẽ được gán khi transaction muốn ghi dữ
liệu và dữ liệu đó chưa bị lock
• Được dùng cho thao tác sửa đổi dữ liệu như lệnh INSERT,
UPDATE hay DELETE. Bảo đảm là nhiều lệnh cập nhật không
thực hiện trên cùng 1 tài nguyên cùng 1 lúc
3.1. Các cấp độ khóa (tt)
Hệ quản trị Cơ sở dữ liệu 18
• Các kiểu lock
• Exclusive Locks
• Tồn tại khi transaction ghi dữ liệu
• Được sử dụng khi có khả năng đụng độ dữ liệu.
• Một exclusive lock sẽ được gán khi transaction muốn ghi dữ
liệu và dữ liệu đó chưa bị lock
• Được dùng cho thao tác sửa đổi dữ liệu như lệnh INSERT,
UPDATE hay DELETE. Bảo đảm là nhiều lệnh cập nhật không
thực hiện trên cùng 1 tài nguyên cùng 1 lúc
3.1. Các cấp độ khóa (tt)
Hệ quản trị Cơ sở dữ liệu 19
• Các kiểu lock
• Exclusive Locks
• Ví dụ: nếu lệnh Update sửa đổi các hàng trong một bảng mà
lệnh này có kết nối (join) với 1 bảng khác thì sẽ cần bao
nhiêu khóa?
• Một khóa shared cho các hàng đọc được trong bảng kết nối
• Một khóa exclusive cho các hàng được cập nhật trong bảng
update.
3.2. Các mức cô lập cho giao tác
• Read Uncommitted
• Read Committed
• Repeatable Read
• Serializable
Hệ quản trị Cơ sở dữ liệu 20
8/25/2017
6
Read Uncommitted
Đặc điểm:
Không thiết lập Shared Lock trên những đơn vị dữ liệu cần đọc. Do đó không
phải chờ khi đọc dữ liệu (kể cả khi dữ liệu đang bị lock bởi giao tác khác)
Vẫn tạo Exclusive Lock trên đơn vị dữ liệu được ghi, Exclusive Lock được giữ
cho đến hết giao tác
Hệ quản trị Cơ sở dữ liệu 21
Ưu điểm:
•Tốc độ xử lý rất nhanh
•Không cản trở những giao tác
khác thực hiện việc cập nhật dữ
liệu
Nhược điểm:
Có khả năng xảy ra mọi vấn đề khi xử lý
đồng thời :
• Dirty Reads
• Unrepeatable Reads
• Phantoms
• Lost Updates
Read Committed
• Đặc điểm:
• Đây là mức độ cô lập mặc định của SQL Server
• Tạo Shared Lock trên đơn vị dữ liệu được đọc, Shared Lock được giải phóng
ngay sau khi đọc xong dữ liệu
• Tạo Exclusive Lock trên đơn vị dữ liệu được ghi, Exclusive Lock được giữ cho
đến hết giao tác
Hệ quản trị Cơ sở dữ liệu 22
Ưu điểm:
• Giải quyết vấn đề Dirty Reads
• Shared Lock được giải phóng ngay,
không cần phải giữ cho đến hết giao
tác nên không cản trở nhiều đến thao
tác cập nhật của các giao tác khác.
Nhược điểm:
• Chưa giải quyết được vấn đề
Unrepeatable Reads,
Phantoms,Lost Updates
• Phải chờ nếu đơn vị dữ liệu cần đọc
đang được giữ khoá ghi (xlock)
Repeatable Read
Đặc điểm:
• Tạo Shared Lock trên đơn vị dữ liệu được đọc và giữ shared lock này đến hết giao
tác => Các giao tác khác phải chờ đến khi giao tác này kết thúc nếu muốn cập nhật,
thay đổi giá trị trên đơn vị dữ liệu này .
• Tạo Exclusive Lock trên đơn vị dữ liệu được ghi, Exclusive Lock được giữ cho đến
hết giao tác.
Hệ quản trị Cơ sở dữ liệu 23
•Ưu điểm:
Giải quyết vấn đề Dirty Reads và
Unrepeatable Reads
Nhược điểm:
•Chưa giải quyết được vấn đề Phantoms.
•Phải chờ nếu đơn vị dữ liệu cần đọc đang được
giữ khoá ghi (xlock)
•Shared lock được giữ đến hết giao tác ==> cản
trở việc cập nhật dữ liệu của các giao tác khác
Serializable
• Đặc điểm:
• Tạo Shared Lock trên đơn vị dữ liệu được đọc và giữ shared
lock này đến hết giao tác => Các giao tác khác phải chờ đến
khi giao tác này kết thúc nếu muốn cập nhật, thay đổi giá trị
trên đơn vị dữ liệu này .
• Không cho phép Insert những dòng dữ liệu thỏa mãn điều
kiện
• thiết lập Shared Lock (sử dụng Key Range Lock) ==>
Serializable = Repeatable Read + Giải quyết Phantoms
• Tạo Exclusive Lock trên đơn vị dữ liệu được ghi, Exclusive
Lock được giữ cho đến hết giao tác.
Hệ quản trị Cơ sở dữ liệu 24
8/25/2017
7
Serializable (tt)
Ưu điểm:
Giải quyết thêm được vấn đề Phantoms
Nhược điểm:
• Phải chờ nếu đơn vị dữ liệu cần đọc đang được giữ khoá ghi (xlock)
• Cản trở nhiều đến việc cập nhật dữ liệu của các giao tác khác
Hệ quản trị Cơ sở dữ liệu 25
Bảng tóm tắt
Hệ quản trị Cơ sở dữ liệu 26
Mức Isolation Dirty read Nonrepeatable read Phantom read
Read Uncommitted Yes Yes Yes
Read Committed No Yes Yes
Repeatable read No No Yes
Serializable No No No SET TRANSACTION ISOLATION LEVEL SERIALIZABLE
SET TRANSACTION ISOLATION LEVEL REPEATABLE READ
SET TRANSACTION ISOLATION LEVEL READ COMMITTED
SET TRANSACTION ISOLATION LEVEL READ COMMITTED
3.3. Live lock
• Khóa sống (live lock): khóa nhưng không giải phóng làm
cho các giao tác phải chờ vô tận
• T1 yêu cầu khóa trên B, T2 yêu cầu khóa trên B
• T1 yêu cầu trước nên B được T1 khóa, nhưng T1 không giải
phóng B nên T2 không thể khóa B mà phải chờ vô tận
Hệ quản trị Cơ sở dữ liệu 27
3.3. Live lock (tt)
Hệ quản trị Cơ sở dữ liệu 28
8/25/2017
8
3.4. Dead lock
• Khóa chết (dead lock): trường hợp 2 hay nhiều giao tác chờ
đợi lẫn nhau. Giả sử T1 đang khóa A và chờ B được giải
phóng để khóa; trong khi T2 đang khóa B và chờ A được giải
phóng để khóa A. Các yêu cầu khóa A,B như vậy dẫn đến sự
chờ trở nên vô hạn.
Hệ quản trị Cơ sở dữ liệu 29
• Kỹ thuật ngăn ngừa deadlock
• Ép người viết chương trình
viết không bao giờ
deadLock có thể xảy ra
ngăn ngừa deadlock
• HQT theo dõi nếu có
deadlock sẽ báo cho admin
biết để xử lý
30
3.4. Dead lock (tt)
31
• Giải quyết Deadlock
• Hủy tất cả không phải là
cách giải quyết tốt
• Hủy giao tác gây ra
deadlock. Giao tác nào gây
ra?
• Dùng thời gian chờ.
• Dùng đồ thị chờ
3.4. Dead lock (tt)
• Ngăn ngừa Deadlock
• Sắp xếp các đơn vị dữ liệu theo
một thứ tự cố định và các giao
tác yêu cầu lock trên chúng
theo thứ tự này.
• Các giao tác chờ lần nhau
deadlock. Các transaction chờ
theo 1 chiều nhất định ngăn
ngừa deadlock.
32
• Đồ thị chờ
• Khi có trình trạng deadlock xảy ra, hệ thống hủy trình
trạng deadlock.
• Dùng đồ thị chờ để phát hiện deadlock
• Cho S là lịch giao tác của các giao tác T1, T2,.., Tn.
• Đồ thị có đỉnh là các giao tác.
• Cung có hướng Ti Tj nếu Ti phải chờ Tj
• Đồ thị có chu trình Deadlock
• Để giải quyết: hủy đỉnh (ứng với giao tác) có nhiều cung vào ra
nhất.
3.4. Dead lock (tt)
8/25/2017
9
Ví dụ
33
T1 T2
L(A); R(A)
L(C); R(C)
1
T3 T4
L(B); R(B)
L(D); R(D)
2
3
4
5
6
7
8
L(A)
L(C)
L(A)
L(B)
Chờ
Chờ
Chờ
Chờ
T2T1 T3 T4
Ví dụ
34
T2T1 T3 T4
T1 T2
L(A); R(A)
L(C); R(C)
1
T3 T4
L(B); R(B)
L(D); R(D)
2
3
4
5
6
7
8
L(A)
L(C)
L(A)
L(B)
Giải quyết deadlock trong SQL server
Hệ quản trị Cơ sở dữ liệu 35 Hệ quản trị Cơ sở dữ liệu 36
Các file đính kèm theo tài liệu này:
- giao_trinh_he_quan_tri_co_so_du_lieu_chuong_5_xu_ly_truy_xua.pdf