Giáo trình Hệ quản trị cơ sở dữ liệu - Chương 5: Xử lý truy xuất đồng thời - Lê Thị Minh Nguyên

• Đồ thị chờ • Khi có trình trạng deadlock xảy ra, hệ thống hủy trình trạng deadlock. • Dùng đồ thị chờ để phát hiện deadlock • Cho S là lịch giao tác của các giao tác T1, T2,., Tn. • Đồ thị có đỉnh là các giao tác. • Cung có hướng Ti  Tj nếu Ti phải chờ Tj • Đồ thị có chu trình  Deadlock • Để giải quyết: hủy đỉnh (ứng với giao tác) có nhiều cung vào ra nhất.

pdf9 trang | Chia sẻ: huongthu9 | Lượt xem: 521 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Giáo trình Hệ quản trị cơ sở dữ liệu - Chương 5: Xử lý truy xuất đồng thời - Lê Thị Minh Nguyên, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
8/25/2017 1 Chương 5. Xử lý truy xuất đồng thời GV: Lê Thị Minh Nguyện Email: nguyenltm@huflit.edu.vn Nội dung 1. Các vấn đề trong truy xuất đồng thời 2. Cách giải quyết vấn đề 3. Chế độ khóa Hệ quản trị Cơ sở dữ liệu 2 1. Các vấn đề trong truy xuất đồng thời 1.1. Mất dữ liệu đã cập nhật (lost updated) 1.2. Không thể đọc lại (unrepeatable read) 1.3. “Bóng ma” (phantom) 1.4. Đọc dữ liệu chưa chính xác (dirty read) Hệ quản trị Cơ sở dữ liệu 3 1.1. Mất dữ liệu đã cập nhật (lost updated) Hệ quản trị Cơ sở dữ liệu 4  Xét 2 giao tác  Giả sử T1 và T2 được thực hiện đồng thời  Dữ liệu đã cập nhật tại t4 của T1 bị mất vì đã bị ghi chồng lên ở thời điểm t6 t1 t2 t3 t4 t5 t6 Read(A) A=50 T2T1 Read(A) A:=A+10 Write(A) A:=A+20 Write(A) A=60 A=70 T2 Read(A) A:=A+20 Write(A) T1 Read(A) A:=A+10 Write(A) 8/25/2017 2 1.1. Mất dữ liệu đã cập nhật (lost updated) (tt) Hệ quản trị Cơ sở dữ liệu 5 Tình trạng xảy ra khi hai hay nhiều thao tác của các giao tác khác nhau cùng yêu cầu truy cập một mục dữ liệu. Các dữ liệu đã được các thao tác trước cập nhật nhưng lại bị các thao tác sau cập nhật lại làm thay đổi kết quả mong muốn. 1.1. Mất dữ liệu đã cập nhật (lost updated) (tt) Hệ quản trị Cơ sở dữ liệu 6 • Ví dụ: nhà sách còn 500 cuốn sách: Từ lúc T1 nhân viên A yêu cầu mua 400 cuốn sách từ khách hàng X. Cũng từ T1 nhân viên B yêu cầu mua 300 cuốn từ khách hàng Y. A và B đọc dữ liệu thấy 500 cuốn nên đều đồng ý bán. Vào lúc T2 nhân viên A sẽ thực hiện cập nhật số sách từ 500 thành 100. Vào lúc T3 nhân viên B sẽ cập nhật số sách từ 500 thành 200 • Như vậy thao tác cập nhật của A không có tác dụng hay dữ liệu của A cập nhật sẽ bị mất vì B cập nhật sau. 1.2. Không thể đọc lại (unrepeatable read) Hệ quản trị Cơ sở dữ liệu 7 • Xét 2 giao tác • Giả sử T1 và T2 được thực hiện đồng thời • T2 tiến hành đọc A hai lần thì cho hai kết quả khác nhau T2 Read(A) Print(A) Read(A) Print(A) T1 Read(A) A:=A+10 Write(A) t1 t2 t3 t4 t5 t6 Read(A) A=50 T2T1 Read(A) A:=A+10 Write(A) Print(A) Read(A) t7 Print(A) A=50 A=50 A=60 A=60 1.2. Không thể đọc lại (unrepeatable read) (tt) Hệ quản trị Cơ sở dữ liệu 8 • Ví dụ: giả sử nhà sách còn 200 cuốn sách. Vào lúc T1 nhân viên A bán cho khách 150 cuốn, sẽ thực hiện cập nhật sách từ 200 thành 50. (giao dịch chưa hoàn thành chẳng hạn vì việc giao nhận tiền chưa xong). Sau đó lúc T2, B nhận được yêu cầu mua 100 cuốn sách, nếu B đọc được dữ liệu chưa hoàn tất thì B sẽ từ chối bán 100 cuốn sách này. Nếu vào lúc T3 vì lý do nào đó chẳng hạn không đủ tiền khách hàng của A không mua 150 cuốn sách nữa. Giao tác bán hàng của A sẽ không thực hiện nên quay về trạng thái số sách còn lại là 200 Nhưng B từ chối khách hàng. Nếu B không đọc được dữ liệu từ lúc T1 đến T3 thì sẽ như thế nào? 8/25/2017 3 1.3. “Bóng ma” (phantom) Hệ quản trị Cơ sở dữ liệu 9 • Xét 2 giao tác T1 và T2 được xử lý đồng thời • A và B là 2 tài khoản • T1 rút 1 số tiền ở tài khoản A rồi đưa vào tài khoản B • T2 kiểm tra đã nhận đủ tiền hay chưa? mất 50 ??? t1 t2 t3 t4 t5 t6 Read(A) T2T1 Read(A) A:=A-50 Write(A) Read(B) Print(A+B) t7 Read(B) A=70 A=20 A+B=70 A=70, B=50 A=20 B=50 B:=B+50 Write(B) t8 t9 Đọc dữ liệu chưa chính xác (dirty read) Hệ quản trị Cơ sở dữ liệu 10 • Xét 2 giao tác T1 và T2 được xử lý đồng thời • T2 đã đọc dữ liệu được ghi bởi T1 nhưng sau đó T1 yêu cầu hủy việc ghi t1 t2 t3 t4 t5 t6 Read(A) T2T1 Read(A) A:=A+10 Write(A) Print(A) Abort 2. Cách giải quyết vấn đề • Các hệ quản trị CSDL thương mại đã làm hết rồi!!!!!! • Thực hiện cơ chế Transaction và cơ chế khoa • Trước khi transaction đọc hoặc chỉnh sửa dữ liệu, nó cần được bảo vệ và tránh ảnh hưởng của các transaction khác đang chỉnh sửa cùng dữ liệu. Hệ quản trị Cơ sở dữ liệu 11 3. Chế độ khóa 3.1. Các cấp độ khóa 3.2. Các mức cô lập cho giao tác 3.3. Live lock 3.4. Dead lock Hệ quản trị Cơ sở dữ liệu 12 8/25/2017 4 3.1. Các cấp độ khóa Hệ quản trị Cơ sở dữ liệu 13 • Các mức Locking • Database level • Table level • Page level • Row level • Field (attribute) level Bất kể mức khóa nào DBMS có thể dùng 2 loại khóa khác nhau: Binary và Shared / Exclusive 3.1. Các cấp độ khóa (tt) Hệ quản trị Cơ sở dữ liệu 14 14 • Các kiểu lock • Binary Locks • Có 2 trạng thái: locked (1) or unlocked (0). • Nếu 1 object bị lock bởi 1 transaction, không transaction nào được sử dụng object đó • Nếu 1 object là unlocked, bất kỳ transaction nào cũng có thể lock object đó để sử dụng • 1 transaction phải “unlock”object sau khi hoàn tất. Ví dụ Hệ quản trị Cơ sở dữ liệu 15 T2T1 Read(A,s) s:=s*2 t:=t+100 Read(A,t) t:=t+100 Write(A,t) Read(B,t) Write(B,t) s:=s*2 Write(A,s) Read(B,s) Write(B,s) S Lock(A) Unlock(A) Lock(A) Unlock(A) Lock(B) Unlock(B) Lock(B) Unlock(B) 3.1. Các cấp độ khóa (tt) Hệ quản trị Cơ sở dữ liệu 16 • Các kiểu lock • Shared Locks • Một shared lock tồn tại khi các transaction đồng thời đọc dữ liệu • Một shared lock không làm đụng độ dữ liệu khi các transaction đồng thời chỉ đọc dữ liệu • Một shared lock được gán khi transaction muốn đọc dữ liệu và dữ liệu đó không tồn tại exclusive lock. 8/25/2017 5 3.1. Các cấp độ khóa (tt) Hệ quản trị Cơ sở dữ liệu 17 • Các kiểu lock • Exclusive Locks • Tồn tại khi transaction ghi dữ liệu • Được sử dụng khi có khả năng đụng độ dữ liệu • Một exclusive lock sẽ được gán khi transaction muốn ghi dữ liệu và dữ liệu đó chưa bị lock • Được dùng cho thao tác sửa đổi dữ liệu như lệnh INSERT, UPDATE hay DELETE. Bảo đảm là nhiều lệnh cập nhật không thực hiện trên cùng 1 tài nguyên cùng 1 lúc 3.1. Các cấp độ khóa (tt) Hệ quản trị Cơ sở dữ liệu 18 • Các kiểu lock • Exclusive Locks • Tồn tại khi transaction ghi dữ liệu • Được sử dụng khi có khả năng đụng độ dữ liệu. • Một exclusive lock sẽ được gán khi transaction muốn ghi dữ liệu và dữ liệu đó chưa bị lock • Được dùng cho thao tác sửa đổi dữ liệu như lệnh INSERT, UPDATE hay DELETE. Bảo đảm là nhiều lệnh cập nhật không thực hiện trên cùng 1 tài nguyên cùng 1 lúc 3.1. Các cấp độ khóa (tt) Hệ quản trị Cơ sở dữ liệu 19 • Các kiểu lock • Exclusive Locks • Ví dụ: nếu lệnh Update sửa đổi các hàng trong một bảng mà lệnh này có kết nối (join) với 1 bảng khác thì sẽ cần bao nhiêu khóa? • Một khóa shared cho các hàng đọc được trong bảng kết nối • Một khóa exclusive cho các hàng được cập nhật trong bảng update. 3.2. Các mức cô lập cho giao tác • Read Uncommitted • Read Committed • Repeatable Read • Serializable Hệ quản trị Cơ sở dữ liệu 20 8/25/2017 6 Read Uncommitted Đặc điểm: Không thiết lập Shared Lock trên những đơn vị dữ liệu cần đọc. Do đó không phải chờ khi đọc dữ liệu (kể cả khi dữ liệu đang bị lock bởi giao tác khác) Vẫn tạo Exclusive Lock trên đơn vị dữ liệu được ghi, Exclusive Lock được giữ cho đến hết giao tác Hệ quản trị Cơ sở dữ liệu 21 Ưu điểm: •Tốc độ xử lý rất nhanh •Không cản trở những giao tác khác thực hiện việc cập nhật dữ liệu Nhược điểm: Có khả năng xảy ra mọi vấn đề khi xử lý đồng thời : • Dirty Reads • Unrepeatable Reads • Phantoms • Lost Updates Read Committed • Đặc điểm: • Đây là mức độ cô lập mặc định của SQL Server • Tạo Shared Lock trên đơn vị dữ liệu được đọc, Shared Lock được giải phóng ngay sau khi đọc xong dữ liệu • Tạo Exclusive Lock trên đơn vị dữ liệu được ghi, Exclusive Lock được giữ cho đến hết giao tác Hệ quản trị Cơ sở dữ liệu 22 Ưu điểm: • Giải quyết vấn đề Dirty Reads • Shared Lock được giải phóng ngay, không cần phải giữ cho đến hết giao tác nên không cản trở nhiều đến thao tác cập nhật của các giao tác khác. Nhược điểm: • Chưa giải quyết được vấn đề Unrepeatable Reads, Phantoms,Lost Updates • Phải chờ nếu đơn vị dữ liệu cần đọc đang được giữ khoá ghi (xlock) Repeatable Read Đặc điểm: • Tạo Shared Lock trên đơn vị dữ liệu được đọc và giữ shared lock này đến hết giao tác => Các giao tác khác phải chờ đến khi giao tác này kết thúc nếu muốn cập nhật, thay đổi giá trị trên đơn vị dữ liệu này . • Tạo Exclusive Lock trên đơn vị dữ liệu được ghi, Exclusive Lock được giữ cho đến hết giao tác. Hệ quản trị Cơ sở dữ liệu 23 •Ưu điểm: Giải quyết vấn đề Dirty Reads và Unrepeatable Reads Nhược điểm: •Chưa giải quyết được vấn đề Phantoms. •Phải chờ nếu đơn vị dữ liệu cần đọc đang được giữ khoá ghi (xlock) •Shared lock được giữ đến hết giao tác ==> cản trở việc cập nhật dữ liệu của các giao tác khác Serializable • Đặc điểm: • Tạo Shared Lock trên đơn vị dữ liệu được đọc và giữ shared lock này đến hết giao tác => Các giao tác khác phải chờ đến khi giao tác này kết thúc nếu muốn cập nhật, thay đổi giá trị trên đơn vị dữ liệu này . • Không cho phép Insert những dòng dữ liệu thỏa mãn điều kiện • thiết lập Shared Lock (sử dụng Key Range Lock) ==> Serializable = Repeatable Read + Giải quyết Phantoms • Tạo Exclusive Lock trên đơn vị dữ liệu được ghi, Exclusive Lock được giữ cho đến hết giao tác. Hệ quản trị Cơ sở dữ liệu 24 8/25/2017 7 Serializable (tt) Ưu điểm: Giải quyết thêm được vấn đề Phantoms Nhược điểm: • Phải chờ nếu đơn vị dữ liệu cần đọc đang được giữ khoá ghi (xlock) • Cản trở nhiều đến việc cập nhật dữ liệu của các giao tác khác Hệ quản trị Cơ sở dữ liệu 25 Bảng tóm tắt Hệ quản trị Cơ sở dữ liệu 26 Mức Isolation Dirty read Nonrepeatable read Phantom read Read Uncommitted Yes Yes Yes Read Committed No Yes Yes Repeatable read No No Yes Serializable No No No SET TRANSACTION ISOLATION LEVEL SERIALIZABLE SET TRANSACTION ISOLATION LEVEL REPEATABLE READ SET TRANSACTION ISOLATION LEVEL READ COMMITTED SET TRANSACTION ISOLATION LEVEL READ COMMITTED 3.3. Live lock • Khóa sống (live lock): khóa nhưng không giải phóng làm cho các giao tác phải chờ vô tận • T1 yêu cầu khóa trên B, T2 yêu cầu khóa trên B • T1 yêu cầu trước nên B được T1 khóa, nhưng T1 không giải phóng B nên T2 không thể khóa B mà phải chờ vô tận Hệ quản trị Cơ sở dữ liệu 27 3.3. Live lock (tt) Hệ quản trị Cơ sở dữ liệu 28 8/25/2017 8 3.4. Dead lock • Khóa chết (dead lock): trường hợp 2 hay nhiều giao tác chờ đợi lẫn nhau. Giả sử T1 đang khóa A và chờ B được giải phóng để khóa; trong khi T2 đang khóa B và chờ A được giải phóng để khóa A. Các yêu cầu khóa A,B như vậy dẫn đến sự chờ trở nên vô hạn. Hệ quản trị Cơ sở dữ liệu 29 • Kỹ thuật ngăn ngừa deadlock • Ép người viết chương trình viết không bao giờ deadLock có thể xảy ra  ngăn ngừa deadlock • HQT theo dõi nếu có deadlock sẽ báo cho admin biết để xử lý 30 3.4. Dead lock (tt) 31 • Giải quyết Deadlock • Hủy tất cả  không phải là cách giải quyết tốt • Hủy giao tác gây ra deadlock. Giao tác nào gây ra? • Dùng thời gian chờ. • Dùng đồ thị chờ 3.4. Dead lock (tt) • Ngăn ngừa Deadlock • Sắp xếp các đơn vị dữ liệu theo một thứ tự cố định và các giao tác yêu cầu lock trên chúng theo thứ tự này. • Các giao tác chờ lần nhau  deadlock. Các transaction chờ theo 1 chiều nhất định  ngăn ngừa deadlock. 32 • Đồ thị chờ • Khi có trình trạng deadlock xảy ra, hệ thống hủy trình trạng deadlock. • Dùng đồ thị chờ để phát hiện deadlock • Cho S là lịch giao tác của các giao tác T1, T2,.., Tn. • Đồ thị có đỉnh là các giao tác. • Cung có hướng Ti Tj nếu Ti phải chờ Tj • Đồ thị có chu trình Deadlock • Để giải quyết: hủy đỉnh (ứng với giao tác) có nhiều cung vào ra nhất. 3.4. Dead lock (tt) 8/25/2017 9 Ví dụ 33 T1 T2 L(A); R(A) L(C); R(C) 1 T3 T4 L(B); R(B) L(D); R(D) 2 3 4 5 6 7 8 L(A) L(C) L(A) L(B)  Chờ  Chờ  Chờ  Chờ T2T1 T3 T4 Ví dụ 34 T2T1 T3 T4 T1 T2 L(A); R(A) L(C); R(C) 1 T3 T4 L(B); R(B) L(D); R(D) 2 3 4 5 6 7 8 L(A) L(C) L(A) L(B) Giải quyết deadlock trong SQL server Hệ quản trị Cơ sở dữ liệu 35 Hệ quản trị Cơ sở dữ liệu 36

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_he_quan_tri_co_so_du_lieu_chuong_5_xu_ly_truy_xua.pdf