Luận văn Ứng dụng hệ thống nhận dạng miễn dịch tạo mờ trong chẩn đoán ung thư
ỨNG DỤNG HỆ THỐNG NHẬN DẠNG MIỄN DỊCH TẠO MỜ TRONG CHẨN ĐOÁN UNG THƯ
VÕ THỊ THỦY TÚ
Trang nhan đề
Lời cảm ơn
Lời nói đầu
Mục lục
Danh mục thuật ngữ và viết tắt
Danh mục các hình vẽ
Danh mục bảng
Chương_1: Tổng quan
Chương_2: Các hệ thống miễn dịch: Tự nhiên và nhân tạo
Chương_3: Thuật toán Hệ thống nhận dạng miễn dịch nhân tạo
Chương 4: Ứng dụng vào hệ thống chuẩn đoán ung thư
Chương 5: Kết luận
Tài liệu tham khảo
Phụ lục
Mục lục
Lời cảm ơn 1
Lời nói đầu 2
Mục lục 4
Danh mục thuật ngữ và viết tắt .8
Danh mục các hình vẽ .10
Danh mục các bảng .11
Chương 1 Tổng quan .12
1.1 Phát biểu vấn đề .12
1.2 Hệ thống nhận dạng miễn dịch nhân tạo mờ .13
1.3 Hệ thống nhận dạng miễn dịch nhân tạo mờ và chẩn đoán ung thư .14
1.4 Một số nghiên cứu gần đây .15
1.4.1 Những nghiên cứu AIRS 15
1.4.2 Những nghiên cứu ung thư vú 16
1.5 Phân tích nhu cầu thực tế của ứng dụng 16
1.6 Mục tiêu của đề tài .17
1.7 Nội dung của luận văn .18
Chương 2 Các hệ thống miễn dịch: Tự nhiên và Nhân tạo .19
2.1 Hệ thống miễn dịch tự nhiên .19
2.1.1 Các thành phần miễn dịch .20
2.1.2 Nhớ và học 25
2.1.3 Tính đa dạng và tính phân phối 26Trang 5
2.1.4 Bản chất của tự nhận biết 27
2.2 Hệ thống miễn dịch nhân tạo .27
2.2.1 Kháng nguyên, kháng thể và tế bào B 27
2.2.2 Quả cầu nhận dạng nhân tạo và sự cạnh tranh tài nguyên 28
2.3 Tế bào nhớ, đột biến và chọn lọc dòng 29
2.4 Mạng miễn dịch và sự tương tác tế bào – tế bào .30
2.5 Sự phân lớp 31
Chương 3 Thuật toán Hệ thống nhận dạng miễn dịch nhân tạo 32
3.1 Các định nghĩa .32
3.2 Thuật toán nhận dạng miễn dịch nhân tạo .35
3.2.1 Khởi tạo 36
3.2.2 Xác định tế bào nhớ và phát sinh ARB 37
3.2.3 Cạnh tranh tài nguyên và phát triển tế bào nhớ ứng viên .39
3.2.4 Giới thiệu tế bào nhớ 43
3.2.5 Phân lớp 44
3.3 Thảo luận về thuật toán AIRS .44
Chương 4 Ứng dụng vào hệ thống chẩn đoán ung thư 47
4.1 Tiến trình chẩn đoán ung thư .47
4.2 Dữ liệu nhập của hệ thống .49
4.2.1 Dữ liệu nhập ung thư vú .49
4.2.2 Dữ liệu nhập ung thư cổ tử cung 50
4.3 Dữ liệu xuất của hệ thống 51
4.3.1 Dữ liệu xuất ung thư vú 51
4.3.2 Dữ liệu xuất ung thư cổ tử cung .52Trang 6
4.4 Xây dựng hệ thống AIRS 52
4.4.1 Khởi tạo 53
4.4.2 Xác định tế bào nhớ và phát sinh ARB 53
4.4.3 Cạnh tranh tài nguyên và phát triển tế bào nhớ ứng viên .56
4.4.4 Giới thiệu tế bào nhớ 59
4.4.5 Phân lớp 61
4.5 Tích hợp logic mờ vào AIRS – FAIRS .61
4.5.1 Biến mờ .61
4.5.2 Tập luật mờ .62
4.5.3 Hàm thành viên .63
Chương 5 Kết luận .65
5.1 Bộ dữ liệu ung thư vú 65
5.1.1 Mục đích thử nghiệm 65
5.1.2 Kết quả đạt được .65
5.2 Bộ dữ liệu ung thư cổ tử cung .67
5.2.1 Mục đích thử nghiệm 67
5.2.2 Kết quả đạt được .67
5.3 Nhận xét .67
5.3.1 Ưu điểm 67
5.3.2 Khuyết điểm 68
5.4 Hướng phát triển 68
Tài liệu tham khảo .69
Phụ lục .73
Chức năng phần mềm 73Trang 7
Các độ đo để đánh giá khả năng thực hiện .73
Thuật toán K láng giềng gần nhất .74
7 trang |
Chia sẻ: maiphuongtl | Lượt xem: 2102 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Luận văn Ứng dụng hệ thống nhận dạng miễn dịch tạo mờ trong chẩn đoán ung thư, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Trang 12
Chương 1
Tổng quan
Nội dung của Chương 1 trình bày tổng quan về Hệ thống nhận dạng miễn dịch
nhân tạo (Artificial Immune Regconition System – AIRS), Hệ thống nhận dạng miễn
dịch nhân tạo mờ (Fuzzy Artificial Immune Regconition System – FAIRS), và ứng
dụng chẩn đoán ung thư vú thông qua hai hệ thống này; giới thiệu chung về tình
hình nghiên cứu hiện nay trên thế giới cũng như trong nước; đồng thời nêu lên mục
đích, nội dung và ý nghĩa của đề tài.
1.1 Phát biểu vấn đề
Khi khoa học kĩ thuật phát triển, cuộc sống của con người không ngừng cải thiện
nhờ vào các thành tựu nghiên cứu. Máy móc thiết bị đóng vai trò quan trọng trong
việc cơ giới hoá mọi hoạt động của con người, trong đó phải kể đến các thiết bị y tế,
y khoa dùng trong việc xét nghiệm và chẩn đoán bệnh.
Việc tích hợp những ứng dụng giúp hỗ trợ chẩn đoán trong y khoa bắt đầu hình
thành khi độ chính xác trong các bài toán phân lớp dần tăng cao, khởi đầu từ logic
mờ, tiếp đến là các loại mạng nơron truyền thống, thuật giải di truyền, các mô hình
tích hợp… Ở đây, một hệ thống phân lớp được sử dụng để thực hiện phân lớp hay
còn gọi là chẩn đoán ung thư, được nghiên cứu, phân tích và ứng dụng – gọi là hệ
thống nhận dạng miễn dịch nhân tạo mờ (FAIRS).
Cũng như các hệ thống nhận dạng khác, FAIRS cũng bao gồm 2 giai đoạn: huấn
luyện và thử nghiệm. Trong đó, giai đoạn huấn luyện sẽ sử dụng “cơ chế miễn dịch”
để đào thải những “tác nhân xấu” (những mẫu không tốt hoặc không cần thiết cho
việc nhận dạng), chỉ giữ lại những tế bào có ích cho cơ thể. Giai đoạn thử nghiệm
Trang 13
được thực hiện bằng cách so khớp mẫu cần phân lớp và những tế bào có ích, nếu
khớp với mẫu nào nhất thì phân lớp của mẫu cũng chính là kết quả chẩn đoán ung
thư.
Quá trình phân tích ứng dụng chẩn đoán ung thư được mô tả trong Hình 1.1.
Hình 1.1: Tiến trình phân tích ứng dụng chẩn đoán ung thư
1.2 Hệ thống nhận dạng miễn dịch nhân tạo mờ
Thuật toán phân lớp bằng Hệ thống nhận dạng miễn dịch nhân tạo (Artificial
Immune Regconition System - AIRS) là một thuật toán quan trọng trong lĩnh vực
Hệ thống miễn dịch nhân tạo (Artificial Immune System - AIS) và có khả năng ứng
dụng rất hiệu quả và hấp dẫn. AIRS được ứng dụng chủ yếu trong các bài toán phân
lớp y khoa như ung thư vú, bệnh tim, đái tháo đường… và cho những kết quả thỏa
đáng. Vì vậy, AIRS chứng tỏ được nó là một kỹ thuật trí tuệ nhân tạo trong lĩnh vực
y khoa. Bên cạnh đó, cơ chế phân phối tài nguyên trong thuật toán AIRS được thực
hiện bằng logic mờ, gọi là Hệ thống nhận dạng miễn dịch nhân tạo mờ (Fuzzy
Artificial Regconition System - Fuzzy AIRS).
Trang 14
1.3 Hệ thống nhận dạng miễn dịch nhân tạo mờ và chẩn
đoán ung thư
Hiện nay, việc sử dụng các hệ thống phân lớp trong chẩn đoán y khoa đang ngày
càng tăng. Chúng ta không thể phủ định vai trò quan trọng của việc đánh giá bệnh
án và quyết định của chuyên gia trong chẩn đoán bệnh. Tuy nhiên, những hệ
chuyên gia cùng những kỹ thuật trí tuệ nhân tạo khác dùng để phân lớp cũng hỗ trợ
các chuyên gia rất nhiều. Những hệ thống phân lớp có thể xác định được các lỗi hợp
lý mà một chuyên gia khi mệt mỏi hoặc thiếu kinh nghiệm có thể gặp phải, với thời
gian ngắn hơn và chi tiết hơn.
Những đổi mới trong cách điều trị ung thư đã tạo được tỷ lệ sống cao hơn cho
những người bị bệnh này. Đặc biệt, bệnh được chẩn đoán càng sớm, tỷ lệ sống càng
tăng. Theo thống kê của các Tổ chức Y tế Thế giới, Ung thư vú là một loại bệnh
phổ biến ở phụ nữ, chỉ đứng sau ung thư cổ tử cung. Do đó việc đưa kỹ thuật trí tuệ
nhân tạo vào giải quyết bài toán chẩn đoán ung thư nói chung và ung thư vú nói
riêng là rất quan trọng.
Khi hệ thống AIS nổi lên vào thập niên 90, khả năng thực hiện của những phương
pháp đưa ra không thực sự tốt để giải quyết vấn đề phân lớp. Tuy nhiên, hệ thống
AIRS đề xuất năm 2001 đã thay đổi được vấn đề này nhờ một số thuộc tính:
AIRS thực hiện tốt trên những vấn đề khác nhau như không gian đặc trưng
có số chiều lớn, có nhiều lớp…
AIRS tự điều chỉnh theo cấu trúc không gian của vấn đề.
Bên cạnh đó, sự phân phối tài nguyên của AIRS được thực hiện bởi logic mờ làm
tăng khả năng thực hiện phân lớp, giảm được số lượng tài nguyên và thời gian phân
lớp một cách đáng kể.
Như vậy, cả hai hệ thống AIRS và Fuzzy AIRS sẽ được dùng để phân lớp tập dữ
liệu ung thư vú, được thực hiện bởi trường Đại học California tại Urvine (UCI) [15].
Trang 15
Các giai đoạn phát triển từ thuật toán đến ứng dụng được thể hiện trong Hình 1.2.
Hình 1.2: Giai đoạn phát triển thuật toán
1.4 Một số nghiên cứu gần đây
1.4.1 Những nghiên cứu AIRS
AIRS là bộ phân lớp dựa trên nguyên lý của hệ miễn dịch nhân tạo giới hạn tài
nguyên được đề xuất bởi Watkins năm 2001 [1]. AIRS có khả năng thực hiện phân
lớp rất tốt.
Trong nghiên cứu của Donald E. Goodman, AIRS được áp dụng vào vấn đề đa lớp
và được so sánh với Learning Vector Quantisation (LVQ) Kohonen [11]. Trong hầu
hết những lời giải, AIRS cho kết quả tốt hơn LVQ và LVQ tối ưu. Gaurav Marwah
và Lois Boggess cũng cố gắng thực hiện những phép biến đổi trên sự định vị tài
nguyên và những hướng tiếp cận cho việc tổ chức tập ARB [23]. Họ khai thác một
vài thuật toán khác nhằm tăng độ chính xác thuật toán và những phân lớp k láng
giềng gần nhất. Trong nghiên cứu của Donald E. Goodman, AIRS được kiểm tra
thực nghiệm bằng cách thay thế một trong hai nguồn năng lượng phân lớp bởi
Hệ miễn dịch tự nhiên
Natural Immune System - NIS
Hệ miễn dịch nhân tạo
Artificial Immune System - AIS
Hệ nhận dạng miễn dịch nhân tạo
Artificial Immune System - AIRS
Hệ nhận dạng miễn dịch nhân tạo mờ
Fuzzy Artificial Immune System - Fuzzy AIRS
Ứng dụng vào hệ thống phân lớp chẩn đoán
ung thư
Trang 16
những biến đổi khác [12]. Họ kết luận những biến đổi này cho kết quả thử nghiệm
nhanh đối với người dùng. Bên cạnh những nghiên cứu này, Hamaker và Boggess
cũng phân tích hiệu quả của việc thêm độ đo khoảng cách phi Euclidean đối với
thuật toán AIRS nguyên thủy [13].
1.4.2 Những nghiên cứu ung thư vú
Cũng như những vấn đề chẩn đoán bệnh án khác, các hệ thống phân lớp cũng được
sử dụng để chẩn đoán ung thư vú. Khi những nghiên cứu liên quan đến các ứng
dụng phân lớp được kiểm nghiệm, chúng ta có thể thấy một số lượng lớn các
phương pháp được sử dụng để đạt được hiệu quả phân lớp cao. Phương pháp C4.5
cho độ chính xác phân lớp là 94.74% sử dụng ngưỡng hợp lý 10 (10 CV) [26].
Hamilton thu được độ chính xác 96% với phương pháp RIAC (10 CV) [14].
Trong khi đó Ster và Dobnikar đạt 96.8% với phương pháp Linear Discriminant
Analysis (LDA) (10 CV) [30]. Độ chính xác thu được bởi Bennett và Blue là
97.2% khi sử dụng phương pháp SVM [7]. Nơron mờ được áp dụng và cho độ
chính xác là 95.06% (10 CV) [24] và 97.51% với di truyền mờ (huấn luyện 75%,
kiểm nghiệm 25%) [25]. Hơn nữa, Setiono đạt 98.1% khi sử dụng nơron mờ [29].
Goodman cũng áp dụng ba phương pháp khác nhau phương pháp LVQ tối ưu,
phương pháp LVQ lớn và AIRS với độ chính xác tương ứng là 96.7%, 96.8% và
97.2% (10 CV) [11].
1.5 Phân tích nhu cầu thực tế của ứng dụng
Theo những tài liệu chuyên ngành cũng như thông tin đại chúng, trên thế giới, ung
thư vú là nguyên nhân gây tử vong hàng đầu ở phụ nữ. Cứ 5 phụ nữ thì có 1 người
bị tử vong. Ở Việt Nam, tỷ lệ phát sinh ung thư hàng năm là 116,8 trên 100.000 dân.
Trong đó, ung thư vú chiếm 22,8% trên tổng số ung thư. Còn ở thành phố Hồ Chí
Minh, ung thư vú chiếm 12,1% trên tổng số ung thư phát sinh [17].
Trang 17
Ung thư khởi nguồn từ sự phân bào không kiểm soát được và kết quả là xuất hiện
một khối u có thể nhìn thấy. Khối u có thể lành tính hay ác tính. Khối u ác tính phát
triển nhanh chóng và xâm lấn một loạt những mô xung quanh gây nguy hiểm cho
chúng. Ung thư vú là một mô ác tính bắt đầu phát triển bên trong vú. Những bất
thường xuất hiện bên trong vú làm thay đổi hình dạng và kích thước vú, màu da, sự
đau nhức,… là những triệu chứng của ung thư vú. Việc chẩn đoán ung thư được
thực hiện dựa trên những tiêu chuẩn phi phân tử như loại mô, những thuộc tính
bệnh lý, định vị bệnh án. Cũng như các loại ung thư khác, ung thư vú có thể chữa trị
tốt hơn khi được phát hiện sớm hơn. Do đó rất cần xây dựng một hệ thống hỗ trợ
chẩn đoán ung thư vú nói riêng và các loại ung thư nói chung.
1.6 Mục tiêu của đề tài
Xây dựng một hệ chẩn đoán ung thư nói riêng và y khoa nói chung là một công việc
rất rộng nhưng ý nghĩa. Trong phạm vi đề tài này, mục tiêu nghiên cứu tập trung
vào một số vấn đề sau:
Tìm hiểu, xây dựng và đánh giá một thuật toán trí tuệ nhân tạo: Hệ thống
nhận dạng miễn dịch nhân tạo. Đây là một thuật toán mô phỏng hệ thống
miễn dịch tự nhiên để giải quyết bài toán phân lớp.
Cải tiến thuật toán Hệ thống nhận dạng miễn dịch nhân tạo bằng cách tích
hợp logic mờ vào bước phân phối tài nguyên hệ thống, nhằm nâng cao độ
chính xác của quá trình phân lớp. Hệ thống cải tiến được gọi là hệ thống
nhận dạng miễn dịch nhân tạo mờ - FAIRS.
Dùng cơ sở dữ liệu bệnh ung thư vú để đánh giá và so sánh mức độ thực hiện
của hai hệ thống thuật toán.
Thực hiện chẩn đoán ung thư vú thông qua các đặc trưng bệnh án, gồm 9
thuộc tính được phân tích từ việc lấy sinh thiết tế bào vú.
Thực hiện chẩn đoán ung thư cổ tử cung, theo các đặc tính luật chuyên gia và
luật theo thuật toán trích chọn đặc trưng.
Trang 18
1.7 Nội dung của luận văn
Nội dung của luận văn bao gồm những phần sau:
Chương 1 trình bày tổng quan về hệ thống AIRS, hệ thống AIRS mờ, cũng
như giới thiệu mục đích, ý nghĩa và nội dung đề tài.
Chương 2 nêu lên mối quan hệ giữa hệ thống miễn dịch tự nhiên và hệ thống
miễn dịch nhân tạo, nhằm đưa ra luận cứ xây dựng hệ nhận dạng miễn dịch
nhân tạo.
Chương 3 giới thiệu thuật toán AIRS cơ bản và nhận xét khả năng thực hiện
của thuật toán về mặt lý thuyết.
Chương 4 nêu lên cách ứng dụng thuật toán AIRS vào hệ thống chẩn đoán
ung thư vú, đồng thời cải tiến thuật toán bằng cách tích hợp logic mờ vào
giai đoạn phân phối tài nguyên hệ thống.
Chương 5 phân tích dữ liệu thử nghiệm và đánh giá kết quả thực nghiệm.
Tài liệu tham khảo chứa thông tin nguồn tài liệu tham khảo cho đề tài.
Phụ lục giới thiệu chức năng phần mềm, các độ đo sử dụng để đánh giá khả
năng thực hiện của thuật toán và thuật toán k láng giềng gần nhất.