Luận văn Ứng dụng hệ thống nhận dạng miễn dịch tạo mờ trong chẩn đoán ung thư
          
        
            
            
              
            
 
            
                
                    ỨNG DỤNG HỆ THỐNG NHẬN DẠNG MIỄN DỊCH TẠO MỜ TRONG CHẨN ĐOÁN UNG THƯ
 
VÕ THỊ THỦY TÚ
Trang nhan đề 
Lời cảm ơn
Lời nói đầu
Mục lục 
Danh mục thuật ngữ và viết tắt 
Danh mục các hình vẽ 
Danh mục bảng 
Chương_1: Tổng quan
Chương_2: Các hệ thống miễn dịch: Tự nhiên và nhân tạo
Chương_3: Thuật toán Hệ thống nhận dạng miễn dịch nhân tạo
Chương 4: Ứng dụng vào hệ thống chuẩn đoán ung thư
Chương 5: Kết luận
Tài liệu tham khảo
Phụ lục
Mục lục
Lời cảm ơn 1
Lời nói đầu 2
Mục lục 4
Danh mục thuật ngữ và viết tắt .8
Danh mục các hình vẽ .10
Danh mục các bảng .11
Chương 1 Tổng quan .12
1.1 Phát biểu vấn đề .12
1.2 Hệ thống nhận dạng miễn dịch nhân tạo mờ .13
1.3 Hệ thống nhận dạng miễn dịch nhân tạo mờ và chẩn đoán ung thư .14
1.4 Một số nghiên cứu gần đây .15
1.4.1 Những nghiên cứu AIRS 15
1.4.2 Những nghiên cứu ung thư vú 16
1.5 Phân tích nhu cầu thực tế của ứng dụng 16
1.6 Mục tiêu của đề tài .17
1.7 Nội dung của luận văn .18
Chương 2 Các hệ thống miễn dịch: Tự nhiên và Nhân tạo .19
2.1 Hệ thống miễn dịch tự nhiên .19
2.1.1 Các thành phần miễn dịch .20
2.1.2 Nhớ và học 25
2.1.3 Tính đa dạng và tính phân phối 26Trang 5
2.1.4 Bản chất của tự nhận biết 27
2.2 Hệ thống miễn dịch nhân tạo .27
2.2.1 Kháng nguyên, kháng thể và tế bào B 27
2.2.2 Quả cầu nhận dạng nhân tạo và sự cạnh tranh tài nguyên 28
2.3 Tế bào nhớ, đột biến và chọn lọc dòng 29
2.4 Mạng miễn dịch và sự tương tác tế bào – tế bào .30
2.5 Sự phân lớp 31
Chương 3 Thuật toán Hệ thống nhận dạng miễn dịch nhân tạo 32
3.1 Các định nghĩa .32
3.2 Thuật toán nhận dạng miễn dịch nhân tạo .35
3.2.1 Khởi tạo 36
3.2.2 Xác định tế bào nhớ và phát sinh ARB 37
3.2.3 Cạnh tranh tài nguyên và phát triển tế bào nhớ ứng viên .39
3.2.4 Giới thiệu tế bào nhớ 43
3.2.5 Phân lớp 44
3.3 Thảo luận về thuật toán AIRS .44
Chương 4 Ứng dụng vào hệ thống chẩn đoán ung thư 47
4.1 Tiến trình chẩn đoán ung thư .47
4.2 Dữ liệu nhập của hệ thống .49
4.2.1 Dữ liệu nhập ung thư vú .49
4.2.2 Dữ liệu nhập ung thư cổ tử cung 50
4.3 Dữ liệu xuất của hệ thống 51
4.3.1 Dữ liệu xuất ung thư vú 51
4.3.2 Dữ liệu xuất ung thư cổ tử cung .52Trang 6
4.4 Xây dựng hệ thống AIRS 52
4.4.1 Khởi tạo 53
4.4.2 Xác định tế bào nhớ và phát sinh ARB 53
4.4.3 Cạnh tranh tài nguyên và phát triển tế bào nhớ ứng viên .56
4.4.4 Giới thiệu tế bào nhớ 59
4.4.5 Phân lớp 61
4.5 Tích hợp logic mờ vào AIRS – FAIRS .61
4.5.1 Biến mờ .61
4.5.2 Tập luật mờ .62
4.5.3 Hàm thành viên .63
Chương 5 Kết luận .65
5.1 Bộ dữ liệu ung thư vú 65
5.1.1 Mục đích thử nghiệm 65
5.1.2 Kết quả đạt được .65
5.2 Bộ dữ liệu ung thư cổ tử cung .67
5.2.1 Mục đích thử nghiệm 67
5.2.2 Kết quả đạt được .67
5.3 Nhận xét .67
5.3.1 Ưu điểm 67
5.3.2 Khuyết điểm 68
5.4 Hướng phát triển 68
Tài liệu tham khảo .69
Phụ lục .73
Chức năng phần mềm 73Trang 7
Các độ đo để đánh giá khả năng thực hiện .73
Thuật toán K láng giềng gần nhất .74
                
              
                                            
                                
            
 
            
                 7 trang
7 trang | 
Chia sẻ: maiphuongtl | Lượt xem: 2256 | Lượt tải: 0 
              
            Bạn đang xem nội dung tài liệu Luận văn Ứng dụng hệ thống nhận dạng miễn dịch tạo mờ trong chẩn đoán ung thư, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Trang 12 
Chương 1 
Tổng quan 
Nội dung của Chương 1 trình bày tổng quan về Hệ thống nhận dạng miễn dịch 
nhân tạo (Artificial Immune Regconition System – AIRS), Hệ thống nhận dạng miễn 
dịch nhân tạo mờ (Fuzzy Artificial Immune Regconition System – FAIRS), và ứng 
dụng chẩn đoán ung thư vú thông qua hai hệ thống này; giới thiệu chung về tình 
hình nghiên cứu hiện nay trên thế giới cũng như trong nước; đồng thời nêu lên mục 
đích, nội dung và ý nghĩa của đề tài. 
1.1 Phát biểu vấn đề 
Khi khoa học kĩ thuật phát triển, cuộc sống của con người không ngừng cải thiện 
nhờ vào các thành tựu nghiên cứu. Máy móc thiết bị đóng vai trò quan trọng trong 
việc cơ giới hoá mọi hoạt động của con người, trong đó phải kể đến các thiết bị y tế, 
y khoa dùng trong việc xét nghiệm và chẩn đoán bệnh. 
Việc tích hợp những ứng dụng giúp hỗ trợ chẩn đoán trong y khoa bắt đầu hình 
thành khi độ chính xác trong các bài toán phân lớp dần tăng cao, khởi đầu từ logic 
mờ, tiếp đến là các loại mạng nơron truyền thống, thuật giải di truyền, các mô hình 
tích hợp… Ở đây, một hệ thống phân lớp được sử dụng để thực hiện phân lớp hay 
còn gọi là chẩn đoán ung thư, được nghiên cứu, phân tích và ứng dụng – gọi là hệ 
thống nhận dạng miễn dịch nhân tạo mờ (FAIRS). 
Cũng như các hệ thống nhận dạng khác, FAIRS cũng bao gồm 2 giai đoạn: huấn 
luyện và thử nghiệm. Trong đó, giai đoạn huấn luyện sẽ sử dụng “cơ chế miễn dịch” 
để đào thải những “tác nhân xấu” (những mẫu không tốt hoặc không cần thiết cho 
việc nhận dạng), chỉ giữ lại những tế bào có ích cho cơ thể. Giai đoạn thử nghiệm 
Trang 13 
được thực hiện bằng cách so khớp mẫu cần phân lớp và những tế bào có ích, nếu 
khớp với mẫu nào nhất thì phân lớp của mẫu cũng chính là kết quả chẩn đoán ung 
thư. 
Quá trình phân tích ứng dụng chẩn đoán ung thư được mô tả trong Hình 1.1. 
Hình 1.1: Tiến trình phân tích ứng dụng chẩn đoán ung thư 
1.2 Hệ thống nhận dạng miễn dịch nhân tạo mờ 
Thuật toán phân lớp bằng Hệ thống nhận dạng miễn dịch nhân tạo (Artificial 
Immune Regconition System - AIRS) là một thuật toán quan trọng trong lĩnh vực 
Hệ thống miễn dịch nhân tạo (Artificial Immune System - AIS) và có khả năng ứng 
dụng rất hiệu quả và hấp dẫn. AIRS được ứng dụng chủ yếu trong các bài toán phân 
lớp y khoa như ung thư vú, bệnh tim, đái tháo đường… và cho những kết quả thỏa 
đáng. Vì vậy, AIRS chứng tỏ được nó là một kỹ thuật trí tuệ nhân tạo trong lĩnh vực 
y khoa. Bên cạnh đó, cơ chế phân phối tài nguyên trong thuật toán AIRS được thực 
hiện bằng logic mờ, gọi là Hệ thống nhận dạng miễn dịch nhân tạo mờ (Fuzzy 
Artificial Regconition System - Fuzzy AIRS). 
Trang 14 
1.3 Hệ thống nhận dạng miễn dịch nhân tạo mờ và chẩn 
đoán ung thư 
Hiện nay, việc sử dụng các hệ thống phân lớp trong chẩn đoán y khoa đang ngày 
càng tăng. Chúng ta không thể phủ định vai trò quan trọng của việc đánh giá bệnh 
án và quyết định của chuyên gia trong chẩn đoán bệnh. Tuy nhiên, những hệ 
chuyên gia cùng những kỹ thuật trí tuệ nhân tạo khác dùng để phân lớp cũng hỗ trợ 
các chuyên gia rất nhiều. Những hệ thống phân lớp có thể xác định được các lỗi hợp 
lý mà một chuyên gia khi mệt mỏi hoặc thiếu kinh nghiệm có thể gặp phải, với thời 
gian ngắn hơn và chi tiết hơn. 
Những đổi mới trong cách điều trị ung thư đã tạo được tỷ lệ sống cao hơn cho 
những người bị bệnh này. Đặc biệt, bệnh được chẩn đoán càng sớm, tỷ lệ sống càng 
tăng. Theo thống kê của các Tổ chức Y tế Thế giới, Ung thư vú là một loại bệnh 
phổ biến ở phụ nữ, chỉ đứng sau ung thư cổ tử cung. Do đó việc đưa kỹ thuật trí tuệ 
nhân tạo vào giải quyết bài toán chẩn đoán ung thư nói chung và ung thư vú nói 
riêng là rất quan trọng. 
Khi hệ thống AIS nổi lên vào thập niên 90, khả năng thực hiện của những phương 
pháp đưa ra không thực sự tốt để giải quyết vấn đề phân lớp. Tuy nhiên, hệ thống 
AIRS đề xuất năm 2001 đã thay đổi được vấn đề này nhờ một số thuộc tính: 
 AIRS thực hiện tốt trên những vấn đề khác nhau như không gian đặc trưng 
có số chiều lớn, có nhiều lớp… 
 AIRS tự điều chỉnh theo cấu trúc không gian của vấn đề. 
Bên cạnh đó, sự phân phối tài nguyên của AIRS được thực hiện bởi logic mờ làm 
tăng khả năng thực hiện phân lớp, giảm được số lượng tài nguyên và thời gian phân 
lớp một cách đáng kể. 
Như vậy, cả hai hệ thống AIRS và Fuzzy AIRS sẽ được dùng để phân lớp tập dữ 
liệu ung thư vú, được thực hiện bởi trường Đại học California tại Urvine (UCI) [15]. 
Trang 15 
Các giai đoạn phát triển từ thuật toán đến ứng dụng được thể hiện trong Hình 1.2. 
Hình 1.2: Giai đoạn phát triển thuật toán 
1.4 Một số nghiên cứu gần đây 
1.4.1 Những nghiên cứu AIRS 
AIRS là bộ phân lớp dựa trên nguyên lý của hệ miễn dịch nhân tạo giới hạn tài 
nguyên được đề xuất bởi Watkins năm 2001 [1]. AIRS có khả năng thực hiện phân 
lớp rất tốt. 
Trong nghiên cứu của Donald E. Goodman, AIRS được áp dụng vào vấn đề đa lớp 
và được so sánh với Learning Vector Quantisation (LVQ) Kohonen [11]. Trong hầu 
hết những lời giải, AIRS cho kết quả tốt hơn LVQ và LVQ tối ưu. Gaurav Marwah 
và Lois Boggess cũng cố gắng thực hiện những phép biến đổi trên sự định vị tài 
nguyên và những hướng tiếp cận cho việc tổ chức tập ARB [23]. Họ khai thác một 
vài thuật toán khác nhằm tăng độ chính xác thuật toán và những phân lớp k láng 
giềng gần nhất. Trong nghiên cứu của Donald E. Goodman, AIRS được kiểm tra 
thực nghiệm bằng cách thay thế một trong hai nguồn năng lượng phân lớp bởi 
Hệ miễn dịch tự nhiên
Natural Immune System - NIS
Hệ miễn dịch nhân tạo
Artificial Immune System - AIS
Hệ nhận dạng miễn dịch nhân tạo
Artificial Immune System - AIRS
Hệ nhận dạng miễn dịch nhân tạo mờ
Fuzzy Artificial Immune System - Fuzzy AIRS
Ứng dụng vào hệ thống phân lớp chẩn đoán
ung thư
Trang 16 
những biến đổi khác [12]. Họ kết luận những biến đổi này cho kết quả thử nghiệm 
nhanh đối với người dùng. Bên cạnh những nghiên cứu này, Hamaker và Boggess 
cũng phân tích hiệu quả của việc thêm độ đo khoảng cách phi Euclidean đối với 
thuật toán AIRS nguyên thủy [13]. 
1.4.2 Những nghiên cứu ung thư vú 
Cũng như những vấn đề chẩn đoán bệnh án khác, các hệ thống phân lớp cũng được 
sử dụng để chẩn đoán ung thư vú. Khi những nghiên cứu liên quan đến các ứng 
dụng phân lớp được kiểm nghiệm, chúng ta có thể thấy một số lượng lớn các 
phương pháp được sử dụng để đạt được hiệu quả phân lớp cao. Phương pháp C4.5 
cho độ chính xác phân lớp là 94.74% sử dụng ngưỡng hợp lý 10 (10 CV) [26]. 
Hamilton thu được độ chính xác 96% với phương pháp RIAC (10 CV) [14]. 
Trong khi đó Ster và Dobnikar đạt 96.8% với phương pháp Linear Discriminant 
Analysis (LDA) (10 CV) [30]. Độ chính xác thu được bởi Bennett và Blue là 
97.2% khi sử dụng phương pháp SVM [7]. Nơron mờ được áp dụng và cho độ 
chính xác là 95.06% (10 CV) [24] và 97.51% với di truyền mờ (huấn luyện 75%, 
kiểm nghiệm 25%) [25]. Hơn nữa, Setiono đạt 98.1% khi sử dụng nơron mờ [29]. 
Goodman cũng áp dụng ba phương pháp khác nhau phương pháp LVQ tối ưu, 
phương pháp LVQ lớn và AIRS với độ chính xác tương ứng là 96.7%, 96.8% và 
97.2% (10 CV) [11]. 
1.5 Phân tích nhu cầu thực tế của ứng dụng 
Theo những tài liệu chuyên ngành cũng như thông tin đại chúng, trên thế giới, ung 
thư vú là nguyên nhân gây tử vong hàng đầu ở phụ nữ. Cứ 5 phụ nữ thì có 1 người 
bị tử vong. Ở Việt Nam, tỷ lệ phát sinh ung thư hàng năm là 116,8 trên 100.000 dân. 
Trong đó, ung thư vú chiếm 22,8% trên tổng số ung thư. Còn ở thành phố Hồ Chí 
Minh, ung thư vú chiếm 12,1% trên tổng số ung thư phát sinh [17]. 
Trang 17 
Ung thư khởi nguồn từ sự phân bào không kiểm soát được và kết quả là xuất hiện 
một khối u có thể nhìn thấy. Khối u có thể lành tính hay ác tính. Khối u ác tính phát 
triển nhanh chóng và xâm lấn một loạt những mô xung quanh gây nguy hiểm cho 
chúng. Ung thư vú là một mô ác tính bắt đầu phát triển bên trong vú. Những bất 
thường xuất hiện bên trong vú làm thay đổi hình dạng và kích thước vú, màu da, sự 
đau nhức,… là những triệu chứng của ung thư vú. Việc chẩn đoán ung thư được 
thực hiện dựa trên những tiêu chuẩn phi phân tử như loại mô, những thuộc tính 
bệnh lý, định vị bệnh án. Cũng như các loại ung thư khác, ung thư vú có thể chữa trị 
tốt hơn khi được phát hiện sớm hơn. Do đó rất cần xây dựng một hệ thống hỗ trợ 
chẩn đoán ung thư vú nói riêng và các loại ung thư nói chung. 
1.6 Mục tiêu của đề tài 
Xây dựng một hệ chẩn đoán ung thư nói riêng và y khoa nói chung là một công việc 
rất rộng nhưng ý nghĩa. Trong phạm vi đề tài này, mục tiêu nghiên cứu tập trung 
vào một số vấn đề sau: 
 Tìm hiểu, xây dựng và đánh giá một thuật toán trí tuệ nhân tạo: Hệ thống 
nhận dạng miễn dịch nhân tạo. Đây là một thuật toán mô phỏng hệ thống 
miễn dịch tự nhiên để giải quyết bài toán phân lớp. 
 Cải tiến thuật toán Hệ thống nhận dạng miễn dịch nhân tạo bằng cách tích 
hợp logic mờ vào bước phân phối tài nguyên hệ thống, nhằm nâng cao độ 
chính xác của quá trình phân lớp. Hệ thống cải tiến được gọi là hệ thống 
nhận dạng miễn dịch nhân tạo mờ - FAIRS. 
 Dùng cơ sở dữ liệu bệnh ung thư vú để đánh giá và so sánh mức độ thực hiện 
của hai hệ thống thuật toán. 
 Thực hiện chẩn đoán ung thư vú thông qua các đặc trưng bệnh án, gồm 9 
thuộc tính được phân tích từ việc lấy sinh thiết tế bào vú. 
 Thực hiện chẩn đoán ung thư cổ tử cung, theo các đặc tính luật chuyên gia và 
luật theo thuật toán trích chọn đặc trưng. 
Trang 18 
1.7 Nội dung của luận văn 
Nội dung của luận văn bao gồm những phần sau: 
 Chương 1 trình bày tổng quan về hệ thống AIRS, hệ thống AIRS mờ, cũng 
như giới thiệu mục đích, ý nghĩa và nội dung đề tài. 
 Chương 2 nêu lên mối quan hệ giữa hệ thống miễn dịch tự nhiên và hệ thống 
miễn dịch nhân tạo, nhằm đưa ra luận cứ xây dựng hệ nhận dạng miễn dịch 
nhân tạo. 
 Chương 3 giới thiệu thuật toán AIRS cơ bản và nhận xét khả năng thực hiện 
của thuật toán về mặt lý thuyết. 
 Chương 4 nêu lên cách ứng dụng thuật toán AIRS vào hệ thống chẩn đoán 
ung thư vú, đồng thời cải tiến thuật toán bằng cách tích hợp logic mờ vào 
giai đoạn phân phối tài nguyên hệ thống. 
 Chương 5 phân tích dữ liệu thử nghiệm và đánh giá kết quả thực nghiệm. 
 Tài liệu tham khảo chứa thông tin nguồn tài liệu tham khảo cho đề tài. 
 Phụ lục giới thiệu chức năng phần mềm, các độ đo sử dụng để đánh giá khả 
năng thực hiện của thuật toán và thuật toán k láng giềng gần nhất.