Luận văn Ứng dụng hệ thống nhận dạng miễn dịch tạo mờ trong chẩn đoán ung thư

ỨNG DỤNG HỆ THỐNG NHẬN DẠNG MIỄN DỊCH TẠO MỜ TRONG CHẨN ĐOÁN UNG THƯ VÕ THỊ THỦY TÚ Trang nhan đề Lời cảm ơn Lời nói đầu Mục lục Danh mục thuật ngữ và viết tắt Danh mục các hình vẽ Danh mục bảng Chương_1: Tổng quan Chương_2: Các hệ thống miễn dịch: Tự nhiên và nhân tạo Chương_3: Thuật toán Hệ thống nhận dạng miễn dịch nhân tạo Chương 4: Ứng dụng vào hệ thống chuẩn đoán ung thư Chương 5: Kết luận Tài liệu tham khảo Phụ lục Mục lục Lời cảm ơn 1 Lời nói đầu 2 Mục lục 4 Danh mục thuật ngữ và viết tắt .8 Danh mục các hình vẽ .10 Danh mục các bảng .11 Chương 1 Tổng quan .12 1.1 Phát biểu vấn đề .12 1.2 Hệ thống nhận dạng miễn dịch nhân tạo mờ .13 1.3 Hệ thống nhận dạng miễn dịch nhân tạo mờ và chẩn đoán ung thư .14 1.4 Một số nghiên cứu gần đây .15 1.4.1 Những nghiên cứu AIRS 15 1.4.2 Những nghiên cứu ung thư vú 16 1.5 Phân tích nhu cầu thực tế của ứng dụng 16 1.6 Mục tiêu của đề tài .17 1.7 Nội dung của luận văn .18 Chương 2 Các hệ thống miễn dịch: Tự nhiên và Nhân tạo .19 2.1 Hệ thống miễn dịch tự nhiên .19 2.1.1 Các thành phần miễn dịch .20 2.1.2 Nhớ và học 25 2.1.3 Tính đa dạng và tính phân phối 26Trang 5 2.1.4 Bản chất của tự nhận biết 27 2.2 Hệ thống miễn dịch nhân tạo .27 2.2.1 Kháng nguyên, kháng thể và tế bào B 27 2.2.2 Quả cầu nhận dạng nhân tạo và sự cạnh tranh tài nguyên 28 2.3 Tế bào nhớ, đột biến và chọn lọc dòng 29 2.4 Mạng miễn dịch và sự tương tác tế bào – tế bào .30 2.5 Sự phân lớp 31 Chương 3 Thuật toán Hệ thống nhận dạng miễn dịch nhân tạo 32 3.1 Các định nghĩa .32 3.2 Thuật toán nhận dạng miễn dịch nhân tạo .35 3.2.1 Khởi tạo 36 3.2.2 Xác định tế bào nhớ và phát sinh ARB 37 3.2.3 Cạnh tranh tài nguyên và phát triển tế bào nhớ ứng viên .39 3.2.4 Giới thiệu tế bào nhớ 43 3.2.5 Phân lớp 44 3.3 Thảo luận về thuật toán AIRS .44 Chương 4 Ứng dụng vào hệ thống chẩn đoán ung thư 47 4.1 Tiến trình chẩn đoán ung thư .47 4.2 Dữ liệu nhập của hệ thống .49 4.2.1 Dữ liệu nhập ung thư vú .49 4.2.2 Dữ liệu nhập ung thư cổ tử cung 50 4.3 Dữ liệu xuất của hệ thống 51 4.3.1 Dữ liệu xuất ung thư vú 51 4.3.2 Dữ liệu xuất ung thư cổ tử cung .52Trang 6 4.4 Xây dựng hệ thống AIRS 52 4.4.1 Khởi tạo 53 4.4.2 Xác định tế bào nhớ và phát sinh ARB 53 4.4.3 Cạnh tranh tài nguyên và phát triển tế bào nhớ ứng viên .56 4.4.4 Giới thiệu tế bào nhớ 59 4.4.5 Phân lớp 61 4.5 Tích hợp logic mờ vào AIRS – FAIRS .61 4.5.1 Biến mờ .61 4.5.2 Tập luật mờ .62 4.5.3 Hàm thành viên .63 Chương 5 Kết luận .65 5.1 Bộ dữ liệu ung thư vú 65 5.1.1 Mục đích thử nghiệm 65 5.1.2 Kết quả đạt được .65 5.2 Bộ dữ liệu ung thư cổ tử cung .67 5.2.1 Mục đích thử nghiệm 67 5.2.2 Kết quả đạt được .67 5.3 Nhận xét .67 5.3.1 Ưu điểm 67 5.3.2 Khuyết điểm 68 5.4 Hướng phát triển 68 Tài liệu tham khảo .69 Phụ lục .73 Chức năng phần mềm 73Trang 7 Các độ đo để đánh giá khả năng thực hiện .73 Thuật toán K láng giềng gần nhất .74

7 trang | Chia sẻ: maiphuongtl | Lượt xem: 2323 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Luận văn Ứng dụng hệ thống nhận dạng miễn dịch tạo mờ trong chẩn đoán ung thư, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Trang 12 Chương 1 Tổng quan Nội dung của Chương 1 trình bày tổng quan về Hệ thống nhận dạng miễn dịch nhân tạo (Artificial Immune Regconition System – AIRS), Hệ thống nhận dạng miễn dịch nhân tạo mờ (Fuzzy Artificial Immune Regconition System – FAIRS), và ứng dụng chẩn đoán ung thư vú thông qua hai hệ thống này; giới thiệu chung về tình hình nghiên cứu hiện nay trên thế giới cũng như trong nước; đồng thời nêu lên mục đích, nội dung và ý nghĩa của đề tài. 1.1 Phát biểu vấn đề Khi khoa học kĩ thuật phát triển, cuộc sống của con người không ngừng cải thiện nhờ vào các thành tựu nghiên cứu. Máy móc thiết bị đóng vai trò quan trọng trong việc cơ giới hoá mọi hoạt động của con người, trong đó phải kể đến các thiết bị y tế, y khoa dùng trong việc xét nghiệm và chẩn đoán bệnh. Việc tích hợp những ứng dụng giúp hỗ trợ chẩn đoán trong y khoa bắt đầu hình thành khi độ chính xác trong các bài toán phân lớp dần tăng cao, khởi đầu từ logic mờ, tiếp đến là các loại mạng nơron truyền thống, thuật giải di truyền, các mô hình tích hợp… Ở đây, một hệ thống phân lớp được sử dụng để thực hiện phân lớp hay còn gọi là chẩn đoán ung thư, được nghiên cứu, phân tích và ứng dụng – gọi là hệ thống nhận dạng miễn dịch nhân tạo mờ (FAIRS). Cũng như các hệ thống nhận dạng khác, FAIRS cũng bao gồm 2 giai đoạn: huấn luyện và thử nghiệm. Trong đó, giai đoạn huấn luyện sẽ sử dụng “cơ chế miễn dịch” để đào thải những “tác nhân xấu” (những mẫu không tốt hoặc không cần thiết cho việc nhận dạng), chỉ giữ lại những tế bào có ích cho cơ thể. Giai đoạn thử nghiệm Trang 13 được thực hiện bằng cách so khớp mẫu cần phân lớp và những tế bào có ích, nếu khớp với mẫu nào nhất thì phân lớp của mẫu cũng chính là kết quả chẩn đoán ung thư. Quá trình phân tích ứng dụng chẩn đoán ung thư được mô tả trong Hình 1.1. Hình 1.1: Tiến trình phân tích ứng dụng chẩn đoán ung thư 1.2 Hệ thống nhận dạng miễn dịch nhân tạo mờ Thuật toán phân lớp bằng Hệ thống nhận dạng miễn dịch nhân tạo (Artificial Immune Regconition System - AIRS) là một thuật toán quan trọng trong lĩnh vực Hệ thống miễn dịch nhân tạo (Artificial Immune System - AIS) và có khả năng ứng dụng rất hiệu quả và hấp dẫn. AIRS được ứng dụng chủ yếu trong các bài toán phân lớp y khoa như ung thư vú, bệnh tim, đái tháo đường… và cho những kết quả thỏa đáng. Vì vậy, AIRS chứng tỏ được nó là một kỹ thuật trí tuệ nhân tạo trong lĩnh vực y khoa. Bên cạnh đó, cơ chế phân phối tài nguyên trong thuật toán AIRS được thực hiện bằng logic mờ, gọi là Hệ thống nhận dạng miễn dịch nhân tạo mờ (Fuzzy Artificial Regconition System - Fuzzy AIRS). Trang 14 1.3 Hệ thống nhận dạng miễn dịch nhân tạo mờ và chẩn đoán ung thư Hiện nay, việc sử dụng các hệ thống phân lớp trong chẩn đoán y khoa đang ngày càng tăng. Chúng ta không thể phủ định vai trò quan trọng của việc đánh giá bệnh án và quyết định của chuyên gia trong chẩn đoán bệnh. Tuy nhiên, những hệ chuyên gia cùng những kỹ thuật trí tuệ nhân tạo khác dùng để phân lớp cũng hỗ trợ các chuyên gia rất nhiều. Những hệ thống phân lớp có thể xác định được các lỗi hợp lý mà một chuyên gia khi mệt mỏi hoặc thiếu kinh nghiệm có thể gặp phải, với thời gian ngắn hơn và chi tiết hơn. Những đổi mới trong cách điều trị ung thư đã tạo được tỷ lệ sống cao hơn cho những người bị bệnh này. Đặc biệt, bệnh được chẩn đoán càng sớm, tỷ lệ sống càng tăng. Theo thống kê của các Tổ chức Y tế Thế giới, Ung thư vú là một loại bệnh phổ biến ở phụ nữ, chỉ đứng sau ung thư cổ tử cung. Do đó việc đưa kỹ thuật trí tuệ nhân tạo vào giải quyết bài toán chẩn đoán ung thư nói chung và ung thư vú nói riêng là rất quan trọng. Khi hệ thống AIS nổi lên vào thập niên 90, khả năng thực hiện của những phương pháp đưa ra không thực sự tốt để giải quyết vấn đề phân lớp. Tuy nhiên, hệ thống AIRS đề xuất năm 2001 đã thay đổi được vấn đề này nhờ một số thuộc tính: AIRS thực hiện tốt trên những vấn đề khác nhau như không gian đặc trưng có số chiều lớn, có nhiều lớp… AIRS tự điều chỉnh theo cấu trúc không gian của vấn đề. Bên cạnh đó, sự phân phối tài nguyên của AIRS được thực hiện bởi logic mờ làm tăng khả năng thực hiện phân lớp, giảm được số lượng tài nguyên và thời gian phân lớp một cách đáng kể. Như vậy, cả hai hệ thống AIRS và Fuzzy AIRS sẽ được dùng để phân lớp tập dữ liệu ung thư vú, được thực hiện bởi trường Đại học California tại Urvine (UCI) [15]. Trang 15 Các giai đoạn phát triển từ thuật toán đến ứng dụng được thể hiện trong Hình 1.2. Hình 1.2: Giai đoạn phát triển thuật toán 1.4 Một số nghiên cứu gần đây 1.4.1 Những nghiên cứu AIRS AIRS là bộ phân lớp dựa trên nguyên lý của hệ miễn dịch nhân tạo giới hạn tài nguyên được đề xuất bởi Watkins năm 2001 [1]. AIRS có khả năng thực hiện phân lớp rất tốt. Trong nghiên cứu của Donald E. Goodman, AIRS được áp dụng vào vấn đề đa lớp và được so sánh với Learning Vector Quantisation (LVQ) Kohonen [11]. Trong hầu hết những lời giải, AIRS cho kết quả tốt hơn LVQ và LVQ tối ưu. Gaurav Marwah và Lois Boggess cũng cố gắng thực hiện những phép biến đổi trên sự định vị tài nguyên và những hướng tiếp cận cho việc tổ chức tập ARB [23]. Họ khai thác một vài thuật toán khác nhằm tăng độ chính xác thuật toán và những phân lớp k láng giềng gần nhất. Trong nghiên cứu của Donald E. Goodman, AIRS được kiểm tra thực nghiệm bằng cách thay thế một trong hai nguồn năng lượng phân lớp bởi Hệ miễn dịch tự nhiên Natural Immune System - NIS Hệ miễn dịch nhân tạo Artificial Immune System - AIS Hệ nhận dạng miễn dịch nhân tạo Artificial Immune System - AIRS Hệ nhận dạng miễn dịch nhân tạo mờ Fuzzy Artificial Immune System - Fuzzy AIRS Ứng dụng vào hệ thống phân lớp chẩn đoán ung thư Trang 16 những biến đổi khác [12]. Họ kết luận những biến đổi này cho kết quả thử nghiệm nhanh đối với người dùng. Bên cạnh những nghiên cứu này, Hamaker và Boggess cũng phân tích hiệu quả của việc thêm độ đo khoảng cách phi Euclidean đối với thuật toán AIRS nguyên thủy [13]. 1.4.2 Những nghiên cứu ung thư vú Cũng như những vấn đề chẩn đoán bệnh án khác, các hệ thống phân lớp cũng được sử dụng để chẩn đoán ung thư vú. Khi những nghiên cứu liên quan đến các ứng dụng phân lớp được kiểm nghiệm, chúng ta có thể thấy một số lượng lớn các phương pháp được sử dụng để đạt được hiệu quả phân lớp cao. Phương pháp C4.5 cho độ chính xác phân lớp là 94.74% sử dụng ngưỡng hợp lý 10 (10 CV) [26]. Hamilton thu được độ chính xác 96% với phương pháp RIAC (10 CV) [14]. Trong khi đó Ster và Dobnikar đạt 96.8% với phương pháp Linear Discriminant Analysis (LDA) (10 CV) [30]. Độ chính xác thu được bởi Bennett và Blue là 97.2% khi sử dụng phương pháp SVM [7]. Nơron mờ được áp dụng và cho độ chính xác là 95.06% (10 CV) [24] và 97.51% với di truyền mờ (huấn luyện 75%, kiểm nghiệm 25%) [25]. Hơn nữa, Setiono đạt 98.1% khi sử dụng nơron mờ [29]. Goodman cũng áp dụng ba phương pháp khác nhau phương pháp LVQ tối ưu, phương pháp LVQ lớn và AIRS với độ chính xác tương ứng là 96.7%, 96.8% và 97.2% (10 CV) [11]. 1.5 Phân tích nhu cầu thực tế của ứng dụng Theo những tài liệu chuyên ngành cũng như thông tin đại chúng, trên thế giới, ung thư vú là nguyên nhân gây tử vong hàng đầu ở phụ nữ. Cứ 5 phụ nữ thì có 1 người bị tử vong. Ở Việt Nam, tỷ lệ phát sinh ung thư hàng năm là 116,8 trên 100.000 dân. Trong đó, ung thư vú chiếm 22,8% trên tổng số ung thư. Còn ở thành phố Hồ Chí Minh, ung thư vú chiếm 12,1% trên tổng số ung thư phát sinh [17]. Trang 17 Ung thư khởi nguồn từ sự phân bào không kiểm soát được và kết quả là xuất hiện một khối u có thể nhìn thấy. Khối u có thể lành tính hay ác tính. Khối u ác tính phát triển nhanh chóng và xâm lấn một loạt những mô xung quanh gây nguy hiểm cho chúng. Ung thư vú là một mô ác tính bắt đầu phát triển bên trong vú. Những bất thường xuất hiện bên trong vú làm thay đổi hình dạng và kích thước vú, màu da, sự đau nhức,… là những triệu chứng của ung thư vú. Việc chẩn đoán ung thư được thực hiện dựa trên những tiêu chuẩn phi phân tử như loại mô, những thuộc tính bệnh lý, định vị bệnh án. Cũng như các loại ung thư khác, ung thư vú có thể chữa trị tốt hơn khi được phát hiện sớm hơn. Do đó rất cần xây dựng một hệ thống hỗ trợ chẩn đoán ung thư vú nói riêng và các loại ung thư nói chung. 1.6 Mục tiêu của đề tài Xây dựng một hệ chẩn đoán ung thư nói riêng và y khoa nói chung là một công việc rất rộng nhưng ý nghĩa. Trong phạm vi đề tài này, mục tiêu nghiên cứu tập trung vào một số vấn đề sau: Tìm hiểu, xây dựng và đánh giá một thuật toán trí tuệ nhân tạo: Hệ thống nhận dạng miễn dịch nhân tạo. Đây là một thuật toán mô phỏng hệ thống miễn dịch tự nhiên để giải quyết bài toán phân lớp. Cải tiến thuật toán Hệ thống nhận dạng miễn dịch nhân tạo bằng cách tích hợp logic mờ vào bước phân phối tài nguyên hệ thống, nhằm nâng cao độ chính xác của quá trình phân lớp. Hệ thống cải tiến được gọi là hệ thống nhận dạng miễn dịch nhân tạo mờ - FAIRS. Dùng cơ sở dữ liệu bệnh ung thư vú để đánh giá và so sánh mức độ thực hiện của hai hệ thống thuật toán. Thực hiện chẩn đoán ung thư vú thông qua các đặc trưng bệnh án, gồm 9 thuộc tính được phân tích từ việc lấy sinh thiết tế bào vú. Thực hiện chẩn đoán ung thư cổ tử cung, theo các đặc tính luật chuyên gia và luật theo thuật toán trích chọn đặc trưng. Trang 18 1.7 Nội dung của luận văn Nội dung của luận văn bao gồm những phần sau: Chương 1 trình bày tổng quan về hệ thống AIRS, hệ thống AIRS mờ, cũng như giới thiệu mục đích, ý nghĩa và nội dung đề tài. Chương 2 nêu lên mối quan hệ giữa hệ thống miễn dịch tự nhiên và hệ thống miễn dịch nhân tạo, nhằm đưa ra luận cứ xây dựng hệ nhận dạng miễn dịch nhân tạo. Chương 3 giới thiệu thuật toán AIRS cơ bản và nhận xét khả năng thực hiện của thuật toán về mặt lý thuyết. Chương 4 nêu lên cách ứng dụng thuật toán AIRS vào hệ thống chẩn đoán ung thư vú, đồng thời cải tiến thuật toán bằng cách tích hợp logic mờ vào giai đoạn phân phối tài nguyên hệ thống. Chương 5 phân tích dữ liệu thử nghiệm và đánh giá kết quả thực nghiệm. Tài liệu tham khảo chứa thông tin nguồn tài liệu tham khảo cho đề tài. Phụ lục giới thiệu chức năng phần mềm, các độ đo sử dụng để đánh giá khả năng thực hiện của thuật toán và thuật toán k láng giềng gần nhất.

Các file đính kèm theo tài liệu này:

7.pdf
0.pdf
1.pdf
10.pdf
11.pdf
12.pdf
13.pdf
2.pdf
3.pdf
4.pdf
5.pdf
6.pdf
8.pdf
9.pdf