Tóm lại, khi giải quyết bài toán bằng mạng nơron theo thủ tục truyền ngƣợc
có những vấn đề rút ra là:
- Sẽ có bao nhiêu nơron trong mạng, bao nhiêu ngõ vào, bao nhiêu ngõ ra và
bao nhiêu lớp ẩn. Càng nhiều lớp ẩn bài toán trở nên phức tạp nhƣng có thể giải
quyết đƣợc những vấn đề lớn.
- Thuật toán Back propagation cung cấp một phƣơng pháp “xấp xỉ” cho việc
tìm trong không gian trọng số (nhằm tìm ra những trọng số phù hợp cho mạng).
Chúng ta càng lấy giá trị của tham số học càng nhỏ bao nhiêu thì sự thay đổi trọng
số càng nhỏ bấy nhiêu và quỹ đạo không gian học sẽ càng trơn. Tuy nhiên điều này
lại làm cho tốc độ học chậm đi. Trái lại, nếu chúng ta chọn tham số tốc độ học quá
lớn, sự thay đổi lớn của các trọng số có thể làm cho mạng trở nên không ổn định.
Về mặt ý tƣởng, tất cả các nơron trong mạng nên chọn cùng một tốc độ học, tham
số học nên gán một giá trị nhỏ. Các nơron với nhiều ngõ vào nên chọn một tham
số tốc độ học nhỏ hơn để giữ một thời gian học tƣơng tự cho nhau cho tất cả các
nơron trong mạng
144 trang |
Chia sẻ: huyhoang44 | Lượt xem: 769 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận án Nghiên cứu một thuật toán tìm điểm tối ưu toàn cục trong quá trình luyện mạng nơron bằng thuật toán vƣợt khe có sự kết hợp với giải thuật di truyền, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
uấn luyện chất lƣợng mạng, performance
learning, là một lớp quan trọng khác của luật huấn luyện, trong phƣơng pháp này thì
các thông số mạng đƣợc điều chỉnh để tối ƣu hóa chất lƣợng của mạng. Thuật toán
lan truyền ngƣợc là một phát minh chính trong nghiên cứu về mạng nơ-ron, thuộc
loại thuật học chất lƣợng mạng (học có giám sát). Ngƣợc dòng thời gian, chúng ta
thấy rằng sau khoảng mƣời năm kể từ khi lan truyền ngƣợc bắt đầu đƣợc thai
nghén, năm 1974, thì thuật học lan truyền ngƣợc đƣợc chính thức nghiên cứu lại và
mở rộng ra một cách độc lập bởi David Rumelhart, Geoffey Hinton và Ronald
Williams; David Parker và Yann Le Cun. Thuật toán đã đƣợc phổ biến hóa bởi cuốn
sách Parallel Distributed Processing của nhóm tác giả David Rumelhart và James
Mc Clelland. Tuy nhiên, thuật toán nguyên thủy thì quá chậm chạp đối với hầu hết
các ứng dụng thực tế [1], có nhiều lý do cho việc hội tụ chậm trong đó có sự ảnh
hƣởng của bƣớc học.
Luận án Tiến sĩ Kỹ thuật 2013
111
Nhắc lại rằng lan truyền ngƣợc, tiền thân của nó là thuật học Widow-Hoff
(thuật toán LMS, Least Mean Square), là một thuật toán xấp xỉ giảm dốc nhất.
Giống với luật học LMS, hàm mục tiêu là trung bình bình phƣơng sai số. Điểm
khác giữa thuật toán LMS và lan truyền ngƣợc chỉ là cách mà các đạo hàm đƣợc
tính. Đối với mạng tuyến tính một lớp đơn giản, sai số là hàm tuyến tính tƣờng
minh của các trọng số, và các đạo hàm của nó liên quan tới các trọng số có thể đƣợc
tính toán một cách dễ dàng. Trong các mạng nhiều lớp với các hàm phi tuyến, mối
quan hệ giữa các trọng số mạng và sai số là cực kỳ phức tạp. Để tính các đạo hàm,
chúng ta cần sử dụng luật chuỗi.
Chúng ta đã thấy rằng giảm dốc nhất là một thuật toán đơn giản, và thông
thƣờng chậm nhất. Thuật toán gradient liên hợp và phƣơng pháp Newton’s nói
chung mang đến sự hội tụ nhanh hơn [6]. Khi nghiên cứu về các thuật toán nhanh
hơn thì thƣờng rơi vào hai trƣờng phái. Trƣờng phái thứ nhất phát triển về các kỹ
thuật tìm kiếm. Các kỹ thuật tìm kiếm bao gồm các ý tƣởng nhƣ việc thay đổi tốc độ
học, sử dụng qui tắc mô-men, bƣớc học thích nghi. Trƣờng phái khác của nghiên
cứu nhằm vào các kỹ thuật tối ƣu hóa số chuẩn, điển hình là phƣơng pháp gradient
liên hợp, hay thuật toán Levengerg-Marquardt (một biến thể của phƣơng pháp
Newton). Tối ƣu hóa số đã là một chủ đề nghiên cứu quan trọng với 30, 40 năm, nó
dƣờng nhƣ là nguyên nhân để tìm kiếm các thuật toán huấn luyện nhanh.
Ta biết rằng, thuật toán LMS đƣợc đảm bảo để hội tụ tới một lời giải cực tiểu
hóa trung bình bình phƣơng sai số, miễn là tốc độ học không quá lớn. Điều này là
đúng bởi vì trung bình bình phƣơng sai số cho một mạng tuyến tính một lớp là một
hàm toàn phƣơng. Hàm toàn phƣơng chỉ có một điểm tĩnh. Hơn nữa, ma trận
Hessian của hàm toàn phƣơng là hằng số, cho nên độ dốc của hàm theo hƣớng là
không thay đổi, và các hàm đồng mức có dạng hình e-lip.
Lan truyền ngƣợc giảm dốc nhất (SDBP) cũng nhƣ LMS, nó cũng là một
thuật toán xấp xỉ giảm dốc nhất cho việc cực tiểu trung bình bình phƣơng sai số.
Thật vậy, lan truyền ngƣợc giảm dốc nhất là tƣơng đƣơng thuật toán LMS khi sử
dụng trên mạng tuyến tính một lớp.
Bâ
.
.
Luận án Tiến sĩ Kỹ thuật 2013
112
.
.
.
(1985).
.
.
.
. C
Luận án Tiến sĩ Kỹ thuật 2013
113
.
.
phân
loại
nhau,
gradient descend.
Tóm lại, khi giải quyết bài toán bằng mạng nơron theo thủ tục truyền ngƣợc
có những vấn đề rút ra là:
- Sẽ có bao nhiêu nơron trong mạng, bao nhiêu ngõ vào, bao nhiêu ngõ ra và
bao nhiêu lớp ẩn. Càng nhiều lớp ẩn bài toán trở nên phức tạp nhƣng có thể giải
quyết đƣợc những vấn đề lớn.
- Thuật toán Back propagation cung cấp một phƣơng pháp “xấp xỉ” cho việc
tìm trong không gian trọng số (nhằm tìm ra những trọng số phù hợp cho mạng).
Chúng ta càng lấy giá trị của tham số học càng nhỏ bao nhiêu thì sự thay đổi trọng
số càng nhỏ bấy nhiêu và quỹ đạo không gian học sẽ càng trơn. Tuy nhiên điều này
lại làm cho tốc độ học chậm đi. Trái lại, nếu chúng ta chọn tham số tốc độ học quá
lớn, sự thay đổi lớn của các trọng số có thể làm cho mạng trở nên không ổn định.
Về mặt ý tƣởng, tất cả các nơron trong mạng nên chọn cùng một tốc độ học, tham
số học nên gán một giá trị nhỏ. Các nơron với nhiều ngõ vào nên chọn một tham
số tốc độ học nhỏ hơn để giữ một thời gian học tƣơng tự cho nhau cho tất cả các
nơron trong mạng.
Luận án Tiến sĩ Kỹ thuật 2013
114
II.3.2. Hiệu quả của lan truyền ngƣợc
.
(w)
trọng hóa
i
ijij zwa , v i
ji ;
trên
(w).
(w)
(w
2
) g O(w)
(w) để lan truyền ngƣợc (w)
(w
2
)
(w) -
.
II.4. Các vấn đề trong xây dựng mạng MLP
II.4.1. Chuẩn bị dữ liệu
a. Kích thước mẫu
Không có nguyên tắc nào hƣớng dẫn kích thƣớc mẫu phải là bao nhiêu đối
với một bài toán cho trƣớc. Hai yếu tố quan trọng ảnh hƣởng đến kích thƣớc mẫu:
♦ Dạng hàm đích: khi hàm đích càng phức tạp thì kích thƣớc mẫu cần tăng.
♦ Nhiễu: khi dữ liệu bị nhiễu (thông tin sai hoặc thiếu thông tin) kích thƣớc
mẫu cần tăng.
Luận án Tiến sĩ Kỹ thuật 2013
115
Đối với mạng truyền thẳng, cho hàm đích có độ phức tạp nhất định, kèm một
lƣợng nhiễu nhất định thì độ chính xác của mô hình luôn có một giới hạn nhất định.
Có thể cần tập mẫu vô hạn để đạt đến giới hạn chính xác. Nói cách khác độ chính
xác của mô hình là hàm theo kích thƣớc tập mẫu. Khi kích thƣớc mẫu tăng, độ
chính xác sẽ đƣợc cải thiện - lúc đầu nhanh, nhƣng chậm dần khi tiến đến giới hạn.
Dạng tổng quát của mối liên hệ giữa sai số và kích thƣớc mẫu nhƣ sau:
Hình 3: Mối liên hệ giữa sai số và kích thước mẫu
Trong thực hành thƣờng gặp phải 2 vấn đề sau:
♦ Đối với hầu hết bài toán thực tế, mẫu bị ràng buộc chặt chẽ với dữ liệu có
sẵn. Ta thƣờng không có đƣợc số lƣợng mẫu mong muốn.
♦ Kích thƣớc mẫu cũng có thể bị giới hạn bởi bộ nhớ hoặc khả năng lƣu trữ
của máy tính. Nếu tất cả các dữ liệu đồng thời đƣợc giữ trong bộ nhớ suốt thời gian
luyện, kích thƣớc bộ nhớ máy tính sẽ bị chiếm dụng nghiêm trọng.
Nếu lƣu trữ trên đĩa sẽ cho phép dùng mẫu lớn hơn nhƣng thao tác đọc đĩa từ
thế hệ này sang thế hệ khác khiến cho tiến trình chậm đi rất nhiều.
Chú ý: việc tăng kích thƣớc mẫu không làm tăng thời gian luyện. Những tập
mẫu lớn hơn sẽ yêu cầu ít thế hệ luyện hơn. Nếu ta tăng gấp đôi kích thƣớc của
mẫu, mỗi thế hệ luyện sẽ tốn thời gian khoảng gấp đôi, nhƣng số thế hệ cần luyện sẽ
giảm đi một nửa. Điều này có nghĩa là kích thƣớc mẫu (cũng có nghĩa là độ chính
xác của mô hình) không bị giới hạn bởi thời gian luyện.
Luật cơ bản là: Sử dụng mẫu lớn nhất có thể sao cho đủ khả năng lƣu trữ
trong bộ nhớ trong (nếu lƣu trữ đồng thời) hoặc trên đĩa từ (đủ thời gian đọc từ đĩa).
Luận án Tiến sĩ Kỹ thuật 2013
116
b. Mẫu con
Trong xây dựng mô hình cần chia tập mẫu thành 2 tập con: một để xây dựng
mô hình gọi là tập huấn luyện (training set), và một để kiểm nghiệm mô hình gọi là
tập kiểm tra (test set). Thông thƣờng dùng 2/3 mẫu cho huấn luyện và 1/3 cho kiểm
tra. Điều này là để tránh tình trạng quá khớp (overfitting).
c. Sự phân tầng mẫu
Nếu ta tổ chức mẫu sao cho mỗi mẫu trong quần thể đều có cơ hội nhƣ nhau
thì tập mẫu đƣợc gọi là tập mẫu đại diện. Tuy nhiên khi ta xây dựng một mạng để
xác định xem một mẫu thuộc một lớp hay thuộc một loại nào thì điều ta mong muốn
là các lớp có cùng ảnh hƣởng lên mạng, để đạt đƣợc điều này ta có thể sử dụng mẫu
phân tầng. Xét ví dụ sau:
Giả sử ta xây dựng mô hình nhận dạng chữ cái viết tay tiếng Anh, và nguồn
dữ liệu của ta có 100.000 ký tự mà mỗi ký tự đƣợc kèm theo một mã cho biết nó là
chữ cái nào. Chữ cái xuất hiện thƣờng xuyên nhất là e, nó xuất hiện 11.668 lần
chiếm khoảng 12%; chữ cái xuất hiện ít nhất là chữ z, chỉ có 50 lần chiếm 0,05%.
Trƣớc hết do giới hạn của bộ nhớ máy tính, giả sử bộ nhớ chỉ có thể xử lý
đƣợc 1300 mẫu. Ta tạo hai dạng tập mẫu: tập mẫu đại diện và tập mẫu phân tầng.
Với tập mẫu đại diện, chữ e sẽ xuất hiện 152 lần (11,67% của 1300) trong khi đó
chữ z chỉ xuất hiện một lần (0,05% của 1300). Ngƣợc lại ta có thể tạo tập mẫu phân
tầng để mỗi chữ có 50 mẫu. Ta thấy rằng nếu chỉ có thể dùng 1300 mẫu thì tập mẫu
phân tầng sẽ tạo ra mô hình tốt hơn. Việc tăng số mẫu của z từ 1 lên 50 sẽ cải thiện
rất nhiều độ chính xác của z, trong khi nếu giảm số mẫu của e từ 152 xuống 50 sẽ
chỉ giảm chút ít độ chính xác của e.
Bây giờ giả sử ta dùng máy tính khác có bộ nhớ đủ để xử lý một lƣợng mẫu
gấp 10 lần, nhƣ vậy số mẫu sẽ tăng lên 13000. Rõ ràng việc tăng kích thƣớc mẫu sẽ
giúp cho mô hình chính xác hơn. Tuy nhiên ta không thể dùng tập mẫu phân tầng
nhƣ trên nữa vì lúc này ta sẽ cần tới 500 mẫu cho chữ z trong khi ta chỉ có 50 mẫu
trong nguồn dữ liệu. Để giải quyết điều này ta tạo tập mẫu nhƣ sau: tập mẫu gồm tất
cả các chữ hiếm với số lần xuất hiện của nó và kèm thêm thông tin về chữ có nhiều
mẫu nhất. Chẳng hạn ta tạo tập mẫu có 50 mẫu của chữ z (đó là tất cả) và 700 mẫu
của chữ e (chữ mà ta có nhiều mẫu nhất).
Nhƣ vậy trong tập mẫu của ta, chữ e có nhiều hơn chữ z 14 lần. Nếu ta muốn
các chữ z cũng có nhiều ảnh hƣởng nhƣ các chữ e, khi học chữ z ta cho chúng trọng
Luận án Tiến sĩ Kỹ thuật 2013
117
số lớn hơn 14 lần. Để làm đƣợc điều này ta có thể can thiệp chút ít vào quá trình lan
truyền ngƣợc trên mạng. Khi mẫu học là chữ z, ta thêm vào 14 lần đạo hàm, nhƣng
khi mẫu là chữ e ta chỉ thêm vào 1 lần đạo hàm. Ở cuối thế hệ, khi cập nhật các
trọng số, mỗi chữ z sẽ có ảnh hƣởng hơn mỗi chữ e là 14 lần, và tất cả các chữ z
gộp lại sẽ có bằng có ảnh hƣởng bằng tất cả các chữ e.
d. Chọn biến
Khi tạo mẫu cần chọn các biến sử dụng trong mô hình. Có 2 vấn đề cần quan
tâm:
♦ Cần tìm hiểu cách biến đổi thông tin sao cho có lợi cho mạng hơn: thông
tin trƣớc khi đƣa vào mạng cần đƣợc biến đổi ở dạng thích hợp nhất, để mạng đạt
đƣợc hiệu suất cao nhất. Xét ví dụ về bài toán dự đoán một ngƣời có mắc bệnh ung
thƣ hay không. Khi đó ta có trƣờng thông tin về ngƣời này là “ngày tháng năm
sinh”. Mạng sẽ đạt đƣợc hiệu quả cao hơn khi ta biến đổi trƣờng thông tin này sang
thành “tuổi”. Thậm chí ta có thể quy tuổi về một trong các giá trị: 1 = “trẻ em”
(dƣới 18), 2 = “thanh niên” (từ 18 đến dƣới 30), 3 = “trung niên” (từ 30 đến dƣới
60) và 4 = “già” (từ 60 trở lên).
♦ Chọn trong số các biến đã đƣợc biến đổi biến nào sẽ đƣợc đƣa vào mô
hình: không phải bất kì thông tin nào về mẫu cũng có lợi cho mạng. Trong ví dụ dự
đoán ngƣời có bị ung thƣ hay không ở trên, những thuộc tính nhƣ “nghề nghiệp”,
“nơi sinh sống”, “tiểu sử gia đình”, là những thông tin có ích. Tuy nhiên những
thông tin nhƣ “thu nhập”, “số con cái”, là những thông tin không cần thiết.
II.4.2. Xác định các tham số cho mạng
a. Chọn hàm truyền
Không phải bất kỳ hàm truyền nào cũng cho kết quả nhƣ mong muốn. Để trả
lời cho câu hỏi «hàm truyền như thế nào được coi là tốt ? » là điều không hề đơn
giản. Có một số quy tắc khi chọn hàm truyền nhƣ sau:
♦ Không dùng hàm truyền tuyến tính ở tầng ẩn. Vì nếu dùng hàm truyền
tuyến tính ở tầng ẩn thì sẽ làm mất vai trò của tầng ẩn đó: Xét tầng ẩn thứ i:
Tổng trọng số ni = wiai-1 + bi
ai = f(ni) = wf ni +bf (hàm truyền tuyến tính)
Khi đó: tổng trọng số tại tầng thứ (i + 1)
ni+1 = wi+1ai + bi+1
Luận án Tiến sĩ Kỹ thuật 2013
118
= wi+1[wf ni +bf] + bi+1
= wi+1 [wf(wiai-1 + bi) + bf] + bi+1
= Wai-1 + b
Nhƣ vậy ni+1 = Wai-1 + b, và tầng i đã không còn giá trị nữa.
♦ Chọn các hàm truyền sao cho kiến trúc mạng nơron là đối xứng (tức là với
đầu vào ngẫu nhiên thì đầu ra có phân bố đối xứng). Nếu một mạng nơron không
đối xứng thì giá trị đầu ra sẽ lệch sang một bên, không phân tán lên toàn bộ miền
giá trị của output. Điều này có thể làm cho mạng rơi vào trạng thái bão hòa, không
thoát ra đƣợc.
Trong thực tế ngƣời ta thƣờng sử dụng các hàm truyền dạng – S. Một hàm
s(u) đƣợc gọi là hàm truyền dạng – S nếu nó thỏa mãn 3 tính chất sau:
– s(u) là hàm bị chặn: tức là tồn tại các hằng số C1 ≤ C2 sao cho: C1 ≤ s(u) ≤
C2 với mọi u.
– s(u) là hàm đơn điệu tăng: giá trị của s(u) luôn tăng khi u tăng. Do tính chất
thứ nhất, s(u) bị chặn, nên s(u) sẽ tiệm cận tới giá trị cận trên khi u dần tới dƣơng vô
cùng, và tiệm cận giá trị cận dƣới khi u dần tới âm vô cùng.
– s(u) là hàm khả vi: tức là s(u) liên tục và có đạo hàm trên toàn trục số.
Có 3 dạng hàm kích hoạt thƣờng đƣợc dùng trong thực tế:
*Hàm dạng bước:
00
01
x
x
xstep
x
x
xstep
0
1
*Hàm dấu:
01
01
x
x
xstep
x
x
xstep
1
1
*Hàm sigmoid:
xe
xSigmoid
1
1
)(
Một hàm truyền dạng - S điển hình và đƣợc áp dụng rộng rãi là hàm
Sigmoid.
Luận án Tiến sĩ Kỹ thuật 2013
119
b. Xác định số nơron tầng ẩn
Câu hỏi chọn số lƣợng noron trong tầng ẩn của một mạng MLP thế nào là
khó, nó phụ thuộc vào bài toán cụ thể và vào kinh nghiệm của nhà thiết kế mạng.
Nếu tập dữ liệu huấn luyện đƣợc chia thành các nhóm với các đặc tính tƣơng tự
nhau thì số lƣợng các nhóm này có thể đƣợc sử dụng để chọn số lƣợng nơron ẩn.
Trong trƣờng hợp dữ liệu huấn luyện nằm rải rác và không chứa các đặc tính chung,
số lƣợng kết nối có thể gần bằng với số lƣợng các mẫu huấn luyện để mạng có thể
hội tụ. Có nhiều đề nghị cho việc chọn số lƣợng nơron tầng ẩn h trong một mạng
MLP. Chẳng hạn h phải thỏa mãn h>(p-1)/(n+2), trong đó p là số lƣợng mẫu huấn
luyện và n là số lƣợng đầu vào của mạng. Càng nhiều nút ẩn trong mạng, thì càng
nhiều đặc tính của dữ liệu huấn luyện sẽ đƣợc mạng nắm bắt, nhƣng thời gian học
sẽ càng tăng.
Một kinh nghiệm khác cho việc chọn số lƣợng nút ẩn là số lƣợng nút ẩn bằng
với số tối ƣu các cụm mờ (fuzzy clusters)[8]. Phát biểu này đã đƣợc chứng minh
bằng thực nghiệm. Việc chọn số tầng ẩn cũng là một nhiệm vụ khó. Rất nhiều bài
toán đòi hỏi nhiều hơn một tầng ẩn để có thể giải quyết tốt.
Để tìm ra mô hình mạng nơron tốt nhất, Ishikawa and Moriyama (1995) sử
dụng học cấu trúc có quên (structural leanrning with forgetting), tức là trong thời
gian học cắt bỏ đi các liên kết có trọng số nhỏ. Sau khi huấn luyện, chỉ các noron có
đóng góp vào giải quyết bài toán mới đƣợc giữ lại, chúng sẽ tạo nên bộ xƣơng cho
mô hình mạng nơron.
c. Khởi tạo trọng số
Trọng thƣờng đƣợc khởi tạo bằng phƣơng pháp thử sai, nó mang tính chất
kinh nghiệm và phụ thuộc vào từng bài toán. Việc định nghĩ thế nào là một bộ trọng
tốt cũng không hề đơn giản. Một số quy tắc khi khởi tạo trọng:
♦ Khởi tạo trọng sao cho mạng nơron thu đƣợc là cân bằng (với đầu vào
ngẫu nhiên thì sai số lan truyền ngƣợc cho các ma trận trọng số là xấp xỉ bằng
nhau):
|ΔW1/W1| = |ΔW2/W2| = |ΔW3/W3|
Nếu mạng nơron không cân bằng thì quá trình thay đổi trọng số ở một số ma
trận là rất nhanh trong khi ở một số ma trận khác lại rất chậm, thậm chí không đáng
kể. Do đó để các ma trận này đạt tới giá trị tối ƣu sẽ mất rất nhiều thời gian.
Luận án Tiến sĩ Kỹ thuật 2013
120
♦ Tạo trọng sao cho giá trị kết xuất của các nút có giá trị trung gian. (0.5 nếu
hàm truyền là hàm Sigmoid). Rõ ràng nếu ta không biết gì về giá trị kết xuất thì giá
trị ở giữa là hợp lý. Điều này cũng giúp ta tránh đƣợc các giá trị thái quá.
Thủ tục khởi tạo trọng thƣờng đƣợc áp dụng:
– B1: Khởi tạo các trọng số nút ẩn (và các trọng số của các cung liên kết trực tiếp
giữa nút nhập và nút xuất, nếu có) giá trị ngẫu nhiên, nhỏ, phân bố đều quanh 0.
– B2: Khởi tạo một nửa số trọng số của nút xuất giá trị 1, và nửa kia giá trị -1.
Giải thuật di truyền
Giải thuật di truyền (Genetic Algorithms - GA) đã đƣợc đề cập trong rất
nhiều tài liệu, trong đó có các công trình của D.E. Goldberg [26] và Thomas Back
[27]. Trong phần này chỉ trình bày các khái niệm cơ bản về giải thuật di truyền và
khả năng ứng dụng của nó.
I.2. Tóm tắt về giải thuật di truyền
Từ trƣớc tới nay, trong các nghiên cứu và ứng dụng tin học đã xuất hiện
nhiều bài toán chƣa tìm ra đƣợc phƣơng pháp giải nhanh và hợp lý. Phần lớn đó là
các bài toán tối ƣu nảy sinh trong các ứng dụng. Để giải các bài toán này ngƣời ta
thƣờng phải tìm đến một giải thuật hiệu quả mà kết quả thu đƣợc chỉ là xấp xỉ tối
ƣu. Trong nhiều trƣờng hợp chúng ta có thể sử dụng giải thuật xác suất, tuy không
bảo đảm kết quả tối ƣu nhƣng cũng có thể chọn các giá trị sao cho sai số đạt đƣợc
sẽ nhỏ nhƣ mong muốn.
Theo lời giải xác suất, việc giải bài toán quy về quá trình tìm kiếm trên
không gian tập hợp các lời giải có thể. Tìm đƣợc lời giải tốt nhất và quá trình đƣợc
hiểu là tối ƣu. Với miền tìm kiếm nhỏ, một số thuật toán cổ điển đƣợc sử dụng. Tuy
nhiên đối với các miền lớn, phải sử dụng các kỹ thuật trí tuệ nhân tạo đặc biệt, giải
thuật di truyền là một trong những công cụ đó. Ý tƣởng của giải thuật di truyền là
mô phỏng những gì mà tự nhiên đã thực hiện. GA hình thành dựa trên quan niệm
cho rằng: quá trình tiến hóa tự nhiên là quá trình hoàn hảo nhất, hợp lý nhất và tự nó
đã mang tính tối ƣu.
Giải thuật di truyền áp dụng quá trình tiến hóa tự nhiên để giải các bài toán
tối ưu trong thực tế (từ tập các lời giải có thể ban đầu thông qua nhiều bước
Luận án Tiến sĩ Kỹ thuật 2013
121
tiến hóa hình thành các tập hợp mới với lời giải tốt hơn và cuối cùng sẽ tìm
được lời giải gần tối ưu).
Giải thuật di truyền là một kỹ thuật của khoa học máy tính nhằm tìm kiếm
giải pháp thích hợp cho các bài toán tối ƣu tổ hợp (combinatorial optimization).
Giải thuật di truyền là một phân ngành của giải thuật tiến hóa vận dụng các nguyên
lý của tiến hóa nhƣ di truyền, đột biến, chọn lọc tự nhiên, và trao đổi chéo.
Giải thuật di truyền thƣờng đƣợc ứng dụng nhằm sử dụng ngôn ngữ máy tính
để mô phỏng quá trình tiến hoá của một tập hợp những đại diện trừu tƣợng (gọi là
những nhiễm sắc thể) của các giải pháp có thể (gọi là những cá thể) cho bài toán tối
ƣu hóa vấn đề. Tập hợp này sẽ tiến triển theo hƣớng chọn lọc những giải pháp tốt
hơn.
Thông thƣờng, những giải pháp đƣợc thể hiện dƣới dạng nhị phân với những
chuỗi 0 và 1, nhƣng lại mang nhiều thông tin mã hóa khác nhau. Quá trình tiến hóa
xảy ra từ một tập hợp những cá thể hoàn toàn ngẫu nhiên ở tất cả các thế hệ. Trong
từng thế hệ, tính thích nghi của tập hợp này đƣợc ƣớc lƣợng, nhiều cá thể đƣợc
chọn lọc định hƣớng từ tập hợp hiện thời (dựa vào thể trạng), đƣợc sửa đổi (bằng
đột biến hoặc tổ hợp lại) để hình thành một tập hợp mới. Tập hợp này sẽ tiếp tục
đƣợc chọn lọc lặp đi lặp lại trong các thế hệ kế tiếp của giải thuật.
Giải thuật di truyền cũng nhƣ các thuật toán tiến hoá đều đƣợc hình thành
dựa trên một quan niệm đƣợc coi là một tiên đề phù hợp với thực tế khách quan. Đó
là quan niệm "Quá trình tiến hoá tự nhiên là quá trình hoàn hảo nhất, hợp lý nhất và
tự nó đã mang tính tối ƣu". Quá trình tiến hoá thể hiện tính tối ƣu ở chỗ thế hệ sau
bao giờ cũng tốt hơn thế hệ trƣớc.
Quá trình phát triển của giải thuật di truyền có thể đƣợc chỉ ra qua các mốc
thời gian sau:
1960: Ý tƣởng đầu tiên về Tính toán tiến hoá đƣợc Rechenberg giới thiệu
trong công trình "Evolution Strategies" (Các chiến lƣợc tiến hoá). Ý tƣởng này sau
đó đƣợc nhiều nhà nghiên cứu phát triển.
Luận án Tiến sĩ Kỹ thuật 2013
122
1975: Giải thuật gen do John Holland phát minh và đƣợc phát triển bởi ông
cùng với các đồng nghiệp và những sinh viên. Cuốn sách "Adaption in Natural and
Artificial Systems" (Sự thích nghi trong các hệ tự nhiên và nhân tạo) xuất bản năm
1975 đã tổng hợp các kết quả của quá trình nghiên cứu và phát triển đó.
1992: John Koza đã dùng GA để xây dựng các chƣơng trình giải quyết một
số bài toán và gọi phƣơng pháp này là "lập trình gen".
Ngày nay giải thuật di truyền càng trở nên quan trọng, đặc biệt là trong lĩnh
vực tối ƣu hoá, một lĩnh vực có nhiều bài toán thú vị, đƣợc ứng dụng nhiều trong
thực tiễn nhƣng thƣờng khó và chƣa có giải thuật hiệu quả để giải.
I.3. Các khái niệm cơ bản
Giải thuật di truyền dựa vào quá trình tiến hoá trong tự nhiên nên các khái
niệm và thuật ngữ của nó đều có liên quan đến các thuật ngữ của di truyền học.
I.3.1. Cá thể, nhiễm sắc thể
Một cá thể trong giải thuật di truyền, biểu diễn một giải pháp của bài toán.
Tuy nhiên không giống với trong tự nhiên, một cá thể có nhiều nhiễm sắc thể
(NST),có 1 thì gọi là thể đơn bội, còn nếu có nhiều thì là thể đa bội, ở đây để giới
hạn trong giải thuật di truyền ta quan niệm một cá thể có một nhiễm sắc thể. Do đó
khái niệm cá thể và nhiễm sắc thể trong giải thuật di truyền coi nhƣ là tƣơng đƣơng.
Một NST đƣợc tạo thành từ nhiều gen, mỗi gen có thể có các giá trị khác
nhau để quy định một tính trạng nào đó. Trong GA, một gen đƣợc coi nhƣ một phần
tử trong chuỗi NST.
I.3.2. Quần thể
Quần thể là một tập hợp các cá thể có cùng một số đặc điểm nào đấy. Trong
giải thuật di truyền ta quan niệm quần thể là một tập các lời giải của một bài toán.
I.3.3. Các toán tử di truyền
a. Chọn lựa
Trong tự nhiên, quá trình chọn lọc và đấu tranh sinh tồn đã làm thay đổi các
cá thể trong quần thể. Những cá thể tốt, thích nghi đƣợc với điều kiện sống thì có
Luận án Tiến sĩ Kỹ thuật 2013
123
khả năng đấu tranh lớn hơn, do đó có thể tồn tại và sinh sản. Các cá thể không thích
nghi đƣợc với điều kiện sống thì dần mất đi. Dựa vào nguyên lý của quá trình chọn
lọc và đấu tranh sinh tồn trong tự nhiên, chọn lựa các cá thể trong GA chính là cách
chọn các cá thể có độ thích nghi tốt để đƣa vào thế hệ tiếp theo hoặc để cho lai
ghép, với mục đích là sinh ra các cá thể mới tốt hơn. Có nhiều cách để lựa chọn
nhƣng cuối cùng đều nhằm đáp ứng mục tiêu là các cá thể tốt sẽ có khả năng đƣợc
chọn cao hơn.
b. Lai ghép
Lai ghép trong tự nhiên là sự kết hợp các tính trạng của bố mẹ để sinh ra thế
hệ con. Trong giải thuật di truyền, lai ghép đƣợc coi là một sự tổ hợp lại các tính
chất (thành phần) trong hai lời giải cha mẹ nào đó để sinh ra một lời giải mới mà có
đặc tính mong muốn là tốt hơn thế hệ cha mẹ. Đây là một quá trình xảy ra chủ yếu
trong giải thuật di truyền.
c. Đột biến
Đột biến là một sự biến đổi tại một (hay một số) gen của nhiễm sắc thể ban
đầu để tạo ra một nhiễm sắc thể mới. Đột biến có xác suất xảy ra thấp hơn lai ghép.
Đột biến có thể tạo ra một cá thể mới tốt hơn hoặc xấu hơn cá thể ban đầu. Tuy
nhiên trong giải thuật di truyền thì ta luôn muốn tạo ra những phép đột biến cho
phép cải thiện lời giải qua từng thế hệ.
I.4. Mô hình giải thuật di truyền
Luận án Tiến sĩ Kỹ thuật 2013
124
Nhận các tham số
của bài toán
Khởi tạo quần thể
ban đầu
Tính giá trị thích nghi
Sinh sản
Lai ghép
Đột biến
Điều kiện
dừng
Kết
thúc
Bắt đầu
Lựa chọn giải pháp tốt
nhất
Với các khái niệm đƣợc nêuở trên, giải thuật di truyền đƣợc mô tả nhƣ sau:
1.[Bắt đầu] Nhận các tham số cho thuật toán.
2.[Khởi tạo] Sinh ngẫu nhiên một quần thể gồm n cá thể (là n lời giải cho
bài toán).
3. [Quần thể mới] Tạo quần thể mới bằng cách lặp lại các bƣớc sau cho đến
khi quần thể mới hoàn thành.
a.[Thích nghi] Ƣớc lƣợng độ thích nghi eval(x) của mỗi cá thể.
Hình 4: Mô hình của giải thuật di truyền
Luận án Tiến sĩ Kỹ thuật 2013
125
b.[Kiểm tra] Kiểm tra điều kiện kết thúc giải thuật.
c.[Chọn lọc] Chọn hai cá thể bố mẹ từ quần thể cũ theo độ thích nghi
của chúng (cá thể có độ thích nghi càng cao thì càng có nhiều khả năng đƣợc
chọn)
d.[Lai ghép] Với một xác suất lai ghép đƣợc chọn, lai ghép hai cá thể
bố mẹ để tạo ra một cá thể mới.
e.[Đột biến] Với một xác suất đột biến đƣợc chọn, biến đổi cá thể mới
4. [Chọn kết quả] Nếu điều kiện dừng đƣợc thỏa mãn thì thuật toán kết thúc
và trả về lời giải tốt nhất trong quần thể hiện tại.
Mặc dù GA có khả năng đạt tới cực trị toàn cục cho quá trình tìm kiếm
nhƣng do có kết hợp những yếu tố ngẫu nhiên nên tốc độ tìm kiếm nói chung là rất
chậm. Mặt khác nó không thể hoàn toàn đạt đƣợc tới cực trị toàn cục mà chỉ cho
những kết quả xung quanh đó. Đối lập với GA, giải thuật lan truyền ngƣợc sai số
(BP) lại cho phép đạt đƣợc những cực trị nếu nhƣ điểm xuất phát của quá trình tìm
kiếm nằm trong vùng cực trị toàn cục.
Luận án Tiến sĩ Kỹ thuật 2013
126
PHỤ LỤC 2: MÃ NGUỒN CHƢƠNG TRÌNH LUYỆN MẠNG NƠRON VỚI
BƢỚC HỌC VƢỢT KHE NHẬN DẠNG ĐỐI TƢỢNG
% Lap trinh tong quat cho thuat toan vuot khe
% Date:15-10-2011
% Version 1
%-------------------------------------------------------
a=ap;
u0=up;
% huongtim
d1=subs(Ju1,u1);%d1=diff(J,u1)
d2=subs(Ju2,u2);%d2=diff(J,u2)
Ju=[d1 d2];
s0=-Ju;
PPThammuctieu
%J=(u1-5)^2+(u2-5)^2;
Jtruoc=J;
%Buoc 1 ----------------------------------------
%XL=anpha
%XU=beta
XL=a;
u01=u0+XL*s0;
u1=u01(1);
u2=u01(2);
%J=(u1-5)^2+(u2-5)^2;
PPThammuctieu
Jsau=J;
if Jsau > Jtruoc %Jsau=Jsau; Jtruoc=Jtruoc
XL=0;
XU=a;
else
XL=a;
b=1.5*a;
XU=b;
Jtruoc=Jsau;
end
u02=u0+XU*s0;
u1=u02(1);
u2=u02(2);
PPThammuctieu
Jsau=J;
while Jsau<Jtruoc
% if Jsau > Jtruoc`
% F=Jtruoc;
% break
% else
XL=a;
b=1.5*a;
XU=b;
Jtruoc=Jsau;
u03=u0+XU*s0;
Luận án Tiến sĩ Kỹ thuật 2013
127
u1=u03(1);
u2=u03(2);
PPThammuctieu
Jsau=J;
end
%end
if Jsau > Jtruoc
F = Jtruoc;
end
% Buoc 2 ---------------------------------------
% FL1=abs(XU-XL)
while (abs(XU-XL)>FD)
%FL=abs(XU-XL);
%FL1=FL;
% if FL <=FD
% break
% else
TH=XL+gama*(XU-XL);
teta = TH;
u04=u0+TH*s0;
u1=u04(1);
u2=u04(2);
PPThammuctieu
Jsau=J;
if Jsau<F
XU =TH;
Jtruoc = F;
else
XL=TH;
u05=u0+XL*s0;
u1=u05(1);
u2=u05(2);
PPThammuctieu
Jtruoc=J;
end
% end
end
tocdohoc=TH;
% if abs(XU-XL)<=FD
% XL=XU
% end
c=tocdohoc
%Gradient------------------------------
e{3}=t(:,k)-x{3};
J=J+sum(e{3}.^2);
Ju1=diff(J,u1);
Ju2=diff(J,u2);
%Ham muc tieu
e{3}=t(:,k)-x{3};
J=J+sum(e{3}.^2);
Luận án Tiến sĩ Kỹ thuật 2013
128
%------------------------------------------
% Lap trinh tong quat cho thuat toan vuot khe
% Date:15-10-2011
% Version 1
%-------------------------------------------------------
function y = PPTbexulynuocthai(p,t)
clc
clear;
%Nhap du lieu vao he thong
L=3;%so lop
g=inline('1./(1+exp(-x))');%Activation function
unl=[5 16 3];%The units of each layers
% lt=0.3;% learning rate
J=1;
sum=0;
sum1=0;
%Initital the Weights and biases
for i=1:L-1
for n=1:unl(i)
for m=1:unl(i+1)
w{i}(m,n)=1*rand;%The Weights
end
end
for m=1:unl(i+1)
b{i}(m,1)=1*rand;% The biases
end
end
w{L}=eye(unl(L));
while (J>0.00001)& sum<1000
sum=sum+1;%Number of Loops
J=0;
for k=1:length(p)
x{1}=p(:,k);% Inputs vector
% Feed forward Propagation
for i=1:L-1
s{i}=w{i,1}*x{i}+b{i};
x{i+1}=g(s{i});
%x{i+1};
end
%The caculatar error
PPThammuctieu
%Feed back Propagation
for i=L-1:-1:1
e{i}=(x{i+1}.*(1-
x{i+1})).*(w{i+1}'*e{i+1});
thuattoanvuotkhe%Su dung thuat toan vuot khe de xac
%dinh toc do hoc cua mang neural
deltw{i}=(c.*e{i})*x{i};
w{i}=w{i}+deltw{i};% The modify
Weights
Luận án Tiến sĩ Kỹ thuật 2013
129
deltb{i}=(c.*e{i}).*ones(unl(i+1),1);
b{i}=b{i}+deltb{i};% The modify
biases
end
end
J=J/2;
if mod(sum,100)==0
sum1=sum1+1;
data(sum1,1)=sum;
data(sum1,2)=J;
end
end
% Example a value
x{1} = [22 35 1 6 36]';
for i=1:L-1
s{i}=w{i}*x{i}+b{i};
x{i+1}=g(s{i});
end
x{i+1}
%x{L}
semilogy(data(:,1),data(:,2)),grid
%-------------------------------
Luận án Tiến sĩ Kỹ thuật 2013
130
PHỤ LỤC 3: MÃ NGUỒN CHƢƠNG TRÌNH LUYỆN MẠNG NƠRON
VỚI BƢỚC HỌC VƢỢT KHE ĐỂ NHẬN DẠNG CHỮ VIẾT
dinhnghia.h
/*
*=======================================================================*
*------------------------------------------------------------------------
*
* DE TAI : HUAN LUYEN MANG NO-RON VOI BUOC HOC TINH THEO NGUYEN LY
VUOT KHE *
* NGON NGU : C
* TRINH DICH : VISUAL C++
* TEN TEP : dinhnghia.h
*-----------------------------------------------------------------------*
*=======================================================================*
*/
#define SIGMF(x) 1/(1 + exp(-(double)x))//HAM KICH HOAT NO RON
#define DSIGM(y) (float)(y)*(1.0-y))//DAO HAM CUA HAM KICH HOAT NO RON
#define SLNRLV 35 // SO LUONG NO RON LOP VAO
#define SLNRLA 5 // SO LUONG NO RON LOP AN
#define SLNRLR 10 // SO LUONG NO RON LOP RA
#define EPSILON 0.06 // SAI SO TRUNG BINH BINH PHUONG DE DUNG QUA
TRINH LUYEN MANG
#define SLMHL 18 // SO LUONG MAU HUAN LUYEN MANG
#define STEPinit 0.5 // GIA TRI KHOI TAO BUOC HOC, CO THE DUNG CHO
NHIEU TRUONG HOP
#define DCBH 0.0001 // DIEU CHINH BUOC HOC
#define MSDCBH 5 // MAU SO DIEU CHINH BUOC HOC
#define TSDCBH 5 // TU SO DIEU CHINH BUOC HOC
#define BLTD 30000 // BUOC LAP TOI DA
#define FD 1e-1 //
taphuanluyen.h
/*
*====================================================================*
*-----------------------------------------------------------------------*
* DE TAI : HUAN LUYEN MANG NO-RON VOI BUOC HOC TINH THEO NGUYEN LY
VUOT KHE *
* NGON NGU : C
* TRINH DICH : VISUAL C++
* TEN TEP : taphuanluyen.h
*-----------------------------------------------------------------------*
*=======================================================================*
*/
#include "dinhnghia.h"
//TAP MAU HUAN LUYEN DAU VAO
int TAPHUANLUYEN[SLMHL][SLNRLV] =
{
{ 0,1,1,1,1,1,0, /* 0 */
1,0,0,0,0,0,1,
1,0,0,0,0,0,1,
1,0,0,0,0,0,1,
0,1,1,1,1,1,0 },
{ 0,0,0,0,0,0,0, /* 1 */
0,1,0,0,0,0,1,
1,1,1,1,1,1,1,
0,0,0,0,0,0,1,
Luận án Tiến sĩ Kỹ thuật 2013
131
0,0,0,0,0,0,0 },
{ 0,1,0,0,0,0,1, /* 2 */
1,0,0,0,0,1,1,
1,0,0,0,1,0,1,
1,0,0,1,0,0,1,
0,1,1,0,0,0,1 },
{ 1,0,0,0,0,1,0, /* 3 */
1,0,0,0,0,0,1,
1,0,0,1,0,0,1,
1,1,1,0,1,0,1,
1,0,0,0,1,1,0 },
{ 0,0,0,1,1,0,0, /* 4 */
0,0,1,0,1,0,0,
0,1,0,0,1,0,0,
1,1,1,1,1,1,1,
0,0,0,0,1,0,0 },
{ 1,1,1,0,0,1,0, /* 5 */
1,0,1,0,0,0,1,
1,0,1,0,0,0,1,
1,0,1,0,0,0,1,
1,0,0,1,1,1,0 },
{ 0,0,1,1,1,1,0, /* 6 */
0,1,0,1,0,0,1,
1,0,0,1,0,0,1,
1,0,0,1,0,0,1,
0,0,0,0,1,1,0 },
{ 1,0,0,0,0,0,0, /* 7 */
1,0,0,0,0,0,0,
1,0,0,1,1,1,1,
1,0,1,0,0,0,0,
1,1,0,0,0,0,0 },
{ 0,1,1,0,1,1,0, /* 8 */
1,0,0,1,0,0,1,
1,0,0,1,0,0,1,
1,0,0,1,0,0,1,
0,1,1,0,1,1,0 },
{ 0,1,1,0,0,0,0, /* 9 */
1,0,0,1,0,0,1,
1,0,0,1,0,0,1,
1,0,0,1,0,1,0,
0,1,1,1,1,0,0 },
{ 1,1,1,1,0,0,0, /* 4 */
0,0,0,1,0,0,0,
0,0,0,1,0,0,0,
0,0,0,1,0,0,0,
1,1,1,1,1,1,1 },
{ 1,1,1,1,0,1,0, /* 5 */
1,0,0,1,0,0,1,
1,0,0,1,0,0,1,
1,0,0,1,0,0,1,
1,0,0,0,1,1,0 },
Luận án Tiến sĩ Kỹ thuật 2013
132
{ 1,0,0,0,0,0,0, /* 7 */
1,0,0,0,0,0,0,
1,0,0,1,0,0,0,
1,1,1,1,1,1,1,
0,0,0,1,0,0,0 },
{ 0,1,0,0,0,1,0, /* 3 */
1,0,0,0,0,0,1,
1,0,0,1,0,0,1,
1,0,1,0,1,0,1,
0,1,1,0,1,1,0 },
{ 1,0,0,0,0,1,1, /* 2 */
1,0,0,0,1,0,1,
1,0,0,1,0,0,1,
1,0,1,0,0,0,1,
1,1,0,0,0,0,1 },
{ 1,1,1,1,0,0,0, /* 4 */
0,0,0,1,0,0,0,
0,0,0,1,0,0,0,
1,1,1,1,1,1,1,
0,0,0,1,0,0,0 },
{ 1,1,1,1,1,1,1, /* 0 */
1,0,0,0,0,0,1,
1,0,0,0,0,0,1,
1,0,0,0,0,0,1,
1,1,1,1,1,1,1 },
{ 0,1,1,0,0,0,1, /* 9 */
1,0,0,1,0,0,1,
1,0,0,1,0,0,1,
1,0,0,1,0,0,1,
0,1,1,1,1,1,1 } };
//DAU RA MONG MUON TUONG UNG
int DRMM[SLMHL][SLNRLR] =
{
{ 1,0,0,0,0,0,0,0,0,0 }, /* 0 */
{ 0,1,0,0,0,0,0,0,0,0 }, /* 1 */
{ 0,0,1,0,0,0,0,0,0,0 }, /* 2 */
{ 0,0,0,1,0,0,0,0,0,0 }, /* 3 */
{ 0,0,0,0,1,0,0,0,0,0 }, /* 4 */
{ 0,0,0,0,0,1,0,0,0,0 }, /* 5 */
{ 0,0,0,0,0,0,1,0,0,0 }, /* 6 */
{ 0,0,0,0,0,0,0,1,0,0 }, /* 7 */
{ 0,0,0,0,0,0,0,0,1,0 }, /* 8 */
{ 0,0,0,0,0,0,0,0,0,1 }, /* 9 */
{ 0,0,0,0,1,0,0,0,0,0 }, /* 4 */
{ 0,0,0,0,0,1,0,0,0,0 }, /* 5 */
{ 0,0,0,0,0,0,0,1,0,0 }, /* 7 */
{ 0,0,0,1,0,0,0,0,0,0 }, /* 3 */
{ 0,0,1,0,0,0,0,0,0,0 }, /* 2 */
{ 0,0,0,0,1,0,0,0,0,0 }, /* 4 */
{ 1,0,0,0,0,0,0,0,0,0 }, /* 0 */
{ 0,0,0,0,0,0,0,0,0,1 } };/* 9 */
backprop5.c
/*
*=======================================================================*
Luận án Tiến sĩ Kỹ thuật 2013
133
*------------------------------------------------------------------------
*
* DE TAI : HUAN LUYEN MANG NO-RON VOI BUOC HOC TINH THEO NGUYEN LY
VUOT KHE *
* NGON NGU : C
* TRINH DICH : VISUAL C++
* TEN TEP : backprop.c
*------------------------------------------------------------------------
*
*=======================================================================*
*/
#include
#include
#include
#include "taphuanluyen.h"
#include "dinhnghia.h"
/************************** DINH NGHIA CAC BIEN TOAN CUC
****************************/
float MTTSLA[SLNRLV][SLNRLA]; //MA TRAN TRONG SO LOP AN
float MTTSLR[SLNRLA][SLNRLR]; //MA TRAN TRONG SO LOP RA
float BTMTTSLA[SLNRLV][SLNRLA];//BIEN THIEN MA TRAN TRONG SO LOP AN
float BTMTTSLR[SLNRLA][SLNRLR];//BIEN THIEN MA TRAN TRONG SO LOP RA
float x[SLNRLV]; //VEC-TO DAU VAO LOP VAO
float y[SLNRLA]; //VEC TO DAU RA LOP AN
float z[SLNRLR]; //VEC TO DAU RA LOP RA
float HW1[SLNRLV][SLNRLA]; //KHONG SU DUNG
float HW2[SLNRLV][SLNRLA]; //KHONG SU DUNG
float OW1[SLNRLA][SLNRLR]; //KHONG SU DUNG
float OW2[SLNRLA][SLNRLR]; //KHONG SU DUNG
float SSLA[SLNRLA]; //SAI SO LOP AN
float SSLR[SLNRLR]; //SAI SO LOP RA
int PATR[SLMHL];
float ECM[SLMHL];
float TOCDOHOC=2; //TOC DO HOC
int SOBUOCLAP=0;
float BVK=0; //BUOC VUOT KHE
int NBS=0;
float FX[SLMHL];
float F[SLMHL];
float A,GAMA;
float QUANTINH=0.1; //TOAN HANG QUAN TINH
int MTDVKT[35]; //MA TRAN DAU VAO KIEM TRA
long int itr;
int HTHL; //HOAN THANH HUAN LUYEN
int LCBH; //LUA CHON BUOC HOC
int RESET; //RESET MANG
int RES=1; //RESET MANG
int SDM; //SU DUNG MANG
/*************** KET THUC DINH NGHIA CAC BIEN TOAN CUC ****************/
/*************************** CAC NGUYEN MAU HAM ***********************/
int KHOITAOMANG();
void QUATRINHHUANLUYEN();
void DAPUNGDAURA(int afer[]);
float GIATRIHAMMUCTIEU(int x[],float y[],int SIZE);
void DIEUCHINHTRONGSO(int k);
void HAMMUCTIEU();
void BUOCLAP();
/***************************** CAC HAM VA CAC THU TUC ******************/
Luận án Tiến sĩ Kỹ thuật 2013
134
/*----------------------------------------------------------------------
Ten Ham: KHOITAOMANG
Mo ta: 1. KHOI TAO MA TRAN TRONG SO LOP AN, VOI CACS GIA TRI
NGAU NHIEN BI CHAN
2. KHOI TAO MA TRAN TRONG SO LOP RA, VOI CACS GIA
TRI NGAU NHIEN BI CHAN
Cac dau vao: KHONG CO
Gia tri tra ve: 1
--------------------------------------------------------------------*/
int KHOITAOMANG()
{
int i,j;
int ch;
int num;
NBS=0;
HTHL=2;
RESET=0;
RES=1;
MHL=0;
srand(time(0));
for(i=0;i<SLNRLV;i++)
for(j=0;j<SLNRLA;j++)
{
MTTSLA[i][j] = -0.5+ (float) rand()/RAND_MAX;
BTMTTSLA[i][j] = 0;
}
for(i=0;i<SLNRLA;i++)
for(j=0;j<SLNRLR;j++)
{
MTTSLR[i][j] = -0.5 + (float) rand()/RAND_MAX;
BTMTTSLR[i][j] = 0;
}
for(i=0;i<SLMHL;i++)
PATR[i] = 0;
for(i=0;i<35;i++)
MTDVKT[i]=0;
return 1;
}
/*---------------------------------------------------------------------
Ten Thu tuc: TOCDOHOCZERO
Mo ta: 1. CAC DAU RA CUA MANG VAN LA ZERO, VI TOC DO HOC LA
ZERO.
2. CAC SAI SO HOAN TOAN BANG VOI CAC DAU RA MONG
MUON.
3. THU TUC NAY DUNG DE PHUC VU CHO VIEC TINH
TOAN BUOC VUOT KHE.
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
------------------------------------------------------------------------
*/
void TOCDOHOCZERO(void)
{
int t;
TOCDOHOC=0;
Luận án Tiến sĩ Kỹ thuật 2013
135
BUOCLAP();
HAMMUCTIEU();
for(t=0;t<SLMHL;t++)
FX[t] = ECM[t];
}
/*---------------------------------------------------------------------
Ten Thu tuc: TINHBUOCHOCVUOTKHE
Ngay sua : 03-11-2007
Phien ban : V2
Mo ta: THU TUC TINH BUOC HOC THEO NGUYEN LY VUOT KHE
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
----------------------------------------------------------------------*/
void TINHBUOCHOCVUOTKHE(void)
{
float XL,XU,FL[SLMHL],temp;
int i,t,j;
if(NBS==0)
{
A=0.5;
GAMA=0.1;
TOCDOHOC=A;
}
for(t=0;t<SLMHL;t++)
FL[t]=FX[t];
XL=0;
BUOC1:
TOCDOHOC=A;
BUOCLAP();
HAMMUCTIEU();
for(t=0;t<SLMHL;t++)
F[t] = ECM[t];
if(F[t]>FL[t])
{
XU=A;
goto BUOC2;
}
//XL=A;
for(t=0;t<SLMHL;t++)
FL[t]=F[t];
XL=A;
A=1.5*A;
XU=A;
goto BUOC1;
BUOC2:
if(FD>=(XU-FL))
goto BUOC3;
A=XL+GAMA*(XU-XL);
temp=TOCDOHOC;
TOCDOHOC=A;
BUOCLAP();
HAMMUCTIEU();
TOCDOHOC=temp;
for(t=0;t<SLMHL;t++)
F[t] = ECM[t];
for(t=0;t<SLMHL;t++)
Luận án Tiến sĩ Kỹ thuật 2013
136
if(FL[t]>F[t])
{
XU=A;
for(j=0;j<SLMHL;j++)
FL[j]=F[j];
goto BUOC2;
}
for(t=0;t<SLMHL;t++)
if(F[t]>FL[t])
{
for(j=0;j<SLMHL;j++)
FL[j]=F[j];
XL=A;
goto BUOC2;
}
BUOC3:
for(t=0;t<SLMHL;t++)
FX[t]=F[t];
NBS=NBS+1;
TOCDOHOC=A;
}
/*-----------------------------------------------------------------------
----
Ten Thu tuc: TINHTOANBUOCHOC
Mo ta: TINH TOAN TOC DO HOC SAU MOI BUOC LAP
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
-----------------------------------------------------------------------*/
void TINHTOANBUOCHOC()
{
TOCDOHOC=TSDCBH/(SOBUOCLAP*0.001+MSDCBH);
}
/*-----------------------------------------------------------------------
Ten Thu tuc: BUOCLAP
Mo ta: DIEU CHINH CAC TRONG SO CUA MANG
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
------------------------------------------------------------------------
*/
void BUOCLAP()
{
int i;
i=0;
//LUA CHON MAU HUAN LUYEN NGAU NHIEN: i = (int)(SLMHL*rnd), VOI
0<rnd<1
do
{
i = (int)(SLMHL*(float) rand() / RAND_MAX);
}while(PATR[i]);
DAPUNGDAURA(TAPHUANLUYEN[i]);
DIEUCHINHTRONGSO(i);
}
/*-----------------------------------------------------------------------
Ten Thu tuc: HUANLUYENCODINH
Mo ta: HUAN LUYEN MANG DE TB-BINH PHUONG SAI SO DAU RA NHO HON
EPSILON CHO TRUOC
BUOC HOC LA MOT HANG SO.
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
Luận án Tiến sĩ Kỹ thuật 2013
137
-----------------------------------------------------------------------*/
void HUANLUYENCODINH()
{
int t,l;
printf("\nDANG HUAN LUYEN MANG VOI BUOC HOC CO DINH...\n");
START:
if(RES==0)
printf("\nKHOI DONG VA HUAN LUYEN LAI MANG!");
KHOITAOMANG();
//Luyen mang
do
{
TOCDOHOC=0.2;
BUOCLAP();
HAMMUCTIEU();
l = 1;
for(t=0;t<SLMHL;t++)
{
PATR[t] = ECM[t] < EPSILON;
l = l && (PATR[t]);
}
SOBUOCLAP++;
RESET++;
if(RESET>15000)break;
if(SOBUOCLAP>BLTD)
{
HTHL=0;
printf("\nQUA TRINH HUAN LUYEN MANG THAT BAI! \n");
printf("\nDE NGHI HUAN LUYEN LAI! \n");
break;
}
}while(!l);//while(!l && !kbhit());
if(RESET>15000)
{
RES=0;
goto START;
}
if(SOBUOCLAP<BLTD)
{
printf("\n\nMANG DA DUOC HUAN LUYEN XONG SAU: ");
printf("%ld",RESET);
printf(" BUOC LAP!\n\n");
}
}
/*-----------------------------------------------------------------------
-
Ten Thu tuc: HUANLUYENGIAMDAN
Mo ta: HUAN LUYEN MANG DE TB-BINH PHUONG SAI SO DAU RA NHO HON
EPSILON CHO TRUOC
BUOC HOC DUOC TINH THEO PHUONG PHAP GIAM DAN DON
GIAN
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
-------------------------------------------------------------------------
-*/
void HUANLUYENGIAMDAN()
{
int t,l;
printf("\n\nDANG HUAN LUYEN MANG VOI BUOC HOC GIAM DAN...\n");
Luận án Tiến sĩ Kỹ thuật 2013
138
START:
if(RES==0)
printf("\n\nKHOI DONG VA HUAN LUYEN LAI MANG!");
KHOITAOMANG();
//Luyen mang
do
{
TINHTOANBUOCHOC();
BUOCLAP();
HAMMUCTIEU();
l = 1;
for(t=0;t<SLMHL;t++)
{
PATR[t] = ECM[t] < EPSILON;
l = l && (PATR[t]);
}
SOBUOCLAP++;
RESET++;
if(RESET>3000)break;
if(SOBUOCLAP>BLTD)
{
HTHL=0;
printf("\nQUA TRINH HUAN LUYEN MANG THAT BAI! \n");
printf("\nDE NGHI HUAN LUYEN LAI! \n");
break;
}
}while(!l);//while(!l && !kbhit());
if(RESET>3000)
}
if(SOBUOCLAP<BLTD)
{
HTHL=1;
printf("\n\nMANG DA DUOC HUAN LUYEN XONG SAU: ");
printf("%ld",RESET);
printf(" BUOC LAP!\n\n");
}
}
/*-----------------------------------------------------------------------
-
Ten Thu tuc: HUANLUYENVUOTKHE
Mo ta: HUAN LUYEN MANG DE TB-BINH PHUONG SAI SO DAU RA NHO HON
EPSILON CHO TRUOC
BUOC HOC DUOC TINH THEO NGUYEN LY VUOT KHE
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
------------------------------------------------------------------------
*/
void HUANLUYENVUOTKHE()
{
int t,l;
printf("\n\nDANG HUAN LUYEN MANG THEO BUOC VUOT KHE...\n");
START:
if(RES==0){
printf("\nKHOI DONG VA HUAN LUYEN LAI MANG!");
}
KHOITAOMANG();
TOCDOHOCZERO();
TINHBUOCHOCVUOTKHE();
//Luyen mang
Luận án Tiến sĩ Kỹ thuật 2013
139
do
{
TINHBUOCHOCVUOTKHE();
BUOCLAP();
HAMMUCTIEU();
l = 1;
for(t=0;t<SLMHL;t++)
{
PATR[t] = ECM[t] < EPSILON;
l = l && (PATR[t]);
}
SOBUOCLAP++;
RESET++;
// printf("lan lap thu %d\n",RESET);
if(RESET>100)break;
if(SOBUOCLAP>BLTD)
{
HTHL=0;
printf("\nQUA TRINH HUAN LUYEN MANG THAT BAI! \n");
printf("\nDE NGHI HUAN LUYEN LAI! \n");
break;
}
}while(!l);//while(!l && !kbhit());
if(RESET>100)
{
RES=0;
goto START;
}
if(SOBUOCLAP<BLTD)
{
HTHL=1;
printf("\n\nMANG DA DUOC HUAN LUYEN XONG SAU: ");
printf("%ld",RESET);
printf(" BUOC LAP!\n\n");
}
}
/*-----------------------------------------------------------------------
-
Ten Thu tuc: DAPUNGDAURA
Mo ta: TINH CAC DAU RA LOP AN, y, VA DAU RA LOP RA, z, TU DAU
VAO LOPA VAO, x.
Cac dau vao: VEC-TO DAU VAO x[i]
Gia tri tra ve: KHONG CO
------------------------------------------------------------------------
*/
void DAPUNGDAURA(int afer[])
{
int i,j;
float totin;
for(i=0;i<SLNRLV;i++)
x[i] = (float)afer[i];
for(j=0;j<SLNRLA;j++)
{
totin = 0;
for(i=0;i<SLNRLV;i++)
totin = totin + x[i]*MTTSLA[i][j];
Luận án Tiến sĩ Kỹ thuật 2013
140
y[j] = SIGMF(totin);
}
for(j=0;j<SLNRLR;j++)
{
totin = 0;
for(i=0;i<SLNRLA;i++)
totin = totin + y[i]*MTTSLR[i][j];
z[j] = SIGMF(totin);
}
}
/*-----------------------------------------------------------------------
Ten Ham: TB_BINHPHUONGSAISO
Mo ta: TINH BINH PHUONG SAI SO DAU RA CUA MANG THEO VEC-TO DAU
RA VA VEC-TO DICH
Cac dau vao: 1. VEC-TO DAU RA MONG MUON DRMM[i],
2. VEC-TO DAU RA CU LOP RA z[i],
3. SO LUONG NO-RON CUA LAOP DAU RA, SLNRLR
Gia tri tra ve: TRUNG BINH BINH PHUONG SAI SO DAU RA CUA LOP RA
------------------------------------------------------------------------
*/
float TB_BINHPHUONGSAISO(int a[],float b[],int SIZE)
{
int i;
float e=0;
for(i=0;i<SIZE;i++)
e = e + ((float)a[i] - b[i])*(a[i] - b[i]);
e = 0.5 * e;
return e;
}
/*-----------------------------------------------------------------------
-
Ten Thu tuc: SAISODAURA
Mo ta: TINH SAI SO DAU RA CUA MANG THEO VEC-TO DAU RA VA VEC-TO
DICH
1. VEC-TO DAU RA MONG MUON DRMM[i],
2. VEC-TO DAU RA CU LOP RA z[i],
Cac dau vao: SO THU TU MAU
Gia tri tra ve: KHONG CO
------------------------------------------------------------------------
*/
void SAISODAURA(int i)
{
int j;
for(j=0;j<SLNRLR;j++)
SSLR[j] = 0;
for(j=0;j<SLNRLR;j++)
SSLR[j] = z[j] - (float)DRMM[i][j];
}
/*-----------------------------------------------------------------------
Ten Thu tuc: SAISOLOPAN
Mo ta: TINH SAI SO DAU RA CUA LOP AN THEO SAI SO LOP RA VA DAO
HAM CUA SIGMF
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
-----------------------------------------------------------------------*/
Luận án Tiến sĩ Kỹ thuật 2013
141
void SAISOLOPAN()
{
int i,j;
for(i=0;i<SLNRLA;i++)
SSLA[i] = 0;
for(i=0;i<SLNRLA;i++)
for(j=0;j<SLNRLR;j++)
SSLA[i] = SSLA[i] + MTTSLR[i][j]*z[j]*(1-z[j])*SSLR[j];
}
/*-------------------------------------------------------------------
Ten Thu tuc: DIEUCHINHTRONGSO
Mo ta: CAP NHAT MA TRAN TRONG SO LOP AN VA LOP RA
Cac dau vao: SO THU TU MAU
Gia tri tra ve: KHONG CO
----------------------------------------------------------------------*/
void DIEUCHINHTRONGSO(int k)
{
int i,j;
float temp;
SAISODAURA(k);
SAISOLOPAN();
for(i=0;i<SLNRLA;i++)
{
for(j=0;j<SLNRLR;j++)
{
temp = -TOCDOHOC*y[i]*z[j]*(1-z[j])*SSLR[j];
MTTSLR[i][j] = MTTSLR[i][j] + temp +
QUANTINH*BTMTTSLR[i][j];
BTMTTSLR[i][j] = temp;
}
}
for(i=0;i<SLNRLV;i++)
{
for(j=0;j<SLNRLA;j++)
{
temp = -TOCDOHOC*x[i]*y[j]*(1-y[j])*SSLA[j];
MTTSLA[i][j] = MTTSLA[i][j] + temp +
QUANTINH*BTMTTSLA[i][j];
BTMTTSLA[i][j] = temp;
}
}
}
/*----------------------------------------------------------------------
Ten Thu tuc: HAMMUCTIEU
Mo ta: TINH BINH PHUONG SAI SO DAU RA CUA MANG THEO VEC-TO DAU
RA VA VEC-TO DICH
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
---------------------------------------------------------------------*/
void HAMMUCTIEU()
{
int i;
Luận án Tiến sĩ Kỹ thuật 2013
142
for(i=0;i<SLMHL;i++)
{
DAPUNGDAURA(TAPHUANLUYEN[i]);
ECM[i]=TB_BINHPHUONGSAISO(DRMM[i],z,SLNRLR);
}
}
/*----------------------------------------------------------------------
Ten Thu tuc: KIEMTRAMANG
Mo ta: NGUOI SU DUNG NHAP MA TRAN DAU VAO, TINH TOAN DAP UNG
DAU RA CUA MANG
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
------------------------------------------------------------------------
*/
void KIEMTRAMANG()
{
int i,j,t,ind;
float temp;
float tempz1[SLNRLR];
float tempz2[3];
ind=0;
for(;;)
{
printf("\n\nXIN MOI DUA VEC-TO DAU VAO DE KIEM TRA
MANG\n\n");
for(i=0;i<7;i++)
{
for(j=0;j<5;j++)
scanf("%d",&MTDVKT[j*7+i]);
printf("\n");
}
printf("\n\nDAP UNG DAU RA CUA MANG:\n");
DAPUNGDAURA(MTDVKT);
for(i=0;i<SLNRLR;i++)
printf("\nNO-RON %d, Z = %f",i,z[i]);
for(i=0;i<SLNRLR;i++)
tempz1[i]=z[i];
printf("\n\nBA DAU RA CO DAP UNG CAO NHAT UNG VOI VEC-TO DAU
VAO:\n");
for(t=0;t<3;t++)
{
temp=0;
ind=0;
for(i=0;i<SLNRLR;i++)
if(temp<=tempz1[i])
{
temp=tempz1[i];
ind=i;
}
tempz2[t]=temp;
printf("\nDAU RA THU %d LA %3.0f%%",ind,
tempz2[t]*100);
tempz1[ind]=0;
}
temp=z[0];
ind=0;
Luận án Tiến sĩ Kỹ thuật 2013
143
for(i=0;i<SLNRLR;i++)
if(temp<=z[i])
{
temp=z[i];
ind=i;
}
printf("\n\nKET LUAN CUA MANG NO-RON:\n");
printf("\nVEC-TO DAU VAO MANG LA MA CUA KY TU:
%d",ind);
}
}
/*----------------------------------------------------------------------
Ten Thu tuc: MATRANTRONGSOLOPAN
Mo ta: IN MA TRAN TRONG SO LOP AN RA MAN HINH
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
------------------------------------------------------------------------
*/
void MATRANTRONGSOLOPAN()
{
int i,j;
printf("\n\nMA TRAN TRONG SO LOP AN MTTSLA[slnrlv][slnrla]:\n\n");
for(i=0;i<SLNRLV;i++)
{
for(j=0;j<SLNRLA;j++)
{
if(MTTSLA[i][j]>=0)
printf("+%f ",MTTSLA[i][j]);
else
printf("%f ",MTTSLA[i][j]);
}
printf("\n");
}
}
/*----------------------------------------------------------------------
Ten Thu tuc: MATRANTRONGSOLOPRA
Mo ta: IN MA TRAN TRONG SO LOP RA RA MAN HINH
Cac dau vao: KHONG CO
Gia tri tra ve: KHONG CO
---------------------------------------------------------------------*/
void MATRANTRONGSOLOPRA()
{
int i,j;
printf("\n\nMA TRAN TRONG SO LOP RA MTTSLR[slnrla][slnrlr]:\n\n");
for(j=0;j<SLNRLR;j++)
{
for(i=0;i<SLNRLA;i++)
{
if(MTTSLR[i][j]>=0)
printf("+%f ",MTTSLR[i][j]);
else
printf("%f ",MTTSLR[i][j]);
}
printf("\n");
}
}
Luận án Tiến sĩ Kỹ thuật 2013
144
/******************************* HAM CHINH ***********************/
void main(int argc,char *argv[])
{
int read;
char c;
KHOITAOMANG();
printf("*******************************************\n\n");
printf("* CHUONG TRINH HUAN LUYEN MANG NO-RON *\n\n");
printf("* BUOC HOC TINH THEO NGUYEN LY VUOT KHE *\n\n");
printf("*******************************************\n\n");
/*
printf("/Vao\\ /~~~~Lop an~~~~\\ /~~~~~Lop ra~~~~~\\\n");
printf(" -- ------- ---- --------- ---- \n");
printf("| | | | | |Y | | | | Z\n");
printf("|X |->| W11 |->| f1 |->| W21 |->| f2 |-->\n");
printf("| | | (35x5)| | | | (5x10) | | |\n");
printf("| | | | | | | | | |\n");
printf(" -- ------- ---- --------- ---- \n");
printf("\\35/ \\__Y=f1(W11.X)__/ \\__Z=f1(W11.X)___/ \n\n");
printf(" f=sigm(net) \n\n");
printf("\nSU DUNG MANG: TRUOC KHI HOC, t, SAU KHI HOC, s.\n");
SDM = getchar();
if(SDM=='t')
KIEMTRAMANG();// SU DUNG MANG TRUOC KHI HUAN LUYEN
else if(SDM=='s')
{
printf("\n\nLUA CHON LOAI BUOC HOC\n");
printf("\nCO DINH: c, GIAM DAN: g, NGUYEN LY VUOT KHE:
v\n\n");
c = getchar();
}
LCBH = getchar();
switch(LCBH)
{
case 'c':
HUANLUYENCODINH();
break;
case 'g':
HUANLUYENGIAMDAN();
break;
case 'v':
HUANLUYENVUOTKHE();
break;
}
*/
HUANLUYENVUOTKHE();
if(HTHL==1)//NEU MANG DA DUOC HUAN LUYEN XONG
{
MATRANTRONGSOLOPAN();
MATRANTRONGSOLOPRA();
// KIEMTRAMANG();
}
}
Các file đính kèm theo tài liệu này:
- lun_an_tin_si_k_thut_2013_1_mc_lc_6151.pdf