MỤC LỤC
Chương 1: TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT TÍNH 3
1.1. HOẠT TÍNH 4
1.1.1. Hoạt tính sinh học 4
1.1.2. Hoạt tính hóa học 4
1.2. CÁC THAM SỐ CẤU TRÚC 5
1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR 5
Chương 2: CƠ HỌC LƯỢNG TỬ, LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ9
2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG
BORN-OPPENHEIMER 9
2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM 11
2.2.1. Giới thiệu 11
2.2.2. Phương pháp PM3
3.1. PHƯƠNG PHÁP HỒI QUI ĐA BIẾN TUYẾN TÍNH 16
3.1.1. Tương quan và hồi qui 16
3.1.2. Phân tích hồi qui đa biến tuyến tính 20
3.1.2.1. Các thủ tục chọn biến 20
3.1.2.1. Đánh giá mô hình 21
3.2. PHƯƠNG PHÁP MẠNG NƠRON NHÂN TẠO 22
3.2.1. Nơron sinh học và nơron nhân tạo 25
3.2.2.1. Nơron sinh học 23
3.2.2.2. Nơron nhân tạo 24
3.2.2. Cấu trúc mạng nơron đa lớp 25
3.2.3. Luyện mạng: Kỹ thuật lan truyền ngược 26
3.2.4. Ngừng tiến trình luyện 27
3.2.5. Các yếu tố ảnh hưởng đến tính tổng quát hóa của mạng 28
Chương 4: CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE 30
4.1. BỆNH DO MUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔI MUỖI 33
C – PHƯƠNG PHÁP
Chương 5: PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN37
5.1. PHẦN MỀM 37
5.1.1. Hyperchem 8.03 37
5.1.2. Stagraphics Centurion XV 37
5.1.3. NeuroSolution 5.07 37
5.1.4. Microsoft Excel 37
5.2. CÁC BƯỚC THỰC HIỆN 37
5.2.1. Tính toán hóa lượng tử 38
5.2.2. Phân tích hồi qui đa biến tuyến tính 38
5.2.3. Tính toán mạng nơron 39
D – KẾT QUẢ VÀ BÀN LUẬN
Chương 6: KHẢO SÁT MỐI QUAN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE42
6.1. DỮ LIỆU 42
6.2. KẾT QUẢ VÀ BÀN LUẬN 44
6.2.1. Phương pháp hồi qui đa biến tuyến tính 44
6.2.1.1. Tính toán với hoạt tính PT 25 45 Mục lục
6.2.1.2. Tính toán với hoạt tính PT 2.5 47
6.2.2. Phương pháp mạng nơron 48
6.3. ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU TRÚC LÊN
HOẠT TÍNH 55
E – KẾT LUẬN
KẾT LUẬN 60
TÀI LIỆU THAM KHẢO
PHỤ LỤC
79 trang |
Chia sẻ: maiphuongtl | Lượt xem: 2388 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất N-Acylpiperidine, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
luyện bằng cách tìm giá trị gradient lỗi và
số nút ẩn phù hợp. Điều này đòi hỏi nhiều thời gian.
Nếu không bị giới về khả năng tính toán (phần cứng) thì ta có thể cho mạng
một lượng nút ẩn thừa để luyện và dùng phương pháp dừng luyện bằng bộ kiểm tra.
Phương pháp này được thực hiện như sau: chia bộ mẫu ra thành ba tập, tập số một
dùng để luyện mạng, tập số hai dùng để kiểm tra hiện tượng quá khớp, bộ số ba dùng
để kiểm tra tính tổng quát hoá của mạng. Luyện mạng với tập mẫu luyện nhưng định
kì ngừng luyện để đánh giá sai số trên tập mẫu kiểm tra (khi đánh giá sai số trên tập
mẫu kiểm tra, ta chỉ cần thực hiện ánh xạ cho từng mẫu mà không phải trải qua giai
đoạn lan truyền ngược). Khi sai số trong mẫu kiểm tra đi lên, thì quá khớp đã bắt đầu.
Khi đó, ta ngừng luyện, trở về các trọng sinh ra lỗi thấp nhất trên mẫu kiểm tra, và
dùng các trọng đó cho mô hình của ta. Như vậy, song song với tiến trình luyện ta phải
tính sai số trên tập mẫu kiểm tra.
3.2.5 Các yếu tố ảnh hưởng đến tính tổng quát hoá của mạng nơron
Mạng có tính tổng quát hoá khi nó có thể dự đoán tốt các dữ liệu mới. Các yếu
tố ảnh hưởng nhiều đến tính tổng quát hoá của mạng là:
Kích thước tập mẫu: mạng học để mô hình hóa dữ liệu và có thể mô hình hóa
cả nhiễu, có thể ngăn nó quá khớp bằng cách tạo mẫu luyện đủ lớn để bù cho mức
nhiễu trong dữ liệu. Nhưng việc tăng mẫu thường gặp phải khó khăn trong thực hành
vì thực tế mẫu hiếm khi đủ lớn để ngăn được nhiễu.
Số nút ẩn: mỗi trọng số trong mạng là một tham số làm tăng khả năng của
mạng, số trọng số trong mạng là một hàm theo số nút của mạng, nó quyết định mức độ
Chương 3
29
tự do mà mạng có thể khớp với dữ liệu. Do đó, mạng chỉ đạt được trạng thái tối ưu khi
tìm được số nút ẩn phù hợp. Để tìm số nút ẩn tối ưu thì phải luyện nhiều mạng với số
nút ẩn khác nhau. Hơn nữa, phải luyện cho đến khi mạng hội tụ. Phương pháp này
cũng tạm ổn nhưng đòi hỏi thời gian máy tính khá nhiều. Quá trình tìm mạng tối ưu
chủ yếu tập trung vào việc tìm số nút ẩn, nhưng số nút nhập cũng quan trọng. Khi
dùng nhiều nút nhập ta sẽ cho mạng nhiều mức tự do hơn – nhiều khả năng để mô hình
hóa một cách chính xác các hàm phức tạp, hay nhiều khả năng để quá khớp.
Thời gian luyện mạng cũng quan trọng không kém. Trong thực tế, việc luyện
mạng đến hội tụ là một bài toán không dễ. Giai đoạn luyện có thể rất dài khi phải
luyện đến giá trị gradient lỗi rất nhỏ cho đến khi một nút ẩn nào đó tìm được giá trị tối
ưu. Vì vậy, mạng cần đủ thời gian để luyện và dừng luyện đúng lúc.
Mạng chỉ có giá trị sử dụng khi có tính tổng quát hoá cao.
Chương 4
30
Chương 4
CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE
----------
4.1 BỆNH DO MUỖI GÂY RA VÀ CÁC HÓA CHẤT
ĐUỔI MUỖI 13-15
Muỗi đốt, ngoài chuyện khó chịu, ngứa ngáy tại chỗ, muỗi còn là trung gian
truyền một số bệnh ký sinh trùng ở nhiều vùng nhiệt đới và cận nhiệt đới. Sau đây là
một vài bệnh nguy hiểm thường gặp:
Sốt rét là một chứng bệnh gây ra bởi ký sinh trùng loại protozoa tên
Plasmodium, lây truyền từ người này sang người khác khi những người này bị muỗi
đốt. Muỗi lan truyền bệnh là những loài Anopheles, thuộc nhóm Plasmodium. Chúng
hút máu người bệnh, tiêu hóa máu nhưng không tiêu hóa ký sinh trùng. Bệnh phổ biến
ở các khu vực nhiệt đới và cận nhiệt đới của châu Mỹ, châu Á và châu Phi. Sốt rét là
một trong những bệnh truyền nhiễm phổ biến nhất và là vấn đề nghiêm trọng đối với
sức khoẻ cộng đồng. Bệnh có thể chữa và phòng bằng thuốc căn bản Chloroquine.
Sốt Dengue còn gọi là Sốt Đập Lưng (breakbone fever) do muỗi Aedes
Aegyti truyền virus từ người bệnh sang người lành. Bệnh ít gây tử vong ngoại trừ
trường hợp Sốt Đập Lưng Xuất Huyết thường thấy ở các quốc gia Đông Nam Á và
châu Mỹ La Tinh. Bệnh nhân có triệu chứng như đau xương khớp, nhức đầu, nóng sốt,
nổi ban trên da và làm cơ thể suy nhược. Không có thuốc chữa khỏi bệnh mà cũng
chưa có thuốc tiêm ngừa. Sốt xuất huyết đang là vấn đề nan giải của mọi quốc gia vì
dịch bệnh ngày một gia tăng.
Sốt vàng (Yellow Fever) là chứng bệnh sốt gây vàng da do siêu vi trùng
thuộc họ Flaviviridae gây ra. Đây là một chứng bệnh sốt xuất huyết quan trọng tại
Châu Phi và Nam Mỹ mặc dầu hiện nay đã có vắc-xin hiệu nghiệm. Sốt vàng từng gây
nhiều trận dịch tàn khốc, gây tử vong khắp nơi cho đến thế kỷ 20 khi khoa học khám
phá ra bệnh lây do muỗi đốt và nghiên cứu được phương cách phòng chống bằng
vắc-xin. Sốt vàng cũng do muỗi Aedes Aegypti truyền một loại virus.
Bệnh Giun Chỉ (Filariasis) có nhiều ở vùng nhiệt đới và bán nhiệt đới. Giun
Chương 4
31
chỉ bạch huyết (Lymphatic filariasis) là một bệnh nhiễm ký sinh trùng Wuchereria
bancrofti, Brugia malayi hoặc Brugia timori. Loài ký sinh trùng này được truyền từ
người này sang người khác do muỗi đốt và phát triển thành giun trưởng thành trong hệ
mạch bạch huyết, gây nên tổn thương và tổ chức sưng phồng. Bệnh phù chân voi
(Elephantiasis) gồm đau, biến dạng chi cơ thể và cơ quan sinh dục - đây là các dấu
hiệu cổ điển trong giai đoạn muộn của bệnh này. Bệnh có thể chữa được bằng thuốc
diethylcarbamazine.
Viêm não Nhật Bản: tác nhân truyền bệnh là muỗi Culicinea
tritaeniorhyunchus, thường có ở nông thôn. Người là ký chủ trong chu trình truyền
bệnh và thường trẻ em mắc bệnh nhiều hơn người lớn. Tỉ lệ tử vong từ 7-33% hay cao
hơn nhưng tỉ lệ di chứng ngược lại với tỉ lệ tử vong . Các di chứng của bệnh thường là
liệt dai dẳng, mất điều hòa trương lực, chậm phát triển trí tuệ và rối loạn tính cách. Vì
đây là bệnh do virus gây ra nên các hiểu biết bệnh học còn nhiều hạn chế. Việc điều trị
dựa vào điều trị triệu chứng và tiêm phòng là chủ yếu.
Các vấn đề về phòng tránh, xua đuổi hay tiêu diệt muỗi đã được con người quan
tâm từ lâu. Nó là vấn đề nan giải của nhiều quốc gia trên thế giới.
Hình 7 Thuốc xịt muỗi và muỗi thuộc nhóm Plasmodium
Từ xưa, con người đã biết dùng hóa chất để đuổi muỗi như đốt vỏ cam quýt và
một số thảo mộc có chứa tinh dầu hoặc dùng nhiệt để tạo điều kiện phát tán các hương
liệu đối kháng với muỗi, hay dùng các loại cây củ tươi như hành tây cắt đôi đặt trong
phòng,… Các phương pháp dân gian này có nhiều hạn chế là không giết được muỗi,
chỉ đuổi được muỗi trong khoảng thời gian và một vùng không gian nhất định, đôi khi
lại còn gây ra phiền hà đối với nhiều người khác.
Chương 4
32
Ngày nay, thuốc đuổi muỗi thông dụng sử dụng các hóa chất tổng hợp – được
điều chế thông qua công nghệ cao và tiên tiến của ngành dược phẩm. Sau đây là một
vài hóa chất được sử dụng trong sản phẩm thuốc đuổi muỗi đã đăng kí với Cơ quan
Bảo Vệ Môi Sinh của Hoa Kì US EPA (United State Environmental Protection
Agency):
DEET tên hóa học là N,N-diethyl-meta-toluamide hoặc N,N-diethyl-3-
methyl-benzamide là thành phần hoạt chất được tìm thấy trong nhiều sản phẩm đuổi
muỗi nhất.
DEET được điều chế vào năm 1946 sau khi chiến tranh thế giới lần thứ 2
nhấn mạnh cần ngăn ngừa muỗi và các côn trùng khác đốt chích. DEET được sử dụng
hơn 50 năm nay và được xem là “tiêu chuẩn vàng” cho các hoạt chất đuổi muỗi. Kể từ
năm 1957 hóa chất này đã có mặt ở khắp mọi nơi và là hóa chất chống muỗi và các
loài côn trùng hút máu khác được sử dụng rộng rãi nhất trên thế giới.
Hóa chất DEET hoạt động bằng cách làm cho muỗi và họ hàng nhà muỗi
không thể đánh hơi mùi mồ hôi hấp dẫn của con người ở gần đó. Một cuộc nghiên cứu
mới được thực hiện gần đây cho thấy những kết quả như sau:
Một sản phẩm chứa 23.8% DEET có công dụng ngăn muỗi cắn khoảng 5
giờ đồng hồ.
Một sản phẩm chứa 20% DEET có công dụng ngăn muỗi cắn gần 4 giờ
đồng hồ.
Một sản phẩm chứa 6.65% DEET có công dụng ngăn muỗi cắn gần 2
tiếng đồng hồ.
Những sản phẩm chứa 4.75% DEET và 2% dầu đậu nành: cả hai loại này
đều có công dụng ngăn muỗi cắn trong vòng khoảng 90 phút đồng hồ.
Ủy ban Sức Khỏe Môi Trường của Hội Bác Sĩ Nhi Khoa Hoa Kỳ (The
American Academy of Pediatrics Committee on Environmental Health) mới đây cho
biết những sản phẩm chứa DEET có thể dùng một cách an toàn cho trẻ em và cho phụ
nữ mang thai hoặc đang cho con bú.
Picaridin (tên hóa học là 1-methylpropyl 2-(2-hydroxyethyl)-
1-piperidinecarboxylat) là chất lỏng không màu không mùi được sử dụng như là thuốc
diệt côn trùng như ruồi, muỗi, chiggers, và bọ ve. Các sản phẩm có chứa khoảng
Chương 4
33
5-20% hoạt chất.
Tinh dầu bạch đàn chanh được tìm thấy trong lá và cành cây bạch đàn. Nó
đã được đăng ký đầu tiên vào năm 1948 như là một thuốc trừ sâu và thuốc diệt côn
trùng và bọ ve. Như với hầu hết các loại dầu thực vật, không có tác dụng phụ cho con
người. Sản phẩm có chứa khoảng 30–40% của các thành phần hoạt chất.
PMD (p-mentane-3,8-diol) là hóa chất tổng hợp của tinh dầu bạch đàn
chanh. Nó được áp dụng cho da hoặc quần áo để xua đuổi côn trùng. Sản phẩm có
chứa 8-10% thành phần hoạt chất có tác dụng bảo vệ như DEET ở nồng độ thấp.
IR3535 (tên hóa học là etyl 3-(N-butyl-N-axetyl)-aminopropionat), cũng
được gọi là Merck 3.535, được sử dụng như một thuốc diệt côn trùng chống muỗi và
loài cắn đốt khác. Sản phẩm có chứa khoảng 7.5-20.07% của các thành phần hoạt chất.
Permethrin được đăng ký để sử dụng như một loại thuốc trừ sâu và thuốc
đuổi muỗi. Sản phẩm Permethrin được sử dụng trên quần áo, giày, lưới, giường.
Permethrin dùng ngâm tẩm quần áo, giầy dép như một cách phòng chống bọ ve, muỗi,
các loài côn trùng và vẫn còn hiệu quả sau khi giặt rửa nhiều lần.
Allethrin là hóa chất đuổi muỗi thường được sử dụng cho vùng không gian
rộng, là chất dễ bay hơi, được sử dụng trong các sản phẩm thương mại như nhang,
miếng dán, nến và đèn xông muỗi.
Hiện thị trường có nhiều sản phẩm phòng chống muỗi với những cách thức sử
dụng khác nhau. Loại diệt muỗi bằng nhang hoặc bình xịt (với các nhãn hiệu như
Mosfly, Jumbo, Raid Max...); loại thuốc chống muỗi dùng cho cá nhân dưới dạng kem
bôi (Soffell) hay thuốc xịt lên da có hương thơm; loại máy xông muỗi, máy bắt muỗi;
keo dán đuổi muỗi;… Tuy nhiên, nguyên liệu của các các loại sản phẩm này là hóa
chất đều gây ra tác dụng phụ đến sức khỏe con người nên khi sử dụng cần lưu ý công
dụng để có cách sử dụng hiệu quả, phù hợp và an toàn cho sức khỏe.
4.2 N-ACYLPIPERIDINE - CHẤT ĐUỔI MUỖI MỚI 18, 29, 31
Dữ liệu ban đầu về cấu trúc và hoạt tính của các chất họ piperidines được lấy từ
bộ dữ liệu về các hợp chất đuổi muỗi của Bộ Nông Nghiệp Hoa Kì USDA (United
States Department of Agricuture) đã thu thập hơn 50 năm18. Các nhà khoa học của
trường đại học Florida (Mỹ) kết hợp với USDA đã nghiên cứu sàn lọc ra 200 chất từ
Chương 4
34
hàng ngàn hợp chất tiềm năng, họ tập trung cuộc tìm kiếm chủ yếu trên các hợp chất
N-acylpiperidine (thành phần làm cho hạt tiêu có vị cay).
Công thức tổng quát của các dẫn xuất N-acylpiperidine như sau:
NR
O
R'
1
2
3
4
5
6
7
8
9
Từ bộ dữ liệu lựa chọn, họ dùng chương trình máy tính thiết kế thuốc, chương
trình này sử dụng những thông tin về các cấu trúc hóa học và tác dụng của các hợp
chất này trên các thụ quan của côn trùng để tiên đoán tính hữu hiệu của chất đuổi
muỗi.
Chương trình máy tính này cho phép các nhà khoa học thu hẹp các hợp chất
xuống còn 11 chất. Từ những thông tin có được từ 11 chất đó, họ tổng hợp thêm 23
chất, sau đó họ kiểm nghiệm 34 chất này với các đối tượng tình nguyện trong phòng
thí nghiệm. Những người tình nguyện đã đeo các miếng băng vào cánh tay thấm đầy
các liều lượng xác định mỗi hợp chất và cho tay vào lồng chứa muỗi. Mỗi lồng chứa
khoảng 500 con muỗi cái 5–10 ngày tuổi, nhiệt độ trong lồng là 28 1C và độ ẩm
tương đối là 35–60 %. Các nhà nghiên cứu đã đo đạc tính bền bỉ của các hợp chất –
thời gian cho tới khi chất đuổi muỗi phai hết – và điều này được đánh dấu bằng việc
bắt đầu bị muỗi chích.
Cuộc nghiên cứu đưa ra kết quả “đầy kinh ngạc” đối với các nhà khoa học, nó
cho thấy những chất này bảo vệ được nhiều hơn gấp 3 lần hóa chất DEET – chất đuổi
muỗi hiệu quả nhất hiện nay. Những hợp chất này có hiệu quả lâu nhất trong vòng 73
ngày và nhiều chất có thời gian bảo vệ từ 40 đến 50 ngày so với DEET là 17.5 ngày.
Các nhà nghiên cứu dự định tiếp tục kiểm nghiệm trên 7 trong số các hợp chất
nhiều hứa hẹn nhất với mục đích xác định được thế hệ hóa chất DEET kế tiếp và sẽ
tiếp tục quan sát xem việc chúng chống lại các loài côn trùng hiệu quả như thế nào.
Chương 4
35
Hình 8 Thí nghiệm hoạt tính sinh học
* Những phát hiện thú vị về muỗi và thuốc đuổi muỗi gần đây 13, 14
Gần đây nhà nghiên cứu Hector Douglas tại trường Đại học Alaska
Fairbanks đã phát hiện được loài chim sẻ biển có lông vũ có khả năng tiết ra chất có
thành phần tương tụ như DEET có khả năng đuổi muỗi.
Nghiên cứu của trợ lý giáo sư Mike Tyler từ Đại học Adelaide và nhà côn
trùng học Craig Williams từ Đại học James Cook cho thấy: ếch sản xuất ra một loạt
hoá chất ở trên da, một số loài lưỡng cư như một loài ếch xanh ở Australia cũng có thể
bài tiết ra dịch đuổi muỗi...
Nhóm nghiên cứu của James Logan thuộc Trung tâm Nghiên cứu
Rothamsted (Anh quốc) đã tìm được thuốc đuổi muỗi từ chính mồ hôi của một số tình
nguyên viên và họ đã tìm được thuốc đuổi muỗi do chính cơ thể củanhững người này
để tìm cách tổng hợp một loại hóa chất tương đương có thể đuổi muỗi và tương thích
cao với sức khỏe con người – chất này gần như không mùi đối với con người, song
hiện nay vẫn đang trong thời gian thử nghiêm hoặc chỉ có ở mức độ phòng thí nghiệm.
Trong một nghiên cứu vừa được công bố trên tạp chí Current Biology (Mỹ),
một nhóm chuyên gia quốc tế đã lập được sơ đồ chi tiết của cơ quan cảm thụ mùi mà
muỗi Anopheles sử dụng để tìm con người hút máu và truyền bệnh sốt rét. Qua đó, các
nhà khoa học đã phát hiện khả năng tiếp nhận mùi nhạy bén của xúc tu, một bộ phận
xuất phát từ đầu muỗi. Cùng với râu, xúc tu này giúp muỗi Anopheles có khả năng
ngửi và nếm. Theo nhóm nghiên cứu, muỗi Anopheles sử dụng xúc tu để phát hiện
Vải chưa xử lý hóa chất Vải đã xử lý hóa chất
Chương 4
36
mục tiêu từ xa; còn trong những pham vi gần, nó dùng vòi để cảm nhận. Biết được cơ
chế mà chúng sử dụng để phát hiện và tấn công con người, các chuyên gia có thể tạo ra
các chất mới để xua đuổi hoặc dẫn dụ chúng vào bẫy để tiêu diệt, góp phần hạn chế
bệnh sốt rét – một căn bệnh hiểm nghèo mang tính phổ biến nhất hiện nay. Nghiên cứu
này lấp đầy một khoảng trống về hiểu biết khoa học với hệ thống khứu giác của muỗi.
Hiện nay, các nhà khoa học đang nghĩ cách diệt muỗi hữu hiệu hơn bằng
cách lập bản đồ gen của muỗi truyền bệnh. Qua đó thay đổi cơ cấu di truyền của muỗi
để muỗi cái không thể mang ký sinh trùng sốt rét. Đầu năm 2002, một nhóm nghiên
cứu ở Đại học Cleveland (Ohio) đã cấy thành công một gen mới của loài muỗi
Anophele Stephensi chống lại ký sinh trùng sốt rét, nghĩa là không còn là trung gian
truyền bệnh, gen nay có tác dụng: thay đổi các thụ thể nhận mùi của muỗi để muỗi
chích động vật thay vì chích người; sử dụng công nghệ triệt sản côn trùng (Sterile
Insect Technique –.SIT) nghĩa là chiếu tia gamma vào muỗi đực, tạo ra giống muỗi
đực triệt sản không còn khả năng thụ tinh để giảm mật độ sinh sôi ở muỗi.
C. PHƯƠNG PHÁP
Chương 5
37
Chương 5
PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN
----------
5.1 PHẦN MỀM
5.1.1 Hyperchem 8.03
Chương trình HyperChemTM 8.03 được dùng để xây dựng cấu trúc phân tử, tối
ưu hoá hình học, tính các tham cấu trúc. Đây là chương trình được ứng dụng rộng rãi
vì có độ chính xác có thể đáp ứng yêu cầu đặt ra trong lĩnh vực thiết kế phân tử với
nhiều tính năng như: xây dựng cấu trúc, tối thiểu hóa năng lượng, tính toán tham số
lượng tử, trình bày cấu trúc ba chiều.
5.1.2 Statgraphics Centurion XV
Statgraphics Centurion XV là phần mềm phân tích dữ liệu thống kê chuyên
dụng, được sử dụng để xây dựng mô hình MLR. Nó có hơn 160 chương trình thống
kê, bao gồm từ phân tích thống kê cơ bản đến phức tạp. Người dùng không nhất thiết
phải là một chuyên gia về thống kê bởi vì chương trình này đã có các công cụ như
StatWizard và StatAdvisor giúp người dùng sử dụng một cách hiệu quả nhất.
5.1.3 NeuroSolution 5.07
NeuroSolutionTM 5.07 là phần mềm mô phỏng ANN. NeuroSolution for Excel là
một sản phẩm đột phá của phần mềm NeuroSolutionTM 5.07. Nó được tích hợp trong
Microsoft Excel giúp cho người dùng dễ dàng sử dụng với giao diện quen thuộc trong
bảng tính của Microsoft Excel. Nó không chỉ dành cho người mới bắt đầu học về ANN
mà còn là công cụ mô hình hóa mạnh mẽ để giải quyết bài toán hồi qui phi tuyến.
5.1.4 Microsoft Excel
Microsoft Excel được dùng để nhập dữ liệu ban đầu, vẽ các đồ thị biểu diễn các
mối quan hệ của hoạt tính và các tham số cấu trúc, truy xuất dữ liệuvào phần mềm
NeuroSolution cho việc tính toán mạng, lưu trữ các kết quả sau khi mạng luyện.
5.2 CÁC BƯỚC THỰC HIỆN
Chương 5
38
5.2.1 Tính toán hóa lượng tử
Xây dựng mô hình cấu trúc phân tử của các dẫn xuất N-acylpiperidine bằng
phần mềm HyperChem 8.03
Tối ưu hoá hình dạng các mô hình vừa xây dựng bằng phương pháp gần đúng
PM3 với các thông số sau:
Convergence limit: 10-4
Iteration limit: 300
RHF
RMS gradient: 10-4
Thuật toán Polak-Ribiere
Từ những cấu trúc đã tối ưu ở trên, tính toán những thông số đặc trưng cho
cấu trúc đóng vai trò là các biến độc lập để xây dựng mô hình.
5.2.2 Phân tích hồi qui tuyến tính đa biến
Chia bộ dữ liệu thành hai tập: một tập để xây dựng mô hình (27 chất), một
tập để kiểm tra khả năng dự đoán của mô hình (7 chất).
Xác định số biến độc lập thích hợp: tất cả các biến độc lập (20 biến – xem
chương 6) không phải được đưa hết vào mô hình. Mặc dù việc thêm biến độc lập vào
làm tăng hệ số tương quan R2, nhưng nó chỉ tốt khi chúng có liên hệ mạnh với biến
phụ thuộc. Mô hình được chọn ứng với mô hình có Q2 cao nhất, kế đó là số biến độc
lập nhỏ nhất và cuối cùng là R2. Thực hiện tính toán Regression Model Selection để
chọn mô hình có các biến tối ưu.
Lập mô hình thích hợp với số biến đã chọn: sau khi lựa chọn được số biến
thích hợp thì tiến hành phân tích MLR. Khi đó thu có được hằng số và hệ số cho từng
biến của mô hình.
Tính Q2 bằng cách thực hiện tham chiếu chéo trên tập dữ liệu xây dựng mô
hình với thành phần bỏ ra là 3 (xem chương 3).
Nhận xét về mô hình đạt được.Tính toán hoạt tính cho các tập dữ liệu theo
mô hình thu được.
Chương 5
39
5.2.3 Tính toán mạng nơ ron
Chia bộ dữ liệu thành hai tập: một tập dùng để luyện mạng có kiểm tra chéo
(traing set - 27 chất), một tập kiểm tra khả năng dự đoán của mạng (test set - 7 chất).
Sự lựa chọn biến độc lập được thực hiện từ những thông tin độ nhạy sau khi
mạng luyện với toàn bộ biến ứng với số nút ẩn bằng 1. Phần mềm NeuroSolution 5.07
có chức năng phân tích độ nhạy (Sensetivity about the mean) là đo mức độ quan trọng
tương đối giữa các input của mạng. Nó phân tích sự biến thiên của hoạt tính theo sự
biến thiên của của một input trong vùng xung quanh giá trị trung bình trong khi vẫn
giữ nguyên các input khác. Các biến chọn theo giá trị độ nhạy từ cao xuống thấp mà
với bộ biến này có thể luyện được mạng cho kết quả kiểm tra trên bộ test tương đương
hoặc tốt hơn với kết quả kiểm tra của mạng ban đầu.
Xây dựng cấu trúc mạng nơron được thực hiện bằng NeuralBuilder tiến hành
theo các bước sau:
Nhập dữ liệu (Tag): bằng cách dán nhãn cho các cột trong chức năng Tag
(input – dữ liệu nhập, disire – giá trị đích), hàng (training – luyện, cross validation –
tham chiếu chéo, test – kiểm tra).
Thiết kế mạng (Create Network) gồm các bước:
Chọn loại mạng (choosing a neural network): NeuralBuilder có 11 tùy
chọn cho loại mạng, mỗi loại có những ưu điểm riêng phụ thuộc vào mục đích sử dụng
và tính chất của bài toán. Trong luận văn này, chọn Multiplayer Perceptron cho việc
giải bài toán.
Hình 9 Các loại mạng trong NeuroBuilder
Chương 5
40
Thiết lập số lớp ẩn, số nơron ở lớp nhập, số nơron ở lớp ẩn và ở lớp xuất:
xây dựng mạng nơron gồm ba lớp là một lớp nhập có số nơron là các biến độc lập, một
lớp ẩn có số nơron thay đổi, một lớp xuất có hai nơron đại diện cho hoạt tính ở hai
nồng độ khác nhau. Ở bước này chỉ cần thiết lập số nơron cho lớp ẩn, NeuralBuilder sẽ
tự động thiết lập số nơron nhập và nơron xuất khi ta thực hiện bước Tag.
Chọn hàm truyền: chọn hàm truyền ở lớp ẩn là hàm Sigmoid (kí hiệu là
SigmoidAxon), hàm kích động ở lớp xuất là hàm tuyến tính (kí hiệu là LinearAxon),
dùng phương pháp lan truyền ngược để cập nhật bộ trọng số. Trong phần mềm
NeuroSolution 5.07, NeuroBuilder sẽ tự động chuẩn hóa dữ liệu nhập vào vùng giới
hạn của hàm truyền. Thí dụ: nếu dùng hàm truyền của lớp ẩn là hàm Sigmoid thì dữ
liệu sẽ được chuẩn hóa trong khoảng 0 và 1.
Hình 10 Các loại hàm truyền trong NeuroBuilder
Ở đây dùng điều kiện dừng luyện là giá trị ngưỡng tối thiểu của trung bình
bình phương sai số MSE (Mean Square Error) trên bộ luyện.
Để xác được giá trị này cần phải thử luyện mạng nhiều lần với các giá trị MSE
thay đổi dần để mạng có thể luyện tốt mà vẫn còn khả năng đoán tốt. Đây là bước
quan trọng và mất nhiều thời gian. Sau khi xây dựng cấu trúc mạng xong, phải lưu lại
cấu trúc mới có thể tiếp tục luyện mạng được.
Chương 5
41
Hình 11 Bảng NeuralBuilder Supervised Learning
Luyện mạng: khi cấu trúc mạng đã được xây dựng thì bắt đầu luyện mạng lần
lượt với các nút ẩn thay đổi từ 1 đến 10. Số nơron trên lớp ẩn là một thông số quan
trọng trong mạng nơron. Nếu mạng có ít nơron trên lớp ẩn thì mạng không lấy được
đầy đủ nhưng thông tin trong bộ dữ liệu, ngược lại nếu có quá nhiều nơron sẽ xảy ra
hiện tượng quá luyện.
Kiểm tra mạng: sau mỗi lần luyện mạng thành công thì kiểm tra mạng trên bộ
training và bộ test. Trong quá trình thực hiện, để lấy được giá trị R2 và Q2 ta luyện
mạng bằng hai cách luyện khác nhau:
Tính R2: luyện mạng với chức năng Training, sau đó kiểm tra mạng trên
bộ training và bộ test ta sẽ có giá trị R2 và R2test.
Tính Q2: luyện mạng với chức năng Leave-N-out, khi đó NeuroSolution
for Excel sẽ đưa ra giá trị Q2.
D. KẾT QUẢ VÀ
BÀN LUẬN
Chương 6
42
Chương 6
KHẢO SÁT MỐI QUAN HỆ ĐỊNH LƯỢNG
GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA
CÁC DẪN XUẤT N-ACYLPIPERIDINE
----------
6.1 DỮ LIỆU
Dữ liệu được sử dụng trong luận văn này gồm 34 chất dẫn xuất của
N-acylpiperidine đã được tổng hợp và thí nghiệm sinh học bởi nhóm nghiên cứu của
trường Đại học Florida (Mỹ) và Bộ Nông nghiệp Hoa Kì (United States Depertment of
Agriculture). Công thức tổng quát của các dẫn xuất N-acylpiperidine và qui ước đánh
số trên các nguyên tử như sau:
NR
O
R'
1
2
3
4
5
6
7
8
9
Bảng 1 Cấu trúc và hoạt tính của dẫn xuất N-acylpiperidine[17]
Hợp chất
Kí hiệu R R′
PT, d ( 25
µmol/cm2)
PT, d ( 2.5
µmol/cm2)
4a Me 2-Me 2 2
4b Et H 5 4
4c Et 2-Et 5 3
4d n-C6H13 2-Me 17 5
4e n-C6H13 3-Me 15.5 7.5
4f n-C7H15 4-Me 48 8
4g n-C7H15 4-Bn 13 7
4h n-C8H17 2-Et 43 9.5
4i n-C9H19 2-Me 49.5 8
4j n-C9H19 4-Me 41 11.5
4k CH2=CH(CH2)8 H 50 13.5
Chương 6
43
Hợp chất
Kí hiệu R R′
PT, d ( 25
µmol/cm2)
PT, d ( 2.5
µmol/cm2)
4l CH2=CH(CH2)8 2-Et 53 9
4m CH2=CH(CH2)8 4-Bn 8.5 8
4n CH2=CH(CH2)8 4-Me 73 10.5
4o n-C10H21 H 39.5 13
4p n-C11H23 2-Me 14.5 5
4q n-C11H23 3-Me 19.5 5.5
4a′ 1-c-C6H9 H 17 5
4b′ c-C6H11 H 14 8
4c′ c-C6H11 3-Me 17 6
4d′ c-C6H11 4-Me 24.5 8.5
4e′ c-C5H9(CH2)2 H 35 9
4f′ 1-Me-c-C6H10 3-Me 12 7
4g′ 4-Me-c-C6H10 2-Me 33 8.5
4h′ c-C6H11 2-Et 21.5 7
4i′ c-C6H11CH2 2-Me 29.5 7.5
4j′ c-C6H11(CH2)2 2-Me 47.5 10
4k′ c-C6H11(CH2)2 3-Me 35 9
4l′ c-C6H11(CH2)2 4-Me 45.5 8
4m′ c-C6H11(CH2)3 4-Me 33 3
4n′ c-C5H9(CH2)2 2-Et 40.5 8.5
4o′ c-C6H11(CH2)2 2-Et 42 10.5
4p′ c-C6H11CH2 4-Bn 3 1.5
4q′ c-C6H11(CH2)2 4-Bn 12 1
Bn: benzyl Et: etyl Me: metyl
Từ những cấu trúc đã tối ưu, tính toán những dữ liệu đặc trưng về cấu trúc, gồm
20 tham số, đóng vai trò là các biến độc lập để xây dựng mô hình, kí hiệu các đại
lượng đặc trưng cho cấu trúc đã sử dụng như sau:
Ký hiệu Ý nghĩa
N1, Ci , O9 : Điện tích trên N, O và các C với i = 2, 3, 5, 4, 6, 7, 8 (e).
HOF : Nhiệt tạo thành (Kcal/mol).
Chương 6
44
Etotal : Năng lượng tổng cộng (Kcal/mol).
DM : Moment lưỡng cực (D).
S : Diện tích bề mặt (Å2).
V : Thể tích phân tử (Å3).
Ref : Chỉ số khúc xạ(Å3).
Polar : Khả năng phân cực (Å3).
Mw : Khối lượng phân tử (a.u).
EHOMO : Năng lượng vân đạo phân tử đầy cao nhất (eV).
ELUMO : Năng lượng vân đạo phân tử trống thấp nhất (eV).
LogP : Hàm log của hệ số phân bố octanol – nước.
Hoạt tính sử dụng trong luận văn này được biểu diễn qua giá trị PT (Protection
Time) ở nồng độ 25 µmol/cm2 và ở nồng độ 2.5 µmol/cm2 là số ngày hóa chất có tác
dụng bảo vệ con người không bị muỗi đốt.
6.2 KẾT QUẢ VÀ BÀN LUẬN
6.2.1 Phương pháp hồi qui đa biến tuyến tính
Bộ biến sử dụng gồm 20 tham số cấu trúc là biến độc lập và hoạt tính ở hai
nồng độ là biến phụ thuộc (Phụ lục 2). Chia ngẫu nhiên bộ dữ liệu thành 2 tập riêng
biệt, tập để xây dựng mô hình gồm 27 chất, tập để kiểm tra tính dự đoán của mô hình
gồm 7 chất (lấy ngẫu nhiên các chất có kí hiệu 4a, 4c, 4n, 4p, 4d′, 4i′, 4j′ cho hoạt tính
PT 25 và các chất 4a, 4c, 4l, 4p, 4d′, 4m′, 4p′ cho hoạt tính PT 2.5 ). Thử tính hồi qui
tuyến tính với tất cả 20 biến độc lập, kết quả như sau:
Bảng 2 Kết quả phân tích hồi qui đa biến tuyến tính với 20 biến độc lập
Hoạt tính R2 R2a MSE F Q2
PT 25 0.8341 0.36 213.93 1.76 0
PT 2.5 0.8359 0.3286 6.89 1.66 0
Nhận thấy, khi có nhiều biến thì sự tái lập dữ liệu tốt (R2 > 0.81) nhưng mô hình
không có ý nghĩa về mặt thống kê (Phụ lục 3), và không có khả năng dự đoán (Q2 = 0).
Vì vậy, cần phải lựa chọn biến độc lập thích hợp trong phân tích MLR.
Tìm hiểu mối quan hệ giữa các biến bằng ma trận hệ số tương quan Pearson của
Chương 6
45
các biến được cho (Phụ lục 4). Nhận thấy giữa biến phụ thuộc và các biến độc lập
không có tương quan mạnh với nhau (|R| < 0.5) nhưng giữa các biến độc lập lại có sự
tương quan chặt chẽ với nhau (|R| > 0.9) như giữa biến S với các biến V, Mw, Ref,
Polar, Etotal; giữa DM với N1. Do đó chỉ giữ lại một biến độc lập có tương quan lớn
nhất với biến phụ trong số các biến tương quan chặt chẽ đó. Sau khi loại ra thì số biến
độc lập còn lại là 14.
6.2.1.1 Tính toán với hoạt tính PT 25
Từ 14 biến trên, thực hiện phương pháp hồi qui chọn mô hình (Regression
Model Selection). Như vậy đã thực hiện hồi qui tổng cộng 16.278 mô hình chứa từ ít
nhất 3 biến đến tối đa 14 biến và chọn ra được một số mô hình có R2a tốt nhất.
Bảng 3 Một số mô hình tốt nhất trong 16.278 mô hình khảo sát của PT 25
Mô hình MSE R2 R2a Bao gồm các biến
1.1 65.61 0.8566 0.7336 ABCDEFHIKLMN
1.2 62.89 0.8527 0.7446 ABCDEFHKLMN
1.3 60.44 0.8490 0.7546 ABCEFHKLMN
1.4 57.75 0.8467 0.7655 BCEFHKLMN
1.5 55.17 0.8449 0.7760 BCEHKLMN
1.6 52.69 0.8437 0.7861 CEHKLMN
1.7 52.92 0.8347 0.7851 CEHKMN
1.8 53.66 0.8240 0.7821 EHKMN
1.9 60.80 0.7911 0.7531 HKMN
1.10 85.316 0.6935 0.6536 CMN
Kí hiệu các biến như sau:
A : N1 D : C4 G : C7 J : S M : ELUMO
B : C2 E : C5 H : C8 K : HOF N : LogP
C : C3 F : C6 I : O9 L : EHOMO
Từ kết quả ở Bảng 3, nhận thấy rằng trong các mô hình được chọn thì mô hình
1.6, 1.7, 1.8 có R2a cao hơn các mô hình khác, MSE thấp và các biến cũng có xuất hiện
trong các mô hình khác. Do đó thực hiện phân tích MLR cho 3 mô hình này.
Chương 6
46
Bảng 4 Kết quả phân tích hồi qui cho mô hình 1.6, 1.7, 1.8
Mô hình Số biến R2 F MSE Q2
1.6 7 0.8437 14.65 52.69 0.2431
1.7 6 0.8347 16.83 52.92 0.2559
1.8 5 0.8240 19.67 53.66 0.3173
Kết quả ở Bảng 4 cho thấy rằng trong cả ba mô hình đều có R2 > 0.81 (tương
ứng với R > 0.9) có khả năng tái lập dữ liệu tương đối tốt, nhưng không có khả năng
khái quát hóa (Q2 < 0.5). Nếu phải chọn mô hình theo phương pháp phân tích hồi qui
tuyến tính thì sẽ chọn mô hình 1.8 gồm các biến C5, C8, HOF, ELUMO, LogP. Phương
trình MLR cho mô hình 1.8 như sau:
PT 25 = –119.94 – 325.86 C5 – 310.95 C8 – 0.13 HOF + 32.26 ELUMO + 9.36 LogP
Mô hình cho thấy giá trị C5 có tác động lớn nhất đến hoạt tính.
Bảng 5 Giá trị dự đoán của tập dữ liệu kiểm tra với PT 25
Hợp chất PT 25 TN PT 25 TT Sai số
4a 2 8.17 -308.5
4c 5 3.26 34.8
4n 73 43.44 40.5
4p 14.5 57.31 -295.2
4d' 24.5 26.80 -9.4
4i' 29.5 32.64 -10.6
4j' 47.5 42.93 9.6
Sai số = (PT TN – PT TT)/PT TN*100
R2 = 0.32
0
10
20
30
40
50
60
70
0 10 20 30 40 50 60 70 80
PT 25 TN
PT
2
5
TT
Hình 12 Đồ thị giá trị dự đoán cho tập dữ liệu kiểm tra với PT 25
Chương 6
47
Hệ số xác định R2test cho bộ hợp chất mới là rất kém (R2test < 0.5), không thể
dùng mô hình này để dự đoán hoạt tính cho chất mới được. Do đó, không thể dùng mô
hình này mô tả mối quan hệ định lượng giữa hoạt tính với cấu trúc của các dẫn xuất N-
acylpiperidine.
6.2.1.2 Tính toán với hoạt tính PT 2.5
Cũng áp dụng phương pháp lựa chọn mô hình hồi qui cho PT 2.5 với 14 biến
trên, thực hiện hồi qui tổng cộng 16.278 mô hình chứa từ ít nhất 3 biến đến tối đa 14
biến và chọn ra được một số mô hình có R2a tốt nhất.
Bảng 6 Một số mô hình tốt nhất trong 16.278 mô hình khảo sát với PT 2.5
PT 2.5 MSE R2 R2a Gồm các biến
2.1 4.88 0.71 0.4615 ABCDEFIJKLMN
2.2 4.79 0.6943 0.4702 ABCDEFJKLMN
2.3 2.32 0.7997 0.6746 ABCDEFIJKM
2.4 2.33 0.7865 0.6734 ABCDEFJKM
2.5 2.56 0.7511 0.6405 ABCDEFJK
2.6 2.66 0.7277 0.6274 BCDFJKM
2.7 2.88 0.6899 0.5968 BDFJKL
2.8 3.01 0.6595 0.5785 FJKLM
2.9 3.15 0.6263 0.5583 JKLM
2.10 3.15 0.6093 0.5583 KLN
Kết quả trong Bảng 6 cho thấy các mô hình có khả năng tái lập dữ liệu chưa tốt
(R2 < 0.81). Thử phân tích hồi qui và tính Q2 cho ba mô hình có R2 và R2a
cao nhất.
Bảng 7 Kết quả phân tích hồi qui cho mô hình 2.3, 2.4, 2.5
Mô hình Số biến R2 R2a F MSE Q2
2.3 10 0.7997 0.6746 6.39 2.32 0.2433
2.4 9 0.7865 0.6734 6.96 2.33 0.3975
2.5 8 0.7511 0.6405 6.79 2.56 0.1055
Trong 3 mô hình thì mô hình 2.4 có giá trị Q2 cao nhất. Phương trình MLR cho
mô hình 2.4:
Chương 6
48
PT 2.5 = – 65.35 – 70.68N1 – 147C2 – 121.2C3 – 79.77C4 – 71.56C5 –
121.1C6 + 0.0289S – 0.028HOF + 3.2876ELUMO
Mô hình cho thấy giá trị C2 có tác động lớn nhất đến hoạt tính.
Bảng 8 Giá trị dự đoán cho tập dữ liệu kiểm tra với PT 2.5
Kí hiệu hợp chất PT 2.5 TN PT 25 TT Sai số
4a 2 1.19 40.5
4c 3 -1.11 137
4l 9 12.37 -37.44
4p 5 12.21 -144.2
4d' 8.5 7.20 15.294
4m' 3 9.86 -228.7
4p' 1.5 3.61 -140.7
R2 = 0.37
-2
0
2
4
6
8
10
12
14
0 2 4 6 8 10
PT 2.5 TN
PT
2
.5
T
T
Hình 13 Đồ thị giá trị dự đoán bộ dữ liệu kiểm tra với PT 2.5
Kết quả tính toán cho hoạt tính PT 2.5 tương tự như PT 25 cho thấy các mô
hình này vừa không có khả năng khái quát hóa (Q2 < 0.5) lẫn dự đoán ngoại (R2test <
0.5). Do đó không thể dùng phương pháp MLR để xây dựng mô hình QSAR cho các
dẫn xuất N-acylpiperidine được. Điều này được biết khi phân tích tương quan giữa các
biến. Kết quả chứng tỏ đây là mối quan hệ phi tuyến. Vì thế cần tìm mô hình bằng các
phương pháp khác nhằm cải thiện R2test và Q2.
6.2.2 Phương pháp mạng nơron nhân tạo
Dữ liệu được chia ngẫu nhiên thành hai tập riêng biệt: 27 chất dùng để luyện
mạng (training set – tính R2, Q2); 7 chất dùng để kiểm tra khả năng dự đoán của
Chương 6
49
mạng có kí hiệu 4n, 4m, 4g, 4g', 4j', 4j, 4i' (test set – tính R2test).
Xây dựng cấu trúc mạng gồm 3 lớp với 2 nút xuất được mô tả trong mục 5.2.3.
Sau đó, mạng được luyện bằng cách thay đổi số nơron trên lớp ẩn từ 1 – 10 kết hợp
với kiểm tra chéo. Căn cứ vào hệ số tương quan R2, Q2, R2test
để đánh giá mạng.
Luyện mạng với toàn bộ biến độc lập. Chuẩn ngừng luyện tốt nhất là MSE của
bộ training bằng 0.01.
Bảng 9 Hệ số R2, Q2 và R2test ứng với số nơron trên lớp ẩn với mạng 20 input
PT 25 PT 2.5
Số nút ẩn
R2 Q2 R2test R2 Q2 R2test
1 0.77 0.4 0.58 0.68 0.29 0.4
2 0.93 0.62 0.35 0.93 0.47 0.04
3 0.94 0.7 0.49 0.98 0.66 0.21
4 0.95 0.73 0.41 0.96 0.63 0.19
5 0.94 0.7 0.5 0.98 0.66 0.29
6 0.95 0.73 0.5 0.97 0.62 0.27
7 0.96 0.69 0.37 0.98 0.64 0.12
8 0.98 0.72 0.38 0.98 0.59 0.16
9 0.98 0.68 0.54 0.98 0.59 0.22
10 0.99 0.69 0.43 0.98 0.58 0.16
Kết quả trong Bảng 9 cho thấy mạng có khả năng tái lập dữ liệu tốt (R2 > 0.81)
nhưng không có khả năng khái quát hóa (Q2 < 0.81) và không cho kết quả đoán tốt với
bộ dữ liệu không được học (R2test < 0.6).
PT 25
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 2 3 4 5 6 7 8 9 10
Số nút ẩn
R2
Q2
R2test
Chương 6
50
PT 2.5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 2 3 4 5 6 7 8 9 10
Số nút ẩn
R2
Q2
R2test
Hình 14 Đồ thị R2, Q2 và R2test ứng với số nơron trên lớp ẩn ở 2 nồng độ
Kết quả này cũng không tốt hơn phương pháp MLR trên. Mạng không tìm
được mô hình tối ưu với bộ biến này.
Qua việc khảo sát sự thay đổi số nút ẩn trên thì khó có thể sử dụng nút ẩn để
tối ưu hóa mạng, vì vậy cần lựa chọn lại các biến nhập cho mạng. Số biến độc lập lựa
chọn đưa vào mạng được chọn từ giá trị độ nhạy sau khi mạng luyện với toàn bộ biến
và với số nút ở lớp ẩn là 1 như đã trình bày trong Chương 5. Các biến được chọn
gồm: ELUMO, HOF, DM, S, C2, C3, C5, C6, C8. Luyện mạng với số nơron trên lớp ẩn
thay đổi từ 1 đến 10 có kết hợp với kiểm tra chéo. Chuẩn ngừng luyện tốt nhất là
MSE của bộ training bằng 0.003.
Bảng 10 Hệ số R2, Q2 và R2test ứng với số nơron trên lớp ẩn với mạng 9 input
PT 25 PT 2.5
Số nút ẩn
R2 Q2 R2test R2 Q2 R2test
1 0.72 0.74 0.68 0.54 0.54 0.69
2 0.92 0.8 0.73 0.75 0.52 0.76
3 0.95 0.9 0.69 0.9 0.56 0.72
4 0.98 0.91 0.83 0.97 0.88 0.58
5 0.98 0.87 0.65 0.97 0.83 0.9
6 0.97 0.92 0.42 0.99 0.87 0.74
7 0.97 0.93 0.69 0.98 0.89 0.72
8 0.98 0.93 0.85 0.98 0.92 0.85
9 0.98 0.91 0.69 0.98 0.88 0.81
10 0.98 0.92 0.8 0.99 0.88 0.78
Chương 6
51
PT 25
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 2 3 4 5 6 7 8 9 10
Số nút ẩn
R2
Q2
R2(test)
PT 2.5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 2 3 4 5 6 7 8 9 10
Số nút ẩn
R2
Q2
R2(test)
Hình 15 R2, Q2 và R2test ứng với số nơron trên lớp ẩn ở 2 nồng độ
Kết quả trong Bảng 10 và đồ thị cho thấy mạng nơron này nhanh chóng đưa ra
mô hình cho sự tái lặp dữ liệu tốt (R2 > 0.81), đồng thời còn có khả năng khái quát
hóa và dự đoán tốt (Q2 > 0.81, R2test > 0.81) với tập dữ liệu kiểm tra. Mô hình tốt nhất
được chọn cho cả hai hoạt tính đều có cấu trúc là (9 – 8 – 2). Kết quả tính toán và dự
đoán hoạt tính của mô hình trên như sau:
Chương 6
52
Bảng 11 Kết quả tính và dự đoán hoạt tính theo mô hình (9 – 8 – 2)
Kí
hiệu
PT 25
TN
PT 25
TT SS 1
PT25
DD SS 2
PT2.5
TN
PT2.5
TT SS 1
PT2.5
DD SS 2
4a 2.0 1.8 10.0 4.2 -110.0 2.0 2.3 -15.0 2.2 -10.0
4b 5.0 4.6 8.0 10.0 -100.0 4.0 3.8 5.0 4.2 -5.0
4c 5.0 4.9 2.0 -1.4 128.0 3.0 3.1 -3.3 3.4 -13.3
4d 17.0 17.8 -4.7 19.9 -17.1 5.0 5.1 -2.0 6.0 -20.0
4e 15.5 16.1 -3.9 18.3 -18.1 7.5 7.3 2.7 6.4 14.7
4f 48.0 49.5 -3.1 47.8 0.4 8.0 9.5 -18.8 11.5 -43.8
4h' 43.0 50.7 -17.9 47.8 -11.2 9.5 9.2 3.2 10.3 -8.4
4i 49.5 42.2 14.7 32.7 33.9 8.0 6.9 13.8 8.0 0.0
4k 50.0 48.9 2.2 47.7 4.6 13.5 12.9 4.4 11.0 18.5
4l 53.0 50.8 4.2 49.5 6.6 9.0 9.5 -5.6 9.4 -4.4
4o 39.5 38.7 2.0 42.7 -8.1 13.0 12.8 1.5 11.3 13.1
4p' 14.5 18.5 -27.6 25.3 -74.5 5.0 5.5 -10.0 5.1 -2.0
4q 19.5 19.8 -1.5 20.0 -2.6 5.5 5.6 -1.8 6.0 -9.1
4a' 17.0 17.8 -4.7 16.0 5.9 5.0 4.9 2.0 4.1 18.0
4b' 14.0 17.8 -27.1 18.7 -33.6 8.0 8.2 -2.5 7.8 2.5
4c' 17.0 16.9 0.6 18.2 -7.1 6.0 6.1 -1.7 5.5 8.3
4d' 24.5 21.9 10.6 23.2 5.3 8.5 8.6 -1.2 8.4 1.2
4e' 35.0 33.9 3.1 34.3 2.0 9.0 8.4 6.7 9.1 -1.1
4f' 12.0 11.5 4.2 13.1 -9.2 7.0 6.9 1.4 7.1 -1.4
4h' 21.5 21.7 -0.9 17.0 20.9 7.0 7.0 0.0 6.6 5.7
4k' 35.0 34.1 2.6 36.2 -3.4 9.0 9.1 -1.1 9.5 -5.6
4l' 45.5 46.6 -2.4 38.2 16.0 8.0 7.9 1.3 8.5 -6.3
4m' 33.0 32.2 2.4 33.5 -1.5 3.0 3.1 -3.3 4.2 -40.0
4n' 40.5 40.4 0.2 32.4 20.0 8.5 8.3 2.4 7.6 10.6
4o' 42.0 39.6 5.7 50.9 -21.2 10.5 10.6 -1.0 8.8 16.2
4p' 3.0 2.7 10.0 8.7 -190.0 1.5 1.2 20.0 0.7 53.3
4q' 12.0 12.0 0.0 8.8 26.7 1.0 1.2 -20.0 2.2 -120.0
TN: hoạt tính thực nghiệm TT: hoạt tính tính toán DD:hoạt tính dự đoán
SS 1: Sai số 1 = (PT TN – PT TT)/PT TN*100
SS 2: Sai số 2 = (PT TN – PT DD)PT TN*100
Chương 6
53
PT 25
-10
0
10
20
30
40
50
60
1 3 5 7 9 11 13 15 17 19 21 23 25 27
Số mẫu luyện
PT25 TN
PT25 TT
PT25 DD
PT 2.5
0
2
4
6
8
10
12
14
16
1 3 5 7 9 11 13 15 17 19 21 23 25 27
Số mẫu luyện
PT2.5 TN
PT2.5 TT
PT2.5 DD
Hình 16 Đồ thị giá trị tính toán và dự đoán theo hoạt tính thực nghiệm ở 2 nồng
độ với cấu trúc mạng (9 – 8 – 2)
Bảng 12 Kết quả dự đoán hoạt tính cho tập dữ liệu mới
Kí hiệu PT 25 TN
PT 25
TT
Sai số PT 2.5 TN
PT 2.5
TT Sai số
4n 73 60.77 16.75 10.5 13.56 -29.14
4g' 33 28.86 12.55 8.5 8.51 -0.12
4g 13 12.20 6.15 7 4.07 41.86
4j' 47.5 41.33 12.99 10 11.05 -10.50
4j 41 44.18 -7.76 11.5 12.13 -5.48
4i' 29.5 25.24 14.44 7.5 6.03 19.60
4m 8.5 9.49 -11.65 8 7.05 11.88
Sai số = (PT TN – PT TT)/PT TN*100
Chương 6
54
PT 2.5
0
2
4
6
8
10
12
14
16
1 2 3 4 5 6 7
Số mẫu kiểm tra
PT 25 TN
PT 2.5 TT
PT 25
0
10
20
30
40
50
60
70
80
1 2 3 4 5 6 7
Số mẫu kiểm tra
PT 25 TN
PT 25 TT
Hình 17 Đồ thị giá trị dự đoán và thực nghiệm tập dữ liệu kiểm tra ở 2 nồng độ
Với số nút nhập và chuẩn dừng phù hợp (9 nút và MSE là 0.003), mạng đã
nhanh chóng tìm được số nút ẩn thích hợp để xây dựng mô hình QSAR tốt nhất. Ta
có thể dùng mô hình này để mô tả mối quan hệ định lượng giữa các tham số cấu trúc
và hoạt tính của các dẫn xuất N-acylpiperidine.
Bảng 13 Kết quả các mô hình tốt nhất của phương pháp MLR và ANN
PT 25 PT 2.5 Phương
pháp
Số biến
độc lập R2 Q2 R2test
Số biến
độc lập R2 Q2 R2test
MLR 5 0.82 0.32 0.32 9 0.79 0.4 0.37
ANN 9 0.98 0.93 0.85 9 0.98 0.92 0.85
Kết quả cho thấy các mô hình QSAR cho các dẫn xuất N-acylpiperidine thu
được bằng phương pháp ANN có các giá trị R2, Q2 và R2test lớn hơn nhiều so với
Chương 6
55
phương pháp MLR với các dẫn xuất N-acylpiperidine. Điều này cho thấy phương
pháp ANN giải quyết bài toán QSAR tốt hơn phương pháp MLR.
6.3 ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM
SỐ CẤU TRÚC LÊN HOẠT TÍNH
Việc khảo sát QSAR bằng phương pháp ANN cho các dẫn xuất N-
acylpiperidine đã tìm được cấu trúc mạng mô tả tốt mối quan hệ này. Mức độ ảnh
hưởng của các tham số cấu trúc được đánh giá thông qua giá trị trọng số hoặc sự
phân tích độ nhạy của hoạt tính theo tham số cấu trúc.
Trọng số: luyện mạng với cấu trúc (20 – 1 – 2), khi đó có được 20 trọng số
cho 20 đường truyền từ input đến lớp ẩn. Hàm truyền sử dụng trong lớp ẩn là hàm
sigmoid được tính theo biểu thức:
x
x
e
exf
1
)(
Do đó, độ lớn giá trị trọng số cho biết mức độ tác động của mỗi input đến
output. File chứa các giá trị trọng số được NeuroSolution 5.07 lưu dưới dạng mở rộng
*.*.nsb (Phụ lục 6).
Độ nhạy: phân tích độ nhạy là đo mức độ quan trọng tương đối giữa các input
của mạng, nó xem xét sự biến thiên của hoạt tính theo sự biến thiên của của một input
trong vùng xung quanh giá trị trung bình trong khi vẫn giữ nguyên các input khác.
Phân tích độ nhạy (Sensetivity about the mean) được thực hiện trong phần test
sau khi mạng luyện với cấu trúc mạng (20 – 1 – 2), kết quả đưa ra gồm bảng các giá
trị độ nhạy, biểu đồ cột cho bảng giá trị này và 20 đồ thị thể hiện sự biến thiên của
hoạt tính theo từng tham số cấu trúc (Phụ lục 6). Giá trị của độ nhạy thể hiện mức độ
ảnh hưởng của các biến cấu trúc đến hoạt tính.
Chương 6
56
Bảng 14 Giá trị trọng số và độ nhạy của các biến độc lập
Độ nhạy
Tên biến Trọng số Tên biến Trị tuyệt đối của trọng số Tên biến PT 25 PT 2.5
HOF 6.01 ELUMO 6.2 ELUMO 5.92 0.97
C8 4.82 HOF 6.01 HOF 4.12 0.68
C5 3.72 C8 4.82 C5 3.89 0.67
C6 3.34 C5 3.72 C8 3.48 0.57
DM 2.83 C6 3.34 C6 2.79 0.46
C2 2.79 DM 2.83 DM 2.63 0.43
N1 1.92 C2 2.79 C2 2.53 0.41
C4 1.4 C3 2.75 S 2.44 0.4
Etotal 0.9 S 2.51 C3 2.34 0.38
O9 -0.07 V 1.87 N1 1.81 0.3
LogP -0.75 N1 1.4 V 1.79 0.28
Ref -0.82 C4 1.13 C4 1.64 0.27
C7 -0.86 Polar 0.96 Polar 1.1 0.18
EHOMO -0.86 Mw 0.9 Mw 0.9 0.15
Mw -0.96 Etotal 0.86 Etotal 0.86 0.14
Polar -1.13 EHOMO 0.86 Ref 0.79 0.13
V -2.07 C7 0.82 LogP 0.77 0.13
S -2.31 Ref 0.75 EHOMO 0.72 0.12
C3 -2.75 LogP 0.46 C7 0.62 0.1
ELUMO -6.2 O9 0.07 O9 0.05 0.01
Chương 6
57
0
1
2
3
4
5
6
7
T
rị
tu
yệ
t đ
ối
c
ủa
tr
ọn
g
số
EL
u m
o
HO
F
C8 C5 C6 DM C
2 C3 S V N1 C4
Po
la
r
M
w
Et
ot
al
EH
om
o
C7 Re
f
Lo
gP O
9
Tên biến
0
1
2
3
4
5
6
Đ
ộ
n
h
ạy
EL
um
o
HO
F C5 C8 C6 DM C
2 S C3 N1 V C4
Po
lar M
w
Et
ot
al Re
f
Lo
gP
EH
om
o C7 O9
Tên biến
PT 25
PT 2.5
Hình 18 Biểu đồ giá trị trị tuyệt đối trọng số và biểu đồ độ nhạy của hai hoạt tính
Trong Bảng 14, độ lớn giá trị trọng số và độ lớn giá trị độ nhạy được
sắp xếp theo thứ tự giảm dần. Cột thứ 4 biểu diễn các giá trị trọng số sau khi lấy giá
trị tuyệt đối của chúng ở cột thứ 2. Từ Bảng 14 và hai biểu đồ cho thấy 15 giá trị
đứng đầu của hai quá trình tính toán này tương ứng với nhau, chỉ có sự đổi thứ tự của
C5 và C8, C3 và S, N1 và V, nhưng các giá trị này khác nhau không đáng kể; thứ tự độ
nhạy của các tham số cấu trúc theo hoạt tính của PT 25 và PT 2.5 cũng tương ứng với
nhau.
Với bộ tham số gồm 9 biến đầu tiên, đã xây dựng được mô hình ANN vừa có
khả năng tái lập dữ liệu tốt vừa có khả năng khái quát hóa và dự đoán tốt cho hoạt
tính ở hai nồng độ như trên. Vậy các tham số ảnh hưởng đáng kể đến hoạt tính gồm
các biến theo thứ tự là ELUMO, HOF, C5, C8, C6, DM, C2, C3.
Chương 6
58
Chuẩn hóa các giá trị của tham số và hoạt tính về cùng một vùng [0.1; 0.9] để
xem xét sự biến đổi của các tham số này và hoạt tính.
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
C2
PT 25
PT 2.5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
C3
PT 25
PT 2.5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
C5
PT 25
PT 2.5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
C6
PT 25
PT 2.5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
C8
PT 25
PT 2.5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
S
PT 25
PT 2.5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
HOF
PT 25
PT 2.5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
DM
PT 25
PT 2.5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
ELUMO
PT 25
PT 2.5
Hình 19 Đồ thị biểu diễn giá trị của 9 tham số cấu trúc và hoạt tính
Chương 6
59
Qua các đồ thị nhận thấy sự biến thiên của các 9 tham số cấu trúc này và hoạt
tính không tuân theo một qui luật nào cả. Điều này càng chứng tỏ đây là mối quan hệ
rất phức tạp không thể mô tả bằng phương trình hồi qui đa biến tuyến tính một cách
rõ ràng. Mối quan hệ phi tuyến này cũng được khẳng định qua bảng ma trận hệ số
tương quan tuyến tính Pearson tính cho bộ dữ liệu thỏa điều kiện phân phối chuẩn
(Phụ lục 4) hay tương quan Spearman đối với dữ liệu không thỏa điều kiện phân phối
chuẩn (Phụ lục 5), trị tuyệt đối các hệ số tương quan này đều thấp hơn 0.61.
E. KẾT LUẬN
Kết luận
60
KẾT LUẬN
----------
KẾT QUẢ VỀ PHƯƠNG PHÁP NGHIÊN CỨU QSAR
Việc nghiên cứu QSAR của N-acylpiperidine trong đề tài này đã được thực
hiện qua sự kết hợp giữa các giá trị tính toán bằng hóa lượng tử với các phương pháp
xử lí số liệu kinh điển và hiện đại (MLR và ANN). Kết quả thu được cho thấy
phương pháp ANN giải quyết tốt bài toán khảo sát QSAR của các dẫn xuất N-
acylpiperidine.
Phương pháp bán thực nghiệm PM3 trong chương trình Hyperchem 8.03 để
tính các tham số cấu trúc của N-acylpiperidine không quá lâu và thực hiện dễ dàng.
Phần mềm Stagraphics Centurion XV thực hiện nhanh chóng các bước phân tích dữ
liệu, lựa chọn biến, phân tích và lựa chọn mô hình tối ưu. Chương trình
NeuroSolution for Excel của NeuronSolution 5.07 dễ dàng thực hiện việc xây dựng,
luyện và kiểm tra mạng.
KẾT QUẢ NGHIÊN CỨU QSAR
Cũng cùng mục đích như các nghiên cứu QSAR về thuốc đuổi muỗi khác,
luận văn này đã thực hiện khảo sát QSAR trên 34 chất dẫn xuất của N-acylpiperidine
bằng hai phương pháp: hồi qui đa biến tuyến tính (MLR) và mạng nơron nhân tạo
(ANN). Kết quả mô hình thu được bằng phương pháp ANN đều có R2 và Q2 lớn hơn
0.81, do đó có thể áp dụng được mô hình này trong thực tế để đoán nhận hoạt tính
của những chất N-acylpiperidine chưa biết bằng cách thiết kế phân tử muốn thử trên
máy tính và nhập vào những thống số có trong mô hình. Mô hình này sẽ là công cụ
hỗ trợ đắc lực cho việc thiết kế ra các phân tử mới có tác dụng đuổi muỗi hữu hiệu
hơn mà giảm được công sức, thời gian và chi phí.
Hướng tiếp theo và lâu dài của đề tài này là tiếp tục hoàn chỉnh phương pháp
luận nghiên cứu QSAR qua việc cải thiện phương pháp tính toán (như phối hợp
phương pháp mạng nơron với phương pháp logic mờ hay với thuật toán di truyền ...),
cải thiện việc chọn lọc và tính toán các tham số cấu trúc mới.
TÀI LIỆU THAM KHẢO
TÀI LIỆU THAM KHẢO
----------
TIẾNG VIỆT
[1] Bùi Thọ Thanh (2008), Bài giảng hóa lượng tử - tin học dành cho học viên cao
học, Đại Học Cần Thơ.
[2] Bùi Thọ Thanh (2000), Bài giảng Mạng Nơron dành cho sinh viên khoa sinh, Đại
Học Khoa Học Tự Nhiên.
[3] Bùi Thọ Thanh (2000), Bài giảng Quantitative Structure – Activity Relationship
(QSAR) dành cho sinh viên khoa hóa, Đại Học Khoa Học Tự Nhiên.
[4] Bùi Thọ Thanh (2002), Phùng Quán, Trịnh Thành Thuật, “Khảo sát liên hệ định
lượng cấu trúc – hoạt tính của Benzenesulfonamid”; Bùi Thọ Thanh (2002),
Phùng Quán, Nguyễn Chí Sơn, “Khảo sát liên hệ định lượng cấu trúc – hoạt
tính của Polychlorinated Dibenzofurans”, Tuyển tập các báo toàn văn Hội
nghị toàn quốc các đề tài nghiên cứu khoa học cơ bản trong lĩnh vực Hóa lý
và Hóa lý thuyết 27/04/2002, Hà Nội, Việt Nam, tr. 98-121.
[5] Đặng Văn Giáp (1998), Liên quan cấu trúc - tác dụng & thiết kế phân tử bằng
máy tính, NXB Giáo Dục, tr. 89-123.
[6] Hoàng Trọng (2008), Chu Nguyễn Mộng Ngọc, Phân tích dữ liệu nghiên cứu với
SSPS, tập 1, NXB Hồng Đức, Chương IX: Tương quan và Hồi qui tuyến tính,
tr. 195-277.
[7] Lâm Ngọc Thiềm (1999), Phạm Văn Nhiêu, Lê Kim Long, Cơ sở hóa họ lượng
tử, chương 11, tr. 291-314.
[8] Nguyễn Đình Thúc (2000), Hoàng Đức Hải, Trí tuệ nhân tạo Mạng Nơron –
Phương pháp & ứng dụng, NXB Giáo Dục.
[9] Phạm Trần Nguyên Nguyên (1998), Ứng dụng hóa lượng tử và tin học khảo sát
các chất ức chế enzym khử dihidroflate, Luận văn thạc sĩ khoa học hóa học,
Đại Học Khoa Học Tự Nhiên-TpHCM.
[10] Phạm Quý Tư (1999), Đỗ Đình Thành, Cơ học lượng tử, NXB Đại Học Quốc
Gia Hà Nội.
[11] Phùng Quán (2002), Khảo sát mối liên hệ định lượng giữa độc tính và cấu trúc
của các hợp chất Dioxin, Luận văn thạc sĩ khoa học hóa học, Đại Học Khoa
Học Tự Nhiên-TpHCM.
[12] Thái Sanh Nguyên Bình (2003), Khảo sát mối quan hệ định lượng giữa độc tính
và cấu trúc của hợp chất benzen, Luận văn thạc sĩ khoa học hóa học, Đại
Học Khoa Học Tự Nhiên-TpHCM.
[13] www.contrungviet.net, Tập tính các loài muỗi truyền bệnh và cách phòng
chống.
[14] www.impe-qn.org.vn, Những nghiên cứu phát hiện mới về cơ quan thính giác và
khứu giác của muỗi.
[15] vi.wikipedia.org, Muỗi.
[16] vi.wikipedia.org, Thuốc đuổi muỗi.
TIẾNG ANH
[17] Ana Gallegos Saliner (2004), Molecular Quantum Similarity in QSAR:
Applications in computer – aided molecular design, Girona, pp.141-146.
[18] Alan R. Katritzky (2008), “Synthesis and bioassay of improved mosquito
repellents predicted from chemical structure”, PNAS, 105(21), pp.7359-
7364.
[19] Frank Jensen (1999), Introduction to Computational Chemistry, Jonh Wiley &
Sons Ltd.
[20] Jure Zupan (1992), Johann Gasteiger, Neural Networks for Chemists, VCH
Wienheim, part I, pp.3-59.
[21] Kubinyi H. (1994), QSAR Hansch Analysis and Related Approaches, Mannhold
R, Ed., VCH Wienheim, 57-76.
[22] Morrison D.F., Multivariate Statistical Methods, McGraw-Hill, pp.107-110.
[23] Sandhya Samarasinghe (2006), Neural Networks for Applied Sciences and
Engineering, Auerbach Pulications, Boca Raton, New York, pp. 113-150.
[24] Wylie W.A. (1994), “Molecular Modeling Methods” in Molecular Modeling and
Drug Design, Vinter J.G. & M.Eds, CRC Press, pp.1-15.
[25] Zongde Wang (2008), “QSAR study of mosquito repellents from terpenoid with a
six-member-ring”, Bioorganic & Medicinal Chemistry Letter, 10(18),
pp.2854-2859.
[26] en.wikipedia.org, Quantitative structure activity relationship.
[27] www.ars.usda.gov, New Mosquito Repellents.
[28] www.epa.gov, Active Ingredients Found in Insect Repellents.
[29] www.epa.gov, Insect Repellents: Use and Effectiveness.
[30] www.globalhealthreporting.org, Malaria | Several New Substances Repel
Mosquitoes Three Times Longer Than DEET, Study Says.
[31] www.pnas.org, Supporting Information.
[32] www.qsarworld.com, Publicly-accessible QSAR software tools developed by the
Joint Research Centre.
Các file đính kèm theo tài liệu này:
- KH7842O Samp193T M7888I QUAN H7878 2727882NH L4317906NG .pdf