Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất N-Acylpiperidine

MỤC LỤC Chương 1: TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT TÍNH 3 1.1. HOẠT TÍNH 4 1.1.1. Hoạt tính sinh học 4 1.1.2. Hoạt tính hóa học 4 1.2. CÁC THAM SỐ CẤU TRÚC 5 1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR 5 Chương 2: CƠ HỌC LƯỢNG TỬ, LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ9 2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG BORN-OPPENHEIMER 9 2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM 11 2.2.1. Giới thiệu 11 2.2.2. Phương pháp PM3 3.1. PHƯƠNG PHÁP HỒI QUI ĐA BIẾN TUYẾN TÍNH 16 3.1.1. Tương quan và hồi qui 16 3.1.2. Phân tích hồi qui đa biến tuyến tính 20 3.1.2.1. Các thủ tục chọn biến 20 3.1.2.1. Đánh giá mô hình 21 3.2. PHƯƠNG PHÁP MẠNG NƠRON NHÂN TẠO 22 3.2.1. Nơron sinh học và nơron nhân tạo 25 3.2.2.1. Nơron sinh học 23 3.2.2.2. Nơron nhân tạo 24 3.2.2. Cấu trúc mạng nơron đa lớp 25 3.2.3. Luyện mạng: Kỹ thuật lan truyền ngược 26 3.2.4. Ngừng tiến trình luyện 27 3.2.5. Các yếu tố ảnh hưởng đến tính tổng quát hóa của mạng 28 Chương 4: CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE 30 4.1. BỆNH DO MUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔI MUỖI 33 C – PHƯƠNG PHÁP Chương 5: PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN37 5.1. PHẦN MỀM 37 5.1.1. Hyperchem 8.03 37 5.1.2. Stagraphics Centurion XV 37 5.1.3. NeuroSolution 5.07 37 5.1.4. Microsoft Excel 37 5.2. CÁC BƯỚC THỰC HIỆN 37 5.2.1. Tính toán hóa lượng tử 38 5.2.2. Phân tích hồi qui đa biến tuyến tính 38 5.2.3. Tính toán mạng nơron 39 D – KẾT QUẢ VÀ BÀN LUẬN Chương 6: KHẢO SÁT MỐI QUAN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE42 6.1. DỮ LIỆU 42 6.2. KẾT QUẢ VÀ BÀN LUẬN 44 6.2.1. Phương pháp hồi qui đa biến tuyến tính 44 6.2.1.1. Tính toán với hoạt tính PT 25 45 Mục lục 6.2.1.2. Tính toán với hoạt tính PT 2.5 47 6.2.2. Phương pháp mạng nơron 48 6.3. ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU TRÚC LÊN HOẠT TÍNH 55 E – KẾT LUẬN KẾT LUẬN 60 TÀI LIỆU THAM KHẢO PHỤ LỤC

pdf79 trang | Chia sẻ: maiphuongtl | Lượt xem: 2381 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất N-Acylpiperidine, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
luyện bằng cách tìm giá trị gradient lỗi và số nút ẩn phù hợp. Điều này đòi hỏi nhiều thời gian. Nếu không bị giới về khả năng tính toán (phần cứng) thì ta có thể cho mạng một lượng nút ẩn thừa để luyện và dùng phương pháp dừng luyện bằng bộ kiểm tra. Phương pháp này được thực hiện như sau: chia bộ mẫu ra thành ba tập, tập số một dùng để luyện mạng, tập số hai dùng để kiểm tra hiện tượng quá khớp, bộ số ba dùng để kiểm tra tính tổng quát hoá của mạng. Luyện mạng với tập mẫu luyện nhưng định kì ngừng luyện để đánh giá sai số trên tập mẫu kiểm tra (khi đánh giá sai số trên tập mẫu kiểm tra, ta chỉ cần thực hiện ánh xạ cho từng mẫu mà không phải trải qua giai đoạn lan truyền ngược). Khi sai số trong mẫu kiểm tra đi lên, thì quá khớp đã bắt đầu. Khi đó, ta ngừng luyện, trở về các trọng sinh ra lỗi thấp nhất trên mẫu kiểm tra, và dùng các trọng đó cho mô hình của ta. Như vậy, song song với tiến trình luyện ta phải tính sai số trên tập mẫu kiểm tra. 3.2.5 Các yếu tố ảnh hưởng đến tính tổng quát hoá của mạng nơron Mạng có tính tổng quát hoá khi nó có thể dự đoán tốt các dữ liệu mới. Các yếu tố ảnh hưởng nhiều đến tính tổng quát hoá của mạng là:  Kích thước tập mẫu: mạng học để mô hình hóa dữ liệu và có thể mô hình hóa cả nhiễu, có thể ngăn nó quá khớp bằng cách tạo mẫu luyện đủ lớn để bù cho mức nhiễu trong dữ liệu. Nhưng việc tăng mẫu thường gặp phải khó khăn trong thực hành vì thực tế mẫu hiếm khi đủ lớn để ngăn được nhiễu.  Số nút ẩn: mỗi trọng số trong mạng là một tham số làm tăng khả năng của mạng, số trọng số trong mạng là một hàm theo số nút của mạng, nó quyết định mức độ Chương 3 29 tự do mà mạng có thể khớp với dữ liệu. Do đó, mạng chỉ đạt được trạng thái tối ưu khi tìm được số nút ẩn phù hợp. Để tìm số nút ẩn tối ưu thì phải luyện nhiều mạng với số nút ẩn khác nhau. Hơn nữa, phải luyện cho đến khi mạng hội tụ. Phương pháp này cũng tạm ổn nhưng đòi hỏi thời gian máy tính khá nhiều. Quá trình tìm mạng tối ưu chủ yếu tập trung vào việc tìm số nút ẩn, nhưng số nút nhập cũng quan trọng. Khi dùng nhiều nút nhập ta sẽ cho mạng nhiều mức tự do hơn – nhiều khả năng để mô hình hóa một cách chính xác các hàm phức tạp, hay nhiều khả năng để quá khớp.  Thời gian luyện mạng cũng quan trọng không kém. Trong thực tế, việc luyện mạng đến hội tụ là một bài toán không dễ. Giai đoạn luyện có thể rất dài khi phải luyện đến giá trị gradient lỗi rất nhỏ cho đến khi một nút ẩn nào đó tìm được giá trị tối ưu. Vì vậy, mạng cần đủ thời gian để luyện và dừng luyện đúng lúc. Mạng chỉ có giá trị sử dụng khi có tính tổng quát hoá cao.  Chương 4 30 Chương 4 CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE ---------- 4.1 BỆNH DO MUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔI MUỖI 13-15 Muỗi đốt, ngoài chuyện khó chịu, ngứa ngáy tại chỗ, muỗi còn là trung gian truyền một số bệnh ký sinh trùng ở nhiều vùng nhiệt đới và cận nhiệt đới. Sau đây là một vài bệnh nguy hiểm thường gặp:  Sốt rét là một chứng bệnh gây ra bởi ký sinh trùng loại protozoa tên Plasmodium, lây truyền từ người này sang người khác khi những người này bị muỗi đốt. Muỗi lan truyền bệnh là những loài Anopheles, thuộc nhóm Plasmodium. Chúng hút máu người bệnh, tiêu hóa máu nhưng không tiêu hóa ký sinh trùng. Bệnh phổ biến ở các khu vực nhiệt đới và cận nhiệt đới của châu Mỹ, châu Á và châu Phi. Sốt rét là một trong những bệnh truyền nhiễm phổ biến nhất và là vấn đề nghiêm trọng đối với sức khoẻ cộng đồng. Bệnh có thể chữa và phòng bằng thuốc căn bản Chloroquine.  Sốt Dengue còn gọi là Sốt Đập Lưng (breakbone fever) do muỗi Aedes Aegyti truyền virus từ người bệnh sang người lành. Bệnh ít gây tử vong ngoại trừ trường hợp Sốt Đập Lưng Xuất Huyết thường thấy ở các quốc gia Đông Nam Á và châu Mỹ La Tinh. Bệnh nhân có triệu chứng như đau xương khớp, nhức đầu, nóng sốt, nổi ban trên da và làm cơ thể suy nhược. Không có thuốc chữa khỏi bệnh mà cũng chưa có thuốc tiêm ngừa. Sốt xuất huyết đang là vấn đề nan giải của mọi quốc gia vì dịch bệnh ngày một gia tăng.  Sốt vàng (Yellow Fever) là chứng bệnh sốt gây vàng da do siêu vi trùng thuộc họ Flaviviridae gây ra. Đây là một chứng bệnh sốt xuất huyết quan trọng tại Châu Phi và Nam Mỹ mặc dầu hiện nay đã có vắc-xin hiệu nghiệm. Sốt vàng từng gây nhiều trận dịch tàn khốc, gây tử vong khắp nơi cho đến thế kỷ 20 khi khoa học khám phá ra bệnh lây do muỗi đốt và nghiên cứu được phương cách phòng chống bằng vắc-xin. Sốt vàng cũng do muỗi Aedes Aegypti truyền một loại virus.  Bệnh Giun Chỉ (Filariasis) có nhiều ở vùng nhiệt đới và bán nhiệt đới. Giun Chương 4 31 chỉ bạch huyết (Lymphatic filariasis) là một bệnh nhiễm ký sinh trùng Wuchereria bancrofti, Brugia malayi hoặc Brugia timori. Loài ký sinh trùng này được truyền từ người này sang người khác do muỗi đốt và phát triển thành giun trưởng thành trong hệ mạch bạch huyết, gây nên tổn thương và tổ chức sưng phồng. Bệnh phù chân voi (Elephantiasis) gồm đau, biến dạng chi cơ thể và cơ quan sinh dục - đây là các dấu hiệu cổ điển trong giai đoạn muộn của bệnh này. Bệnh có thể chữa được bằng thuốc diethylcarbamazine.  Viêm não Nhật Bản: tác nhân truyền bệnh là muỗi Culicinea tritaeniorhyunchus, thường có ở nông thôn. Người là ký chủ trong chu trình truyền bệnh và thường trẻ em mắc bệnh nhiều hơn người lớn. Tỉ lệ tử vong từ 7-33% hay cao hơn nhưng tỉ lệ di chứng ngược lại với tỉ lệ tử vong . Các di chứng của bệnh thường là liệt dai dẳng, mất điều hòa trương lực, chậm phát triển trí tuệ và rối loạn tính cách. Vì đây là bệnh do virus gây ra nên các hiểu biết bệnh học còn nhiều hạn chế. Việc điều trị dựa vào điều trị triệu chứng và tiêm phòng là chủ yếu. Các vấn đề về phòng tránh, xua đuổi hay tiêu diệt muỗi đã được con người quan tâm từ lâu. Nó là vấn đề nan giải của nhiều quốc gia trên thế giới. Hình 7 Thuốc xịt muỗi và muỗi thuộc nhóm Plasmodium Từ xưa, con người đã biết dùng hóa chất để đuổi muỗi như đốt vỏ cam quýt và một số thảo mộc có chứa tinh dầu hoặc dùng nhiệt để tạo điều kiện phát tán các hương liệu đối kháng với muỗi, hay dùng các loại cây củ tươi như hành tây cắt đôi đặt trong phòng,… Các phương pháp dân gian này có nhiều hạn chế là không giết được muỗi, chỉ đuổi được muỗi trong khoảng thời gian và một vùng không gian nhất định, đôi khi lại còn gây ra phiền hà đối với nhiều người khác. Chương 4 32 Ngày nay, thuốc đuổi muỗi thông dụng sử dụng các hóa chất tổng hợp – được điều chế thông qua công nghệ cao và tiên tiến của ngành dược phẩm. Sau đây là một vài hóa chất được sử dụng trong sản phẩm thuốc đuổi muỗi đã đăng kí với Cơ quan Bảo Vệ Môi Sinh của Hoa Kì US EPA (United State Environmental Protection Agency):  DEET tên hóa học là N,N-diethyl-meta-toluamide hoặc N,N-diethyl-3- methyl-benzamide là thành phần hoạt chất được tìm thấy trong nhiều sản phẩm đuổi muỗi nhất. DEET được điều chế vào năm 1946 sau khi chiến tranh thế giới lần thứ 2 nhấn mạnh cần ngăn ngừa muỗi và các côn trùng khác đốt chích. DEET được sử dụng hơn 50 năm nay và được xem là “tiêu chuẩn vàng” cho các hoạt chất đuổi muỗi. Kể từ năm 1957 hóa chất này đã có mặt ở khắp mọi nơi và là hóa chất chống muỗi và các loài côn trùng hút máu khác được sử dụng rộng rãi nhất trên thế giới. Hóa chất DEET hoạt động bằng cách làm cho muỗi và họ hàng nhà muỗi không thể đánh hơi mùi mồ hôi hấp dẫn của con người ở gần đó. Một cuộc nghiên cứu mới được thực hiện gần đây cho thấy những kết quả như sau:  Một sản phẩm chứa 23.8% DEET có công dụng ngăn muỗi cắn khoảng 5 giờ đồng hồ.  Một sản phẩm chứa 20% DEET có công dụng ngăn muỗi cắn gần 4 giờ đồng hồ.  Một sản phẩm chứa 6.65% DEET có công dụng ngăn muỗi cắn gần 2 tiếng đồng hồ.  Những sản phẩm chứa 4.75% DEET và 2% dầu đậu nành: cả hai loại này đều có công dụng ngăn muỗi cắn trong vòng khoảng 90 phút đồng hồ. Ủy ban Sức Khỏe Môi Trường của Hội Bác Sĩ Nhi Khoa Hoa Kỳ (The American Academy of Pediatrics Committee on Environmental Health) mới đây cho biết những sản phẩm chứa DEET có thể dùng một cách an toàn cho trẻ em và cho phụ nữ mang thai hoặc đang cho con bú.  Picaridin (tên hóa học là 1-methylpropyl 2-(2-hydroxyethyl)- 1-piperidinecarboxylat) là chất lỏng không màu không mùi được sử dụng như là thuốc diệt côn trùng như ruồi, muỗi, chiggers, và bọ ve. Các sản phẩm có chứa khoảng Chương 4 33 5-20% hoạt chất.  Tinh dầu bạch đàn chanh được tìm thấy trong lá và cành cây bạch đàn. Nó đã được đăng ký đầu tiên vào năm 1948 như là một thuốc trừ sâu và thuốc diệt côn trùng và bọ ve. Như với hầu hết các loại dầu thực vật, không có tác dụng phụ cho con người. Sản phẩm có chứa khoảng 30–40% của các thành phần hoạt chất.  PMD (p-mentane-3,8-diol) là hóa chất tổng hợp của tinh dầu bạch đàn chanh. Nó được áp dụng cho da hoặc quần áo để xua đuổi côn trùng. Sản phẩm có chứa 8-10% thành phần hoạt chất có tác dụng bảo vệ như DEET ở nồng độ thấp.  IR3535 (tên hóa học là etyl 3-(N-butyl-N-axetyl)-aminopropionat), cũng được gọi là Merck 3.535, được sử dụng như một thuốc diệt côn trùng chống muỗi và loài cắn đốt khác. Sản phẩm có chứa khoảng 7.5-20.07% của các thành phần hoạt chất.  Permethrin được đăng ký để sử dụng như một loại thuốc trừ sâu và thuốc đuổi muỗi. Sản phẩm Permethrin được sử dụng trên quần áo, giày, lưới, giường. Permethrin dùng ngâm tẩm quần áo, giầy dép như một cách phòng chống bọ ve, muỗi, các loài côn trùng và vẫn còn hiệu quả sau khi giặt rửa nhiều lần.  Allethrin là hóa chất đuổi muỗi thường được sử dụng cho vùng không gian rộng, là chất dễ bay hơi, được sử dụng trong các sản phẩm thương mại như nhang, miếng dán, nến và đèn xông muỗi. Hiện thị trường có nhiều sản phẩm phòng chống muỗi với những cách thức sử dụng khác nhau. Loại diệt muỗi bằng nhang hoặc bình xịt (với các nhãn hiệu như Mosfly, Jumbo, Raid Max...); loại thuốc chống muỗi dùng cho cá nhân dưới dạng kem bôi (Soffell) hay thuốc xịt lên da có hương thơm; loại máy xông muỗi, máy bắt muỗi; keo dán đuổi muỗi;… Tuy nhiên, nguyên liệu của các các loại sản phẩm này là hóa chất đều gây ra tác dụng phụ đến sức khỏe con người nên khi sử dụng cần lưu ý công dụng để có cách sử dụng hiệu quả, phù hợp và an toàn cho sức khỏe. 4.2 N-ACYLPIPERIDINE - CHẤT ĐUỔI MUỖI MỚI 18, 29, 31 Dữ liệu ban đầu về cấu trúc và hoạt tính của các chất họ piperidines được lấy từ bộ dữ liệu về các hợp chất đuổi muỗi của Bộ Nông Nghiệp Hoa Kì USDA (United States Department of Agricuture) đã thu thập hơn 50 năm18. Các nhà khoa học của trường đại học Florida (Mỹ) kết hợp với USDA đã nghiên cứu sàn lọc ra 200 chất từ Chương 4 34 hàng ngàn hợp chất tiềm năng, họ tập trung cuộc tìm kiếm chủ yếu trên các hợp chất N-acylpiperidine (thành phần làm cho hạt tiêu có vị cay). Công thức tổng quát của các dẫn xuất N-acylpiperidine như sau: NR O R' 1 2 3 4 5 6 7 8 9 Từ bộ dữ liệu lựa chọn, họ dùng chương trình máy tính thiết kế thuốc, chương trình này sử dụng những thông tin về các cấu trúc hóa học và tác dụng của các hợp chất này trên các thụ quan của côn trùng để tiên đoán tính hữu hiệu của chất đuổi muỗi. Chương trình máy tính này cho phép các nhà khoa học thu hẹp các hợp chất xuống còn 11 chất. Từ những thông tin có được từ 11 chất đó, họ tổng hợp thêm 23 chất, sau đó họ kiểm nghiệm 34 chất này với các đối tượng tình nguyện trong phòng thí nghiệm. Những người tình nguyện đã đeo các miếng băng vào cánh tay thấm đầy các liều lượng xác định mỗi hợp chất và cho tay vào lồng chứa muỗi. Mỗi lồng chứa khoảng 500 con muỗi cái 5–10 ngày tuổi, nhiệt độ trong lồng là 28 1C và độ ẩm tương đối là 35–60 %. Các nhà nghiên cứu đã đo đạc tính bền bỉ của các hợp chất – thời gian cho tới khi chất đuổi muỗi phai hết – và điều này được đánh dấu bằng việc bắt đầu bị muỗi chích. Cuộc nghiên cứu đưa ra kết quả “đầy kinh ngạc” đối với các nhà khoa học, nó cho thấy những chất này bảo vệ được nhiều hơn gấp 3 lần hóa chất DEET – chất đuổi muỗi hiệu quả nhất hiện nay. Những hợp chất này có hiệu quả lâu nhất trong vòng 73 ngày và nhiều chất có thời gian bảo vệ từ 40 đến 50 ngày so với DEET là 17.5 ngày. Các nhà nghiên cứu dự định tiếp tục kiểm nghiệm trên 7 trong số các hợp chất nhiều hứa hẹn nhất với mục đích xác định được thế hệ hóa chất DEET kế tiếp và sẽ tiếp tục quan sát xem việc chúng chống lại các loài côn trùng hiệu quả như thế nào. Chương 4 35 Hình 8 Thí nghiệm hoạt tính sinh học * Những phát hiện thú vị về muỗi và thuốc đuổi muỗi gần đây 13, 14  Gần đây nhà nghiên cứu Hector Douglas tại trường Đại học Alaska Fairbanks đã phát hiện được loài chim sẻ biển có lông vũ có khả năng tiết ra chất có thành phần tương tụ như DEET có khả năng đuổi muỗi.  Nghiên cứu của trợ lý giáo sư Mike Tyler từ Đại học Adelaide và nhà côn trùng học Craig Williams từ Đại học James Cook cho thấy: ếch sản xuất ra một loạt hoá chất ở trên da, một số loài lưỡng cư như một loài ếch xanh ở Australia cũng có thể bài tiết ra dịch đuổi muỗi...  Nhóm nghiên cứu của James Logan thuộc Trung tâm Nghiên cứu Rothamsted (Anh quốc) đã tìm được thuốc đuổi muỗi từ chính mồ hôi của một số tình nguyên viên và họ đã tìm được thuốc đuổi muỗi do chính cơ thể củanhững người này để tìm cách tổng hợp một loại hóa chất tương đương có thể đuổi muỗi và tương thích cao với sức khỏe con người – chất này gần như không mùi đối với con người, song hiện nay vẫn đang trong thời gian thử nghiêm hoặc chỉ có ở mức độ phòng thí nghiệm.  Trong một nghiên cứu vừa được công bố trên tạp chí Current Biology (Mỹ), một nhóm chuyên gia quốc tế đã lập được sơ đồ chi tiết của cơ quan cảm thụ mùi mà muỗi Anopheles sử dụng để tìm con người hút máu và truyền bệnh sốt rét. Qua đó, các nhà khoa học đã phát hiện khả năng tiếp nhận mùi nhạy bén của xúc tu, một bộ phận xuất phát từ đầu muỗi. Cùng với râu, xúc tu này giúp muỗi Anopheles có khả năng ngửi và nếm. Theo nhóm nghiên cứu, muỗi Anopheles sử dụng xúc tu để phát hiện Vải chưa xử lý hóa chất Vải đã xử lý hóa chất Chương 4 36 mục tiêu từ xa; còn trong những pham vi gần, nó dùng vòi để cảm nhận. Biết được cơ chế mà chúng sử dụng để phát hiện và tấn công con người, các chuyên gia có thể tạo ra các chất mới để xua đuổi hoặc dẫn dụ chúng vào bẫy để tiêu diệt, góp phần hạn chế bệnh sốt rét – một căn bệnh hiểm nghèo mang tính phổ biến nhất hiện nay. Nghiên cứu này lấp đầy một khoảng trống về hiểu biết khoa học với hệ thống khứu giác của muỗi.  Hiện nay, các nhà khoa học đang nghĩ cách diệt muỗi hữu hiệu hơn bằng cách lập bản đồ gen của muỗi truyền bệnh. Qua đó thay đổi cơ cấu di truyền của muỗi để muỗi cái không thể mang ký sinh trùng sốt rét. Đầu năm 2002, một nhóm nghiên cứu ở Đại học Cleveland (Ohio) đã cấy thành công một gen mới của loài muỗi Anophele Stephensi chống lại ký sinh trùng sốt rét, nghĩa là không còn là trung gian truyền bệnh, gen nay có tác dụng: thay đổi các thụ thể nhận mùi của muỗi để muỗi chích động vật thay vì chích người; sử dụng công nghệ triệt sản côn trùng (Sterile Insect Technique –.SIT) nghĩa là chiếu tia gamma vào muỗi đực, tạo ra giống muỗi đực triệt sản không còn khả năng thụ tinh để giảm mật độ sinh sôi ở muỗi.  C. PHƯƠNG PHÁP Chương 5 37 Chương 5 PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN ---------- 5.1 PHẦN MỀM 5.1.1 Hyperchem 8.03 Chương trình HyperChemTM 8.03 được dùng để xây dựng cấu trúc phân tử, tối ưu hoá hình học, tính các tham cấu trúc. Đây là chương trình được ứng dụng rộng rãi vì có độ chính xác có thể đáp ứng yêu cầu đặt ra trong lĩnh vực thiết kế phân tử với nhiều tính năng như: xây dựng cấu trúc, tối thiểu hóa năng lượng, tính toán tham số lượng tử, trình bày cấu trúc ba chiều. 5.1.2 Statgraphics Centurion XV Statgraphics Centurion XV là phần mềm phân tích dữ liệu thống kê chuyên dụng, được sử dụng để xây dựng mô hình MLR. Nó có hơn 160 chương trình thống kê, bao gồm từ phân tích thống kê cơ bản đến phức tạp. Người dùng không nhất thiết phải là một chuyên gia về thống kê bởi vì chương trình này đã có các công cụ như StatWizard và StatAdvisor giúp người dùng sử dụng một cách hiệu quả nhất. 5.1.3 NeuroSolution 5.07 NeuroSolutionTM 5.07 là phần mềm mô phỏng ANN. NeuroSolution for Excel là một sản phẩm đột phá của phần mềm NeuroSolutionTM 5.07. Nó được tích hợp trong Microsoft Excel giúp cho người dùng dễ dàng sử dụng với giao diện quen thuộc trong bảng tính của Microsoft Excel. Nó không chỉ dành cho người mới bắt đầu học về ANN mà còn là công cụ mô hình hóa mạnh mẽ để giải quyết bài toán hồi qui phi tuyến. 5.1.4 Microsoft Excel Microsoft Excel được dùng để nhập dữ liệu ban đầu, vẽ các đồ thị biểu diễn các mối quan hệ của hoạt tính và các tham số cấu trúc, truy xuất dữ liệuvào phần mềm NeuroSolution cho việc tính toán mạng, lưu trữ các kết quả sau khi mạng luyện. 5.2 CÁC BƯỚC THỰC HIỆN Chương 5 38 5.2.1 Tính toán hóa lượng tử  Xây dựng mô hình cấu trúc phân tử của các dẫn xuất N-acylpiperidine bằng phần mềm HyperChem 8.03  Tối ưu hoá hình dạng các mô hình vừa xây dựng bằng phương pháp gần đúng PM3 với các thông số sau:  Convergence limit: 10-4  Iteration limit: 300  RHF  RMS gradient: 10-4  Thuật toán Polak-Ribiere  Từ những cấu trúc đã tối ưu ở trên, tính toán những thông số đặc trưng cho cấu trúc đóng vai trò là các biến độc lập để xây dựng mô hình. 5.2.2 Phân tích hồi qui tuyến tính đa biến  Chia bộ dữ liệu thành hai tập: một tập để xây dựng mô hình (27 chất), một tập để kiểm tra khả năng dự đoán của mô hình (7 chất).  Xác định số biến độc lập thích hợp: tất cả các biến độc lập (20 biến – xem chương 6) không phải được đưa hết vào mô hình. Mặc dù việc thêm biến độc lập vào làm tăng hệ số tương quan R2, nhưng nó chỉ tốt khi chúng có liên hệ mạnh với biến phụ thuộc. Mô hình được chọn ứng với mô hình có Q2 cao nhất, kế đó là số biến độc lập nhỏ nhất và cuối cùng là R2. Thực hiện tính toán Regression Model Selection để chọn mô hình có các biến tối ưu.  Lập mô hình thích hợp với số biến đã chọn: sau khi lựa chọn được số biến thích hợp thì tiến hành phân tích MLR. Khi đó thu có được hằng số và hệ số cho từng biến của mô hình.  Tính Q2 bằng cách thực hiện tham chiếu chéo trên tập dữ liệu xây dựng mô hình với thành phần bỏ ra là 3 (xem chương 3).  Nhận xét về mô hình đạt được.Tính toán hoạt tính cho các tập dữ liệu theo mô hình thu được. Chương 5 39 5.2.3 Tính toán mạng nơ ron  Chia bộ dữ liệu thành hai tập: một tập dùng để luyện mạng có kiểm tra chéo (traing set - 27 chất), một tập kiểm tra khả năng dự đoán của mạng (test set - 7 chất).  Sự lựa chọn biến độc lập được thực hiện từ những thông tin độ nhạy sau khi mạng luyện với toàn bộ biến ứng với số nút ẩn bằng 1. Phần mềm NeuroSolution 5.07 có chức năng phân tích độ nhạy (Sensetivity about the mean) là đo mức độ quan trọng tương đối giữa các input của mạng. Nó phân tích sự biến thiên của hoạt tính theo sự biến thiên của của một input trong vùng xung quanh giá trị trung bình trong khi vẫn giữ nguyên các input khác. Các biến chọn theo giá trị độ nhạy từ cao xuống thấp mà với bộ biến này có thể luyện được mạng cho kết quả kiểm tra trên bộ test tương đương hoặc tốt hơn với kết quả kiểm tra của mạng ban đầu.  Xây dựng cấu trúc mạng nơron được thực hiện bằng NeuralBuilder tiến hành theo các bước sau:  Nhập dữ liệu (Tag): bằng cách dán nhãn cho các cột trong chức năng Tag (input – dữ liệu nhập, disire – giá trị đích), hàng (training – luyện, cross validation – tham chiếu chéo, test – kiểm tra).  Thiết kế mạng (Create Network) gồm các bước:  Chọn loại mạng (choosing a neural network): NeuralBuilder có 11 tùy chọn cho loại mạng, mỗi loại có những ưu điểm riêng phụ thuộc vào mục đích sử dụng và tính chất của bài toán. Trong luận văn này, chọn Multiplayer Perceptron cho việc giải bài toán.  Hình 9 Các loại mạng trong NeuroBuilder Chương 5 40  Thiết lập số lớp ẩn, số nơron ở lớp nhập, số nơron ở lớp ẩn và ở lớp xuất: xây dựng mạng nơron gồm ba lớp là một lớp nhập có số nơron là các biến độc lập, một lớp ẩn có số nơron thay đổi, một lớp xuất có hai nơron đại diện cho hoạt tính ở hai nồng độ khác nhau. Ở bước này chỉ cần thiết lập số nơron cho lớp ẩn, NeuralBuilder sẽ tự động thiết lập số nơron nhập và nơron xuất khi ta thực hiện bước Tag.  Chọn hàm truyền: chọn hàm truyền ở lớp ẩn là hàm Sigmoid (kí hiệu là SigmoidAxon), hàm kích động ở lớp xuất là hàm tuyến tính (kí hiệu là LinearAxon), dùng phương pháp lan truyền ngược để cập nhật bộ trọng số. Trong phần mềm NeuroSolution 5.07, NeuroBuilder sẽ tự động chuẩn hóa dữ liệu nhập vào vùng giới hạn của hàm truyền. Thí dụ: nếu dùng hàm truyền của lớp ẩn là hàm Sigmoid thì dữ liệu sẽ được chuẩn hóa trong khoảng 0 và 1. Hình 10 Các loại hàm truyền trong NeuroBuilder  Ở đây dùng điều kiện dừng luyện là giá trị ngưỡng tối thiểu của trung bình bình phương sai số MSE (Mean Square Error) trên bộ luyện. Để xác được giá trị này cần phải thử luyện mạng nhiều lần với các giá trị MSE thay đổi dần để mạng có thể luyện tốt mà vẫn còn khả năng đoán tốt. Đây là bước quan trọng và mất nhiều thời gian. Sau khi xây dựng cấu trúc mạng xong, phải lưu lại cấu trúc mới có thể tiếp tục luyện mạng được. Chương 5 41 Hình 11 Bảng NeuralBuilder Supervised Learning  Luyện mạng: khi cấu trúc mạng đã được xây dựng thì bắt đầu luyện mạng lần lượt với các nút ẩn thay đổi từ 1 đến 10. Số nơron trên lớp ẩn là một thông số quan trọng trong mạng nơron. Nếu mạng có ít nơron trên lớp ẩn thì mạng không lấy được đầy đủ nhưng thông tin trong bộ dữ liệu, ngược lại nếu có quá nhiều nơron sẽ xảy ra hiện tượng quá luyện.  Kiểm tra mạng: sau mỗi lần luyện mạng thành công thì kiểm tra mạng trên bộ training và bộ test. Trong quá trình thực hiện, để lấy được giá trị R2 và Q2 ta luyện mạng bằng hai cách luyện khác nhau:  Tính R2: luyện mạng với chức năng Training, sau đó kiểm tra mạng trên bộ training và bộ test ta sẽ có giá trị R2 và R2test.  Tính Q2: luyện mạng với chức năng Leave-N-out, khi đó NeuroSolution for Excel sẽ đưa ra giá trị Q2. D. KẾT QUẢ VÀ BÀN LUẬN Chương 6 42 Chương 6 KHẢO SÁT MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE ---------- 6.1 DỮ LIỆU Dữ liệu được sử dụng trong luận văn này gồm 34 chất dẫn xuất của N-acylpiperidine đã được tổng hợp và thí nghiệm sinh học bởi nhóm nghiên cứu của trường Đại học Florida (Mỹ) và Bộ Nông nghiệp Hoa Kì (United States Depertment of Agriculture). Công thức tổng quát của các dẫn xuất N-acylpiperidine và qui ước đánh số trên các nguyên tử như sau: NR O R' 1 2 3 4 5 6 7 8 9 Bảng 1 Cấu trúc và hoạt tính của dẫn xuất N-acylpiperidine[17] Hợp chất Kí hiệu R R′ PT, d ( 25 µmol/cm2) PT, d ( 2.5 µmol/cm2) 4a Me 2-Me 2 2 4b Et H 5 4 4c Et 2-Et 5 3 4d n-C6H13 2-Me 17 5 4e n-C6H13 3-Me 15.5 7.5 4f n-C7H15 4-Me 48 8 4g n-C7H15 4-Bn 13 7 4h n-C8H17 2-Et 43 9.5 4i n-C9H19 2-Me 49.5 8 4j n-C9H19 4-Me 41 11.5 4k CH2=CH(CH2)8 H 50 13.5 Chương 6 43 Hợp chất Kí hiệu R R′ PT, d ( 25 µmol/cm2) PT, d ( 2.5 µmol/cm2) 4l CH2=CH(CH2)8 2-Et 53 9 4m CH2=CH(CH2)8 4-Bn 8.5 8 4n CH2=CH(CH2)8 4-Me 73 10.5 4o n-C10H21 H 39.5 13 4p n-C11H23 2-Me 14.5 5 4q n-C11H23 3-Me 19.5 5.5 4a′ 1-c-C6H9 H 17 5 4b′ c-C6H11 H 14 8 4c′ c-C6H11 3-Me 17 6 4d′ c-C6H11 4-Me 24.5 8.5 4e′ c-C5H9(CH2)2 H 35 9 4f′ 1-Me-c-C6H10 3-Me 12 7 4g′ 4-Me-c-C6H10 2-Me 33 8.5 4h′ c-C6H11 2-Et 21.5 7 4i′ c-C6H11CH2 2-Me 29.5 7.5 4j′ c-C6H11(CH2)2 2-Me 47.5 10 4k′ c-C6H11(CH2)2 3-Me 35 9 4l′ c-C6H11(CH2)2 4-Me 45.5 8 4m′ c-C6H11(CH2)3 4-Me 33 3 4n′ c-C5H9(CH2)2 2-Et 40.5 8.5 4o′ c-C6H11(CH2)2 2-Et 42 10.5 4p′ c-C6H11CH2 4-Bn 3 1.5 4q′ c-C6H11(CH2)2 4-Bn 12 1 Bn: benzyl Et: etyl Me: metyl Từ những cấu trúc đã tối ưu, tính toán những dữ liệu đặc trưng về cấu trúc, gồm 20 tham số, đóng vai trò là các biến độc lập để xây dựng mô hình, kí hiệu các đại lượng đặc trưng cho cấu trúc đã sử dụng như sau: Ký hiệu Ý nghĩa  N1, Ci , O9 : Điện tích trên N, O và các C với i = 2, 3, 5, 4, 6, 7, 8 (e).  HOF : Nhiệt tạo thành (Kcal/mol). Chương 6 44  Etotal : Năng lượng tổng cộng (Kcal/mol).  DM : Moment lưỡng cực (D).  S : Diện tích bề mặt (Å2).  V : Thể tích phân tử (Å3).  Ref : Chỉ số khúc xạ(Å3).  Polar : Khả năng phân cực (Å3).  Mw : Khối lượng phân tử (a.u).  EHOMO : Năng lượng vân đạo phân tử đầy cao nhất (eV).  ELUMO : Năng lượng vân đạo phân tử trống thấp nhất (eV).  LogP : Hàm log của hệ số phân bố octanol – nước. Hoạt tính sử dụng trong luận văn này được biểu diễn qua giá trị PT (Protection Time) ở nồng độ 25 µmol/cm2 và ở nồng độ 2.5 µmol/cm2 là số ngày hóa chất có tác dụng bảo vệ con người không bị muỗi đốt. 6.2 KẾT QUẢ VÀ BÀN LUẬN 6.2.1 Phương pháp hồi qui đa biến tuyến tính Bộ biến sử dụng gồm 20 tham số cấu trúc là biến độc lập và hoạt tính ở hai nồng độ là biến phụ thuộc (Phụ lục 2). Chia ngẫu nhiên bộ dữ liệu thành 2 tập riêng biệt, tập để xây dựng mô hình gồm 27 chất, tập để kiểm tra tính dự đoán của mô hình gồm 7 chất (lấy ngẫu nhiên các chất có kí hiệu 4a, 4c, 4n, 4p, 4d′, 4i′, 4j′ cho hoạt tính PT 25 và các chất 4a, 4c, 4l, 4p, 4d′, 4m′, 4p′ cho hoạt tính PT 2.5 ). Thử tính hồi qui tuyến tính với tất cả 20 biến độc lập, kết quả như sau: Bảng 2 Kết quả phân tích hồi qui đa biến tuyến tính với 20 biến độc lập Hoạt tính R2 R2a MSE F Q2 PT 25 0.8341 0.36 213.93 1.76 0 PT 2.5 0.8359 0.3286 6.89 1.66 0 Nhận thấy, khi có nhiều biến thì sự tái lập dữ liệu tốt (R2 > 0.81) nhưng mô hình không có ý nghĩa về mặt thống kê (Phụ lục 3), và không có khả năng dự đoán (Q2 = 0). Vì vậy, cần phải lựa chọn biến độc lập thích hợp trong phân tích MLR. Tìm hiểu mối quan hệ giữa các biến bằng ma trận hệ số tương quan Pearson của Chương 6 45 các biến được cho (Phụ lục 4). Nhận thấy giữa biến phụ thuộc và các biến độc lập không có tương quan mạnh với nhau (|R| < 0.5) nhưng giữa các biến độc lập lại có sự tương quan chặt chẽ với nhau (|R| > 0.9) như giữa biến S với các biến V, Mw, Ref, Polar, Etotal; giữa DM với N1. Do đó chỉ giữ lại một biến độc lập có tương quan lớn nhất với biến phụ trong số các biến tương quan chặt chẽ đó. Sau khi loại ra thì số biến độc lập còn lại là 14. 6.2.1.1 Tính toán với hoạt tính PT 25 Từ 14 biến trên, thực hiện phương pháp hồi qui chọn mô hình (Regression Model Selection). Như vậy đã thực hiện hồi qui tổng cộng 16.278 mô hình chứa từ ít nhất 3 biến đến tối đa 14 biến và chọn ra được một số mô hình có R2a tốt nhất. Bảng 3 Một số mô hình tốt nhất trong 16.278 mô hình khảo sát của PT 25 Mô hình MSE R2 R2a Bao gồm các biến 1.1 65.61 0.8566 0.7336 ABCDEFHIKLMN 1.2 62.89 0.8527 0.7446 ABCDEFHKLMN 1.3 60.44 0.8490 0.7546 ABCEFHKLMN 1.4 57.75 0.8467 0.7655 BCEFHKLMN 1.5 55.17 0.8449 0.7760 BCEHKLMN 1.6 52.69 0.8437 0.7861 CEHKLMN 1.7 52.92 0.8347 0.7851 CEHKMN 1.8 53.66 0.8240 0.7821 EHKMN 1.9 60.80 0.7911 0.7531 HKMN 1.10 85.316 0.6935 0.6536 CMN Kí hiệu các biến như sau: A : N1 D : C4 G : C7 J : S M : ELUMO B : C2 E : C5 H : C8 K : HOF N : LogP C : C3 F : C6 I : O9 L : EHOMO Từ kết quả ở Bảng 3, nhận thấy rằng trong các mô hình được chọn thì mô hình 1.6, 1.7, 1.8 có R2a cao hơn các mô hình khác, MSE thấp và các biến cũng có xuất hiện trong các mô hình khác. Do đó thực hiện phân tích MLR cho 3 mô hình này. Chương 6 46 Bảng 4 Kết quả phân tích hồi qui cho mô hình 1.6, 1.7, 1.8 Mô hình Số biến R2 F MSE Q2 1.6 7 0.8437 14.65 52.69 0.2431 1.7 6 0.8347 16.83 52.92 0.2559 1.8 5 0.8240 19.67 53.66 0.3173 Kết quả ở Bảng 4 cho thấy rằng trong cả ba mô hình đều có R2 > 0.81 (tương ứng với R > 0.9) có khả năng tái lập dữ liệu tương đối tốt, nhưng không có khả năng khái quát hóa (Q2 < 0.5). Nếu phải chọn mô hình theo phương pháp phân tích hồi qui tuyến tính thì sẽ chọn mô hình 1.8 gồm các biến C5, C8, HOF, ELUMO, LogP. Phương trình MLR cho mô hình 1.8 như sau: PT 25 = –119.94 – 325.86 C5 – 310.95 C8 – 0.13 HOF + 32.26 ELUMO + 9.36 LogP Mô hình cho thấy giá trị C5 có tác động lớn nhất đến hoạt tính. Bảng 5 Giá trị dự đoán của tập dữ liệu kiểm tra với PT 25 Hợp chất PT 25 TN PT 25 TT Sai số 4a 2 8.17 -308.5 4c 5 3.26 34.8 4n 73 43.44 40.5 4p 14.5 57.31 -295.2 4d' 24.5 26.80 -9.4 4i' 29.5 32.64 -10.6 4j' 47.5 42.93 9.6 Sai số = (PT TN – PT TT)/PT TN*100 R2 = 0.32 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 80 PT 25 TN PT 2 5 TT Hình 12 Đồ thị giá trị dự đoán cho tập dữ liệu kiểm tra với PT 25 Chương 6 47 Hệ số xác định R2test cho bộ hợp chất mới là rất kém (R2test < 0.5), không thể dùng mô hình này để dự đoán hoạt tính cho chất mới được. Do đó, không thể dùng mô hình này mô tả mối quan hệ định lượng giữa hoạt tính với cấu trúc của các dẫn xuất N- acylpiperidine. 6.2.1.2 Tính toán với hoạt tính PT 2.5 Cũng áp dụng phương pháp lựa chọn mô hình hồi qui cho PT 2.5 với 14 biến trên, thực hiện hồi qui tổng cộng 16.278 mô hình chứa từ ít nhất 3 biến đến tối đa 14 biến và chọn ra được một số mô hình có R2a tốt nhất. Bảng 6 Một số mô hình tốt nhất trong 16.278 mô hình khảo sát với PT 2.5 PT 2.5 MSE R2 R2a Gồm các biến 2.1 4.88 0.71 0.4615 ABCDEFIJKLMN 2.2 4.79 0.6943 0.4702 ABCDEFJKLMN 2.3 2.32 0.7997 0.6746 ABCDEFIJKM 2.4 2.33 0.7865 0.6734 ABCDEFJKM 2.5 2.56 0.7511 0.6405 ABCDEFJK 2.6 2.66 0.7277 0.6274 BCDFJKM 2.7 2.88 0.6899 0.5968 BDFJKL 2.8 3.01 0.6595 0.5785 FJKLM 2.9 3.15 0.6263 0.5583 JKLM 2.10 3.15 0.6093 0.5583 KLN Kết quả trong Bảng 6 cho thấy các mô hình có khả năng tái lập dữ liệu chưa tốt (R2 < 0.81). Thử phân tích hồi qui và tính Q2 cho ba mô hình có R2 và R2a cao nhất. Bảng 7 Kết quả phân tích hồi qui cho mô hình 2.3, 2.4, 2.5 Mô hình Số biến R2 R2a F MSE Q2 2.3 10 0.7997 0.6746 6.39 2.32 0.2433 2.4 9 0.7865 0.6734 6.96 2.33 0.3975 2.5 8 0.7511 0.6405 6.79 2.56 0.1055 Trong 3 mô hình thì mô hình 2.4 có giá trị Q2 cao nhất. Phương trình MLR cho mô hình 2.4: Chương 6 48 PT 2.5 = – 65.35 – 70.68N1 – 147C2 – 121.2C3 – 79.77C4 – 71.56C5 – 121.1C6 + 0.0289S – 0.028HOF + 3.2876ELUMO Mô hình cho thấy giá trị C2 có tác động lớn nhất đến hoạt tính. Bảng 8 Giá trị dự đoán cho tập dữ liệu kiểm tra với PT 2.5 Kí hiệu hợp chất PT 2.5 TN PT 25 TT Sai số 4a 2 1.19 40.5 4c 3 -1.11 137 4l 9 12.37 -37.44 4p 5 12.21 -144.2 4d' 8.5 7.20 15.294 4m' 3 9.86 -228.7 4p' 1.5 3.61 -140.7 R2 = 0.37 -2 0 2 4 6 8 10 12 14 0 2 4 6 8 10 PT 2.5 TN PT 2 .5 T T Hình 13 Đồ thị giá trị dự đoán bộ dữ liệu kiểm tra với PT 2.5 Kết quả tính toán cho hoạt tính PT 2.5 tương tự như PT 25 cho thấy các mô hình này vừa không có khả năng khái quát hóa (Q2 < 0.5) lẫn dự đoán ngoại (R2test < 0.5). Do đó không thể dùng phương pháp MLR để xây dựng mô hình QSAR cho các dẫn xuất N-acylpiperidine được. Điều này được biết khi phân tích tương quan giữa các biến. Kết quả chứng tỏ đây là mối quan hệ phi tuyến. Vì thế cần tìm mô hình bằng các phương pháp khác nhằm cải thiện R2test và Q2. 6.2.2 Phương pháp mạng nơron nhân tạo Dữ liệu được chia ngẫu nhiên thành hai tập riêng biệt: 27 chất dùng để luyện mạng (training set – tính R2, Q2); 7 chất dùng để kiểm tra khả năng dự đoán của Chương 6 49 mạng có kí hiệu 4n, 4m, 4g, 4g', 4j', 4j, 4i' (test set – tính R2test). Xây dựng cấu trúc mạng gồm 3 lớp với 2 nút xuất được mô tả trong mục 5.2.3. Sau đó, mạng được luyện bằng cách thay đổi số nơron trên lớp ẩn từ 1 – 10 kết hợp với kiểm tra chéo. Căn cứ vào hệ số tương quan R2, Q2, R2test để đánh giá mạng. Luyện mạng với toàn bộ biến độc lập. Chuẩn ngừng luyện tốt nhất là MSE của bộ training bằng 0.01. Bảng 9 Hệ số R2, Q2 và R2test ứng với số nơron trên lớp ẩn với mạng 20 input PT 25 PT 2.5 Số nút ẩn R2 Q2 R2test R2 Q2 R2test 1 0.77 0.4 0.58 0.68 0.29 0.4 2 0.93 0.62 0.35 0.93 0.47 0.04 3 0.94 0.7 0.49 0.98 0.66 0.21 4 0.95 0.73 0.41 0.96 0.63 0.19 5 0.94 0.7 0.5 0.98 0.66 0.29 6 0.95 0.73 0.5 0.97 0.62 0.27 7 0.96 0.69 0.37 0.98 0.64 0.12 8 0.98 0.72 0.38 0.98 0.59 0.16 9 0.98 0.68 0.54 0.98 0.59 0.22 10 0.99 0.69 0.43 0.98 0.58 0.16 Kết quả trong Bảng 9 cho thấy mạng có khả năng tái lập dữ liệu tốt (R2 > 0.81) nhưng không có khả năng khái quát hóa (Q2 < 0.81) và không cho kết quả đoán tốt với bộ dữ liệu không được học (R2test < 0.6). PT 25 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 Số nút ẩn R2 Q2 R2test Chương 6 50 PT 2.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 Số nút ẩn R2 Q2 R2test Hình 14 Đồ thị R2, Q2 và R2test ứng với số nơron trên lớp ẩn ở 2 nồng độ Kết quả này cũng không tốt hơn phương pháp MLR trên. Mạng không tìm được mô hình tối ưu với bộ biến này. Qua việc khảo sát sự thay đổi số nút ẩn trên thì khó có thể sử dụng nút ẩn để tối ưu hóa mạng, vì vậy cần lựa chọn lại các biến nhập cho mạng. Số biến độc lập lựa chọn đưa vào mạng được chọn từ giá trị độ nhạy sau khi mạng luyện với toàn bộ biến và với số nút ở lớp ẩn là 1 như đã trình bày trong Chương 5. Các biến được chọn gồm: ELUMO, HOF, DM, S, C2, C3, C5, C6, C8. Luyện mạng với số nơron trên lớp ẩn thay đổi từ 1 đến 10 có kết hợp với kiểm tra chéo. Chuẩn ngừng luyện tốt nhất là MSE của bộ training bằng 0.003. Bảng 10 Hệ số R2, Q2 và R2test ứng với số nơron trên lớp ẩn với mạng 9 input PT 25 PT 2.5 Số nút ẩn R2 Q2 R2test R2 Q2 R2test 1 0.72 0.74 0.68 0.54 0.54 0.69 2 0.92 0.8 0.73 0.75 0.52 0.76 3 0.95 0.9 0.69 0.9 0.56 0.72 4 0.98 0.91 0.83 0.97 0.88 0.58 5 0.98 0.87 0.65 0.97 0.83 0.9 6 0.97 0.92 0.42 0.99 0.87 0.74 7 0.97 0.93 0.69 0.98 0.89 0.72 8 0.98 0.93 0.85 0.98 0.92 0.85 9 0.98 0.91 0.69 0.98 0.88 0.81 10 0.98 0.92 0.8 0.99 0.88 0.78 Chương 6 51 PT 25 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 Số nút ẩn R2 Q2 R2(test) PT 2.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 Số nút ẩn R2 Q2 R2(test) Hình 15 R2, Q2 và R2test ứng với số nơron trên lớp ẩn ở 2 nồng độ Kết quả trong Bảng 10 và đồ thị cho thấy mạng nơron này nhanh chóng đưa ra mô hình cho sự tái lặp dữ liệu tốt (R2 > 0.81), đồng thời còn có khả năng khái quát hóa và dự đoán tốt (Q2 > 0.81, R2test > 0.81) với tập dữ liệu kiểm tra. Mô hình tốt nhất được chọn cho cả hai hoạt tính đều có cấu trúc là (9 – 8 – 2). Kết quả tính toán và dự đoán hoạt tính của mô hình trên như sau: Chương 6 52 Bảng 11 Kết quả tính và dự đoán hoạt tính theo mô hình (9 – 8 – 2) Kí hiệu PT 25 TN PT 25 TT SS 1 PT25 DD SS 2 PT2.5 TN PT2.5 TT SS 1 PT2.5 DD SS 2 4a 2.0 1.8 10.0 4.2 -110.0 2.0 2.3 -15.0 2.2 -10.0 4b 5.0 4.6 8.0 10.0 -100.0 4.0 3.8 5.0 4.2 -5.0 4c 5.0 4.9 2.0 -1.4 128.0 3.0 3.1 -3.3 3.4 -13.3 4d 17.0 17.8 -4.7 19.9 -17.1 5.0 5.1 -2.0 6.0 -20.0 4e 15.5 16.1 -3.9 18.3 -18.1 7.5 7.3 2.7 6.4 14.7 4f 48.0 49.5 -3.1 47.8 0.4 8.0 9.5 -18.8 11.5 -43.8 4h' 43.0 50.7 -17.9 47.8 -11.2 9.5 9.2 3.2 10.3 -8.4 4i 49.5 42.2 14.7 32.7 33.9 8.0 6.9 13.8 8.0 0.0 4k 50.0 48.9 2.2 47.7 4.6 13.5 12.9 4.4 11.0 18.5 4l 53.0 50.8 4.2 49.5 6.6 9.0 9.5 -5.6 9.4 -4.4 4o 39.5 38.7 2.0 42.7 -8.1 13.0 12.8 1.5 11.3 13.1 4p' 14.5 18.5 -27.6 25.3 -74.5 5.0 5.5 -10.0 5.1 -2.0 4q 19.5 19.8 -1.5 20.0 -2.6 5.5 5.6 -1.8 6.0 -9.1 4a' 17.0 17.8 -4.7 16.0 5.9 5.0 4.9 2.0 4.1 18.0 4b' 14.0 17.8 -27.1 18.7 -33.6 8.0 8.2 -2.5 7.8 2.5 4c' 17.0 16.9 0.6 18.2 -7.1 6.0 6.1 -1.7 5.5 8.3 4d' 24.5 21.9 10.6 23.2 5.3 8.5 8.6 -1.2 8.4 1.2 4e' 35.0 33.9 3.1 34.3 2.0 9.0 8.4 6.7 9.1 -1.1 4f' 12.0 11.5 4.2 13.1 -9.2 7.0 6.9 1.4 7.1 -1.4 4h' 21.5 21.7 -0.9 17.0 20.9 7.0 7.0 0.0 6.6 5.7 4k' 35.0 34.1 2.6 36.2 -3.4 9.0 9.1 -1.1 9.5 -5.6 4l' 45.5 46.6 -2.4 38.2 16.0 8.0 7.9 1.3 8.5 -6.3 4m' 33.0 32.2 2.4 33.5 -1.5 3.0 3.1 -3.3 4.2 -40.0 4n' 40.5 40.4 0.2 32.4 20.0 8.5 8.3 2.4 7.6 10.6 4o' 42.0 39.6 5.7 50.9 -21.2 10.5 10.6 -1.0 8.8 16.2 4p' 3.0 2.7 10.0 8.7 -190.0 1.5 1.2 20.0 0.7 53.3 4q' 12.0 12.0 0.0 8.8 26.7 1.0 1.2 -20.0 2.2 -120.0 TN: hoạt tính thực nghiệm TT: hoạt tính tính toán DD:hoạt tính dự đoán SS 1: Sai số 1 = (PT TN – PT TT)/PT TN*100 SS 2: Sai số 2 = (PT TN – PT DD)PT TN*100 Chương 6 53 PT 25 -10 0 10 20 30 40 50 60 1 3 5 7 9 11 13 15 17 19 21 23 25 27 Số mẫu luyện PT25 TN PT25 TT PT25 DD PT 2.5 0 2 4 6 8 10 12 14 16 1 3 5 7 9 11 13 15 17 19 21 23 25 27 Số mẫu luyện PT2.5 TN PT2.5 TT PT2.5 DD Hình 16 Đồ thị giá trị tính toán và dự đoán theo hoạt tính thực nghiệm ở 2 nồng độ với cấu trúc mạng (9 – 8 – 2) Bảng 12 Kết quả dự đoán hoạt tính cho tập dữ liệu mới Kí hiệu PT 25 TN PT 25 TT Sai số PT 2.5 TN PT 2.5 TT Sai số 4n 73 60.77 16.75 10.5 13.56 -29.14 4g' 33 28.86 12.55 8.5 8.51 -0.12 4g 13 12.20 6.15 7 4.07 41.86 4j' 47.5 41.33 12.99 10 11.05 -10.50 4j 41 44.18 -7.76 11.5 12.13 -5.48 4i' 29.5 25.24 14.44 7.5 6.03 19.60 4m 8.5 9.49 -11.65 8 7.05 11.88 Sai số = (PT TN – PT TT)/PT TN*100 Chương 6 54 PT 2.5 0 2 4 6 8 10 12 14 16 1 2 3 4 5 6 7 Số mẫu kiểm tra PT 25 TN PT 2.5 TT PT 25 0 10 20 30 40 50 60 70 80 1 2 3 4 5 6 7 Số mẫu kiểm tra PT 25 TN PT 25 TT Hình 17 Đồ thị giá trị dự đoán và thực nghiệm tập dữ liệu kiểm tra ở 2 nồng độ Với số nút nhập và chuẩn dừng phù hợp (9 nút và MSE là 0.003), mạng đã nhanh chóng tìm được số nút ẩn thích hợp để xây dựng mô hình QSAR tốt nhất. Ta có thể dùng mô hình này để mô tả mối quan hệ định lượng giữa các tham số cấu trúc và hoạt tính của các dẫn xuất N-acylpiperidine. Bảng 13 Kết quả các mô hình tốt nhất của phương pháp MLR và ANN PT 25 PT 2.5 Phương pháp Số biến độc lập R2 Q2 R2test Số biến độc lập R2 Q2 R2test MLR 5 0.82 0.32 0.32 9 0.79 0.4 0.37 ANN 9 0.98 0.93 0.85 9 0.98 0.92 0.85 Kết quả cho thấy các mô hình QSAR cho các dẫn xuất N-acylpiperidine thu được bằng phương pháp ANN có các giá trị R2, Q2 và R2test lớn hơn nhiều so với Chương 6 55 phương pháp MLR với các dẫn xuất N-acylpiperidine. Điều này cho thấy phương pháp ANN giải quyết bài toán QSAR tốt hơn phương pháp MLR. 6.3 ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU TRÚC LÊN HOẠT TÍNH Việc khảo sát QSAR bằng phương pháp ANN cho các dẫn xuất N- acylpiperidine đã tìm được cấu trúc mạng mô tả tốt mối quan hệ này. Mức độ ảnh hưởng của các tham số cấu trúc được đánh giá thông qua giá trị trọng số hoặc sự phân tích độ nhạy của hoạt tính theo tham số cấu trúc. Trọng số: luyện mạng với cấu trúc (20 – 1 – 2), khi đó có được 20 trọng số cho 20 đường truyền từ input đến lớp ẩn. Hàm truyền sử dụng trong lớp ẩn là hàm sigmoid được tính theo biểu thức: x x e exf   1 )( Do đó, độ lớn giá trị trọng số cho biết mức độ tác động của mỗi input đến output. File chứa các giá trị trọng số được NeuroSolution 5.07 lưu dưới dạng mở rộng *.*.nsb (Phụ lục 6). Độ nhạy: phân tích độ nhạy là đo mức độ quan trọng tương đối giữa các input của mạng, nó xem xét sự biến thiên của hoạt tính theo sự biến thiên của của một input trong vùng xung quanh giá trị trung bình trong khi vẫn giữ nguyên các input khác. Phân tích độ nhạy (Sensetivity about the mean) được thực hiện trong phần test sau khi mạng luyện với cấu trúc mạng (20 – 1 – 2), kết quả đưa ra gồm bảng các giá trị độ nhạy, biểu đồ cột cho bảng giá trị này và 20 đồ thị thể hiện sự biến thiên của hoạt tính theo từng tham số cấu trúc (Phụ lục 6). Giá trị của độ nhạy thể hiện mức độ ảnh hưởng của các biến cấu trúc đến hoạt tính. Chương 6 56 Bảng 14 Giá trị trọng số và độ nhạy của các biến độc lập Độ nhạy Tên biến Trọng số Tên biến Trị tuyệt đối của trọng số Tên biến PT 25 PT 2.5 HOF 6.01 ELUMO 6.2 ELUMO 5.92 0.97 C8 4.82 HOF 6.01 HOF 4.12 0.68 C5 3.72 C8 4.82 C5 3.89 0.67 C6 3.34 C5 3.72 C8 3.48 0.57 DM 2.83 C6 3.34 C6 2.79 0.46 C2 2.79 DM 2.83 DM 2.63 0.43 N1 1.92 C2 2.79 C2 2.53 0.41 C4 1.4 C3 2.75 S 2.44 0.4 Etotal 0.9 S 2.51 C3 2.34 0.38 O9 -0.07 V 1.87 N1 1.81 0.3 LogP -0.75 N1 1.4 V 1.79 0.28 Ref -0.82 C4 1.13 C4 1.64 0.27 C7 -0.86 Polar 0.96 Polar 1.1 0.18 EHOMO -0.86 Mw 0.9 Mw 0.9 0.15 Mw -0.96 Etotal 0.86 Etotal 0.86 0.14 Polar -1.13 EHOMO 0.86 Ref 0.79 0.13 V -2.07 C7 0.82 LogP 0.77 0.13 S -2.31 Ref 0.75 EHOMO 0.72 0.12 C3 -2.75 LogP 0.46 C7 0.62 0.1 ELUMO -6.2 O9 0.07 O9 0.05 0.01 Chương 6 57 0 1 2 3 4 5 6 7 T rị tu yệ t đ ối c ủa tr ọn g số EL u m o HO F C8 C5 C6 DM C 2 C3 S V N1 C4 Po la r M w Et ot al EH om o C7 Re f Lo gP O 9 Tên biến 0 1 2 3 4 5 6 Đ ộ n h ạy EL um o HO F C5 C8 C6 DM C 2 S C3 N1 V C4 Po lar M w Et ot al Re f Lo gP EH om o C7 O9 Tên biến PT 25 PT 2.5 Hình 18 Biểu đồ giá trị trị tuyệt đối trọng số và biểu đồ độ nhạy của hai hoạt tính Trong Bảng 14, độ lớn giá trị trọng số và độ lớn giá trị độ nhạy được sắp xếp theo thứ tự giảm dần. Cột thứ 4 biểu diễn các giá trị trọng số sau khi lấy giá trị tuyệt đối của chúng ở cột thứ 2. Từ Bảng 14 và hai biểu đồ cho thấy 15 giá trị đứng đầu của hai quá trình tính toán này tương ứng với nhau, chỉ có sự đổi thứ tự của C5 và C8, C3 và S, N1 và V, nhưng các giá trị này khác nhau không đáng kể; thứ tự độ nhạy của các tham số cấu trúc theo hoạt tính của PT 25 và PT 2.5 cũng tương ứng với nhau. Với bộ tham số gồm 9 biến đầu tiên, đã xây dựng được mô hình ANN vừa có khả năng tái lập dữ liệu tốt vừa có khả năng khái quát hóa và dự đoán tốt cho hoạt tính ở hai nồng độ như trên. Vậy các tham số ảnh hưởng đáng kể đến hoạt tính gồm các biến theo thứ tự là ELUMO, HOF, C5, C8, C6, DM, C2, C3. Chương 6 58 Chuẩn hóa các giá trị của tham số và hoạt tính về cùng một vùng [0.1; 0.9] để xem xét sự biến đổi của các tham số này và hoạt tính. 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 C2 PT 25 PT 2.5 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 C3 PT 25 PT 2.5 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 C5 PT 25 PT 2.5 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 C6 PT 25 PT 2.5 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 C8 PT 25 PT 2.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 S PT 25 PT 2.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 HOF PT 25 PT 2.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 DM PT 25 PT 2.5 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 ELUMO PT 25 PT 2.5 Hình 19 Đồ thị biểu diễn giá trị của 9 tham số cấu trúc và hoạt tính Chương 6 59 Qua các đồ thị nhận thấy sự biến thiên của các 9 tham số cấu trúc này và hoạt tính không tuân theo một qui luật nào cả. Điều này càng chứng tỏ đây là mối quan hệ rất phức tạp không thể mô tả bằng phương trình hồi qui đa biến tuyến tính một cách rõ ràng. Mối quan hệ phi tuyến này cũng được khẳng định qua bảng ma trận hệ số tương quan tuyến tính Pearson tính cho bộ dữ liệu thỏa điều kiện phân phối chuẩn (Phụ lục 4) hay tương quan Spearman đối với dữ liệu không thỏa điều kiện phân phối chuẩn (Phụ lục 5), trị tuyệt đối các hệ số tương quan này đều thấp hơn 0.61.  E. KẾT LUẬN Kết luận 60 KẾT LUẬN ----------  KẾT QUẢ VỀ PHƯƠNG PHÁP NGHIÊN CỨU QSAR Việc nghiên cứu QSAR của N-acylpiperidine trong đề tài này đã được thực hiện qua sự kết hợp giữa các giá trị tính toán bằng hóa lượng tử với các phương pháp xử lí số liệu kinh điển và hiện đại (MLR và ANN). Kết quả thu được cho thấy phương pháp ANN giải quyết tốt bài toán khảo sát QSAR của các dẫn xuất N- acylpiperidine. Phương pháp bán thực nghiệm PM3 trong chương trình Hyperchem 8.03 để tính các tham số cấu trúc của N-acylpiperidine không quá lâu và thực hiện dễ dàng. Phần mềm Stagraphics Centurion XV thực hiện nhanh chóng các bước phân tích dữ liệu, lựa chọn biến, phân tích và lựa chọn mô hình tối ưu. Chương trình NeuroSolution for Excel của NeuronSolution 5.07 dễ dàng thực hiện việc xây dựng, luyện và kiểm tra mạng.  KẾT QUẢ NGHIÊN CỨU QSAR Cũng cùng mục đích như các nghiên cứu QSAR về thuốc đuổi muỗi khác, luận văn này đã thực hiện khảo sát QSAR trên 34 chất dẫn xuất của N-acylpiperidine bằng hai phương pháp: hồi qui đa biến tuyến tính (MLR) và mạng nơron nhân tạo (ANN). Kết quả mô hình thu được bằng phương pháp ANN đều có R2 và Q2 lớn hơn 0.81, do đó có thể áp dụng được mô hình này trong thực tế để đoán nhận hoạt tính của những chất N-acylpiperidine chưa biết bằng cách thiết kế phân tử muốn thử trên máy tính và nhập vào những thống số có trong mô hình. Mô hình này sẽ là công cụ hỗ trợ đắc lực cho việc thiết kế ra các phân tử mới có tác dụng đuổi muỗi hữu hiệu hơn mà giảm được công sức, thời gian và chi phí. Hướng tiếp theo và lâu dài của đề tài này là tiếp tục hoàn chỉnh phương pháp luận nghiên cứu QSAR qua việc cải thiện phương pháp tính toán (như phối hợp phương pháp mạng nơron với phương pháp logic mờ hay với thuật toán di truyền ...), cải thiện việc chọn lọc và tính toán các tham số cấu trúc mới. TÀI LIỆU THAM KHẢO TÀI LIỆU THAM KHẢO ---------- TIẾNG VIỆT [1] Bùi Thọ Thanh (2008), Bài giảng hóa lượng tử - tin học dành cho học viên cao học, Đại Học Cần Thơ. [2] Bùi Thọ Thanh (2000), Bài giảng Mạng Nơron dành cho sinh viên khoa sinh, Đại Học Khoa Học Tự Nhiên. [3] Bùi Thọ Thanh (2000), Bài giảng Quantitative Structure – Activity Relationship (QSAR) dành cho sinh viên khoa hóa, Đại Học Khoa Học Tự Nhiên. [4] Bùi Thọ Thanh (2002), Phùng Quán, Trịnh Thành Thuật, “Khảo sát liên hệ định lượng cấu trúc – hoạt tính của Benzenesulfonamid”; Bùi Thọ Thanh (2002), Phùng Quán, Nguyễn Chí Sơn, “Khảo sát liên hệ định lượng cấu trúc – hoạt tính của Polychlorinated Dibenzofurans”, Tuyển tập các báo toàn văn Hội nghị toàn quốc các đề tài nghiên cứu khoa học cơ bản trong lĩnh vực Hóa lý và Hóa lý thuyết 27/04/2002, Hà Nội, Việt Nam, tr. 98-121. [5] Đặng Văn Giáp (1998), Liên quan cấu trúc - tác dụng & thiết kế phân tử bằng máy tính, NXB Giáo Dục, tr. 89-123. [6] Hoàng Trọng (2008), Chu Nguyễn Mộng Ngọc, Phân tích dữ liệu nghiên cứu với SSPS, tập 1, NXB Hồng Đức, Chương IX: Tương quan và Hồi qui tuyến tính, tr. 195-277. [7] Lâm Ngọc Thiềm (1999), Phạm Văn Nhiêu, Lê Kim Long, Cơ sở hóa họ lượng tử, chương 11, tr. 291-314. [8] Nguyễn Đình Thúc (2000), Hoàng Đức Hải, Trí tuệ nhân tạo Mạng Nơron – Phương pháp & ứng dụng, NXB Giáo Dục. [9] Phạm Trần Nguyên Nguyên (1998), Ứng dụng hóa lượng tử và tin học khảo sát các chất ức chế enzym khử dihidroflate, Luận văn thạc sĩ khoa học hóa học, Đại Học Khoa Học Tự Nhiên-TpHCM. [10] Phạm Quý Tư (1999), Đỗ Đình Thành, Cơ học lượng tử, NXB Đại Học Quốc Gia Hà Nội. [11] Phùng Quán (2002), Khảo sát mối liên hệ định lượng giữa độc tính và cấu trúc của các hợp chất Dioxin, Luận văn thạc sĩ khoa học hóa học, Đại Học Khoa Học Tự Nhiên-TpHCM. [12] Thái Sanh Nguyên Bình (2003), Khảo sát mối quan hệ định lượng giữa độc tính và cấu trúc của hợp chất benzen, Luận văn thạc sĩ khoa học hóa học, Đại Học Khoa Học Tự Nhiên-TpHCM. [13] www.contrungviet.net, Tập tính các loài muỗi truyền bệnh và cách phòng chống. [14] www.impe-qn.org.vn, Những nghiên cứu phát hiện mới về cơ quan thính giác và khứu giác của muỗi. [15] vi.wikipedia.org, Muỗi. [16] vi.wikipedia.org, Thuốc đuổi muỗi. TIẾNG ANH [17] Ana Gallegos Saliner (2004), Molecular Quantum Similarity in QSAR: Applications in computer – aided molecular design, Girona, pp.141-146. [18] Alan R. Katritzky (2008), “Synthesis and bioassay of improved mosquito repellents predicted from chemical structure”, PNAS, 105(21), pp.7359- 7364. [19] Frank Jensen (1999), Introduction to Computational Chemistry, Jonh Wiley & Sons Ltd. [20] Jure Zupan (1992), Johann Gasteiger, Neural Networks for Chemists, VCH Wienheim, part I, pp.3-59. [21] Kubinyi H. (1994), QSAR Hansch Analysis and Related Approaches, Mannhold R, Ed., VCH Wienheim, 57-76. [22] Morrison D.F., Multivariate Statistical Methods, McGraw-Hill, pp.107-110. [23] Sandhya Samarasinghe (2006), Neural Networks for Applied Sciences and Engineering, Auerbach Pulications, Boca Raton, New York, pp. 113-150. [24] Wylie W.A. (1994), “Molecular Modeling Methods” in Molecular Modeling and Drug Design, Vinter J.G. & M.Eds, CRC Press, pp.1-15. [25] Zongde Wang (2008), “QSAR study of mosquito repellents from terpenoid with a six-member-ring”, Bioorganic & Medicinal Chemistry Letter, 10(18), pp.2854-2859. [26] en.wikipedia.org, Quantitative structure activity relationship. [27] www.ars.usda.gov, New Mosquito Repellents. [28] www.epa.gov, Active Ingredients Found in Insect Repellents. [29] www.epa.gov, Insect Repellents: Use and Effectiveness. [30] www.globalhealthreporting.org, Malaria | Several New Substances Repel Mosquitoes Three Times Longer Than DEET, Study Says. [31] www.pnas.org, Supporting Information. [32] www.qsarworld.com, Publicly-accessible QSAR software tools developed by the Joint Research Centre. 

Các file đính kèm theo tài liệu này:

  • pdfKH7842O Samp193T M7888I QUAN H7878 2727882NH L4317906NG .pdf
Tài liệu liên quan