Luận văn Xây dựng cơ sở dữ liệu hai gene 16S và 23S ribosom RNA ở vi khuẩn – ứng dụng cơ sở dữ liệu hai gene 16s và 23s ribosom RNA ở vi khuẩn để phát hiện các tác nhân gây bệnh viêm màng não mủ (bacterial meningitis)

Xây dựng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn – ứng dụng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn để phát hiện các tác nhân gây bệnh viêm màng não TÓM TẮT KHÓA LUẬN – Khóa luận được thực hiện tại bộ môn Công Nghệ Sinh Học - Trường Đại Học Nông Lâm TP. Hồ Chí Minh, từ tháng 1/2006 đến 8/2006. Với sự phát triển của kỹ thuật sinh học phân tử, một số lượng lớn các gene 16S và 23S rRNA đã được giải trình tự. Những trình tự gene này được lưu trữ trong CSDL sinh học lớn như NCBI, EMBL, DDBj Vì các CSDL này quá lớn và chứa rất nhiều thông tin khác nhau, không tập trung cho một đối tượng cụ thể nên khó có thể thực hiện việc truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt. Do vậy, mục tiêu của đề tài là tiến hành xây dựng cơ sở dữ liệu hai gene 16S và 23S rRNA ở vi khuẩn và ứng dụng CSDL này để phát hiện các loài vi khuẩn gây bệnh viêm màng não mủ. Để đạt được mục tiêu trên, khóa luận cần đảm bảo thực hiện những nội dung như sau: Dùng Perl script để thu nhận các mẫu tin của hai gene từ trang CSDL GenBank (CSDL nucleotide của NCBI). Tiếp tục sử dụng Perl script tách các mẫu tin thu nhận được thành từng phần riêng biệt như accession number (mã số truy cập), gi, definition, sequence (trình tự của gene) Thiết kế CSDL dựa vào mô hình dữ liệu quan hệ. Dùng Perl script để chuyển tự động các thông tin tách được ở bước trên vào CSDL. Sử dụng giao thức CGI kết hợp với ngôn ngữ lập trình Perl để thiết kế trang web CSDL về hai gene 16S và 23S rRNA ở các loài vi khuẩn. Sử dụng trình tự của hai gene 16S và 23S rRNA trong CSDL để thiết kế mồi cho phản ứng PCR phát hiện và phân biệt các tác nhân gây bệnh viêm màng não mủ. Đề tài đã đạt được những kết quả như sau: Đã thu thập được 2825 mẫu tin về gene 16S rRNA và 305 mẫu tin về gene 23S rRNA từ cơ sở dữ liệu GenBank (NCBI). Tạo được CSDL của hai gene 16S và 23S rRNA tích hợp với web. Trang web CSDL của hai gene và gồm có 5 trang chính: HOME, SEARCH, TOOL, LINK, ABOUT. Từ các trang web này, người sử dụng có thể truy xuất thông tin, tìm kiếm trình tự, so sánh một trình tự quan tâm với các trình tự trong CSDL (alignment, BLAST) Ngoài ra, những trang web chính này còn kết nối đến những trang phụ khác để cung cấp các tiện ích cho người dùng. Thiết kế mồi cho phản ứng PCR phát hiện các tác nhân gây bệnh viêm màng não mủ bằng chương trình thiết kế mồi Primrose. MỤC LỤC Nội dung Trang LỜI CẢM ƠN . iii TÓM TẮT KHÓA LUẬN iv MỤC LỤC . vi DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ x DANH SÁCH CÁC HÌNH . xi DANH SÁCH CÁC CHỮ VIẾT TẮT xiii PHẦN 1: MỞ ĐẦU .1 1.1. ĐẶT VẤN ĐỀ .1 1.2. MỤC ĐÍCH .2 1.3. YÊU CẦU 2 PHẦN 2: TỔNG QUAN TÀI LIỆU 3 2.1. SƠ LưỢC VỀ CƠ SỞ DỮ LIỆU 3 2.1.1. Định nghĩa 3 2.1.2. Hệ quản trị CSDL (Database Management System – DBMS) .3 2.1.3. Các mô hình dữ liệu .3 2.2. NGÔN NGỮ LẬP TRÌNH PERL, MẠNG INTERNET VÀ WEB .3 2.2.1. Perl .3 2.2.1.1. Tóm tắt lịch sử phát triển .3 2.2.1.2. Ứng dụng 4 2.2.1.3. Một số module của Perl thường được sử dụng 4 2.2.2. Giới thiệu về mạng Internet .5 2.2.3. Tích hợp CSDL với web dùng CGI 5 2.3. CƠ SỞ DỮ LIỆU SINH HỌC .6 2.3.1. NCBI (National Center for Bioinformatic Information) .6 2.3.1.1. Vài nét về NCBI 6 2.3.1.2. Một số cơ sở dữ liệu trong NCBI 7 2.3.1.3. Một số công cụ trong NCBI .7 2.3.2. EBI (European Bioinformatics Institute) .8 2.3.2.1. Vài nét về EBI .8 2.3.2.2. Một số cơ sở dữ liệu trong EBI .8 2.3.2.3. Một số công cụ hỗ trợ phân tích trình tự sinh học .9 2.3.3. SIB (Swiss Institute of Bioinformatics) .9 2.3.4. DDBJ (DNA Data Bank Japan) và PDBj (Protein Database Japan) . 10 2.4. BỆNH VIÊM MÀNG NÃO MỦ 12 2.4.1. Sơ lược về bệnh viêm màng não mủ . 12 2.4.1.1. Định nghĩa . 12 2.4.1.2. Bệnh theo lứa tuổi 12 2.4.1.3. Các con đường xâm nhiễm của vi khuẩn gây bệnh 13 2.4.2. Các triệu chứng biểu hiện lâm sàng của bệnh . 13 2.4.2.1. Những triệu chứng giai đoạn khởi phát 13 2.4.2.2. Biểu hiện lâm sàng của viêm màng não mủ . 13 2.4.3. Hậu quả của bệnh trên những đối tượng bị lây nhiễm 15 2.4.4. Tình hình bệnh viêm màng não mủ trên thế giới và Việt Nam . 15 2.5. VI KHUẨN GÂY BỆNH VIÊM MÀNG NÃO MỦ 16 2.6. CÁC PHưƠNG PHÁP XÉT NGHIỆM BỆNH VIÊM MÀNG NÃO MỦ 18 2.6.1. Phương pháp chẩn đoán lâm sàng . 18 2.6.2. Phương pháp xét nghiệm vi khuẩn học . 18 2.6.3. Phương pháp miễn dịch học 19 2.6.4. Phương pháp tế bào học . 19 2.6.5. Phương pháp sinh hoá . 19 2.6.5.1. Đường trong dịch não tủy 19 2.6.5.2. Đạm trong dịch não tủy 19 2.6.5.3. Phương pháp khảo sát nồng độ lactate .20 2.6.6. Phương pháp chụp cắt lớp – CT (computer tomography) .20 2.6.7. Phương pháp xét nghiệm dựa vào kỹ thuật PCR .20 2.7. KỸ THUẬT PCR VÀ ỨNG DỤNG TRONG VIỆC PHÁT HIỆN TÁC NHÂN GÂY BỆNH VIÊM MÀNG NÃO MỦ .20 2.7.1. Nguyên tắc của kỹ thuật PCR .20 2.7.2. Quy trình của phản ứng PCR 21 2.7.3. Seminested PCR/ Multiplex PCR .22 2.7.3.1. Seminested PCR .22 2.7.3.2. Multiplex PCR 22 2.7.4. Ứng dụng kỹ thuật PCR trong việc phát hiện vi khuẩn gây bệnh viêm màng não mủ 22 2.8. GENE 16S rRNA VÀ 23S rRNA 24 2.8.1. RNA ribosome (rRNA) – Cấu trúc ribosome 24 2.8.2. Gene 16S rRNA thước đo tiến hóa 25 2.8.3. Gene 23S rRNA .28 2.9. ĐIỀU TRỊ BỆNH VIÊM MÀNG NÃO MỦ BẰNG KHÁNG SINH .28 PHẦN 3: PHưƠNG PHÁP VÀ CÁC CHưƠNG TRÌNH SỬ DỤNG 29 3.1. CÁC CHưƠNG TRÌNH VÀ NGÔN NGỮ LẬP TRÌNH ĐưỢC SỬ DỤNG 29 3.1.1. Hệ điều hành 29 3.1.2. Các chương trình phân tích trình tự .29 3.1.2.1. Chương trình so sánh trình tự ClustalW 29 3.1.2.2. Chương trình tìm kiếm các trình tự tương đồng – BLAST .30 3.1.3. Hệ quản trị CSDL quan hệ MySQL 30 3.1.4. Apache web server .31 3.1.5. Ngôn ngữ lập trình Perl và các gói sử dụng .31 3.1.6. Chương trình thiết kế mồi Primrose 2.17 .32 3.2. PHưƠNG PHÁP 33 3.2.1. Thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene 16S và 23S rRNA .33 3.2.3. Thiết kế CSDL gene 16S và 23S rRNA 38 3.2.3.1. Phân tích dữ liệu 38 3.2.3.2. Thiết kế CSDL dạng bảng 39 3.2.3.3. Lưu trữ các thông tin vào CSDL 41 3.2.4. Tích hợp CSDL gene 16S rRNA và 23S rRNA với trang web 42 3.3. Thiết kế mồi cho phản ứng PCR phát hiện vi khuẩn viêm màng não .42 3.3.1 Thiết kế mồi dựa trên trình tự gene 16S rRNA 43 3.3.2. Thiết kế mồi dựa trên trình gene 23S rRNA 47 3.3.3. Nhiệt độ nóng chảy của mồi .51 PHẦN 4: KẾT QUẢ VÀ THẢO LUẬN .52 4.1. Kết quả thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene 16S và 23S rRNA .52 4.2. CSDL gene 16S và 23S rRNA 52 4.3. Trang web thể hiện thông tin CSDL gene 16S và 23S rRNA 52 4.3.1. Trang thông tin chung về CSDL gene 16S và 23S rRNA (Home Page) .54 4.3.2. Trang tìm kiếm (Search Page) 55 4.3.3. Trang công cụ (Tool Page) .58 4.3.4. Trang Meningitidis 60 4.4. Kết quả thiết kế mồi phát hiện các tác nhân viêm màng màng não mủ .60 PHẦN 5: KẾT LUẬN VÀ ĐỀ NGHỊ 63 PHẦN 6: TÀI LIỆU THAM KHẢO .64 PHỤ LỤC . Xây dựng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn – ứng dụng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn để phát hiện các tác nhân gây bệnh viêm màng não (Bacterial Meningitidis)

pdf83 trang | Chia sẻ: maiphuongtl | Lượt xem: 2996 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng cơ sở dữ liệu hai gene 16S và 23S ribosom RNA ở vi khuẩn – ứng dụng cơ sở dữ liệu hai gene 16s và 23s ribosom RNA ở vi khuẩn để phát hiện các tác nhân gây bệnh viêm màng não mủ (bacterial meningitis), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
định cho bệnh nhân cứ sốt dai dẳng, có biểu hiện tăng áp lực nội sọ, liệt khu trú, co giật, vòng đầu to, rối loạn thần kinh kéo dài, hoặc kết quả cấy và các thông số của dịch não tủy bất thƣờng kéo dài để xác định biến chứng. Ở trẻ có sốt và nghi ngờ có tràn dịch dƣới màng cứng nên chụp CT để phát hiện và dẫn lƣu. Đặc biệt ở bệnh nhân viêm màng não mủ do vỡ nền sọ có thoát dịch não tủy, chụp CT có thể phát hiện mức độ khí – dịch, độ mờ của xoang mũi hoặc khí nội sọ. CT cắt dọc có thể định vị đƣợc vị trí vỡ xƣơng. Chụp CT có thể sử dụng chất cản quang tạo độ tƣơng phản rõ giữa dịch – chất hòa tan là cách tốt nhất để xác định vị trí thoát dịch. 2.6.7. Phƣơng pháp xét nghiệm dựa vào kỹ thuật PCR Phƣơng pháp PCR là một phƣơng pháp mới để xét nghiệm bệnh viêm màng não mủ. Phƣơng pháp này có nhiều ƣu điểm nhƣ độ nhạy, độ chính xác cao, cho phép phát hiện trực tiếp và chính xác vi khuẩn gây bệnh trong thời gian ngắn, kĩ thuật thao tác đơn giản và nhanh chóng trên một lƣợng dịch não tủy ban đầu ít. Mặt hạn chế của phƣơng pháp này là sự ngoại nhiễm cao. 2.7. KỸ THUẬT PCR VÀ ỨNG DỤNG TRONG VIỆC PHÁT HIỆN TÁC NHÂN GÂY BỆNH VIÊM MÀNG NÃO MỦ 2.7.1. Nguyên tắc của kỹ thuật PCR Tất cả các DNA polymerase khi hoạt động tổng hợp một mạch DNA mới từ mạch khuôn đều cần sự hiện diện của những mồi chuyên biệt. Mồi là những đoạn DNA ngắn, có khả năng bắt cặp bổ sung với một đầu của mạch khuôn. Sau đó DNA polymerase sẽ nối dài để hình thành mạch mới. Phƣơng pháp PCR đã đƣợc hình thành dựa trên các đặc tính đó của DNA polymerase. Vậy nếu ta cung cấp hai mồi chuyên biệt bắt cặp bổ sung với hai đầu của trình tự, ta sẽ tổng hợp đoạn DNA nằm giữa hai mồi. 21 Thành phần cơ bản của phản ứng PCR gồm có: DNA bản mẫu, mồi xuôi và mồi ngƣợc, dNTPs (dATP, dCTP, dGTP,dTTP), dung dịch đệm cho phản ứng PCR, MgCl2, Taq polymerase. 2.7.2. Quy trình của phản ứng PCR Phản ứng PCR là một chuỗi nhiều chu kỳ nối tiếp nhau, mỗi chu kỳ gồm ba bƣớc và mỗi chu kỳ sẽ tăng gấp đôi số lƣợng mẫu lần trƣớc (nhân bản theo cấp số nhân). Bƣớc 1: Giai đoạn biến tính Trong một dung dịch phản ứng bao gồm các thành phần cần thiết cho sự sao chép, phân tử DNA đƣợc biến tính ở nhiệt độ cao hơn Tm của phân tử, thƣờng ở 90oC – 95 oC trong vòng 30 giây đến 1 phút. Bƣớc 2: Giai đoạn bắt cặp (lai) Nhiệt độ đƣợc hạ thấp (thấp hơn Tm của các mồi) cho phép các mồi bắt cặp với khuôn. Trong thực nghiệm, nhiệt độ này dao động trong khoảng 40oC – 70oC tuỳ thuộc Tm các mồi sử dụng và kéo dài từ 30 giây đến 1 phút. Bƣớc 3: Giai đoạn kéo dài Nhiệt độ đƣợc tăng lên đến 72oC giúp cho DNA polymerase hoạt động tổng hợp tốt nhất (DNA polymerase sử dụng là DNA polymerase chịu nhiệt). Thời gian tùy thuộc vào độ dài của trình tự DNA cần nhân bản. Hình 2.6. Quy trình phản ứng PCR 22 2.7.3. Seminested PCR/ multiplex PCR 2.7.3.1. Seminested PCR Đây là một trong những kỹ thuật phát triển sau này dựa vào nền tảng kỹ thuật PCR. Kỹ thuật này gồm hai bƣớc: Bƣớc 1: là sự nhân bản một trình tự DNA. Bƣớc 2: là sự nhân bản các bản mẫu là các đoạn DNA vừa đƣợc nhân bản. Đoạn DNA đƣợc nhân bản trong bƣớc 2 nằm trong đoạn DNA đƣợc nhân bản trong bƣớc 1. Một trong hai mồi sử dụng ở bƣớc 1 sẽ đƣợc sử dụng lại trong bƣớc 2 để cùng mồi mới tạo thành một cặp mồi. Sau bƣớc đầu tiên, các đoạn DNA chứa đoạn DNA cần nhân bản ở bƣớc 2 đã đƣợc nhân lên rất nhiều so với lƣợng DNA ban đầu. Do đó, ở bƣớc 2, lƣợng bản mẫu sẽ nhiều hơn lƣợng DNA không mong muốn nên sự nhân bản các đoạn DNA mong muốn sẽ diễn ra dễ dàng hơn, dẫn đến sự nhân bản đặc hiệu hơn. 2.7.3.2. Multiplex PCR Multiplex PCR là một kỹ thuật dùng nhiều cặp mồi khác nhau trong cùng một phản ứng PCR để nhân bản đồng thời nhiều đoạn trình tự. Số lƣợng các sản phẩm PCR khác nhau đƣợc nhân bản trong cùng một phản ứng PCR có thể từ 2 sản phẩm đến tối đa 15 sản phẩm, điều này có nghĩa là có thể dùng đến 15 cặp mồi trong cùng một phản ứng. Kỹ thuật này đƣợc thử nghiệm thành công vào năm 1988 và từ đó đã đƣợc áp dụng thành công trong nhiều công trình nghiên cứu về các biến đổi di truyền ở ngƣời cũng nhƣ nhiều lĩnh vực nghiên cứu khác. Kỹ thuật multiplex PCR thƣờng dùng để kết hợp với kỹ thuật nested PCR hay seminested PCR nhằm thu đƣợc kết quả với độ chính xác và độ đặc hiệu cao. 2.7.4. Ứng dụng kỹ thuật PCR trong việc phát hiện vi khuẩn gây bệnh viêm màng não mủ Gene 16S rRNA của các vi khuẩn thuộc nhóm Eubacteria có những vùng bảo tồn cao ở cấp độ nhóm, xen kẽ với các vùng biến động khác nhau giữa các loài trong nhóm. Do đó, những trình tự này rất phù hợp với mục đích thiết kế mồi nhằm phát hiện sự hiện diện của vi khuẩn và các kỹ thuật chẩn đoán dựa vào kỹ thuật PCR ngày càng đƣợc phát triển với mục đích tăng độ nhạy của phản ứng. Năm 1994, Radstrom và các cộng sự đã đề ra phƣơng án sử dụng cặp mồi u3 và ru8 để nhân bản vùng trình tự bảo tồn trên gene 16S rRNA trong bƣớc đầu và sử dụng 23 mồi ru8 với các mồi đặc hiệu cho từng loài vi khuẩn để nhân bản vùng trình tự đặc biệt của mỗi loài trong bƣớc 2. Kỹ thuật tiếp tục đƣợc nhóm nghiên cứu phát triển (năm 1998) để phát hiện đồng thời các chủng vi khuẩn gây bệnh viêm màng não mủ trong dịch não tủy nhƣ Haemophilus influenzae, Neisseria meningitidis, Streptococcus agalactiae, Streptococcus pneumoniae và Listeria monocytogenes. Cũng vào năm 1994, Greisen và các cộng sự công bố công trình nghiên cứu những mồi và mẫu dò cho gene 16S rRNA của hầu hết các loài vi khuẩn gây bệnh, bao gồm vi khuẩn tìm thấy trong dịch não tủy. Đầu tiên là sự nhân bản vùng trình tự bảo tồn trên gene 16S rRNA bằng phƣơng pháp PCR. Sau đó sử dụng các mẫu dò đặc hiệu để phát hiện DNA các loài vi khuẩn. Tƣơng tự các công trình nghiên cứu trƣớc, Jang – Jih Lu và các cộng sự vào năm 2000 cũng đã thiết lập một cặp mồi chung trên gene 16S rRNA cho các loài vi khuẩn Staphylococcus aureus, Staphylococcus epidermidis, Streptococcus pyogenes, Streptococcus agalactiae, Streptococcus pneumoniae, Enterococcus faecium, Enterococcus faecalis, Mycobacterium tuberculosis, Legionella pneumophila, Escherichia coli, Klebsiella pneumoniae, Serratia marcescens, Enterobacter cloacae, Pseudomonas aeruginosa, Acinetobacter baumannii, Proteus mirabilis, Haemophilus influenzae, Neisseria meningitidis để thiết lập phản ứng PCR nhân bản đoạn có kích thƣớc 996 bp. Ở bƣớc 2 tác giả sử dụng enzyme cắt giới hạn phân cắt đoạn trình tự lớn 996 bp. Các sản phẩm PCR sau khi đã xử lý bằng enzyme sẽ đƣợc điện di trên gel polyacrylamide 6% và so sánh với thang chuẩn để xác định sự hiện diện của vi khuẩn trong dịch não tủy. Qua một số công trình nghiên cứu trên, chúng tôi thấy hầu hết việc phát hiện vi khuẩn gây viêm màng não mủ đều trải qua bƣớc cơ bản là nhân bản 1 trình tự bảo tồn. Do đó, trong khuôn khổ khóa luận này chúng tôi tiến hành thu thập các trình tự gene 16S và 23S rRNA bảo tồn trên các loài vi khuẩn và lƣu trữ trong CSDL. Từ các trình tự này chúng tôi sử dụng phần mềm Primrose để thiết kế mồi cho phản ứng PCR phát hiện vi khuẩn gây bệnh viêm màng não mủ. 24 2.8. GENE 16S rRNA VÀ 23S rRNA 2.8.1. RNA ribosome (rRNA) – Cấu trúc ribosome Sự tổng hợp các chuỗi polypeptide trong tất cả các hệ thống sống đƣợc thực hiện tại các ribosome. Ribosome của vi khuẩn có khối lƣợng khoảng chừng 2,5 triệu dalton, có hệ số lắng là 70S, trong đó protein chiếm 1/3 khối lƣợng và phần còn lại là các rRNA. Tất cả các ribosome đƣợc hình thành từ hai tiểu đơn vị ribonucleoprotein có kích thƣớc không bằng nhau. Ở vi khuẩn, những tiểu đơn vị này có hệ số lắng là 50S và 30S. Ribosome ở E. coli cũng nhƣ ở các loài vi khuẩn khác chứa 3 loại rRNA: 16S rRNA, 23S rRNA và 5S rRNA. 16S rRNA ở E. coli có chiều dài khoảng 1542 ribonucleotide là một thành phần cấu thành tiểu đơn vị nhỏ của ribosome. Tiểu đơn vị lớn của ribosome thì chứa hai loại rRNA là 23S và 5S (ở E. coli có chiều dài lần lƣợt là 2904 và 120 ribonucleotide). Ngƣời ta cho rằng rRNA đóng vai trò rất quan trọng trong cấu trúc của ribosome, giúp cho việc gắn kết của các protein ribosome và góp phần quyết định hình dạng của ribosome. Thành phần cấu tạo của ribosome điển hình (ở vi khuẩn E. coli) bao gồm 55 phân tử protein có khối lƣợng khoảng 900 000 dalton, trong số này có 4 phân tử protein cùng loại, các phân tử còn lại là khác nhau. Tiểu đơn vị nhỏ của ribosome bao gồm 21 protein kết hợp với 16S rRNA, tiểu đơn vị lớn bao gồm 34 protein kết hợp với 23S rRNA và 5S rRNA. 25 Hình 2.7. Thành phần cấu tạo của ribosome ở prokaryote Cho đến nay, chƣa có một kết luận hợp lý nào về sự xuất hiện một lƣợng lớn rRNA trong ribosome. Tuy nhiên, mọi ngƣời đều tin rằng các ribonucleotide không bắt cặp trong cấu trúc bậc 2 của rRNA có liên quan đến sự gắn kết của các RNA khác lên ribosome. Chẳng hạn một vài ribonucleotide ở gần đầu 3‟ của 16S rRNA là điểm bắt cặp với các nucleotide (trình tự Shine – Dalgarno) trên phân tử RNA thông tin (mRNA) để ribosome có thể gắn vào RNA thông tin và tiến hành tổng hợp chuỗi polypeptide. Tƣơng tự, một vài trình tự rRNA của ribosome cũng tƣơng tác với các trình tự của RNA vận chuyển (tRNA) khác nhau trong quá trình tổng hợp protein. 2.8.2. Gene 16S rRNA thƣớc đo tiến hóa Từ năm 1967, Zuckerkand và Pauling đã đƣa ra ý kiến cho rằng các phân tử sinh học có thể là “tài liệu của lịch sử tiến hoá” hay “thƣớc đo tiến hoá”. Để là một thƣớc đo tiến hóa, phân tử đƣợc chọn phải có các đặc điểm sau. - Phân tử phải có mặt ở tất cả các sinh vật khảo sát. - Phân tử không đƣợc truyền qua lại giữa các loài. - Trình tự của phân tử này phải có độ bảo tồn và biến động thích hợp trong khoảng cách tiến hóa khảo sát. 26 - Phân tử phải có kích thƣớc đủ lớn để chứa nhiều thông tin. Mặc dù các tRNA có mặt ở hầu hết các vi sinh vật nhƣng chúng không đƣợc chọn làm thƣớc đo tiến hóa do có kích thƣớc quá nhỏ (75 ribonucleotide). Một thập kỷ sau, vào năm 1977, Woese và các cộng sự đã xác định 16S rRNA là phân tử rất thích hợp làm thƣớc đo tiến hóa. 16S rRNA là phân tử cổ, là thành phần của bộ máy tổng hợp protein có từ lâu đời. Hơn nữa, các rRNA là những phân tử có chức năng không thay đổi, phân bố ở hầu hết các hệ thống sống và có độ bảo tồn vừa phải cho phép phản ảnh sự liên quan tiến hóa giữa các loài sinh vật. Ba loại rRNA là thành phần của ribosome đều có một số tính chất để có thể đƣợc chọn làm thƣớc đo tiến hóa. Tuy nhiên, 5S rRNA có kích thƣớc quá nhỏ (khoảng 120 ribonucleotide), mang ít thông tin của quá trình tiến hóa nên ít đƣợc chọn. 23S rRNA là phân tử lớn (có khoảng 2900 ribonucleotide), có đầy đủ các tính chất để có thể làm thƣớc đo tiến hóa. Tuy nhiên, kích thƣớc của 23S rRNA lớn nên thao tác nghiên cứu trên phân tử này không thuận lợi lắm. Phân tử 16S rRNA có kích thƣớc vừa phải, khoảng 1500 ribonucleotide, thuận lợi cho các thao tác nghiên cứu nên hiện nay, phân tử này đƣợc coi nhƣ là “tiêu chuẩn vàng” cho phân loại học. Tuy nhiên, do RNA đòi hỏi phải rất cẩn trọng trong thao tác do dễ bị phân hủy nên khuynh hƣớng hiện nay là sử dụng gene mã hóa cho RNA – gọi là gene 16S rRNA – trong các nghiên cứu. Gene 16S rRNA của các vi khuẩn thuộc nhóm Eubacteria có một điểm rất đặc biệt là có những vùng bảo tồn cao ở cấp độ của nhóm xen kẽ những vùng biến động khác nhau giữa các loài trong cùng nhóm này. Tuy là những vùng biến động, nhƣng những vùng này lại là những vùng bảo tồn ở cấp độ loài. Sự bảo tồn và biến động ở các cấp độ khác nhau đã giúp cho gene 16S rRNA luôn là sự lựa chọn đầu tiên của các nhà nghiên cứu khi tiến hành định danh vi khuẩn hay xác định mối quan hệ họ hàng giữa hai hay nhiều loài vi khuẩn. Cho đến nay, số lƣợng các gene 16S rRNA đã đƣợc giải trình tự lên đến hơn 10 000. Điều này cho thấy có sự quan tâm rất lớn của các nhà khoa học đến đối tƣợng này. 27 Hình 2.8. Vị trí và kích thước của 16S và 23S rRNA trong bộ gene vi khuẩn – Ứng dụng của gene 16S rRNA trong lĩnh vực y học Gene 16S rRNA đƣợc sử dụng nhiều trong các nghiên cứu xác định tác nhân vi khuẩn gây bệnh. Trƣớc đây, trong nhiều công trình nghiên cứu, trình tự DNA đích đƣợc nhân trong kỹ thuật PCR liên quan đến các gene gây bệnh đặc hiệu cho tác nhân, nhƣ gene protease A (Kuritza & Oehler, 1991) hay gene dhps (dihydropteroate synthase) (Salo & cs, 1995) nhằm phát hiện N. meningitidis, gene autolysin (Cherian & cs, 1998) nhằm phát hiện các serotype của S. pneumoniae. Đôi khi, trình tự đích là một trình tự ngẫu nhiên đƣợc chọn từ thƣ viện bộ gene của một tác nhân gây bệnh nhƣ trong công trình về Legionella sp và Legionella pneumophila (Mahbubani & cs, 1989). Tuy nhiên trong những năm gần đây, khuynh hƣớng sử dụng các gene có độ bảo tồn cao giữa các vi khuẩn gây bệnh nhƣ vùng gene 16S rRNA ngày càng đƣợc ƣa chuộng. Việc lựa chọn và sử dụng phối hợp consensus primer nằm trong các vùng bảo tồn và các primer đặc hiệu trong các vùng biến động sẽ cho phép phát hiện sự hiện diện của các vi khuẩn gây bệnh nói chung đồng thời xác định đƣợc tên của vi khuẩn. Greisen & cs (1994) sử dụng các consensus primer để nhân bản trình tự DNA của 124 loài vi khuẩn. Các trình tự này sau đó đƣợc lai (Southern blotting) với các probe đặc hiệu cho các nhóm và loài vi khuẩn gây bệnh khảo sát. Các tác giả đã phát hiện và định danh đƣợc hầu hết các vi khuẩn gây bệnh hiện diện. Radstrom & cs (1994) nhân bản gene 16S rRNA bằng hai phản ứng PCR nối tiếp (seminested PCR). Phản ứng PCR I cho sản phẩm nhân bản là một trình tự chung cho mọi vi khuẩn trong khi sản phẩm nhân bản lần II là đặc hiệu cho từng loài vi khuẩn. Theo công bố, quy trình đạt độ nhạy cao (0,94) và độ đặc hiệu cao (0,96). Công trình trên đƣợc hoàn thiện bởi Backman & cs, (1999) nhằm hạn chế các kết quả âm tính giả do tác động ức chế của các tạp chất có mặt trong bệnh phẩm hoặc dƣơng tính giả do sự ngoại nhiễm, đồng thời bổ sung thêm primer đặc hiệu để tăng phổ phát hiện của qui trình. 28 2.8.3. Gene 23S rRNA Gần đây, đã có nhiều nghiên cứu đƣợc tiến hành trên trình tự của tiểu đơn vị lớn (23S rRNA) ở vi khuẩn. Theo Rina Uzuka và cộng sự (2004), vùng 23S rRNA thể hiện sự biến động giữa các loài hơn vùng 16S rRNA. Theo đó, có thể thiết kế mồi chung (universal primer) dựa trên vùng bảo tồn và mồi chuyên biệt (specific primer) dựa trên vùng biến động của trình tự 23S rRNA để phân biệt đƣợc các nhóm vi khuẩn gây viêm màng não. Nếu thiết kế mồi trên trình tự 16S rRNA thì không có khả năng phân biệt các loài trong nhóm vi khuẩn này. Nhóm tác giả sử dụng 10 loài vi khuẩn lấy từ dịch não tủy của trẻ bị viêm màng não để nghiên cứu. Thiết kế mồi trong vùng chung và vùng chuyên biệt của gene 23S rRNA. Sau đó khuếch đại những vùng này bằng kỹ thuật multiplex PCR và real-time PCR. Kết quả, tất cả các vi khuẩn đều cho một băng điện di của sản phẩm PCR chỉ sử dụng mồi chung. Haemophilus influenzae và Streptococcus pneumoniae cho hai băng khi sử dụng phƣơng pháp PCR kết hợp mồi chung và mồi chuyên biệt. Tác giả định lƣợng H. influenzae bằng phƣơng pháp real-time PCR trong 15 phút. Nhƣ vậy ta có thể định danh và định lƣợng vi khuẩn có trong dịch não tủy của bệnh nhân chỉ trong một thời gian ngắn (< 3 giờ). Theo Rina Uzuka, vùng 23S rRNA thƣờng liên quan đến việc kháng kháng sinh phân tử vòng lớn (macrolide antibiotic). Việc thiết kế các universal primer mới để khuếch đại vùng 23S rRNA là rất hữu ích trong chẩn đoán các vi khuẩn kháng thuốc. 2.9. ĐIỀU TRỊ BỆNH VIÊM MÀNG NÃO MỦ BẰNG KHÁNG SINH Việc phân chia vi khuẩn theo khả năng tác động của các nhóm kháng sinh có ý nghĩa rất quan trọng. Nếu dùng đúng thuốc đặc trị cho từng vi khuẩn sẽ giúp cho việc điều trị bệnh một cách hiệu quả. Ngƣợc lại dùng kháng sinh không đúng sẽ xảy ra tình trạng lờn thuốc rất nguy hiểm. Bảng 2.3. Các nhóm kháng sinh đặc trị vi khuẩn viêm màng não mủ Vi khuẩn Chọn kháng sinh S. pneumonia Vancomycin + Broad-spectrum cephalosporin H. influenzae Ceftriaxone N. meningitidis Penicillin G L. monocytogenes Ampicillin + gentamicin S. agalactiae Penicillin G Enterobacteriaceae Broad-spectrum cephalosporin + aminoglycoside Pseudomonas aeruginosa Ceftazidime + aminoglycoside 29 PHẦN 3: PHƢƠNG PHÁP VÀ CHƢƠNG TRÌNH SỬ DỤNG 3.1. CÁC CHƢƠNG TRÌNH VÀ NGÔN NGỮ LẬP TRÌNH ĐƢỢC SỬ DỤNG 3.1.1. Hệ điều hành Windows XP (Microsoft). Xây dựng CSDL gene 16S và 23S rRNA ở vi khuẩn trên hệ điều hành này. 3.1.2. Các chƣơng trình phân tích trình tự 3.1.2.1. Chƣơng trình so sánh trình tự ClustalW ClustalW là một phần mềm (chạy trên nền Dos) dùng để so sánh sự tƣơng đồng của hai hay nhiều trình tự sinh học (pairswise or mutiple alignment). ClustalW mô tả kết quả bằng hệ thống các kí hiệu làm nổi bật những nét đặc trƣng trong những đoạn tƣơng đồng. ClustalW ngày càng trở nên hữu ích cho các nhà nghiên cứu trong việc tìm kiếm những vùng bảo tồn trên những trình tự DNA hoặc protein. Sự hiểu biết về mutiple alignment giúp ích rất nhiều cho các nhà khoa học trong việc dự đoán cấu trúc bậc hai, bậc ba của protein, đồng thời phát hiện sự tƣơng đồng giữa những đoạn gene (hoặc protein) vừa đƣợc giải trình tự với những gene (hoặc protein) đã có. ClustalW tiến hành so sánh tƣơng đồng nhiều trình tự sinh học qua ba giai đoạn: Đầu tiên chƣơng trình sử dụng thuật toán alignment xấp xỉ của Wilbur và Lipman năm 1983 để tính hệ số tƣơng đồng giữa mỗi cặp trình tự. Những hệ số tƣơng đồng tính đƣợc sẽ đƣợc sử dụng để thành lập cây phả hệ (“Guide tree” hay “dendrogram”) bằng phƣơng pháp UPGM (Unweighted Pair – Group Method) của Sneath và Sokal năm 1973. Cuối cùng các trình tự đƣợc so sánh với những nhóm trình tự lớn hơn và cứ thế tiếp tục. Ở mỗi giai đoạn so sánh, ClustalW sẽ sử dụng thuật toán của Myers và Miller (1998) nhằm tối ƣu kết quả. ClustalW 1.83 đƣợc sử dụng trong khóa luận này, có thể tải về từ trang web ( 30 3.1.2.2. Chƣơng trình tìm kiếm các trình tự tƣơng đồng – BLAST BLAST là một chƣơng trình tìm kiếm và so sánh trình tự tƣơng đồng đƣợc nhiều ngƣời dùng nhất hiện nay. Thuật toán của BLAST xuất phát từ ý tƣởng “liệu trong ngân hàng dữ liệu (bao gồm cả CSDL cục bộ và những CSDL lớn trên thế giới nhƣ GenBank, EMBL…) có trình tự nào giống hoặc gần giống với trình tự đang quan tâm”. BLAST thực hiện so sánh trình tự nhập vào (có thể DNA hay protein) với những trình tự trong CSDL. Kết quả của BLAST là những số liệu thống kê chính xác về tỉ lệ tƣơng đồng và nguồn gốc các trình tự. Chiến lƣợc tìm kiếm trình tự tƣơng đồng trong BLAST đƣợc thực hiện qua ba bƣớc chính: Đầu tiên BLAST tìm kiếm những đoạn tƣơng đồng HSPs (High Scoring Pair) giữa một trình tự đƣa vào và mỗi trình tự trong CSDL. Công việc tiếp theo là thực hiện đánh giá ý nghĩa thống kê dựa trên bất cứ sự tƣơng đồng nào đƣợc tìm thấy. Sau cùng BLAST đƣa ra một báo cáo kết quả giống nhau thỏa mãn ngƣỡng giá trị mà ngƣời dùng mong muốn. Stand-alone BLAST version 2.28 là phiên bản đƣợc sử dụng trong khóa luận này, có thể tải về từ địa chỉ web của trang CSDL NCBI (ftp://ftp.ncbi.nih.gov.blast/executables/). 3.1.3. Hệ quản trị CSDL quan hệ MySQL MySQL là một hệ quản trị CSDL quan hệ nguồn mở phổ biến nhất, dƣới sự phát triển, phân phối và bảo vệ bởi MySQL AB (MySQL AB là một công ty thƣơng mại). Phần SQL của MySQL đƣợc viết tắt từ chữ “Structure Query Language”. SQL là một ngôn ngữ chuẩn đƣợc dùng phổ biến để xây dựng CSDL và đƣợc cơ quan tiêu chuẩn SQL là ANSI/ISO công nhận. Xuất xứ của tên MySQL không rõ. Tiền tố My của MySQL chỉ xuất hiện cách đây khoảng 10 năm nay, có lẽ nó đƣợc lấy từ tên con gái của Monty Widenius (ngƣời đặt nền móng cho sự phát triển của MySQL). MySQL đƣợc viết dựa trên ngôn ngữ C và C++, hoạt động trên nhiều hệ điều hành khác nhau. Phiên bản mới nhất của MySQL là MySQL 5.0. – Ƣu điểm. Dễ sử dụng. 31 Mã nguồn mở. Thích hợp cho việc xây dựng CSDL vừa và nhỏ. – Nhƣợc điểm: Không thích hợp cho việc xây dựng CSDL lớn. Phiên bản MySQL 4.0.15 đƣợc sử dụng trong khóa luận. 3.1.4. Apache web server Trên thế giới hiện nay có rất nhiều trình chủ web hỗ trợ CGI và một trong số đó là Apache web Server. Apache web Server là một trình chủ web đƣợc nhiều ngƣời dùng nhất hiện nay trên Internet. Theo số liệu thăm dò của NetCraft, có trên 60% trình chủ web đang đƣợc sử dụng trên Internet hiện nay là sử dụng Apache web Server. Sở dĩ Apache có đƣợc một vị trí đáng nể nhƣ thế là nhờ vào việc nó là một chƣơng trình mã nguồn mở và hoàn toàn miễn phí. Hai ƣu điểm này đã giúp Apache đƣợc yêu thích đối với những công việc vừa và lớn của nhiều công ty trên thế giới. Hơn thế, Apache hoạt động ổn định, an toàn và đáng tin cậy. Chỉ trong thời gian 5 năm qua, Apache đã trở thành một trình chủ web có chức năng tƣơng đƣơng, thậm chí còn vƣợt trội so với nhiều trình chủ web thƣơng mại khác. Một trong những điểm mạnh của Apache là khả năng nâng cấp trình chủ web thông qua các module. Có 2 loại module trong Apache đó là external module và internal module. Cả hai loại module này đều có thể đƣợc sửa chữa, thay thế hoặc nâng cấp vì chúng có kèm theo mã nguồn mở. Khi một yêu cầu từ trình tự khách đƣợc gởi đến Apache phải trải qua một loạt nhiều giai đoạn xử lý để cuối cùng trả về kết quả cho ngƣời dùng. Apache có một chế độ bảo mật đáng tin cậy. Quy trình làm việc của Apache cho phép ngƣời dùng thêm mới những module cần thiết vào bất kỳ giai đoạn nào của quá trình xử lý. Apache 1.3.24 là phiên bản đƣợc sử dụng trong khóa luận này, có thể tải phiên bản này từ địa chỉ ( 3.1.5. Ngôn ngữ lập trình Perl và các gói sử dụng Trình phiên dịch Perl phiên bản 5.6 DBI: version 1.37 32 DBD::MySQL version 2.9002 CGI.pm version 2.752 Các gói này đƣợc cài đặt thông qua ppm trong Perl. 3.1.6. Chƣơng trình thiết kế mồi Primrose 2.17 Primrose là một chƣơng trình máy tính dùng để thiết kế các mẫu dò (probe) hoặc đoạn mồi (primer) cho phản ứng PCR. Mặc dù chủ yếu sử dụng dữ liệu trình tự rRNA trong tiểu đơn vị nhỏ của ribosome, Primrose vẫn có thể thiết kế các mẫu dò hay mồi cho nhiều gene khác. Có thể tải chƣơng trình này về từ địa chỉ trang web sau: Để thiết kế một mồi hoặc probe phải trải qua bốn bƣớc chính. – Xây dựng CSDL: tạo một CSDL trình tự từ một hoặc nhiều file trình tự. – Chọn trình tự đích: chỉ ra các trình tự trong CSDL mà mồi hoặc mẫu dò đƣợc tạo ra từ các trình tựu này. – Tạo mẫu dò hoặc mồi: tìm ra các đoạn oligonucleotide mà có thể bắt đƣợc với trình tự đích. – Kiểm tra các mẫu dò hay mồi trên CSDL: kiểm tra tất cả các mẫu dò hay mồi tạo đƣợc trên CSDL trình tự để tìm mồi hoặc mẫu dò tốt nhất. Những mẫu dò hay mồi tốt nhất bắt cặp nhiều nhất với trình tự đích và bắt cặp ít nhất với trình tự không mong muốn. 33 3.2. PHƢƠNG PHÁP 3.2.1. Thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene 16S và 23S rRNA Sơ đồ tóm tắt quá trình thu nhận nhƣ sau: Sơ đồ tóm tắt quá trình thu nhận mẫu tin của hai gene 16S và 23S rRNA Các bƣớc thực hiện cụ thể nhƣ sau: – Từ trình duyệt web ta vào trang Home Page của NCBI theo địa chỉ: . Trong khung Search chọn Nucleotide. – Nhập từ khóa tìm kiếm trong khung for Từ khóa sử dụng lần lƣợt cho từng gene là:„16S ribosomal RNA gene complete sequence NOT 23S‟ và „23S ribosomal RNA gene complete sequence NOT 16S‟ – Nhấn nút Go hoặc Enter để tìm kiếm. Dùng Perl script tải về tất cả các trình tự có ACCESSION NUMBER của hai gene 16S và 23S rRNA TỪ KHÓA ACCESSION NUMBER NCBI Toàn bộ thông tin về trình tự gene 16S và 23S rRNA 34 Hình 3.1. Tìm kiếm bằng từ khóa trong trang Home Page của NCBI Kết quả tìm kiếm đƣợc trình bày nhƣ hình sau Hình 3.2. Trang kết quả tìm kiếm bằng từ khóa cho gene 16S rRNA – Trong khung Show thay Send to bằng Text 35 Hình 3.3. Kết quả tìm kiếm thể hiện ở dạng text – Chỉ chọn những mã số truy cập có phần tóm tắt phía dƣới là “complete sequence”, không lấy những mã số truy cập có phần tóm tắt là “partial sequence”. – Dùng ngôn ngữ Perl để viết script tách lấy tất cả mã số truy cập và lƣu vào một file dạng (.txt) Hình 3.4. File text chứa mã số truy cập – Từ những mã số truy cập tách đƣợc ở bƣớc trên viết script kết nối với CSDL GenBank, tải về những mẫu tin chứa trình tự và thông tin liên quan của gene. 36 Tất cả các mẫu tin tải về đƣợc lƣu trong hai thƣ mục tƣơng ứng cho hai gene. Hình 3.5. Tất cả mẫu tin của gene 16S rRNA 37 Chi tiết một mẫu tin thu đƣợc nhƣ hình dƣới đây Hình 3.6. Một mẫu tin của gene 16S rRNA có mã số truy cập AB016268 LOCUS AB016268 1524 bp DNA linear BCT 10-MAY-2000 DEFINITION Alteromonas sp. gene for 16S rRNA, strain NIBH P3M26, complete sequence. ACCESSION AB016268 VERSION AB016268.1 GI:6691642 KEYWORDS 16S rRNA; 16S ribosomal RNA. SOURCE Alteromonas sp. ORGANISM Alteromonas sp. Bacteria; Proteobacteria; Gammaproteobacteria; Alteromonadales; Alteromonadaceae; Alteromonas. REFERENCE 1 (sites) AUTHORS Maruyama,A., Honda,D., Yamamoto,H., Kitamura,K. and Higashihara,T. TITLE Phylogenetic analysis of psychrophilic bacteria isolated from the Japan Trench, including a description of the deep-sea species Psychrobacter pacificensis sp. nov JOURNAL Int. J. Syst. Evol. Microbiol. 50 Pt 2, 835-846 (2000) PUBMED 10758895 REFERENCE 2 (bases 1 to 1524) AUTHORS Maruyama,A. and Kitamura,K. TITLE Direct Submission JOURNAL Submitted (16-JUL-1998) Akihiko Maruyama, National Institute of Bioscience and Human-Technology, Department of Applied and Environmental Microbiology; 1-1 Higashi, Tsukuba, Ibaraki 305-8566, Japan (E-mail:maruyama@nibh.go.jp, Tel:+81-298-54-6062, Fax:+81-298-54-6412) FEATURES Location/Qualifiers source 1..1524 /organism="Alteromonas sp." /mol_type="genomic DNA" /strain="NIBH P1M3" /db_xref="taxon:232" rRNA 1..1524 /product="16S ribosomal RNA" ORIGIN 1 agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc 61 ggtaacagaa agtagcttgc tactttgctg acgagcggcg gacgggtgag taatgcttgg 121 gaacatgcct tgaggtgggg gacaacagtt ggaaacgact gctaataccg cataatgtct 181 acggaccaaa gggggctcgc tctcgccttt agattggccc aagtgggatt agctagttgg 241 tgaggtaatg gctcaccaag gcaacgatcc ctagctggtt tgagaggatg accagccaca 301 ctggaactga gacacggtcc agactcctac gggaggcagc agtggggaat attgcacaat 361 gggcgaaatg atgcagccat gccgcgtgtg tgaagaaggc cttcgggttg taaagcactt 421 tcagtcagga ggaaagggtg tnagttaata cctcatatct ntgacgttac tgacagaaga 481 agcaccggct aactccgtgc cagcagccgc ggtaatacgg agggtgcgag cgttaatcgg 541 aattactggg cgtaaagcgt acgcaggcgg tttgttaagc gagatgtgaa agccccgggc 601 tcaacctggg aactgcattt cgaactggca aactagagtg tgatagaggg tggtagaatt 661 tcaggtgtag cggtgaaatg cgtagagatc tgaaggaata ccgatggcga aggcagccac 721 ctgggtcaac actgacgctc atgtacgaaa gcgtggggag caaacgggat tagatacccc 781 ggtagtccac gccgtaaacg atgtctacta gaagctcgga acctcggttc tgtttttcaa 841 agctaacgca ttaagtagac cgcctgggcg agtacggccg caaggttaaa actcaaatgg 901 attgacgggg gcccgcacaa gcggtggagc atgtngttta attcgatgca acgcgaagaa 961 ccttacctac acttgacata cagagaactt tctagagata gattggtgcc ttcgggaact 1021 ctgatacagg tgctgcatgg ctgtcgtcag ctcgtgttgt gagatgttgg gttaagtccc 1081 gcaacgagcg caacccctat ccttagttgc tagcaggtaa tgctgagaac tctaaggaga 1141 ctgccggtga taaaccggag gaaggtgggg acgacgtcaa gtcatcatgg cccttacgtg 1201 tagggctaca cacgtgctac aatggcgcat acagagtgct gcgaacctgc gaaggtaagc 1261 gaatcactta aagtgcgtcg tagtccggat tggagtctgc aactcgactc catgaagtcg 1321 gaatcgctag taatcgcgta tcagaatgac gcggtgaata cgttcccggg ccttgtacac 1381 accgcccgtc acaccatggg agtgggttgc tccagaagta gatagtctaa ccctcgggag 1441 gacgtttacc acggagtatt catgactggg gtgaagtcgt aacaaggtag ccctagggga 1501 acctggggtt ggatcacctc ctta // 38 3.2.3. Thiết kế CSDL gene 16S và 23S rRNA 3.2.3.1. Phân tích dữ liệu Dữ liệu về trình tự nucleotide của gene 16S và 23S rRNA gồm có hai thực thể chính cần quan tâm là Trình tự (Sequence) và Sinh vật (Organism). Nhƣ vậy, ta có thể xác định đƣợc sơ đồ đối tƣợng nhƣ sau: Sơ đồ các đối tượng chính trong CSDL hai gene 16S và 23S rRNA Bảng 3.1. Các đối tượng phụ dựa trên đối tượng chính sinh vật (Organism) Tên đối tƣợng Ý nghĩa của đối tƣợng Thuộc tính Ý nghĩa của thuộc tính Organism Chứa các đặc điểm về các loài, thông tin về quan hệ họ hàng Organism_name Chứa tên của các loài vi khuẩn Nucleic acid Mô tả về trạng thái DNA và kích thƣớc genome Taxonomy Đặc điểm phân loại học Acc Chứa số truy cập trên NCBI Acc_no Các số truy cập Mối quan hệ của các thông tin này là: một sinh vật có thể có nhiều gene (mỗi trình tự thì chỉ có một accession number) và một sinh vật có những đặc điểm (phân loại…) riêng biệt. Sinh vật Trình tự có 39 Bảng 3.2. Các đối tượng phụ dựa trên đối tượng chính trình tự (sequence) Mối quan hệ của các thông tin này là một trình tự của đối tƣợng Sequence chỉ có một accession number, một thông tin chung về trình tự đó. Nhƣng có một hay nhiều tác giả cũng nhƣ một hay nhiều bài báo về trình tự đó. 3.2.3.2. Thiết kế CSDL dạng bảng Theo các mô tả trong mô hình đối tƣợng, ta chuyển từ mô hình đối tƣợng sang mô hình quan hệ nhƣ sau: – Mỗi đối tƣợng trong mô hình đối tƣợng là một quan hệ trong mô hình quan hệ. – Mỗi thuộc tính trong mô hình đối tƣợng là thuộc tính trên quan hệ tƣơng ứng. – Khóa của đối tƣợng là khóa của quan hệ tƣơng ứng. Tạo các quan hệ nhƣ sau: 1:1 đặt khóa chính của quan hệ thứ nhất thành khóa ngoại của quan hệ thứ hai và ngƣợc lại. Tên đối tƣợng Ý nghĩa của đối tƣợng Thuộc tính Ý nghĩa của thuộc tính Gene_seq Chứa trình tự nucleotide Gene_name Chứa tên trình tự nucleotide Gene_seq Chứa trình tự nucleotide Length Chứa chiều dài của gene Accession number Chứa số truy cập của các trình tự trong CSDL Acc_no Là các số truy cập NCBI Các thông tin chung cho trình tự Các thông tin về tác giả giải trình tự và những bài báo của tác giả về các trình tự đó Definition Định nghĩa của trình tự Pubday Ngày công bố trình tự Author Tác giả của trình tự Title Bài báo của tác giả về trình tự Journal Tạp chí đăng tải bài báo 40 1: n đặt khóa chính của quan hệ ở đầu một thành khóa ngoại của quan hệ ở đầu n. Ta có sơ đồ chi tiết của các bảng quan hệ nhƣ sau: Sơ đồ chi tiết các bảng quan hệ Bƣớc tiếp theo là thiết kế các bảng này ở mức vật lý, nghĩa là đƣa vào hệ quản trị CSDL quan hệ MySQL bằng các ngôn ngữ truy vấn SQL nhƣ tạo CSDL, tạo bảng… 1 1 1 1 1 1 1 ACCS_TABLE acc_id acc_no species_id gi DEFINITION_TABLE definition_id definition seq_id SPECIES_TABLE species_id species SEQS_TABLE seq_id seq length acc_id gene_id NCBI_TABLE ncbi_id author title journal pub_day seq_id TAXONOMY_TABLE taxonomy_id taxonomy seq_id GENE_TABLE gene_id gene_name seq_id n 1 1 1 1 41 Hình 3.7. Thiết kế CSDL ở mức vật lý 3.2.3.3. Lƣu trữ các thông tin vào CSDL Sau khi CSDL đƣợc thiết kế ở mức vật lý, ta thực hiện việc đƣa các dữ liệu vào CSDL. Công việc này đƣợc thực hiện tự động cùng một lúc tất cả các quan hệ bằng Perl script và thông qua hai gói DBI, DBD::MySQL để kết nối với CSDL. – Lƣu trữ các trình tự, thông tin chung, tác giả và bài báo… Một mẫu tin về trình tự gene 16S hay 23S rRNA đƣợc trình bày nhƣ Hình 3.6. ta có thể rút trích các thông tin trong mẫu tin để đƣa vào CSDL. Trong phần LOCUS: lấy ngày tháng “02-MAR-2000 “ cho vào trƣờng pubday trong bảng ncbi_table, lấy chiều dài “1524” cho vào trƣờng length trong bảng seqs_table. Trong phần DEFINITION: lấy toàn bộ phần này cho vào trƣờng definition trong bảng definition_table. Phần ACCESSION: lấy số truy cập này cho vào trƣờng acc_no của bảng accs_table. Phần ORGANISM: tách lấy dòng đầu tiên để cho vào trƣờng species trong bảng species_table và các dòng còn lại cho vào trƣờng taxonomy trong bảng taxonomy_table. 42 Phần AUTHOR, TITLE, JOURNAL lần lƣợt cho vào trƣờng author, title, journal của bảng ncbi_table. Phần ORIGIN: cho vào trƣờng seq của bảng seqs_table. – Lƣu trữ thông tin trong bảng gene_name Vì chúng ta xây dựng CSDL cho 2 gene 16S rRNA và 23S rRNA nên trong trƣờng gene_name ở bảng gene_table ta sẽ có 2 thông tin đó là “16S rRNA” và “23S rRNA” và trƣờng gene_id là “1” cho gene 16S rRNA và “2” cho gene 23S rRNA. 3.2.4. Tích hợp CSDL gene 16S rRNA và 23S rRNA với trang web Nhằm mục đích cung cấp giao diện cho ngƣời sử dụng truy xuất thông tin, chia sẻ CSDL trực tuyến, CSDL gene 16S rRNA và 23S rRNA đƣợc tích hợp với web bằng giao thức CGI. Bên cạnh đó, việc tích hợp với web cũng nhằm cung cấp một vài công cụ phân tích trình tự sinh học để hỗ trợ cho việc truy xuất thông tin tốt hơn. Tiến trình ngƣời sử dụng lấy thông tin từ CSDL về hai gene trên đƣợc thực hiện ở hình 3.6 gồm các bƣớc nhƣ sau: Thông qua giao thức truyền siêu văn bản HTTP, trình chủ web Apache nhận thông tin từ yêu cầu trình duyệt, sau đó xử lý và chuyển đến script CGI. Từ yêu cầu đƣa vào, sử dụng ngôn ngữ truy vấn SQL và các hàm trong module DBI, DBD::MySQL để lấy kết quả trong CSDL của hai gene trên. Kết quả đƣợc script CGI chuyển đến trình chủ Apache. Sau đó Apache chuyển thông tin kết quả lên trình duyệt của ngƣời sử dụng. Hình 3.8. Tiến trình lấy thông tin từ CSDL hai gene ở vi khuẩn 3.3. Thiết kế mồi cho phản ứng PCR phát hiện vi khuẩn viêm màng não Chúng tôi sử dụng trình tự của gene 16S và 23S rRNA để thiết kế mồi thông qua chƣơng trình thiết kế mồi Primrose, cụ thể để phát hiện Streptococcus pneumoniae (tác nhân chiếm khoảng 17%) trong nhóm các vi khuẩn viêm màng não mủ. Trình duyệt client CSDL HAI GENE Trình chủ web Apache * Nhận và xử lý yêu cầu * Tƣơng tác CSDL * Trả kết quả PERL DBI, CGI DBD::MySQL Kết quả Yêu cầu 43 3.3.1 Thiết kế mồi dựa trên trình tự gene 16S rRNA Từ cửa sổ chính của chƣơng trình Primrose thực hiện từng bƣớc cụ thể nhƣ sau – Tạo CSDL: Đƣa vào các file chứa trình tự của tất cả các vi khuẩn viêm màng não mủ ở định dạng fasta (.fas). Hình 3.9. Tạo CSDL trình tự gene 16S rRNA ở các vi khuẩn viêm màng não – Chọn trình tự đích: ở đây chúng ta muốn phát hiện Streptococcus pneumoniae nên chọn trình tự đích là file Strepcococcus pneumoniae.fas Hình 3.10. Chọn trình tự đích trong thiết kế mồi phát hiện Streptococcus pneumoniae dựa trên gene 16S rRNA. – Tạo mồi: chúng ta xác định các thông số nhƣ chiều dài mồi, số base đƣợc cho phép biến đổi trong mồi…Chọn thẻ “Find oligonucleotide” để chƣơng trình tìm ra các mồi có thể có. 44 Hình 3.11. Xác định các thông số cho mồi và số lượng mồi được tạo ra trên trình tự đích 16S rRNA – Kiểm tra lại tất cả các mồi với các trình tự trong CSDL đƣợc tạo ở bƣớc đầu tiên. Chƣơng trình sẽ loại bỏ các mồi bắt cặp với trình tự ngoài trình tự đích và trình bày danh sách các mồi thích hợp. Hinh 3.12. Danh sách các mồi thiết kế được trên 16S rRNA Việc tổ hợp các mồi đơn này thành một cặp mồi để thực hiện các phản ứng PCR phụ thuộc vào nhiều yếu tố nhƣ chiều dài sản phẩm PCR, tính chuyên biệt của cặp mồi và sự tƣơng thích giữa hai mồi… Ở đây chúng tôi chọn một cặp mồi cho đoạn sản phẩm có kích thƣớc vào khoảng 300-400 bp. 45 Mồi xuôi: đoạn oligonnucleotide 68 trong danh sách. Forward primer 16S 5‟-AGAGGGGAGAGTGGAATTCC-3‟(sense) Mồi ngƣợc: đoạn oligonnucleotide 166 Reverse primer 16S 5‟-TTGACATCCCTCTGACSRCT-3‟ (sense) Trong đó S = (G hoặc C) R = (A hoặc G) Nhấp đúp chuột vào trình tự từng mồi để biết đƣợc các thông tin chi tiết nhƣ vị trí bắt cặp của mồi trên trình tự đích, số base trong mồi không bắt cặp (mismatch)… Hình 3.13. Vị trí bắt cặp của mồi xuôi trên trình tự đích 16S rRNA 46 Hình 3.14. Vị trí bắt cặp của mồi ngược trên trình tự đích 16S rRNA Kiểm tra lại sự bắt cặp của cặp mồi này trên trình tự đích Hinh 3.15. Kiểm tra sự bắt cặp của mồi ngược và mồi xuôi trên trình tự đích 16S rRNA 47 Hình 3.16. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngược trên trình tự đích gene 16S rRNA 3.3.2. Thiết kế mồi dựa trên trình gene 23S rRNA – Tạo CSDL: chọn các file trình tự gene 23S rRNA ở vi khuẩn viêm màng não mủ. – Xác định trình tự đích: tƣơng tự nhƣ ở gene 16S rRNA ta chọn trình tự gene 23S rRNA ở Streptococcus pneumoniae. – Các bƣớc tạo mồi, kiểm tra mồi tƣơng tự các bƣớc đã tiến hành cho gene 16S rRNA. Sau khi kiểm tra loại bỏ các mồi bắt cặp với trình tự ngoài trình tự đích (gene 23S rRNA ở Streptococcus pneumoniae) ta có danh sách các mồi phù hợp 48 Hình 3.17. Danh sách các mồi thiết kế được cho trình tự gene 23S rRNA ở Streptococcus pneumoniae Chúng tôi chọn một cặp mồi cho đoạn sản phẩm có kích thƣớc vào khoảng 300-400 bp. Mồi xuôi: đoạn oligonnucleotide 190 trong danh sách. Forward primer 23S 5‟- AAGCGATTGCCTTAGTAGCG -3‟(sense) Mồi ngƣợc: đoạn oligonnucleotide 426 Reverse primer 23S 5‟- CGGGAGGGGAGTGAAATAGA-3‟ (sense) Nhấp đúp chuột vào trình tự từng mồi để biết đƣợc các thông tin chi tiết nhƣ vị trí bắt cặp của mồi trên trình tự đích, số base trong mồi không bắt cặp (mismatch),… 49 Hình 3.18. Vị trí bắt cặp của mồi xuôi trên trình tự đích 23S rRNA Hình 3.19. Vị trí bắt cặp của mồi ngược trên trình tự đích 23S rRNA Kiểm tra lại sự bắt cặp của cặp mồi tổ hợp với trình tự đích (gene 23S rRNA trên Streptococcus pneumoniae) 50 Hình 3.20. Kiểm tra sự bắt cặp của mồi ngược và mồi xuôi trên trình tự đích 23S rRNA Hình 3.21. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngược trên trình tự đích gene 23S rRNA 51 3.3.3. Nhiệt độ nóng chảy của mồi Sử dụng chƣơng trình TmCheck đi kèm trong Primrose để tính nhiệt độ nóng chảy của mồi theo phƣơng pháp “Nearest Neighbour”. Hình 3.22. Tính nhiệt độ nóng chảy của mồi xuôi 16S Tƣơng tự ta tính nhiệt độ nóng chảy của mồi còn lại. 52 PHẦN 4: KẾT QUẢ VÀ THẢO LUẬN 4.1. Kết quả thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene 16S và 23S rRNA Sau khi thực hiện các bƣớc tìm kiếm bằng từ khóa, tách mã số truy cập, viết mã script tải các mẫu tin trên trang NCBI. Kết quả chúng tôi đã thu nhận đƣợc 2825 mẫu tin chứa trình tự và thông tin liên quan đến gene 16S rRNA và 305 mẫu tin liên quan đến gene 23S rRNA. 4.2. CSDL gene 16S và 23S rRNA CSDL chứa 1616 loài vi khuẩn, 2825 trình tự gene 16S rRNA và 305 trình tự gene 23S rRNA. Trong CSDL ngoài hai đối tƣợng chính thì còn chứa đối tƣợng phụ nhằm cung cấp các thông tin khác để bổ sung cho hai đối tƣợng chính nhƣ: tên tác giả, tên bài báo, phân loại… CSDL về hai gene 16S rRNA và 23S rRNA, rất tiện ích cho việc truy xuất, nghiên cứu các thông tin liên quan đến trình tự DNA, các đặc trƣng của từng loài chứa hai gene này, tiết kiệm thời gian tìm hiểu, nắm bắt thông tin nhanh. CSDL này đƣợc xây dựng trên hai gene khá bảo tồn ở vi khuẩn nên chúng ta có thể dựa vào các thông tin trong CSDL để nghiên cứu các hiện tƣợng biến chủng trong họ, giúp đƣa ra các kết luận chính xác về các biến chủng xảy ra ở trên hai gene này. Nhƣng CSDL nhỏ, chứa lƣợng thông tin ít và chƣa có chế độ bảo mật. Ở cấp độ phòng thí nghiệm, cơ quan nghiên cứu hay trƣờng đại học thì việc xây dựng CSDL cho từng đối tƣợng (về một gene, một sinh vật…) thì rất tiện ích để phục vụ cho các nghiên cứu về một đối tƣợng nhất định. 4.3. Trang web thể hiện thông tin CSDL gene 16S và 23S rRNA. Sơ đồ các trang web CSDL gene 16S và 23S rRNA nhƣ sau: 53 Sơ đồ cấu trúc các trang web thể hiện thông tin CSDL gene 16S và 23S rRNA 16S and 23S rRNA gene DATABASE WEB PAGE HOME PAGE ABOUT PAGE LINK PAGE TOOL PAGE BLAST ALIGNMENT SEARCH PAGE SPECIES ACCESSION NUMBER MENINGITIDIS 54 4.3.1. Trang thông tin chung về CSDL gene 16S và 23S rRNA (Home Page) – Nội dung trang web: thể hiện số lƣợng trình tự của từng gene chứa trong CSDL. Từ trang Home Page này có thể xem tất cả các thông tin tổng quát của từng gene bằng cách nhấp chuột vào các liên kết đến từng trang CSDL 16S rRNA hoặc 23S rRNA. – Hình thức thể hiện (Hình 4.1) Hình 4.1. Trang Home Page 55 4.3.2. Trang tìm kiếm (Search Page) Cung cấp cho ngƣời dùng 2 công cụ tìm kiếm trình tự và các thông tin liên quan của 2 gene có trong CSDL. – Trang tìm kiếm khi biết mã số truy cập (accession number) Ngƣời dùng có thể nhập một hoặc nhiều mã số này, để tìm các trình tự nucleotide có mã số tƣơng ứng (Hình 4.2). Ngƣời dùng có thể tùy chọn các phần sẽ hiển thị trong kết quả tìm kiếm nhƣ phần định nghĩa trình tự (definition), tên loài (species), chiều dài của trình tự cần tìm (Hình 4.3) Hình 4.2. Trang tìm kiếm theo mã số truy cập (accession number) 56 Hình 4.3. Trang kết quả tìm kiếm bằng mã số truy cập – Trang tìm kiếm khi biết tên loài (species name) Tất cả tên của vi khuẩn có trong CSDL đƣợc thể hiện trong menu SPECIES NAME(s). Chúng ta có thể chọn một hoặc nhiều tên để tìm kiếm trình tự và các thông tin liên quan đến gene 16S và 23S rRNA ở sinh vật đó (Hình 4.4). Ngƣời dùng có thể tùy chọn các phần sẽ hiển thị trong kết quả tìm kiếm (Hình 4.5). 57 Hình 4.4. Trang tìm kiếm theo tên loài (species name) Hình 4.5. Trang kết quả tìm kiếm theo tên loài (species name) 58 4.3.3. Trang công cụ (Tool Page) – Nội dung trang web: trang này cung cấp hai công cụ chủ yếu để phân tích trình tự sinh học, đó là sắp gióng cột (alignment) và tìm kiếm trình tự tƣơng đồng (BLAST). Sắp gióng cột (alignment) hai hay nhiều trình tự là một công cụ khá thông dụng để khảo sát sự tƣơng đồng, đột biến, nghiên cứu chức năng của gene. Mặt khác để tìm trình tự tƣơng đồng với một trình tự quan tâm, các nhà sinh học thƣờng sử dụng công cụ BLAST. Do nhu cầu đó, chúng tôi đã tích hợp hai công cụ này vào trang web CSDL gene 16S và 23S rRNA. – Hình thức thể hiện: Với công cụ Alignment: ngƣời sử dụng có thể nhập vào một hay nhiều trình tự DNA thông qua ô nhập văn bản hay một tập tin chứa trình tự DNA dƣới định dạng FASTA. Chọn một hay nhiều trình tự trong CSDL gene 16S và 23S rRNA để thực hiện sắp gióng cột (có thể thực hiện Alignment giữa các gene trong CSDL) (Hình 4.6). Hình 4.6. Trang công cụ sắp gióng cột (Alignment) 59 Hình 4.7. Trang kết quả sắp gióng cột hai trình tự Với công cụ BLAST: ngƣời dùng có thể nhập vào một trình tự DNA. Trình tự này sẽ đƣợc so sánh tƣơng đồng cục bộ với CSDL của trình tự gene 16S và 23S rRNA. (Hình 4.8). Hình 4.8. Trang công cụ BLAST 60 4.3.4. Trang Meningitidis – Nội dung trang web: liệt kê các vi khuẩn viêm màng não mủ. Ngƣời dùng có thể chọn một hoặc nhiều trình tự của các vi khuẩn này cho việc thiết kế mồi. – Hình thức thể hiện: Hình 4.9 Hình 4.9. Trang Meningitidis 4.4. Kết quả thiết kế mồi phát hiện các tác nhân viêm màng não mủ Theo các bƣớc tiến hành nhƣ phần 3.3. chúng ta thu đƣợc hai cặp mồi cho phản ứng PCR phát hiện Streptococcus pneumoniae dựa trên hai gene 16S và 23S rRNA. Tuy nhiên các mồi ngƣợc đều đƣợc viết theo chiều 5‟-3‟ trên sợi sense. Do đó, chúng ta phải chuyển các mồi này theo chiều 5‟-3‟ trên sợi antisense bằng cách dịch sang trình tự ngƣợc và bổ sung (Reverse complement). Trình tự các cặp mồi thiết kế đƣợc cho từng gene nhƣ sau Gene 16S rRNA Gene 23S rRNA F 5‟-3‟sense AGAGGGGAGAGTGGAATTCC AAGCGATTGCCTTAGTAGCG R 5‟-3‟antisense AGYSGTCAGAGGGATGTCAA TCTATTTCACTCCCCTCCCG Trong đó S = (C hoặc G) Y = (T hoặc C) So sánh cặp mồi cho gene 16S rRNA với cặp mồi cho gene 23S rRNA – Tính chuyên biệt Kết quả bắt cặp của cặp mồi 16S rRNA với trình tự đích và trình tự ngoài vùng đích. 61 Hình 4.10. Sự bắt cặp của cặp mồi 16S rRNA trên trình tự đích và trình tự ngoài vùng đích Hình 4.11. Sự bắt cặp của cặp mồi 23S rRNA trên trình tự đích và trình tự ngoài vùng đích 62 Nếu có 0 đến 2 mismatch: hai cặp mồi bắt cặp hoàn toàn với vùng đích (target). Nếu có trên 2 mismatch: số lƣợng trình tự ngoài vùng đích (non-target) mà hai mồi có khả năng bắt cặp tăng lên. Tuy nhiên, số lƣợng trình tự này ở cặp mồi cho gene 16S rRNA lớn hơn rất nhiều so với cặp mồi cho gene 23S rRNA. Điều này có nghĩa là tính chuyên biệt của cặp mồi gene 16S rRNA thấp hơn cặp mồi cho gene 23S rRNA. – Sự tƣơng thích giữa mồi ngƣợc và mồi xuôi trong từng cặp mồi Theo việc tính toán nhiệt độ nóng chảy (Tm) đã thực hiện ở mục 3.3.3. ta tính đƣợc nhiệt độ nóng chảy cho các mồi còn lại. Mồi Tm ( o C) %GC Forward primer 16S 51,3 55 Reverse primer 16S 47,5 52,5 Forward primer 23S 52,6 50 Reverse primer 23S 53,5 55 – Nhiệt độ bắt cặp (Tanneal = Tm – 4) thể hiện sự tƣơng thích giữa hai mồi. Sự chênh lệch giữa Tanneal của mồi ngƣợc và mồi xuôi thích hợp là 3 oC. Nhiệt độ bắt cặp của hai mồi càng gần nhau thì phản ứng PCR diễn ra càng tốt. Chênh lệch nhiệt độ bắt cặp (ΔTanneal) giữa mồi xuôi và mồi ngƣợc trong từng cặp mồi: ΔTanneal 16S = 51,3 – 47,5 = 3,8 ( o C) ΔTanneal 23S = 53,5 – 52,6 = 0,9 ( o C) Suy ra ΔTanneal 16S > ΔTanneal 23S Vậy sự tƣơng thích giữa mồi xuôi và mồi ngƣợc trong cặp mồi cho gene 23S rRNA tốt hơn trong cặp mồi cho gene 16S rRNA. Từ sự so sánh trên ta có thể thấy việc sử dụng trình tự gene 23S rRNA để thiết kế mồi cho phản ứng PCR phát hiện Streptococcus pneumoniae trong nhóm vi khuẩn viêm màng não tốt hơn so với chọn trình tự gene 16S rRNA. 63 PHẦN 5: KẾT LUẬN VÀ ĐỀ NGHỊ 5.1. KẾT LUẬN – Chúng tôi đã tải đƣợc 3130 trình tự gene 16S và 23S rRNA từ cơ sở dữ liệu NCBI. Trong đó có 2825 trình tự gene 16S rRNA và 305 trình tự gene 23S rRNA. – CSDL có 3130 trình tự đƣợc tích hợp với web – Trang web CSDL gene 16S và 23S rRNA gồm có 5 trang chính, đó là HOME, SEARCH, TOOL, LINK, ABOUT PAGE. Ngoài ra, từ những trang web chính này còn có thể kết nối đến những trang phụ khác để cung cấp những tiện ích cho ngƣời dùng. Từ các trang web này, ngƣời sử dụng có thể truy xuất thông tin, so sánh một trình tự quan tâm với các trình tự trong cơ sở dữ liệu gene 16S và 23S rRNA, tìm kiếm trình tự, các đặc tính của loài… – Thiết kế đƣợc các primer phục vụ cho phản ứng PCR phân biệt các loài vi khuẩn gây bệnh viêm màng não thông qua chƣơng trình thiết kế mồi Primrose 2.17. 5.2. ĐỀ NGHỊ – Bổ sung các thông tin về trình tự gene, đặc tính của loài… Thông qua việc thu nhận các thông tin liên quan đƣợc đăng tải trên Internet hay các thông tin từ nghiên cứu của phòng thí nghiệm. – Xây dựng nhiều trang web chứa các thông tin và công cụ (enzyme cắt giới hạn, xây dựng mô hình cấu trúc, xây dựng cây phân loài…) phục vụ cho việc khai thác thông tin và các ứng dụng khác. – Tiến hành làm thực nghiệm với các cặp mồi trên để khẳng định ƣu điểm của cặp mồi đƣợc thiết kế dựa trên gene 23S rRNA. 64 PHẦN 6: TÀI LIỆU THAM KHẢO TÀI LIỆU TIẾNG VIỆT 1. CAO NGỌC PHƢỢNG, (2003). Tài liệu cơ sở dữ liệu. Đại học Khoa Học Tự Nhiên – Đại học Quốc Gia thành phố Hồ Chí Minh. 2. ĐẬU QUANG TUẤN, (2006). Thiết kế trang web bằng Front Page 2003 và Xara Webstyle. NXB GTVT. 3. HUỲNH THỊ NGỌC NHÂN, (2003). Xây dựng qui trình phát hiện đồng thời các vi khuẩn gây bệnh viêm màng não mủ Escherichia coli, streptococcus suis, Listeria monocytogenes bằng phƣơng pháp PCR. Luận văn tốt nghiệp cử nhân sinh học. Đại học Khoa Học Tự Nhiên – Đại học Quốc Gia thành phố Hồ Chí Minh. 4. LƢU PHÚC LỢI, (2004). Xây dựng cơ sở dữ liệu gene pbp (Penicililin binding protein) ở vi khuẩn Streptococcus pneumoniae. Luận văn tốt nghiệp cử nhân CNSH. Đại học Khoa Học Tự Nhiên – Đại học Quốc Gia thành phố Hồ Chí Minh. 5. TRẦN HIỀU THUẬN, (2003). Tài liệu lập trình Perl. Đại học Khoa Học Tự Nhiên – Đại học Quốc Gia thành phố Hồ Chí Minh. 6. VÕ CẨM QUY, (2003). Tài liệu soạn thảo web. Đại Học Khoa Học Tự Nhiên – Đại Học Quốc Gia Thành phố Hồ Chí Minh. TÀI LIỆU NƢỚC NGOÀI 7. JAMES TISDALL, (2001). Beginning Perl for bioinformatics. 1st edition, O‟Reilly & Associates, Inc. 468 pages. 8. JAMES TISDALL, (2001). Mastering Perl for bioinformatics. 1st edition, O‟Reilly & Associates, Inc. 369 pages. 9. KONRAD SACHES, DR. RER. NAT. JOACHIM FREY, Ph.D., (2003). Methods in Molecular Biology TM . PCR Detection of Microbial Pathogens. Humana press-Totowa New Jersey, p. 4-9 10. RINA UZUKA, HISASHI KAWASHIMA, (2004). Rapid diagnosis of bacterial meningitidis by using multiplex PCR and real time PCR. Pediatrics International 46, p. 551-554 11. R.M.ANTHONY, T.J.BROWN, AND G.L.FRENCH*, (2000). Rapid diagnosis of Bacteremia by Universal Amplification of 23S Ribosomal DNA Followed 65 by Hybridization to an Oligonucleotide Array. Journal of Clinical Microbiology, Feb. 2000, p. 781-788 12. VINCENT J.QUAGLIARELLO, M.D., AND MICHEAL SCHELD, M.D., (1997). Treatment of Bacterial Meningitidis. The New England Journal of Medicine, p. 708-716 13. Primrose 2.17. Dr K.E. Ashelford, 2006© Cardiff University. TÀI LIỆU TỪ CÁC TRANG WEB 14. 15. 16. 17. 18. 19. 20. 21. PHỤ LỤC PHỤ LỤC 1: MỘT SỐ TRANG WEB TRONG CSDL GENE 16S VÀ 23S rRNA Trang Link: Cung cấp liên kết đến các CSDL sinh học trực tuyến. Trang About: Giới thiệu về cấu trúc của ribosome, gene 16S và 23S rRNA, bệnh viêm màng não mủ. PHỤ LỤC 2: MỘT SỐ CSDL SINH HỌC VÀ ĐỊA CHỈ WEB TƢƠNG ỨNG STT Tổ chức Tên cơ sở dữ liệu Địa chỉ trang web 1 EBI ( c.uk/) EMBL-BANK TrEMBL MSD Ensembl ArrayExpress 2 NCBI ( nlm.nih.gov) OMIM GenBank Protein Genome MMDB Taxonomy dbSNP CDD Pubmed dbEST MỘT SỐ CSDL SINH HỌC VÀ ĐỊA CHỈ WEB TƢƠNG ỨNG (tiếp theo) STT Tổ chức Tên cơ sở dữ liệu Địa chỉ trang web 3 SIB ( y.org) SWISS-PROT SWISS-2DPAGE PROSITE ENZYME SWISS-3DIMAGE CD40L 4 CIB/DDBJ DDBj 5 Pdbj Pdbj 6 PDB PDB 7 wwPDB wwPDB

Các file đính kèm theo tài liệu này:

  • pdfLE VAN TAM - 02126088.pdf