Luận văn Phương pháp biểu diễn ngữ nghĩa lân cận siêu liên kết cho máy tìm kiếm Vietseek
Thông qua việc khảo sát, phân tích, pháttriển nội dung của một số công trình nghiên cứu gần đây về bài toán biểu diễn và xử lý dữ liệu trang web, luận văn đã hoàn thành một số kết quả chính sau đây: •Đã trình bày tổng quan về bài toán tìm kiếm thông tin trên web (chương 1). Đã đã trình bày, khảo sát, phân tích, so sánh và đánh giá chất lượng một số phương pháp tiếp cận điển hình để giải quyết bài toán này (chương 2), •Thông qua việc khảo sát, phân tích, đánh giá từng phương pháp nói trên, luận văn đã: - Đề xuất một cách thức biểu diễn trang web theo ngữ nghĩa lân cận siêu liên kết làm cơ sở so sánh nộidung toàn văn văn bản và khai thác được ngữ nghĩa lân cận các siêu liên kết (mục 2.6). - Đề xuất một phương pháp giảm bớt số lần so sánh độ tương tự các trang web (mục 3.2). - Đề xuất một phương pháp tính cận trên của độ tương tự và cách thức xấp xỉ (cắt bớt nhánh xem xét), do đó giảm được đáng kể số phép tính phải thực hiện, làm tăng tốc độ thực hiện (mục 3.2). - Thông qua việc khảo sát dữ liệu của máy tìm kiếm tiếng Việt VietSeek, luận văn thiết kế các dữ liệu bổsung phù hợp với phương pháp biểu diễn mới và từ đó đề xuất bổ sung thêm chức năng tìm kiếm trang web có nội dung "gần" với nội dung trang web hiện thời (mục 3.3).
Các file đính kèm theo tài liệu này:
- MSc04_Dang_Tieu_Hung_Thesis.pdf