• Luận văn Bài toán trích xuất thông tin cho dữ liệu bán cấu trúc và áp dụng xây dựng hệ thống tìm kiếm giá cả sản phẩmLuận văn Bài toán trích xuất thông tin cho dữ liệu bán cấu trúc và áp dụng xây dựng hệ thống tìm kiếm giá cả sản phẩm

    Trích xuất thông tin từ dữ liệu bán cấu trúc là một bài toán được sự quan tâm tại nhiều hội nghị lớn trên thế giới [9], [10], [12], [13]. Bài toán này là một thành phần không thể thiếu trong các ứng dụng về thu thập và trích xuất thông tin hiện nay. Một trong những ứng dụng đó là trích xuất thông tin của sản phẩm từ các trang thương mại điện tử để ...

    pdf70 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1522 | Lượt tải: 2

  • Luận văn Độ tương đồng ngữ nghĩa giữa hai câu và ứng dụng trong tóm tắt văn bảnLuận văn Độ tương đồng ngữ nghĩa giữa hai câu và ứng dụng trong tóm tắt văn bản

    Dữ liệu trên Internet được sinh ra liên tục mỗi ngày, lượng thông tin khổng lồ đó khiến người dùng trở nên bối rối do không đủ thời gian đọc tất cả văn bản. Tóm tắt văn bản tự động hiện đang là một bài toán được sự quan tâm nghiên cứu của nhiều nhà khoa học. Tóm tắt văn bản có thể được ứng dụng đểtóm tắt các bản tin với định dạng WAP hoặc SMS cho...

    pdf53 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1603 | Lượt tải: 1

  • Luận văn On the analysis of large Scale datasets towards online contextual advertising - Lê Diệu ThưLuận văn On the analysis of large Scale datasets towards online contextual advertising - Lê Diệu Thư

    With the rise of the internet, there came the rise of online advertising. It in turn has been playing a growing part in shaping and supporting the development of the Web. In contextual advertising, ad messages are displayed related to the content of the target page. It leads to the problem in information retrieval community: how to select the most ...

    pdf69 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1387 | Lượt tải: 2

  • Luận văn Social network analysis - Nguyễn Hữu Bình MinhLuận văn Social network analysis - Nguyễn Hữu Bình Minh

    Social network analysis is one of the most active topics in the central of research nowadays. It has been widely used in various domains such as sociology, biology, economics, as well as information science. From the very early start, researchers used the concept of centrality to analyze networks. In 1948, Bavelas [14] proposed the idea of centra...

    pdf44 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1976 | Lượt tải: 0

  • Luận văn Phân lớp câu hỏi hướng tới tìm kiếm ngữ nghĩa tiếng Việt trong lĩnh vực y tếLuận văn Phân lớp câu hỏi hướng tới tìm kiếm ngữ nghĩa tiếng Việt trong lĩnh vực y tế

    Cùng với sự ra đời của Web ngữnghĩa và các Ontology, nhu cầu tìm kiếm ngữ nghĩa ngày càng nhận được nhiều sự quan tâm trong cộng đồng nghiên cứu về khai phá dữ liệu Web/Text. Mặt khác, phân lớp câu hỏi là một trong những thành phần cơ bản nhưng quan trọng nhất trong kiến trúc tổng thể của hầu hết các máy tìm kiếm ngữ nghĩa. Đây cũng là thành phần c...

    pdf56 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1524 | Lượt tải: 0

  • Luận văn Khai phá dữ liệu trong thương mại điện tử và đưa ra phương pháp xây dựng hệ thống khuyến cáo sản phẩmLuận văn Khai phá dữ liệu trong thương mại điện tử và đưa ra phương pháp xây dựng hệ thống khuyến cáo sản phẩm

    Hiện nay, Thương mại điện tử phát triển nhanh theo xu thế toàn cầu hoá. Việc giao dịch thông qua các Website Thương mại điện tử tạo ra lượng dữ liệu vô cùng lớn. Dữ liệu này chính là thông tin về khách hàng cũng như các sản phẩm giao dịch. Nếu có thể khai thác được nguồn dữ liệu này thì chúng ta sẽ có một hệ thống thông tin rất giá trị phục vụ cho ...

    pdf55 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1855 | Lượt tải: 0

  • Luận văn Hash Based approach to data mining - Lê Kim ThưLuận văn Hash Based approach to data mining - Lê Kim Thư

    Using computer, people can collect data in many types. Thus, many applications to revealing valuable information have been considered. One of the most important matters is “to shorten run time” when database become bigger and bigger. Furthermore, we look for algorithms only using minimum required resources but are doing well when database become ve...

    pdf47 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1510 | Lượt tải: 0

  • Luận văn Phân lớp bán giám sát và ứng dụng thuật toán svm vào phân lớp trang webLuận văn Phân lớp bán giám sát và ứng dụng thuật toán svm vào phân lớp trang web

    Hiện nay, với một lượng lớn các dữ liệu thì phân lớp dữ liệu có vai trò rất quan trọng, là một trong những bài toán luôn thời sự trong lĩnh vực xử lý dữ liệu văn bản. Một yêu cầu cơbản được đặt ra là cần tăng tính hiệu quả của thuật toán phân lớp, nâng cao giá trị của các độ đo hồi tưởng, chính xác của thuật toán. Mặt khác, nguồn tài nguyên về ví d...

    pdf47 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1634 | Lượt tải: 2

  • Luận văn Phương pháp lọc thư rác dựa trên nội dungLuận văn Phương pháp lọc thư rác dựa trên nội dung

    Khóa luận trình bày một số nội dung cơ bản nhất về thư rác (khái niệm, tác hại, các hình thức phát tán thư rác.), tập trung định hướng tới các phương pháp lọc thư rác, đặc biệt là phương pháp lọc dựa trên nội dung. Trong các phương pháp lọc theo nội dung, khóa luận quan tâm mô tả, phân tích hệthống hệthống Email Classification Using Examples (ECU...

    pdf53 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 2227 | Lượt tải: 3

  • Luận văn Nghiên cứu mạng thư điện tử và ứng dụng trong lọc thư rác - Bùi Ngọc LanLuận văn Nghiên cứu mạng thư điện tử và ứng dụng trong lọc thư rác - Bùi Ngọc Lan

    Vấn đề thư rác từ lâu đã gây không ít phiền nhiễu cho người sử dụng thư điện tử và là vấn đề đau đầu của những người quản lý mạng. Có rất nhiều giải pháp chống thư rác đã được đưa ra và áp dụng trong thực tế. Tuy nhiên, các phương pháp này đều tỏ ra chưa thực sự hiệu quả và mang những nhược điểm cố hữu của nó. Trong luận văn này, trên cơ sở nghiên ...

    pdf64 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1537 | Lượt tải: 0