• Luận văn Sử dụng phương pháp xếp hạng trong bài toán phân cụm tiếng ViệtLuận văn Sử dụng phương pháp xếp hạng trong bài toán phân cụm tiếng Việt

    Cùng với sự gia tăng nhanh chóng về số lượng các trang Web thì nhu cầu về khai phá dữ liệu Web ngày càng nhận được sự quan tâm của các nhà khoa học và các nhóm nghiên cứu. Trong lĩnh vực khai phá Web thì phân cụm Web là một trong những bài toán cơ bản và quan trọng. Đây cũng là thành phần chịu nhiều ảnh hưởng của các đặc trưng ngôn ngữ.

    pdf55 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1616 | Lượt tải: 0

  • Luận văn Trích rút mối quan hệ ngữ nghĩa và áp dụng cho hệ thống hỏi đáp tự động tiếng ViệtLuận văn Trích rút mối quan hệ ngữ nghĩa và áp dụng cho hệ thống hỏi đáp tự động tiếng Việt

    Với sự ra đời và phát triển ngày càng mạnh mẽ trên World WideWeb đặt ra thách thức đòi hỏi việc khai thác thông tin một cách hiệu quả. Mặc dù chất lượng của các máy tìm kiếm đã được cải thiện nhưng kết quả trả về chỉ là những tài liệu có liên quan. Vì thế, hệ thống hỏi đáp ra đời là một nhu cầu cấp thiết, cung cấp cho người dùng câu trả lời ngắn gọ...

    pdf60 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1578 | Lượt tải: 2

  • Luận văn Trích chọn thuộc tính sản phẩm trong hệ thống mua bán trực tuyến tiếp cận khai phá luật kết hợpLuận văn Trích chọn thuộc tính sản phẩm trong hệ thống mua bán trực tuyến tiếp cận khai phá luật kết hợp

    Ngày nay, thương mại điện tử đã trở nên phổ biến đối với mọi người. Cùng với nó là sự ra đời của các trang web bán hàng trên mạng. Trên các trang web bán hàng trực tuyến thường có mục dành cho khách hàng đưa ra ý kiến, đánh giá của mình về sản phẩm và các dịch vụ liên quan. Với sự phát triển của thương mại điện tử, số lượng đánh giá mà một sản phẩm...

    pdf53 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1509 | Lượt tải: 0

  • Undergraduate thesis some studies on a probabilistic framework for finding object oriented information in unstructured dataUndergraduate thesis some studies on a probabilistic framework for finding object oriented information in unstructured data

    With the rise of the Internet, there is more and more information available on the web. Among this, there is a lot of structureddata embedded within web pages such as “an apartment with location, property type, price, bedrooms, bathrooms, area, direction”, etc. However, there lacks an efficient method to retrieval those information. Therefore, in...

    pdf52 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1751 | Lượt tải: 0

  • Đề tài Thiết kế mạng an toàn sử dụng PIX firewall cho trường Cao đẳng cơ khí luyện kimĐề tài Thiết kế mạng an toàn sử dụng PIX firewall cho trường Cao đẳng cơ khí luyện kim

    Công nghệ thông tin ngày nay được ứng dụng vào tất cả các lĩnh vực của cuộc sống. Có thể thấy máy tính và mạng internet là thành phần không thể thiếu của hầu hết các công ty, trở thành công cụ hỗ trợ đắc lực cho công việc hàng ngày và các giao dịch. Tuy nhiên, sự phát triển này cũng kèm theo vấn đề an ninh máy tính đang ngày càng trở nên nóng bỏn...

    doc78 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1755 | Lượt tải: 0

  • Luận văn So sánh một số phương pháp học máy cho bài toán gán nhãn từ loại tiếng Việt - Lê Hoàng QuỳnhLuận văn So sánh một số phương pháp học máy cho bài toán gán nhãn từ loại tiếng Việt - Lê Hoàng Quỳnh

    Mỗi từ trong một ngôn ngữ nói chung đôi khi có thểgắn với nhiều từloại và việc giải thích đúng nghĩa một từ phụ thuộc vào việc nó được xác định đúng từloại hay không. Công việc gán nhãn từ loại cho một văn bản là xác định từ loại của mỗi từ trong phạm vi văn bản đó, tức là phân loại các từ thành các lớp từ loại dựa trên thực tiễn hoạt động ngôn ngữ...

    pdf57 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1709 | Lượt tải: 0

  • Luận văn Trích chọn thông tin y tế tiếng Việt cho bài toán tìm kiếm ngữ nghĩaLuận văn Trích chọn thông tin y tế tiếng Việt cho bài toán tìm kiếm ngữ nghĩa

    Trích chọn thông tin y tế nhằm xây dựng được một tập dữ liệu tốt, đầy đủ để hỗ trợ việc tìm kiếm ngữ nghĩa đang là nhu cầu thiết yếu, nhận được sự quan tâm đặc biệt trong thời gian gần đây. Ontology là cách biểu diễn khái niệm, thuộc tính, quan hệ trong miền ứng dụng đảm bảo tính nhất quán và đủ phong phú. Xây dựng hệ thống trích chọn thông tin dựa...

    pdf67 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1610 | Lượt tải: 1

  • Luận văn Bài toán trích xuất thông tin cho dữ liệu bán cấu trúc và áp dụng xây dựng hệ thống tìm kiếm giá cả sản phẩmLuận văn Bài toán trích xuất thông tin cho dữ liệu bán cấu trúc và áp dụng xây dựng hệ thống tìm kiếm giá cả sản phẩm

    Trích xuất thông tin từ dữ liệu bán cấu trúc là một bài toán được sự quan tâm tại nhiều hội nghị lớn trên thế giới [9], [10], [12], [13]. Bài toán này là một thành phần không thể thiếu trong các ứng dụng về thu thập và trích xuất thông tin hiện nay. Một trong những ứng dụng đó là trích xuất thông tin của sản phẩm từ các trang thương mại điện tử để ...

    pdf70 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1569 | Lượt tải: 2

  • Luận văn Độ tương đồng ngữ nghĩa giữa hai câu và ứng dụng trong tóm tắt văn bảnLuận văn Độ tương đồng ngữ nghĩa giữa hai câu và ứng dụng trong tóm tắt văn bản

    Dữ liệu trên Internet được sinh ra liên tục mỗi ngày, lượng thông tin khổng lồ đó khiến người dùng trở nên bối rối do không đủ thời gian đọc tất cả văn bản. Tóm tắt văn bản tự động hiện đang là một bài toán được sự quan tâm nghiên cứu của nhiều nhà khoa học. Tóm tắt văn bản có thể được ứng dụng đểtóm tắt các bản tin với định dạng WAP hoặc SMS cho...

    pdf53 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1634 | Lượt tải: 1

  • Luận văn On the analysis of large Scale datasets towards online contextual advertising - Lê Diệu ThưLuận văn On the analysis of large Scale datasets towards online contextual advertising - Lê Diệu Thư

    With the rise of the internet, there came the rise of online advertising. It in turn has been playing a growing part in shaping and supporting the development of the Web. In contextual advertising, ad messages are displayed related to the content of the target page. It leads to the problem in information retrieval community: how to select the most ...

    pdf69 trang | Chia sẻ: vietpd | Ngày: 24/08/2013 | Lượt xem: 1420 | Lượt tải: 2