Hệ thống thích nghi cá nhân (adaptive system) - Luận văn, đồ án, luan van, do an

Hệ thống thích nghi cá nhân là các hệ thống cung cấp thông tin, tài nguyên hoặc các dịch vụ cho người dùng dựa vào đặc điểm của từng cá nhân [17]. Như vậy cùng một vấn đề, những người dùng khác nhau có thể sẽ nhận được những thông tin khác nhau tuỳ thuộc vào đặc trưng của từng người. Ví dụ trong lãnh vực tư vấn phim, mỗi người có thể được giới thiệu những phim khác nhau tuỳ theo sở thích của từng người, hay trong lĩnh vực truyvấn tài liệu, cùng một từ khoá khi truy vấn,

21 trang | Chia sẻ: vietpd | Lượt xem: 1578 | Lượt tải: 1

Bạn đang xem trước 20 trang tài liệu Hệ thống thích nghi cá nhân (adaptive system), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

30 CHƯƠNG 3 HỆ THỐNG THÍCH NGHI CÁ NHÂN (ADAPTIVE SYSTEM) 3.1 GIỚI THIỆU Hệ thống thích nghi cá nhân là các hệ thống cung cấp thông tin, tài nguyên hoặc các dịch vụ cho người dùng dựa vào đặc điểm của từng cá nhân [17]. Như vậy cùng một vấn đề, những người dùng khác nhau có thể sẽ nhận được những thông tin khác nhau tuỳ thuộc vào đặc trưng của từng người. Ví dụ trong lãnh vực tư vấn phim, mỗi người có thể được giới thiệu những phim khác nhau tuỳ theo sở thích của từng người, hay trong lĩnh vực truy vấn tài liệu, cùng một từ khoá khi truy vấn, mỗi người có thể nhận được những kết quả trả về khác nhau tuỳ thuộc vào lãnh vực người đó đang nghiên cứu hay quan tâm. Hay trong lãnh vực đào tạo trực tuyến, cùng một chủ đề, mỗi người học có thể nhận được nội dung bài học, các tài liệu liên quan, bài tập thực hành khác nhau tuỳ theo kiến thức đã có cũng như mục tiêu học của từng cá nhân. Trong khoảng một thập niên vừa qua, các hệ thống thích nghi cá nhân đã phát triển khá mạnh, được ứng dụng rộng rãi trong lãnh vực thương mại điện tử như âm nhạc, phim ảnh, sách báo,…. Tiếp theo sự thành công đó, sự thích nghi cá nhân cũng được phát triển sang các lãnh vực khác như truy vấn thông tin, thư viện số,… và cũng đã đạt được một số thành quả khả quan. Bên cạnh đó, sự thích nghi cá nhân cũng đã được nghiên cứu ứng dụng vào lãnh vực đào tạo trực tuyến, tuy nhiên việc ứng dụng vẫn còn hạn chế và chủ yếu là cho các khoá đào tạo ngắn hạn theo chuyên đề (xem chi tiết mục 2.3).[2] Trong những hệ thống thích nghi này, mỗi người sử dụng sẽ có một profile mô tả đặc trưng riêng của từng cá nhân. Tuỳ theo lãnh vực ứng dụng cũng như phương pháp khai thác, profile sẽ bao gồm những thông tin khác nhau mô tả về bản thân như: thông tin nhân khẩu (họ tên, tuổi, nghề nghiệp, …), sở thích, nhu cầu, mục tiêu, trình độ, nền tảng kiến thức, đánh giá của cá nhân trên sản phẩm, quá trình 31 giao tiếp với hệ thống,....Như vậy profile là thành phần quan trọng nhất trong hệ thống thích nghi và trong phần tiếp theo chúng tôi sẽ trình bày ba nội dung chính liên quan đến profile : tổ chức profile, cập nhật profile, khai thác profile. 3.2 TỔ CHỨC VÀ KHỞI TẠO PROFILE 3.2.1 Tổ chức profile Xây dựng một cấu trúc thể hiện profile người dùng là một là bước rất quan trọng ảnh hưởng đến sự thành công của hệ thống. Việc tổ chức một profile người dùng tốt sẽ rất hữu ích cho vấn đề cung cấp tài nguyên (tức là bảo đảm tài nguyên cung cấp là phù hợp) và vấn đề cộng tác (tức là bảo đảm những người có profile tương tự nhau thì thật sự là tương đồng với nhau). Có rất nhiều cách tiếp cận khác nhau trong việc thể hiện một profile người dùng. Montaner [17] đã tổng hợp và phân loại một số phương pháp phổ biến đã được nghiên cứu và sử dụng: Thông tin nhân khẩu (Demographic features) Theo mô hình này, profile người dùng được thể hiện như một tập các đặc trưng về nhân khẩu (độ tuổi, giới tính, nghề nghiệp, nơi cứ trú,…). Đây là mô hình đơn giản nhất, hầu như hệ thống nào cũng có thể áp dụng được, tuy nhiên tính hiệu quả không được cao. Thông thường mô hình này được dùng kèm với một số mô hình khác. Mô hình này sẽ rất hữu ích đối với những người dùng mới, khi đó đặc trưng của người dùng hầu như không có gì ngoài các thông tin nhân khẩu. Mô hình không gian véc-tơ (Vector space model) Mô hình này thích hợp khi cần làm việc với các tài nguyên dạng văn bản (nội dung tài liệu, nội dung trang web). Profile người dùng được thể hiện bởi véc-tơ những đặc trưng, trong đó thường dùng nhất là những từ khoá (Keyword), với giá trị đi kèm có thể kiểu luận lý hoặc một con số. Giá trị này thể hiện mức độ quan tâm/ hữu ích của đặc trưng đối với người dùng. 32 Profile(u) = (w1, w2,…wn) , với wi là giá trị thể hiện mức độ hữu ích của đặc trưng (thông thường là từ khóa) thứ i đối với người dùng u. Theo mô hình này, người ta cũng tìm cách biểu diễn tài nguyên d dưới dạng véc- tơ các đặc trưng. Việc xác định mức độ hữu ích của tài nguyên d đối với người dùng u sẽ tính toán dựa trên việc so sánh hai véc-tơ : véc-tơ đặc trưng của người dùng u với véc-tơ đặc trưng của tài nguyên d (xem chi tiết hơn ở mục 3.4.1 phương pháp lọc theo nội dung). Mô hình lịch sử khai thác (history-based model) Theo cách tiếp cận này, hệ thống sẽ tìm cách khai thác các thông tin từ quá trình tương tác của người dùng với hệ thống, chẳng hạn như những mặt hàng người dùng đã mua, các đường dẫn URL mà người dùng đã chọn, các thư từ của người dùng hay các hành động của người dùng đối với hệ thống để làm profile người dùng. Mô hình lịch sử khai thác được ứng dụng rất rộng rãi trong lãnh vực thương mại điện tử, trong đó thông thường hệ thống sẽ ghi nhận lại những sản phẩm người dùng đã mua hoặc đã trả lại cùng với đánh giá trên các sản phẩm. Việc lưu trữ trong profile những mặt hàng đã mua và đánh giá cao có thể giúp hệ thống suy diễn ra những chủng loại hàng yêu thích của người dùng, từ đó có thể tư vấn những mặt hàng khác phù hợp với sở thích hay mối quan tâm của người dùng. Ma trận đánh giá (user-item rating matrix) Là một ma trận hai chiều, một chiều là các người dùng và một chiều là các tài nguyên (item). Giá trị trong ma trận thể hiện đánh giá của người dùng đối với các tài nguyên (hình 3.1). Các giá trị này phụ thuộc vào từng hệ thống, nhưng thông thường nằm trong khoảng từ 1 : (xấu) đến 5 (tốt). Thông thường các giá trị trong ma trận trên sẽ được cập nhật thủ công bởi người dùng, tức là hệ thống sẽ cho người dùng tự đánh giá trên những các tài nguyên mà họ đã biết (chẳng những phim đã xem hay những sách đã đọc). Tuy nhiên trong một số lĩnh vực thì các giá trị này sẽ được hệ thống cập nhật tự động dựa vào các hành vi của người dùng, ví dụ như căn cứ vào những sản phẩm mà người dùng đã mua 33 trong lĩnh vực bán hàng qua mạng (với giả thiết là chỉ mua những sản phẩm nào mình quan tâm hay thích) hoặc căn cứ vào những liên kết, những tài liệu mà người sử dụng đã xem trong lĩnh vực tư vấn tài liệu. Hình 3-1- Ma trận đánh giá (Rating matrix) Các mô hình dựa trên bộ phân lớp Một số hệ thống tổ chức profile người dùng theo mô hình phục vụ cho việc khai thác bằng các phương pháp phân lớp. Tuỳ theo phương pháp phân lớp mà profile người dùng sẽ được tổ chức cho phù hợp. Một số kỹ thuật có thể được dùng là: · Cây quyết định : Là một tập hợp các nút và các cạnh được tổ chức theo cấu trúc cây. Trong cấu trúc này, mỗi nút trong là một câu hỏi, các cạnh là các câu trả lời cho câu hỏi này và node lá là quyết định cuối cùng. · Luật kết hợp: Theo phương pháp này, người ta sẽ khai thác tập profile của người dùng và tìm ra các luật với độ hỗ trợ và độ tin cậy nhất định nào đó. Các luật này sẽ được sử dụng để cung cấp tài nguyên cho người dùng thông qua những sản phẩm mà họ đã lựa chọn, đánh giá trước đó. · Ngoài ra một số hệ thống khác tổ chức profile phục vụ cho việc khai thác theo mô hình mạng nơ-ron, mạng Bayesian 3.2.2 Khởi tạo profile Khi có người dùng mới tham gia, hệ thống cần khởi tạo profile ban đầu cho người dùng làm cơ sở cho việc tư vấn, và đây là một vấn đề gặp nhiều khó khăn chung cho tất cả các hệ tư vấn (cold-start problem) vì thông tin về người dùng còn Item1 Item2 Item3 Item4 Item5 Item6 Alice 5 2 3 3 User1 2 4 4 1 User2 3 1 3 1 2 User3 4 2 3 1 1 User4 3 3 2 1 3 1 User5 3 1 2 34 quá ít. Tuy nhiên cũng đã có một số nghiên cứu các phương pháp khác nhau để giải quyết tạm thời vấn đề nay, sau đây là những phương pháp đã được Montaner tổng hợp và phân loại [17] : Dữ liệu trống (Empty) Theo phương pháp này, hệ thống sẽ không khởi tạo profile ban đầu cho người dùng mà profile sẽ được tích luỹ dần trong quá trình hoạt động thông qua tương tác của người dùng với hệ thống. Thủ công (Manual) Phương pháp này sẽ khởi tạo profile bằng cách yêu cầu người dùng điền những thông tin cần thiết trong quá trình đăng ký. Chẳng hạn trong hệ thống thích nghi ActiveMath [16], khi đăng ký tham gia, ngoài một số thông tin về nhân khẩu như họ tên, tuổi, ngôn ngữ chính,…hệ thống còn yêu cầu người dùng xác nhận thêm một số thông tin về kiến thức toán đã biết làm cơ sở để khởi tạo profile và cung cấp tài liệu thích nghi. Phương pháp này có điểm bất lợi là yêu cầu người dùng cung cấp thông tin ban đầu quá nhiều, ngoài ra một số thông tin người dùng cung cấp có thể không chính xác vì bản thân cũng khó xác định được. Ví dụ người sử dụng gặp rất nhiều khó khăn khi mô tả nền tảng kiến thức hay mức độ quan tâm đến các chủ đề Theo khuôn mẫu (Stereotyping) Hệ thống xây dựng sẵn một số profile mẫu. Từ một số thông tin sở khởi ban đầu (tên, tuổi, giới tính, nơi cư trú, nghề nghiệp,…), hệ thống sẽ gán cho người dùng một trong số các profile mà hệ thống cho là thích hợp nhất. Phương pháp này sẽ hiệu quả khi thông tin nhân khẩu ban đầu được người dùng cung cấp tương đối đầy đủ và chính xác. Tuy nhiên thực tế hiện nay, vì các lý do riêng tư cá nhân, người dùng rất ngại cung cấp đầy đủ thông chính xác về bản thân cho hệ thống. Đây là một trở ngại chính của phương pháp này. Sử dụng tập huấn luyện (Training set) 35 Theo phương pháp này, hệ thống sẽ đưa ra một tập dữ liệu mẫu cho người dùng thao tác, đánh giá. Profile người dùng sẽ được khởi tạo bằng cách rút trích các thông tin từ sự tương tác của người dùng với hệ thống qua tập mẫu này. Chẳng hạn như trong lãnh vực tư vấn phim, hệ thống sẽ yêu cầu người dùng mới đánh giá sở thích trên tập một số phim mẫu. Kết quả đánh giá này sẽ được sử dụng để khởi tạo profile ban đầu cho người dùng (phân nhóm người dùng hoặc xác định thể loại phim người dùng yêu thích,…). Ưu điểm của phương pháp này là dễ thực hiện nhưng khuyết điểm lớn nhất là có thể không chính xác nếu những mẫu hệ thống đưa ra không thể hiện đúng những đặc trưng của người dùng cụ thể. 3.3 CẬP NHẬT PROFILE Các phương pháp vừa đề cập ở trên được sử dụng để khởi tạo profile ban đầu cho người dùng, giải quyết tạm thời cho vấn đề người dùng mới. Tuy nhiên thông tin trong các profile ban đầu này còn khá đơn giản và cũng chưa thể phản ánh chính xác đặc trưng của người dùng. Ngoài ra mối quan tâm, sở thích của người dùng cũng sẽ thay đổi theo thời gian, vì vậy việc cập nhật lại profile là điều cần thiết trong các hệ thống thích nghi. Việc cập nhật profile sẽ được căn cứ vào thông tin phản hồi (relevance feedback) của người dùng đối với hệ thống. Thông tin phản hồi ở đây chính là những thông tin về sở thích, mối quan tâm hay là đánh giá của người dùng đối với tài nguyên của hệ thống. Có hai hướng tiếp cận chính cho vấn đề thu thập thông tin phản hồi từ người dùng là phản hồi tường minh (explicit feedback) và phản hồi tiềm ẩn (implicit feedback). Nhiều hệ thống kết hợp cả hai phương pháp này cho việc cập nhật profile. 3.3.1 Phản hồi tường minh (explicit feedback) Theo cách tiếp cận này, người dùng thường xuyên được yêu cầu đánh giá trên các tài nguyên một cách thủ công thông qua các giao diện. Phương pháp này được ứng dụng rất rộng rãi trong lãnh vực thương mại điện tử nhờ tính đơn giản và hiệu quả (người dùng sau khi xem một bộ phim hay đọc một cuốn sách là có thể có nhận 36 xét khá chính xác về mức độ yêu thích/ phù hợp của sản phẩm với họ). Có ba cách tiếp cận chính để tiếp nhận sự phản hồi tường minh của người dùng đối với tài nguyên : Thích/ Không thích : Giá trị đánh giá thể hiện ở mức nhị phân. Tuỳ từng lãnh vực mà có thể là quan tâm/ không quan tâm, liên quan/ không liên quan hoặc thích/ghét. Đánh giá theo điểm số : Tuỳ hệ thống mà sẽ có những thang điểm khác nhau, nhưng thông thường là từ 1 đến 5. Nhận xét bằng lời văn : Một số hệ thống cho người sử dụng đánh giá thông qua các lời nhận xét. Phương pháp này có ưu điểm là sẽ nhận được nhiều ý kiến hữu ích từ phía người dùng, nhưng việc khai thác đặc trưng thông qua các nội dung văn bản đòi hỏi nhiều thuật toán phức tạp hơn. Việc thu thập thông tin qua sự phản hồi tường minh của người dùng là một phương pháp đơn giản, phần lớn trường hợp đều có độ chính xác cao, tuy nhiên phương pháp gặp một số trở ngại như sau : · Mức độ hữu ích của thông tin gắn liền với sự thay đổi nhu cầu thông tin của người dùng, ví dụ bài báo thứ ba mặc dù có cùng chủ đề với các bài báo trước nhưng được người dùng đánh giá rất thấp do hai bài báo trước đã cung cấp khá đầy đủ các thông tin cần thiết cho người dùng. · Trong một số trường hợp thông tin người dùng cung cấp có thể không chính xác, chẳng hạn như yêu cầu đánh giá về nền tảng kiến thức hay mức độ quan tâm đến các chủ đề. · Người dùng thường không sẵn sàng cho việc phản hồi này. 3.3.2 Phản hồi tiềm ẩn (implicit feedback) Phản hồi tiềm ẩn tức là hệ thống tự động xác định sở thích, mối quan tâm của người dùng thông qua các hành vi của người dùng đối với hệ thống. Lợi điểm lớn nhất của phương pháp này là người dùng sẽ cảm thấy thoải mái hơn khi không cần phải cung cấp quá nhiều thông tin cá nhân cho hệ thống nhưng vẫn nhận được nhiều 37 tư vấn hữu ích phù hợp với đặc điểm cá nhân. Đây là phương pháp luôn được quan tâm đầu tiên khi đề cập đến vấn đề cập nhật profile, nhiều hệ thống đã đưa vào sử dụng phương pháp này và đã rất thành công. Phần lớn các hệ thống thu thập thông tin phản hồi tiềm ẩn bằng cách phân tích các liên kết người dùng đã chọn, quá trình mua bán các sản phẩm, quá trình khai thác tài nguyên, hộp thư ý kiến người dùng. Một số hệ thống phân tích thời gian dừng lại trên trang web, các hành động liên quan đến tài nguyên như lưu, in, đánh dấu, xoá, trả lời, gởi mail, cuốn màn hình, phóng to, thu nhỏ, thay đổi kích thước màn hình chứa tài nguyên,…. Mặc dù đã khắc phục được phần lớn các khuyết điểm gặp phải khi thu thập thông tin bằng phản hồi tường minh, phương pháp này cũng gặp phải một trở ngại khá lớn là dữ liệu thu thập được sẽ rất lớn, chi phí cho xử lý tính toán sẽ cao trong khi mức độ tin cậy của thông tin được rút trích ra thường không được cao so với phương pháp phản hồi tường minh. 3.3.3 Phương pháp kết hợp Việc cung cấp chức năng phản hồi tiềm ẩn sẽ giảm bớt thao tác cho người dùng, trong khi việc sử dụng phương pháp phản hồi tương minh sẽ giúp hệ thống xác định sở thích người dùng chính xác hơn. Từ nhận xét này, nhiều hệ thống đã sử dụng phương pháp kết hợp giữa phản hồi tường minh và phản hồi tiềm ẩn. Một hướng tiếp cận của phương pháp này là sử dụng sự phản hồi tiềm ẩn như là một thao tác kiểm tra trên những thông tin mà người dùng đã đánh giá thủ công, hoặc một hướng tiếp cận khác là việc phản hồi tường minh được xem như là một lựa chọn bổ sung khi người sử dụng có nhu cầu [19]. 3.4 KHAI THÁC PROFILE Để cung cấp tài nguyên cũng các dịch vụ phù hợp cho người dùng, các hệ thống thích nghi cá nhân sẽ căn cứ chủ yếu vào thông tin trong profile kết hợp với một số thông tin về các tài nguyên đang khai thác. 38 Các phương pháp lựa chọn tài nguyên phù hợp sẽ dựa vào các kỹ thuật so khớp giữa đặc trưng của tài nguyên đang xét và đặc trưng của người dùng hoặc là kỹ thuật so khớp đặc trưng giữa các người dùng. Hiện nay có ba phương pháp chính liên quan đến vấn đề chọn lọc tài nguyên cho phù hợp với người dùng : Lọc theo nội dung (content-based filtering), lọc cộng tác (collaborative filtering) và lọc theo thông tin nhân khẩu (demographic filtering) 3.4.1 Phương pháp lọc theo nội dung (Content-based Filtering) Nguyên tắc : Tài nguyên được cung cấp cho người dùng vì nó tương tự với những tài nguyên người dùng đã quan tâm trong quá khứ. Lọc theo nội dung là một phương pháp đã được nghiên cứu từ hơn một thập niên qua và cho đến này vẫn là một trong những phương pháp được ứng dụng khá phổ biến trong lãnh vực tư vấn thông tin [19]. Khi sử dụng phương pháp này profile người dùng sẽ chứa các đặc trưng được rút trích từ các tài nguyên mà người dùng đã sử dụng qua hoặc đã đánh giá. Profile này sau đó sẽ được sử dụng để tìm hoặc nhận ra những tài nguyên khác tương tự. Ví dụ nếu người dùng rất quan tâm đến “thuốc đông y” thì những tài nguyên nào có xuất hiện nhiều từ khoá ‘thuốc đông y” sẽ được ưu tiên tư vấn cho người dùng. Phương pháp đặc biệt tích hợp cho các tài nguyên có nội dung văn bản, tài nguyên trong các hệ thống này thường được mô tả dưới dạng các từ khoá kèm trọng số. Một trong những phương pháp nổi tiếng để xác định trọng số của từ khoá là phương pháp TF-IDF (Xem chi tiết phần phụ lục) Theo phương pháp này, nội dung tài liệu (tài nguyên có nội dung dạng văn bản) d sẽ được thể hiện dưới dạng véc-tơ trọng số các từ khoá. Gọi NoiDung(d) là nội dung tài liệu d có chứa n từ khoá quan trọng nhất, ta có : NoiDung (d) = (w1, w2,…wn) Trong đó : wi là trọng số của từ khoá thứ ki trong tài liệu Profile của người dùng u cũng sẽ được thể hiện dưới dạng véc-tơ trọng số các từ khoá, trong đó giá trị trọng số thể hiện mức độ quan tâm của người dùng đối với từ 39 khoá. Gọi Profile(u) là profile của người dùng u trong phương pháp lọc theo nội dung, ta có Profile(u) = (w1, w2,…wm) Trong đó : wi là trọng số của từ khoá thứ ki trong profile người dùng thể hiện mức độ quan tâm của người dùng u đối với từ khoá ki Để cung cấp tài nguyên cho người dùng, người ta tìm cách xác định mức độ hữu ích của tài nguyên d đối với người dùng u : h(u,d) = DiemSo(Profile(u), NoiDung(d)) Hàm hữu ích h(u,d) thường là các hàm heuristic. Trong lãnh vực truy vấn thông tin, khi làm việc với các tài nguyên dạng văn bản, để so sánh hai véc-tơ trọng số các từ khoá (để xác định mức độ tương đồng giữa hai tài nguyên hoặc giữa profile người dùng với tài nguyên), người ta thường sử dụng công thức cosine của góc tạo bởi hai véc-tơ Bên cạnh những đặc điểm vừa được mô tả, phương pháp lọc theo nội dung gặp phải một số hạn chế như sau [3]: - Các tài nguyên trong phương pháp lọc theo nội dung được thể hiện dưới dạng các từ khoá, đôi khi các từ khoá không thể hiện hết ngữ nghĩa tài nguyên dẫn đến tình trạng cung cấp tài nguyên không được chính xác. Ngoài ra việc người dùng lựa chọn một tài nguyên còn phụ thuộc vào các yếu tố chủ quan khác như được viết bởi một tác giả nổi tiếng, nội dung dễ hiểu,… Các yếu tố này không nằm trong các cơ sở để dự đoán mức độ quan tâm. - Phương pháp này rất phù hợp với các tài nguyên dạng nội dung văn bản, khi gặp các tài nguyên dạng khác thì sẽ gặp nhiều khó khăn. - Vấn đề lối mòn khai thác : Người dùng chỉ được cung cấp những gì họ đã quan tâm trong quá khứ, nếu mối quan tâm của người dùng thay đổi thì phải cần một khoảng thời gian dài hệ thống mới có thể cung cấp tài nguyên phù hợp. h(u, d) = cos(wu, wd) 40 - Khi gặp người dùng mới hệ thống sẽ gặp nhiều khó khăn do có quá ít thông tin về họ (đây cũng là vấn đề chung cho một số phương pháp khác). 3.4.2 Phương pháp lọc cộng tác (Collaborative Filtering) 3.4.2.1 Tư vấn dựa vào cộng đồng Nguyên tắc : Tài nguyên được cung cấp cho người dùng nếu nó được đánh giá cao bởi những người dùng tương tự khác. Lọc cộng tác (Collaborative filtering gọi tắt là CF) [4], [21] là kỹ thuật tư vấn rất thông dụng, đã được áp dụng trong cho rất nhiều lĩnh vực và đạt được những kết quả rất khả quan. Nguyên tắc hoạt động của hệ thống tư vấn CF như sau : Hệ thống tư vấn sẽ ghi nhận các thông tin đánh giá của người dùng trên các tài nguyên. Việc ghi nhận này có thể là thủ công, tức là cho người dùng tự đánh giá trên các tài nguyên hoặc tự động, tức là hệ thống tự đánh giá thông qua các hành vi của người dùng. Khi cần tư vấn cho người dùng, hệ thống sẽ tìm những người tương tự với người dùng dựa vào mức độ tương đồng về mặt sở thích, mối quan tâm,…. Sau đó chọn ra những tài nguyên mà những người dùng tương tự đã đánh giá cao để tư vấn cho người dùng. Hình 3-2- Tư vấn dựa vào cộng đồng Người dùng u Nhóm những người dùng ‘tương tự’ với user u Tài nguyên d Các user Dự đoán điểm số dựa vào