Xây dựng cp bằng phương pháp prometheematch

Qua phân tích hiện trạng các phương pháp xây dựng CP hiện có, những ưu khuyết diểm, cũng như những nhu cầu thực tế mà những phương pháp này không thể đáp ứng, Luận văn đề xuất một phương pháp mới với mục tiêu thỏa hiệp được 3 tiêu chí tính phổ biến, chất lượng và tính duy nhất của CP một cách tự nhiên nhất -gần với suy nghĩ của con người. Hơn nữa, phương pháp mới này cũng cho phép ấn định trọng số của các tiêu chí - xác lập mức độ quan trọng tương đối giữa các tiêu chí với nhau - nhằm đáp ứng với các yêu cầu khác nhau của từng ngữ cảnh.

pdf18 trang | Chia sẻ: vietpd | Lượt xem: 1307 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Xây dựng cp bằng phương pháp prometheematch, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
58 CHƯƠNG 4. XÂY DỰNG CP BẰNG PHƯƠNG PHÁP PROMETHEEMATCH 4.1 Cách tiếp cận chính của PrometheeMatch Qua phân tích hiện trạng các phương pháp xây dựng CP hiện có, những ưu khuyết diểm, cũng như những nhu cầu thực tế mà những phương pháp này không thể đáp ứng, Luận văn đề xuất một phương pháp mới với mục tiêu thỏa hiệp được 3 tiêu chí tính phổ biến, chất lượng và tính duy nhất của CP một cách tự nhiên nhất - gần với suy nghĩ của con người. Hơn nữa, phương pháp mới này cũng cho phép ấn định trọng số của các tiêu chí - xác lập mức độ quan trọng tương đối giữa các tiêu chí với nhau - nhằm đáp ứng với các yêu cầu khác nhau của từng ngữ cảnh. Nói cách khác, phương pháp mới này hướng đến việc cho ra CP thỏa hiệp tốt nhất các tiêu chí theo những yêu cầu cụ thể của hệ thống, đồng thời có khả năng linh hoạt để phù hợp với nhiều hệ thống khác nhau. Luận văn gọi phương pháp mới này là PrometheeMatch xuất phát từ việc ứng dụng và cải tiến phương pháp PROMETHEE II để giải quyết những vấn đề sau: 1. PrometheeMatch sử dụng phương pháp PROMETHEE II để xây dựng một tiền thứ tự toàn phần các tài nguyên thuộc một cộng đồng dựa trên việc thỏa hiệp 2 tiêu chí tính phổ biến và chất lượng của tài nguyên. Lý do chọn phương pháp này vì tính hiệu quả, có nền tảng toán học, dễ sử dụng, hơn nữa công cụ GAIA đi kèm cho phép mô tả trực quan các tài nguyên cùng với mối liên hệ của chúng, giúp người thiết kế hệ thống hiểu rõ hơn về kết quả tìm được. Ngoài ra, việc chọn PROMETHEE II còn vì phương pháp này cho ra một tiền thứ tự toàn phần trên tập tài nguyên mà cộng đồng quan tâm, từ đó những tài nguyên có thứ hạng cao nhất sẽ được chọn làm CP. 2. PrometheeMatch sử dụng một ngưỡng trùng lắp u để giới hạn mức độ trùng lắp tài nguyên giữa các CP, u được tính toán dựa trên trọng số của tiêu chí tính duy nhất. Việc sử dụng ngưỡng trùng lắp nhằm cho phép các CP giữ lại những tài 59 nguyên được nhiều cộng đồng ưa thích nhưng vẫn đảm bảo sự khác biệt tương đối giữa các CP với nhau, giúp người dùng không phải bối rối khi chọn cộng đồng để tham gia. 3. PrometheeMatch cũng giải quyết vấn đề phụ thuộc thứ tự duyệt cộng đồng trong quá trình chọn tài nguyên làm CP. Khi có tài nguyên I được nhiều cộng đồng ưa thích và năng lực của tài nguyên này trên các cộng đồng là bằng nhau, và giả sử I chỉ có thể thuộc về một CP duy nhất (để thỏa ngưỡng trùng lắp), vậy tài nguyên này sẽ được thuộc về CP nào? Nếu không thiết lập quyền ưu tiên cho cộng đồng thì điều này sẽ phụ thuộc vào thứ tự duyệt của cộng đồng, cộng đồng nào xem xét (tiếp xúc) tài nguyên I trước thì I sẽ thuộc về CP của cộng đồng đó. Phương pháp cải tiến sẽ bổ sung quyền ưu tiên cho mỗi cộng đồng, để khi xảy ra sự tranh chấp này, cộng đồng nào có độ ưu tiên cao hơn thì giành quyền giữ tài nguyên I trong CP của nó. Phần tiếp theo luận văn trình bày chi tiết từng vấn đề. 4.2 Những cải tiến của PrometheeMatch Bài toán xây dựng CP có thể được phát biểu theo hình thức bài toán MCDM với 2 tiêu chí tính phổ biến và chất lượng của tài nguyên, còn tiêu chí tính duy nhất xem như điều kiện ràng buộc trên tập CP của hệ thống. Tuy vậy trọng số vẫn được áp dụng cho cả 3 tiêu chí, trong đó wp, wa, wu  [0,1] và wp + wa = 1. I Popularity AvgRating Uniqueness wp wa wu I1 I2 . . . Ii . . . In Pop(I1) Pop(I2) . . . Pop(Ii) . . . Pop(In) Avg(I1) Avg(I2) . . . Avg(Ii) . . . Avg(In) u = (1 – wu) kn u: ngưỡng trùng lắp k : số cộng đồng n: số tài nguyên của mỗi CP Hình 4.1 Dữ liệu bài toán xây dựng CP theo MCDM 60 Trong đó:  Ii  I : các giải pháp (hành động) - là tập các tài nguyên mà cộng đồng quan tâm.  Popularity và AvgRating : 2 tiêu chí tương ứng với tính phổ biến và chất lượng của tài nguyên.  wp, wa : trọng số tương ứng với 2 tiêu chí Popularity và AvgRating. wp + wa  [0,1] và wp + wa = 1  Uniqueness: tiêu chí tính duy nhât của CP được phát biểu dưới hình thức điều kiện ràng buộc của CP như sau: Tập CP của hệ thống phải đảm bảo độ trùng lắp tài nguyên không lớn hơn ngưỡng u yêu cầu. Với k là số cộng đồng, n là số phần tử trong mỗi CP, wu là trọng số của tiêu chí tính duy nhất wu  [0,1]. Công thức để tính u như sau: u = (1 – wu) kn (4.1) Đầu tiên, phương pháp PrometheeMatch xác lập các trọng số wp, wa, wu, và tham số u được tính từ wu, sau đó để tìm CP cho mỗi cộng đồng, PrometheeMatch tiến hành 2 giai đoạn: 1. Sử dụng phương pháp PROMETHEE II để xếp hạng các tài nguyên trong mỗi cộng đồng theo 2 tiêu chí Popularity và AvgRating 2. Sau đó, trên mỗi cộng đồng, lấy ra n tài nguyên có thứ hạng cao nhất làm CP sao độ trùng lắp của các CP không vượt quá ngưỡng u. 61 4.2.1 Cải tiến 1 – Sử dụng PROMETHEE II để xếp hạng các tài nguyên trong cộng đồng Có nhiều phương pháp MCDA để thỏa hiệp 2 tiêu chí Popularity và AvgRating nhưng Luận văn chọn phương pháp PROMETHEE II để xếp hạng các tài nguyên trong cộng đồng theo 2 tiêu chí này vì những lý do sau đây [3]:  Hai tiêu chí Ppularity và AvgRating sử dụng hai thang điểm đánh giá khác nhau. Ví dụ, trong MovieLens, AvgRating có thang điểm [1, 5] còn Popularity có thang điểm [1, num_user], với num_user là số người dùng trong cộng đồng.  Điểm của hai tiêu chí này không thể bù trừ cho nhau, việc mất điểm trên tiêu chí này không thể bù đắp bằng việc có điểm trên tiêu chí khác.  Vì điểm đánh giá của tiêu chí avgRating là số thập phân nên hai điểm đánh giá có độ chênh lệch không đáng kể có thể xem là bằng nhau. Cũng như thang điểm đánh giá của popularity lớn nên độ chênh lệch giữa hai điểm đánh giá nhỏ cũng không thể nói là có sự tốt hơn của một trong hai tài nguyên. Do đó có thể sử dụng ngưỡng phân biệt (ngưỡng lớn hơn và ngưỡng bằng nhau) trong cấu trúc so sánh.  Phương pháp PROMETHEE II rõ ràng, dễ hiểu, hơn nữa có nền tảng toán học, cùng với công cụ GAIA đi kèm sẽ cho phép mô tả trực quan kết quả, giúp người thiết kế hệ thống hiểu rõ hơn về kết quả tìm được.  PROMETHEE II cho ra kết quả là thứ tự toàn phần, đã loại bỏ quan hệ không thể so sánh mặc dù cách loại bỏ này không phải lúc nào cũng thuyết phục. Nhưng vì cách tiếp cận của luận văn là chọn n tài nguyên có thứ hạng cao nhất làm CP, do đó một thứ tự toàn phần các tài nguyên là cần thiết, vì vậy luận văn chọn thuật toán PROMETHEE II để áp dụng. Sau đây luận văn trình bày một ví dụ về ứng dụng PROMETHEE II để xếp hạng các tài nguyên trong một cộng đồng, tài nguyên ở đây là các phim. 62 Ví dụ 4.1: Giả sử trong ứng dụng tư vấn phim, ta có một cộng đồng gồm 21 người dùng thực hiện việc đánh giá trên 5 phim và thang điểm đánh giá từ 1 đến 5 như bảng 4.1: C1 movie Popularity AvgRating m1 11 4.9 m2 21 4.8 m3 20 4.5 m4 19 4.3 m5 18 4.0 Bảng 4.1 Bảng đánh giá của cộng đồng C1 Luận văn sẽ xem xét cách xếp hạng các tài nguyên theo kỹ thuật giảm tuyến tính điểm trung bình đánh giá (AvgRating) dựa trên ngưỡng phổ biến (Popularity) đã được áp dụng trong phương pháp avgMatch, khi đó với ngưỡng giảm tuyến tính là 50% số người dùng trong cộng đồng thì tất cả điểm AvgRating đều không thay đổi, vì tất cả các phim đều có Popularity lớn hơn ngưỡng giảm tuyến tính (10.5) (xem chi tiết thuật toán ở phần 2.3.4.3). Và như vậy thứ tự các phim xét theo điểm AvgRating sẽ là: m1 > m2 > m3 > m4 > m5 Thứ tự trên cho thấy phim m1 và m2 có điểm AvgRating gần bằng nhau, trong khi phim m2 có điểm Popularity gần như gấp đôi phim m1. Nhưng phim m1 vẫn xếp thứ hạng cao hơn, vì theo kỹ thuật giảm tuyến tính thì một khi đã thỏa ngưỡng Popularity rồi thì chỉ còn xét điểm AvgRating. Kết quả này không được tự nhiên lắm (không gần với cách hành xử của con người), do đó một phương pháp thỏa hiệp 2 tiêu chí trên một cách hợp lý hơn nên được xem xét. Sau đây, luận văn xem xét việc xếp hạng các tài nguyên bằng phương pháp PROMETHEE II. Các tham số được sử dụng cho PROMETHEE II như trong bảng 4.2: 63 Popularity AvgRating wk 0.5 0.5 qk 0 0 pk 20 4 Bảng 4.2: Tham số PROMETHEE II Cho ví dụ 4.1 Vì tổng số người dùng trong C1 là 21, và mỗi phim có ít nhất một người dùng đánh giá nên khoảng cách tối đa giữa hai giá trị trên tiêu chí Popularity là 20 (p1 = 20) và khoảng cách tối thiểu giữa hai giá trị trên tiêu chí này là 0 (q1 = 0). Các phim được đánh giá theo thang điểm từ 1 đến 5 nên độ lệch tối đa giữa 2 giá trị trên tiêu chí AvgRating là 4 (p2 = 4) và độ lệch tối thiểu của 2 giá trị trên tiêu chí này là 0 (q2 = 0). Ở đây luận văn chọn hàm thích hơn kiểu 5 (Hình 4.2) vì mong muốn phân biệt mức độ thích hơn khác nhau của các tài nguyên theo điểm Popularity và điểm AvgRating (tùy theo mục đích cụ thể mà chúng ta có thể chọn các kiểu hàm thích hơn khác) Hình 4.2 Hàm thích hơn kiểu 5 Tính chỉ số thích hơn và các dòng hơn cấp như bảng 4.3  m1 m2 m3 m4 m5   m1 - 0.025 0.1 0.15 0.225 0.50 -1.20 m2 0.5 - 0.125 0.225 0.35 1.20 1.18 m3 0.45 0 - 0.1 0.225 0.78 0.55 m4 0.4 0 0 - 0.125 0.53 0.05 m5 0.35 0 0 0 - 0.35 -0.58  1.7 0.025 0.225 0.475 0.925 Bảng 4.3: Chỉ số thích hơn và các dòng hơn cấp của Ví dụ 4.1 64 Trong đó:  (m1, m2) = 0.5 * 0 + 0.5 * (4.9 – 4.8)/4 = 0.025  (m2, m1) = 0.5 * (21 – 11)/20 + 0.5 * 0 = 0.5  +(m1) = 0.025 + 0.1 + 0.15 + 0.225 = 0.5  (m1) = 0.5 + 0.45 + 0.4 + 0.35 = 1.7  (m1) = +(m1) – (m1) = 0.5 – 1.7 = -1.2 Dựa vào kết quả dòng hơn cấp thực (.) trong Bảng 4.3, phương pháp PROMETHEE II cho ta tiền thứ tự toàn phần cuối cùng của các phim: m2 > m3 > m4 > m5 > m1 So sánh với kết quả phương pháp avgMatch ta thấy rõ ràng sự thỏa hiệp các tiêu chí của PROMETHEE II cho ta kết quả hợp lý và tự nhiên hơn nhiều. Bằng chứng của sự thỏa hiệp là mặc dầu m1 có điểm đánh giá trung bình cao nhất nhưng vì số người tham gia đánh giá thấp hơn nhiều so với các tài nguyên khác nên có thứ hạng thấp nhất, điều này cũng gần với cách mà con người vẫn thường đánh giá. 4.2.2 Cải tiến 2 – Sử dụng ngưỡng trùng lắp Ngưỡng trùng lắp u cho phép giới hạn sự trùng lắp tài nguyên giữa các CP và được tính theo công thức (4.1). Sau khi áp dụng PROMETHEE II để xếp hạng tài nguyên trên mỗi cộng đồng ta thu được tập thứ tự {<i } trên tập cộng đồng {Ci }. Để chọn ra tập {CPi} không vi phạm ngưỡng trùng lắp u, ta làm như sau: Trên mỗi cộng đồng chúng ta lần lượt chọn tài nguyên có thứ hạng cao nhất và chưa được xét bởi cộng đồng đó để đưa vào CP. Mỗi lần chọn, thực hiện kiểm tra tình trạng vi phạm ngưỡng trùng lắp, nếu sự vi phạm xảy ra - nghĩa là số lượng tài nguyên trùng lắp trong các CP vượt ngưỡng u cho phép - thực hiện việc xếp hạng tất cả các tài nguyên trùng lắp và loại bỏ tài nguyên trùng lắp có thứ hạng thấp nhất 65 ra khỏi CP chứa nó. Thủ tục này lặp lại cho đến khi tât cả CP đều có đủ n tài nguyên. (Xem thuật giải và sơ đồ ở phần 4.3) Việc xếp hạng các tài nguyên trùng lắp cũng được thực hiện bằng phương pháp PROMETHEE II với cùng tham số như khi xếp hạng các tài nguyên trong một cộng đồng. Sau đây luận văn sẽ trình bày một ví dụ về cách chọn tài nguyên làm CP thỏa ngưỡng trùng lắp u. Ví dụ 4.2: Giả sử ta có 3 cộng đồng (k = 3) C1, C2, C3. Mỗi cộng đồng có tối đa 21 người dùng, mỗi người dùng tham gia đánh giá ít nhất một phim, như bảng sau: C1 C2 movie Popularity AvgRating movie Popularity AvgRating m1 10 4.5 m5 10 4 m3 9 4 m1 9 3.8 m4 8 3.5 m7 8 3.5 m5 7 3 m6 7 3 m2 6 2 m10 6 2 C3 movie Popularity AvgRating m1 10 4 m4 9 3.7 m5 8 3.5 m8 7 3 m6 6 2 Hình 4.3: Dữ liệu đánh giá của 3 cộng đồng - ví dụ 4.2 Áp dụng phương pháp PROMETHEE II để xếp hạng các tài nguyên trong mỗi cộng đồng với các tham số như Bảng 4.4. Kết quả ta có thứ hạng các tài nguyên trong mỗi cộng đồng (Bảng 4.5). 66 Popularity AvgRating wk 0.5 0.5 pk 20 4 Bảng 4.4: Tham số của PROMETHEE II – ví dụ 4.2 Stt C1 C2 C3 1 m1 m5 m1 2 m3 m1 m4 3 m4 m7 m5 4 m5 m6 m8 5 m2 m10 m6 Bảng 4.5: Thứ tự tài nguyên trong 3 cộng đồng - ví dụ 4.2 Để chọn trên mỗi cộng đồng 3 tài nguyên (n = 3) làm CP và các CP không vi phạm ngưỡng trùng lắp u = 3 (kết quả như Bảng 4.6). Stt C1 C2 C3 1 m1 m5 m1 2 m3 m1 m4 3 m4 m7 m5 4 m5 m8 5 m2 Bảng 4.6: CP của 3 cộng đồng với u = 3 trong ví dụ 4.2 Luận văn thực hiện như sau:  Đầu tiên xét C1, chọn 3 tài nguyên m1, m3, m4 vào CP1.  Xét C2, chọn 3 tài nguyên m5, m1, m7 vào CP2. Lúc này có 2 tài nguyên trùng lắp là {(m1, C1), (m1, C2)}, số tài nguyên trùng lắp là 2 < u, chưa vi phạm ngưỡng trùng lắp.  Xét tiếp C3, chọn m1 vào CP3, các tài nguyên trùng lắp bao gồm {(m1, C1), (m1, C2), (m1, C3)}, số tài nguyên trùng lắp lúc này là 3 = u nên vẫn chưa vi phạm ngưỡng trùng lắp. 67  Tiếp tục chọn m4 vào CP3, các tài nguyên trùng lắp bao gồm {(m1, C1), (m1, C2), (m1, C3), (m4, C1), (m4, C3)} số tài nguyên trùng lắp là 5 > u. Như vậy sự vi phạm ngưỡng trùng lắp đã xảy ra.  Xếp hạng các tài nguyên trùng lắp bằng phương pháp PROMETHEE II cho ra tiền thứ tự sau: (m1, C1) > (m1, C2) > (m1, C3) > (m4, C3) > (m4, C1).  Loại tài nguyên có thứ hạng thấp nhất là (m4, C1) ra khỏi C1 và như vậy số tài nguyên trùng lắp giảm xuống còn 3 không vi phạm ngưỡng.  Ở C1, chọn m5 vào CP1 thay thế cho tài nguyên m4 đã bị loại, và cứ thế tiếp tục cho đến khi mỗi cộng đồng có đủ 3 tài nguyên trong CP.  Kết quả cuối cùng như bảng sau: CP1 m1 >1 m3 >1 m2 CP2 m5 >2 m1 >2 m7 CP3 m1 >3 m4 >3 m8 Bảng 4.7: Kết quả CP của 3 cộng đồng thỏa ngưỡng trùng lắp-Ví dụ 4.2 Nhờ sử dụng ngưỡng trùng lắp u, 3 cộng đồng giữ được phim m1 – có thứ hạng rất cao trong cả 3 cộng đồng – trong CP của chúng, đồng thời vẫn đảm bảo sự phân biệt tương đối giữa 3 CP với nhau. Ngoài ra, việc giữ lại những tài nguyên có thứ hạng cao cũng làm tăng năng lực của các CP – năng lực CP chính là năng lực trung bình của các tài nguyên trong CP. 4.2.3 Cải tiến 3 – Giảm sự phụ thuộc vào thứ tự duyệt cộng đồng Trong quá trình chọn tài nguyên làm CP thỏa mãn ngưỡng trùng lắp u, khi số tài nguyên trùng lắp vượt quá ngưỡng u, PromeetheeMatch sẽ thực hiện công việc loại bỏ tài nguyên trùng lắp có năng lực thấp nhất ra khỏi CP của nó để giảm mức độ trùng lắp. Nhưng nếu có nhiều hơn 2 tài nguyên trùng lắp có năng lực thấp nhất thì sẽ loại tài nguyên nào? Xem xét ví dụ dưới đây: 68 Ví dụ 4.3: có 3 cộng đồng như hình 4.4: C2 movie Popularity AvgRating m5 10 4 m8 8 3.5 m7 8 3.5 m6 6 3 C1 C3 movie Popularity AvgRating movie Popularity AvgRating m10 10 4.5 m6 10 4 m3 8 4 m9 8 3.7 m4 8 3.5 m4 8 3.5 m1 6 3 m5 6 3 Hình 4.4: Dữ liệu đánh giá của 3 cộng đồng - ví dụ 4.3 Áp dụng phương pháp PROMETHEE II để xếp hạng các tài nguyên trong mỗi cộng đồng ta có kết quả thứ tự các tài nguyên như bảng 4.8 (luận văn cố tình chọn dữ liệu có thứ tự định sẵn trên 2 tiêu chí nhằm đơn giản việc xếp hạng tài nguyên và làm nổi bật việc phụ thuộc vào thứ tự duyệt cộng đồng khi chọn CP). Stt C1 C2 C3 1 m10 m5 m6 2 m3 m8 m9 3 m4 m7 m4 4 m1 m6 m5 Bảng 4.8: Thứ tự tài nguyên trên mỗi cộng đồng cho ví dụ 4.3 Giả sử chọn trên mỗi cộng đồng 3 tài nguyên để làm CP thỏa ngưỡng trùng lắp u = 0 (nghĩa là các CP không có tài nguyên nào trùng lắp). Khi đó xét các tài nguyên trong cộng đồng theo thứ hạng từ trên xuống thì C1 và C3 đều chọn m4 làm CP của chúng, nhưng vì để đảm bảo ngưỡng trùng lắp u=0 nên m4 chỉ có thể thuộc về một CP. PrometheeMatch sẽ tiến hành xếp hạng (m4,C1) 69 và (m4,C3) để loại tài nguyên có năng lực thấp hơn ra khỏi CP nhưng vì (m4,C1) và (m4,C3) có năng lực bằng nhau (xét theo dữ liệu bảng đánh giá), do đó trong trường hợp này, nếu không xét độ ưu tiên cho cộng đồng thì mặc nhiên cộng nào duyệt m4 trước (nghĩa là cộng đồng nào xem xét m4 trước) sẽ được ưu tiên giữ m4 trong CP của nó, và kết quả như trong bảng 4.9 và 4.10: CP1 m10 >1 m3 >1 m4 CP2 m5 >2 m8 >2 m7 CP3 m6 >3 m9 >3 m2 Bảng 4.9: CP của 3 cộng đồng theo thứ tự duyệt C1, C2, C3 của ví dụ 4.3 CP1 m10 >1 m3>1 m1 CP2 m5 >2 m8 >2 m7 CP3 m6 >3 m9 >1 m4 Bảng 4.10 CP của 3 cộng đồng theo thứ tự duyệt C3, C2, C1 của ví dụ 4.3 Kết quả trên cho thấy nếu duyệt cộng đồng theo thứ tự C1, C2, C3. Khi đó m4 thuộc về CP1, và nếu duyệt theo thứ tự ngược lại C3, C2, C1 khi đó m4 thuộc về CP3. Điều này dẫn đến kết quả không nhất quán, phụ thuộc vào thứ tự duyệt cộng đồng. Để cho ra kết quả nhất quán, luận văn đề xuất độ ưu tiên cho mỗi cộng đồng. Độ ưu tiên này nhằm giảm độ chênh lệch năng lực giữa các CP. Ví dụ, nếu CP1 có năng lực cao hơn CP2 và 2 cộng đồng C1, C2 cùng tranh chấp một tài nguyên m, nếu cho m thuộc về CP1 khi đó C2 phải đi tìm một tài nguyên có năng lực kém hơn m để đưa vào CP2, khi đó năng lực của CP1 càng lớn hơn CP2. Do đó độ ưu tiên đưa ra nhằm cho phép m thuộc về CP2 (CP có năng lực yêu hơn) và khi đó độ chênh lệch năng lực của CP1 và CP2 sẽ giảm xuống. Trên tinh thần đó, Luận văn định nghĩa độ ưu tiên của cộng đồng như sau: Độ ưu tiên của cộng đồng Ci đối với tài nguyên mj ký hiệu là P(Ci,mj) và cũng được đánh giá dựa trên 2 tiêu chí Popularity và AvgRating, giá trị của P(Ci, mj) tại các tiêu chí này được xác định bằng nghịch đảo của 2 giá trị Popularity trung bình và AvgRating trung bình của tất cả tài nguyên thuộc Ci và có thứ hạng lớn hơn mj. 70 Sau đây, luận văn sẽ trình bày minh họa cách tính độ ưu tiên của 2 cộng đồng C1 và C3 đối với tài nguyên m4 ở ví dụ 4.3 Gọi P(m4, C1) và P(m4, C3) là độ ưu tiên của C1 và C3 trên tài nguyên m4, ta có bảng dữ liệu quyền ưu tiên như sau: Trong đó:  Popularity của P(m4, C1) = 1/ [(popularity(m10) + popularity(m3))/2] = 1/ [(10 + 8)/2] = 1/9 = 0.11  Popularity của P(m4, C3) = 1/ [(popularity(m6) + popularity(m9))/2] = 1 / [(10 + 8)/2] = 1/9 = 0.11  AvgRating của P(m4, C1) = 1 / [(4.5 + 4)/2] = 1/4.25 = 0.24  AvgRating của P(m4, C3) = 1 / [(4 + 3.7)/2] = 1/3.85 = 0.25 Để biết độ ưu tiên nào lớn hơn ta thực hiện việc xếp hạng các độ ưu tiên này theo 2 tiêu chí Popularity và AvgRating bằng PROMETHEE II với cùng tham số với xếp hạng tài nguyên trong cộng đồng. Kết quả là: P(m4, C3) > P(m4, C1) Điều này có nghĩa là C3 được quyền giữ m4 trong CP3 và C1 phải loại m4 ra khỏi CP1. Và kết quả tập CP cuối cùng CP1 m10 >1 m3 >1 m1 CP2 m5 >2 m8 >2 m7 CP3 m6 >3 m9 >1 m4 Độ ưu tiên mà luận văn đề xuất đã giải quyết được vấn đề phụ thuộc thứ tự duyệt cộng đồng nhưng vẫn còn hạn chế trong trường hợp độ ưu tiên của 2 cộng đồng cũng bằng nhau luôn thì sao? Khi đó thuật toán vẫn lưỡng lự trong việc chọn tài nguyên nào để loại bỏ. Dĩ nhiên có thể đưa thêm nhiều độ ưu tiên khác bổ sung, Popularity AvgRating P(m4, C1) 0.11 0.24 P(m4, C3) 0.11 0.25 71 nhưng cho dù có thêm bao nhiêu độ ưu tiên thì vấn đề 3 về mặt lý thuyết vẫn không thể giải quyết triệt để được. Cho nên quan điểm của luận văn là sử dụng quyền ưu tiên ở mức thực tế nhất, vì hiếm khi có trường hợp một tài nguyên được 2 cộng đồng thích bằng nhau và quyền ưu tiên của 2 cộng đồng cũng bằng nhau. Với độ ưu tiên đề xuất này phương pháp PrometheeMatch đã góp phần tăng tính nhất quán của CP tìm được. 4.3 Thuật toán và sơ đồ khối Phần này luận văn trình bày phương pháp PrometheeMatch hoàn chỉnh dưới dạng thuật toán và sơ đồ khối. Thuật toán: Input: Cho C = {Ci}, Ci là cộng đồng hay nhóm người sử dụng I = {Ij} là tập tài nguyên hệ thống n : số tài nguyên làm CP wp, wa, wu : trọng số của 3 tiêu chí Popularity và avgRating và Uniqueness Kiểu hàm thích hơn và các tham số đi kèm của PROMETHEE II Output: { CPi } danh sách tập đặc trưng của các cộng đồng (S1) Với mỗi cộng đồng Ci  C, xếp hạng tất cả tài nguyên trong I mà Ci đã đánh giá theo 2 tiêu chí popularity và avgRating bằng phương pháp PROMETHEE II. (S2) Với mỗi cộng đồn
Tài liệu liên quan