Kết quả nghiên cứu xây dựng đặc trưng cộng đồng trong các hệ thống tư vấn thông tin

Trong chương này luận văn trình bày quá trình thử nghiệm các phương pháp xây dựng CP. Mục tiêu của thử nghiệm nhằm so sánh phương pháp cải tiến PrometheeMatch với các phương pháp đã có, nêu rõ ý nghĩa của những cải tiến dựa trên kết quả đạt được. Để có thể thực hiện việc so sánh luận văn sẽ trình bày cách tính các tiêu chí mà dựa trên đó các phương pháp được so sánh với nhau. Luận văn cũng trình bày ưu điểm và khuyết điểm của từng phương pháp, cũng như ý nghĩa của từng tham số thông qua kết quả đạt được.

pdf17 trang | Chia sẻ: vietpd | Lượt xem: 1267 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Kết quả nghiên cứu xây dựng đặc trưng cộng đồng trong các hệ thống tư vấn thông tin, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
76 CHƯƠNG 5. THỬ NGHIỆM và PHÂN TÍCH KẾT QUẢ Trong chương này luận văn trình bày quá trình thử nghiệm các phương pháp xây dựng CP. Mục tiêu của thử nghiệm nhằm so sánh phương pháp cải tiến PrometheeMatch với các phương pháp đã có, nêu rõ ý nghĩa của những cải tiến dựa trên kết quả đạt được. Để có thể thực hiện việc so sánh luận văn sẽ trình bày cách tính các tiêu chí mà dựa trên đó các phương pháp được so sánh với nhau. Luận văn cũng trình bày ưu điểm và khuyết điểm của từng phương pháp, cũng như ý nghĩa của từng tham số thông qua kết quả đạt được. 5.1 Dữ liệu thực nghiệm Để có được kết quả khách quan, đáng tin cậy, luận văn thử nghiệm các phương pháp trên tập dữ liệu MovieLens [19], một hệ thống tư vấn về những tài nguyên phim, được thu thập từ dự án nghiên cứu GroupLens thuộc trường đại học Minnesota. Dữ liệu này được dùng làm dữ liệu chuẩn trong những công trình nghiên cứu về CF. Tập dữ liệu này bao gồm 100.000 mẩu tin đánh giá (có số điểm từ 1 đến 5) từ 943 người dùng trên 1682 phim. Mỗi người dùng đánh giá ít nhất 20 phim. Sau đây là mô tả tóm tắt về cơ sở dữ liệu.  Bảng Data chứa 100.000 đánh giá của 943 người dùng trên 1682 phim. Mỗi người dùng đánh giá ít nhất 20 phim, userId và item Id được đánh số liên tiếp nhau bắt đầu từ 1. Bảng này gồm các cột sau: userId | itemId | rating | timestamp.  Bảng Item thông tin về phim, bao gồm các cột sau: movie id | movie title | release date | video release date | IMDb URL | unknown | Action | Adventure | Animation | Children's | Comedy | Crime | Documentary | Drama | Fantasy | Film-Noir | Horror | Musical | Mystery | Romance | Sci-Fi | Thriller | War | Western. 77 19 cột cuối cùng là thể loại phim, với giá trị bằng 1 thể hiện phim thuộc thể loại đó, bằng 0 nghĩa là không thuộc. Một phim có thể cùng lúc thuộc nhiều thể loại.  Bảng User thông tin nhân khẩu học của người dùng, bao gồm các cột sau: user id | age | gender | occupation | zip code  Bảng Group thông tin về nhóm (cộng đồng) người dùng thuộc về, mỗi nhóm thuộc về một phân hoạch (divisionId), bảng này bao gồm các cột sau: group Id | group Name | divisionId  Bảng UserGroup thông tin mô tả người dùng thuộc về nhóm nào, một người dùng có thể thuộc về nhiều nhóm, một nhóm có nhiều người dùng. Bảng này bao gồm các cột sau: user Id | group Id 5.2 Các tiêu chí đánh giá Phần này luận văn trình bày một số tiêu chí được dùng để so sánh các phương pháp trong một số trường hợp cụ thể, ở nhiều khía cạnh khác nhau [21]. 5.2.1 Tiêu chí popRank (Popularity Rank) – TC1 popRank là khái niệm chỉ số thứ tự của tài nguyên trong cộng động hoặc hệ thống dựa trên số lượng người dùng tham gia đánh giá tài nguyên. Tài nguyên có thứ hạng cao nhất sẽ có số lượng người dùng tham gia đánh giá nhiều nhất. Ví dụ Star Wars (1977) là phim được được nhiều người dùng đánh giá nhất trong MovieLens (583 người) có popRank = 1. Chỉ số này đặc trưng cho tính phổ biến của tài nguyên trong hệ thống, popRank càng thấp thì tính phổ biến càng cao. Giả sử áp dụng phương pháp tìm CP f1 trên k cộng đồng, mỗi cộng đồng lấy n tài nguyên làm đặc trưng. Khi đó tập CP của hệ thống có kn tài nguyên và popRank của phương pháp f1 được tính như sau: 78 ݌݋݌ܴܽ݊݇( ଵ݂) = ݌݋݌ܴܽ݊݇(݉ଵ) + ݌݋݌ܴܽ݊݇(݉ଶ) + … + ݌݋݌ܴܽ݊݇(݉௡௞)݊݇ Trong đó: k: là số lượng cộng đồng, n: số lượng tài nguyên trong mỗi CP Ij, j  [1, nk] là tập tài nguyên thuộc CP của hệ thống. Ví dụ: Áp dụng phương pháp tìm CP f1 trên 3 cộng đồng, mỗi cộng đồng chọn ra 2 tài nguyên làm CP như (hình 5.1): Nhóm 1 item Id popRank Nhóm 2 10 3 item Id popRank Nhóm 3 3 6 7 1 item Id popRank 5 4 6 2 8 5 Hình 5.1: CP với điểm popRank Khi đó popRank của f1 được tính như sau: popRank(f1) = [popRank(10) + popRank(3) + popRank(7) + popRank(5) + popRank(6) + popRank(8)] / 6 = (3 + 6 + 1 + 4 + 2 + 5)/6 = 3.5 5.2.2 Tiêu chí avgRating (average Rating) – TC2 Điểm avgRating của một tài nguyên được tính bằng cách lấy trung bình điểm đánh giá của tất cả nguời dùng trong cộng đồng hoặc hệ thống tham gia đánh giá tài nguyên đó. Ví dụ, nếu tài nguyên m1 được 3 người dùng đánh giá với các điểm số 4, 3 và 5, thì avgRating của m1 là (4 + 3 + 5)/3 = 4. Chỉ số này đặc trưng cho chất lượng của tài nguyên trong hệ thống. avgRating càng cao thì chất lượng của tài nguyên càng cao. 79 Công thức tính avgRating của phương pháp f1 tương tự như công thức tính popRank của f1 như sau: ܽݒܴ݃ܽݐ݅݊݃( ଵ݂) = ܽݒܴ݃ܽݐ݅݊݃(݉ଵ) + ܽݒܴ݃ܽݐ݅݊݃(݉ଶ) + … + ܽݒܴ݃ܽݐ݅݊݃(݉௡௞)݊݇ Ví dụ: Ta có CP của 3 nhóm theo phương pháp f1 như sau: Nhóm 1 item Id avgRating Nhóm 2 10 5 item Id avgRating Nhóm 3 3 4.5 7 4 item Id avgRating 5 4 6 4.5 8 4 Hình 5.2: CP với điểm avgRating Khi đó avgRating của f1 được tính như sau: avgRating (f1) = [avgRating (10) + avgRating (3) + avgRating (7) + avgRating (5) + avgRating (6) + avgRating (8)] / 6 = (5 + 4.5 + 4 + 4 + 4.5 + 4)/6 = 4.33 5.2.3 Tiêu chí uniqueness – TC3 Chỉ số uniqueness đặc trưng tính duy nhất của các tài nguyên trong CP. CP có điểm uniqueness càng cao thì tính duy nhất càng cao. Cách tính điểm uniqueness của một phương pháp như sau: Giả sử có k cộng đồng, mỗi cộng đồng chọn ra n tài nguyên - theo phương pháp f1 - làm CP. Như vậy, tập CP của hệ thống có kn tài nguyên. gọi U là tập tài nguyên chọn ra từ kn tài nguyên CP sao cho { m1  U,  m2  U  m1  m2 }. Khi ấy uniqueness(f1) = | U |. Điểm uniqueness  [n, kn]. Ví dụ: Ta có tập CP trên 5 nhóm theo phương pháp f1 như bảng sau: 80 Tài nguyên Nhóm C1 C2 C3 C4 C5 m1 x x m2 x x x x x m3 x x x x x m4 x x m5 x x x x m6 x x x m7 x m8 x m9 x m10 x Hình 5.3 CP và điểm uniqueness Ta thấy điểm uniqueness của tập CP hệ thống thuộc [5, 25] và: uniqueness(f1) = 10 5.3 Cách thức tiến hành thực nghiệm Để tiến hành thực nghiệm, luận văn sử dụng 3 phân hoạch khác nhau (tương ứng với 3 cách chia cộng đồng khác nhau) trên tập người dùng nhằm kiểm tra tính nhất quán của các phương pháp trong những tình trạng dữ liệu khác nhau. Phân hoạch I có 10 nhóm được tạo ngẫu nhiên từ tập người sử dụng. Phân hoạch II gồm 10 nhóm được lấy ra từ một thuật toán gom nhóm dựa trên ma trận đánh giá (xem phần 2.2.1) và phân hoạch III gồm 8 nhóm được lấy ra từ một thuật toán gom nhóm dựa trên ma trận vector trọng số của người dùng trong hệ thống. Hai phân hoạch sau cùng đã được sử dụng cho các thực nghiệm của những công trình được công bố trong [21]. Trong phương pháp PrometheeMatch. Các giá trị w1, w2, w3 là trọng số tương ứng với tiêu chí tính phổ biến, chất lượng và tính duy nhất của CP. w1, w2, w3  [0,1] và w1 + w2 = 1. Bước nhảy của các trọng số này là 0.1, bước nhảy càng nhỏ 81 thì mức độ khác nhau trong các kết quả càng mịn. Tuy nhiên với giá trị 0.1 cũng đủ cho ta thấy được sự khác nhau giữa các kết quả. Để tiện cho việc so sánh giữa các phương pháp, số lượng tài nguyên được chọn làm CP là 5. Nếu chọn số tài nguyên khác 5 thì kết quả so sánh giữa các phương pháp cũng không thay đổi, tuy nhiên hệ thống sẽ xử lý nhiều hơn nên chạy chậm hơn. Điểm popRank  [1, 1682] vì có tổng cộng 1682 phim trong tập dữ liệu thử nghiệm. Điểm avgRating  [1, 5] vì người dùng đánh giá phim dựa theo thang điểm {1, 2, 3, 4, 5}. Trong phân hoạch I và II, điểm uniqueness thuộc [5, 50] (vì có 10 nhóm môi nhóm có 5 tài nguyên đặc trưng). Và phân hoạch III điểm uniqueness thuộc [5, 40] (vì có 8 nhóm, mỗi nhóm có 5 tài nguyên đặc trưng). Đối với TC1 và TC2, luận văn sẽ so sánh các phương pháp ở hai mức cục bộ (trên từng cộng đồng) và toàn cục (trên toàn hệ thống). Bởi vì kết quả cục bộ (trong từng cộng đồng) có thể khác với kết quả trên toàn hệ thống, Ví dụ, xét theo TC2, giả sử có một tài nguyên i có điểm đánh giá trung bình rất cao trong cộng đồng c, nên c chọn i làm CP, nhưng trên toàn hệ thống điểm trung bình của i rất thấp, điều này dẫn đến chất lượng CP trên từng cộng đồng không tỷ lệ thuận với chất lượng CP trên toàn hệ thống. Nghĩa là có khả năng tập CP tìm được tốt nhất trên từng cộng đồng (theo TC1 và TC2) nhưng có khả năng rất tệ (cũng theo 2 tiêu chí này) trên toàn hệ thống. 5.4 Phân tích kết quả 5.4.1 Phương pháp 1, 2, và 3 Trong phần này luận văn trình bày kết quả thử nghiệm của 3 phương pháp đã có (1, 2 và 3) để thấy rõ ý nghĩa của từng phương pháp theo các tiêu chí đánh giá, dựa trên dữ liệu thực tế. 82 Bảng 5.2 trình bày kết quả thử nghiệm của 3 phương pháp trên 3 phân hoạch cộng đồng, việc thử nghiệm trên 3 cộng đồng khác nhau nhằm khẳng định kết quả của các phương pháp không phụ thuộc vào tình trạng cụ thể của dữ liệu. Phương pháp Phân hoạch I Phân hoạch II Phân hoạch III TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 PP1 4.66 3.89 14 8.90 3.90 13 5.48 3.87 11 PP2 56.18 4.32 24 71.33 4.33 21 88.51 4.33 19 PP3 263.14 3.565 50 180.98 3.743 50 107.55 3.934 40 Bảng 5.1 Kết quả thực nghiệm phương pháp 1, 2 và 3 trên toàn cục Phương Pháp Phân hoạch I Phân hoạch II Phân hoạch III TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 PP1 2.82 3.88 14 2.68 3.97 13 2.75 3.89 11 PP2 49.36 4.4847 13 72.93 4.433 21 87.600 4.433 19 PP3 278.5 3.6 50 171.6 3.9 50 102.7 4.0 40 Bảng 5.2 Kết quả thực nghiệm phương pháp 1, 2 và 3 trên cục bộ Kết quả trên toàn cục (Bảng 5.2) và cục bộ (Bảng 5.3) cho thấy, trên cả 3 phân hoạch, phương pháp 1 tốt nhất trên TC1, phương pháp 2 tốt nhất trên TC2 và phương pháp 3 tốt nhất trên TC3. Kết quả này là hợp lý, bởi vì phương pháp 1 hướng đến tính phổ biến tài nguyên (TC1), do đó phương pháp này đạt được điểm nhỏ nhất trên TC1 (tính phổ biến cao nhất). Phương pháp 2 tập trung vào tiêu chí chất lượng nên đạt điểm cao nhất trên TC2 (chất lượng cao nhất. Và phương pháp 3 tập trung vào tính duy nhất nên luôn đạt được điểm TC3 tối đa. Tuy nhiên, đặc điểm chung của 3 phương pháp này là chỉ tập trung vào một tiêu chí và không quan tâm hoặc quan tâm chưa đúng mức 2 tiêu chí còn lại cho nên điểm của 2 tiêu chí còn lại rất thấp. 5.4.2 Phương pháp 4 – PrometheeMatch Trong phần này luận văn trình bày và phân tích kết quả thử nghiệm của phương pháp 4. Đầu tiên sẽ thử nghiệm phương pháp 4 trên từng tiêu chí, sau đó sẽ 83 trình bày kết quả dựa trên sự thỏa hiệp các tiêu chí và cuối cùng sẽ so sánh các phương pháp nhau. 5.4.2.1 Sự ảnh hưởng trọng số lên các tiêu chí: Để thấy rõ mức độ ảnh hưởng của các trọng số lên các tiêu chí, luận văn lần lượt sẽ xét từng trọng số một bằng cách cho các trọng số biến đổi trong miền giá trị của nó trong khi cố định các trọng số còn lại. Vì w1 + w2 = 1 nên khi w1 biến đổi thì w2 cũng biến đổi (nhưng theo hướng ngược lại). Do đó ta chỉ cần xét sự biến thiên của một trọng số là đủ. Đầu tiên luận văn cố định w3 và cho w1, w2 biến thiên (hình 5.4, 5.5) 0.0 200.0 400.0 600.0 800.0 1000.0 1200.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 0, w1 biến thiên w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 0, w2 biến thiên. w2 PH1 PH2 PH3 84 Hình 5.4: kết quả TC1, TC2 của 3 phân hoạch trên toàn cục khi w3 cố định, w1, w2 biến thiên 0.0 200.0 400.0 600.0 800.0 1000.0 1200.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 0.5, w1 biến thiên. w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 0.5, w2 biến thiên w2 PH1 PH2 PH3 0.0 200.0 400.0 600.0 800.0 1000.0 1200.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 1, w1 biến thiên. w1 PH1 PH2 PH3 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 1, w2 biến thiên w2 PH1 PH2 PH3 85 0.0 100.0 200.0 300.0 400.0 500.0 600.0 700.0 800.0 900.0 1000.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 0, w1 biến thiên w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 6.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 0, w2 biến thiên w2 PH1 PH2 PH3 0.0 100.0 200.0 300.0 400.0 500.0 600.0 700.0 800.0 900.0 1000.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 0.5, w1 biến thiên. w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 6.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 0.5, w2 biến thiên w2 PH1 PH2 PH3 86 Hình 5.5: kết quả TC1, TC2 của 3 phân hoạch trên cục bộ khi w3 cố định, w1, w2 biến thiên Ở đây luận văn chỉ thể hiện kết quả TC1, TC2 trên 3 phân hoạch khi w1, w2 biến thiên từ 0 đến 1 với bước nhảy 0.1 tại các giá trị cố định của w3 bằng 0, 0.5 và 1. Thực tế tại các giá trị khác của w3, cũng cho kết quả tương tự. Kết quả cho thấy, trên cục bộ thì tính phổ biến và chất lượng của CP tỷ lệ thuận với trọng số của TC1 và TC2, nghĩa là khi w1 tăng thì TC1 giảm (hay tính phổ biến tăng), khi w2 tăng thì TC2 tăng theo (chất lượng tăng), điều này phù hợp với lý thuyết. Xét tính phổ biến CP trên toàn cục (tính phổ biến tỷ lệ nghịch với TC1): Trên toàn cục thì tính phổ biến gần như tỷ lệ thuận với trọng số của TC1, điều này cũng dễ giải thích vì một tài nguyên có số lượng đánh giá nhiều trong một cộng đồng cũng thường là những tài nguyên được đánh giá nhiều trong toàn hệ thống, do đó khi chọn một tài nguyên có tính phổ biến cao làm CP cũng thường dẫn đến tập CP hệ thống có độ phổ biến cao, kết quả thực nghiệm cũng cho thấy điều này. Xét chất lượng CP trên toàn cục (chất lượng tỷ lệ thuận với TC2): 0.0 100.0 200.0 300.0 400.0 500.0 600.0 700.0 800.0 900.0 1000.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC1 với w3 = 1, w1 biến thiên w1 PH1 PH2 PH3 0.0 1.0 2.0 3.0 4.0 5.0 6.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 TC2 với w3 = 1, w2 biến thiên w2 PH1 PH2 PH3 87 Trên toàn cục chất lượng CP không tỷ lệ thuận với trọng số của TC2, cụ thể TC2 đạt giá trị cao nhất tại các các giá trị trung bình của w2 và thấp dần khi w2 tiền về 2 biên, điều này đúng trên cả 3 phân hoạch. Và được lý giải như sau: khi w2 thấp, nghĩa là w1 cao và đặc trưng trong mỗi cộng đồng sẽ ưu tiên cho tài nguyên có độ phổ biến cao, nói cách khác chất lượng của tài nguyên không được quan tâm nên tập CP hệ thống có chất lượng không cao. Khi w2 cao, lúc này đặc trưng của mỗi cộng đồng sẽ ưu tiên cho những tài nguyên có chất lượng cao (được cộng đồng đánh giá cao). Nhưng thông thường mỗi cộng đồng thường ưu ái cho một loại tài nguyên nào đó, do đó họ sẽ đánh giá những tài nguyên loại này rất cao, nhưng có khả năng những tài nguyên này không được các cộng đồng khác ưa thích nên bị cho điểm thấp, dẫn đến chất lượng của tài nguyên trên toàn cục thấp. Trong trường hợp w2 có giá trị trung bình, nghĩa những tài nguyên này có chất lượng trung bình và độ phổ biến trung bình sẽ được xem xét làm đặc trưng trên mỗi cộng đồng, và những tài nguyên này cũng có nhiều khả năng đạt được chất lượng đó trên toàn hệ thống, do vậy, cuối cùng, chất lượng của tập CP trên hệ thống có xu hướng cao ở những giá trị w2 trung bình. Ta xét ảnh hưởng của trọng số w3 lên TC3 trên toàn cục. (Xem hình 5.6) 0.0 10.0 20.0 30.0 40.0 50.0 60.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 w1 = 0, w2 = 1 và w3 biến thiên w3 PH1 PH2 PH3 0.0 10.0 20.0 30.0 40.0 50.0 60.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 w1 = 0.5, w2 = 0.5 w3 PH1 PH2 PH3 88 Hình 5.6: Đồ thị TC3 trên 3 phân hoạch với w1, w2 cố định và w3 biến thiên. Ở đây, luận văn chỉ trình bày kết quả TC3 khi trọng số w3 biến thiên tại 3 cặp giá trị cố định của w1, w2 là (0, 1), (0.5, 0.5) và (1, 0). Tính duy nhất của CP tỷ lệ thuận với trọng số w3, về mặt lý thuyết cũng như thực nghiệm đều đúng. Ta thấy rằng khác với w1 và w2 – hai trọng số này nhằm xét độ quan trọng của tính phổ biến và chất lượng CP trong từng cộng đồng - w3 ảnh hưởng đến mối quan hệ giữa các CP với nhau thông qua tính duy nhất của tập CP hệ thống, Do đó ta không cần phải xét tính duy nhất trên cục bộ, vì CP của mỗi cộng đồng không thể có sự trùng lắp. 5.4.2.2 So sánh với 3 phương pháp hiện có Vì ngữ cảnh của các phương pháp xây dựng CP hướng đến từng cộng đồng, do đó ta sẽ so sánh các phương pháp ở mức cục bộ, nghĩa là 2 TC1 và TC2 được tính trên từng cộng đồng chứ không phải trên toàn hệ thống, mặc dù một số kết quả trên toàn cục vẫn được đưa ra để tham khảo. Phương pháp 4 – PrometheeMatch - thỏa hiệp 3 tiêu chí tính phổ biến, chất lượng và tính duy nhất tài nguyên theo cách linh động, hiệu quả, cho ra kết quả thỏa hiệp tốt nhất 3 tiêu chí. Để thấy rõ điều này, luận văn tiến hành so sánh phương pháp 4 với 3 phương pháp 1, 2, và 3. 0.0 10.0 20.0 30.0 40.0 50.0 60.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 w1 = 1, w2 = 0 và w3 biến thiên w3 PH1 PH2 PH3 89 So sánh với phương pháp 1 - POP Với (w1 = 1, w2 = 0, w3 = 0) khi đó PrometheeMatch chính là POP. Vì khi w2 = 0 thì PrometheeMatch sẽ xếp hạng tài nguyên theo TC1 (tiêu chí tính phổ biến) và w3 = 0 nghĩa là việc chọn CP không quan tâm đến sự trùng lắp của các tài nguyên. Đây chính là phương pháp POP. Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III Tương đương TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 w1 = 1, w2 = 0, w3 = 0 4.66 3.89 14 8.90 3.90 13 5.48 3.87 11 POP Bảng 5.3: So sánh PrometheeMatch với POP So sánh với phương pháp 2 – HR20 Phương pháp HR20 hướng đến tiêu chí TC2, do đó, phương pháp này luôn có điểm TC2 cao hơn so với các phương pháp khác, nhưng PP4 nhờ thỏa hiệp TC1 và TC2 nên với những bộ trọng số phù hợp (như bảng 5.8) cho kết quả có TC2 tốt gần bằng PP2 nhưng TC1 tốt hơn hẳn PP2. Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 w1 = 0.5, w2 = 0.5, w3 = 0 4.78 4.18 13 66.52 4.4 20 39.73 4.36 16 w1 = 0.6, w2 = 0.4, w3 = 0 3.56 4.07 13 26.12 4.32 17 12.22 4.29 15 HR20 49.36 4.48 13 72.93 4.43 21 87.6 4.43 19 Bảng 5.4: So sánh PrometheeMatch với HR20 So sánh với phương pháp 3 - avgMatch: Phương pháp Phân hoạch I Phân hoạch II Phân hoạch III Ghi chú TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 PP3 263 3.6 50 181 3.7 50 108 3.9 40 Toàn cục 279 3.6 50 172 3.9 50 103 4.0 40 Cục bộ Bảng 5.5: Kết quả phương pháp 3 trên 3 phân hoạch 90 Đầu tiên luận văn xét trường hợp w3 = 1, khi đó phương pháp 4 cho độ duy nhất tối đa giống phương pháp 3. Tuy nhiên với khả năng thỏa hiệp 2 tiêu chí TC1 và TC2 cùng với việc chọn 2 trọng số w1 và w2 phù hợp, phương pháp 4 cho ra kết quả tốt và linh hoạt hơn phương pháp 3 trên 2 TC này. Xem bảng 5.11, 5.12. Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III w1 w2 w3 TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 0.3 0.7 1 276.22 4.06 50 540.00 3.84 50 478.70 3.94 40 0.4 0.6 1 46.28 4.02 50 328.50 3.96 50 354.45 3.98 40 0.5 0.5 1 31.96 3.97 50 137.08 3.96 50 261.15 3.94 40 0.6 0.4 1 30.14 3.93 50 132.92 3.93 50 122.70 3.98 40 0.7 0.3 1 32.18 3.93 50 88.72 3.91 50 48.48 3.97 40 0.8 0.2 1 27.96 3.87 50 38.54 3.90 50 47.58 3.96 40 0.9 0.1 1 27.68 3.84 50 34.70 3.85 50 37.50 3.92 40 1 0 1 27.62 3.82 50 40.56 3.77 50 31.23 3.88 40 Bảng 5.6: Kết quả phương pháp 4 trên 3 phân hoạch với w3=1 trên toàn cục Phương pháp 4 Phân hoạch I Phân hoạch II Phân hoạch III w1 w2 w3 TC1 TC2 TC3 TC1 TC2 TC3 TC1 TC2 TC3 0 1 1 941.46 5.00 50 867.26 5.00 50 938.08 5.00 40 0.1 0.9 1 868.58 5.00 50 788.22 5.00 50 870.00 5.00 40 0.2 0.8 1 656.24 4.90 50 718.00 4.96 50 763.53 4.95 40 0.3 0.7 1 288.84 4.57 50 510.12 4.81 50 400.50 4.73 40 0.4 0.6 1 39.40 4.20 50 299.40 4.64 50 273.40 4.60 40 0.5 0.5 1 18.16 4.06 50 119.62 4.40 50 190.28 4.47 40 0.6 0.4 1 16.96 3.99 50 115.94 4.36 50 93.00 4.32 40 0.7 0.3 1 17.04 3.98 50 61.54 4.21 50 22.90 4.18 40 0.8 0.2 1 15.56 3.90 50 20.94 4.09 50 20.88 4.15 40 0.9 0.1 1 14.42 3.84 50 14.44 3.99 50 13.05 4.02 40 1 0 1 14.60 3.81 50 13.54 3.80 50 11.28 3.87 40 Bảng 5.7: Kết quả phương pháp 4 trên 3 phân hoạch với w3=1 trên cục
Tài liệu liên quan