Hệ thống gợi ý (Recommender Systems - RS) đang được ứng dụng rộng rãi trong nhiều lĩnh vực (như thương mại điện
tử, giải trí, giáo dục,...) nhằm dự đoán sở thích của người dùng nhờ vào thông tin cá nhân hoặc những phản hồi (đánh giá) của họ.
Bài viết này đề xuất một giải pháp trong xây dựng hệ thống gợi ý theo ngữ cảnh, áp dụng cho gợi ý du lịch nhằm gợi ý các điểm
du lịch phù hợp nhất với du khách. Hệ thống này kết hợp các phương pháp như gợi ý dựa trên ngữ cảnh đầu vào (contextual prefiltering), tích hợp với kỹ thuật phân rã ma trận (matrix factorization) và xử lý ngữ cảnh đầu ra (contextual post-filtering) nhằm tăng độ
chính xác cho hệ thống. Sau khi xây dựng hệ thống và tích hợp các giải thuât gợi ý, chúng tôi thu thập thông tin từ người dùng thực
nhằm đánh giá hiệu quả của hệ thống đã đề xuất. Thực nghiệm cho thấy việc ứng dụng giải pháp này trong hỗ trợ phát triển du lịch là
hoàn toàn khả thi
10 trang |
Chia sẻ: candy98 | Lượt xem: 777 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Một tiếp cận trong xây dựng hệ thống gợi ý theo ngữ cảnh, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015
DOI: 10.15625/vap.2015.000185
MỘT TIẾP CẬN TRONG XÂY DỰNG HỆ THỐNG GỢI Ý THEO NGỮ CẢNH
Lư Chân Thiện1 và Nguyễn Thái Nghe2
1Khoa Kỹ thuật Công nghệ, Trường Cao đẳng Cộng đồng Kiên Giang, E-mail: lcthien_kgcc@yahoo.com
2Khoa Công nghệ Thông tin và Truyền thông, Trường Đại học Cần Thơ, E-mail: ntnghe@cit.ctu.edu.vn
Tóm tắt - Hệ thống gợi ý (Recommender Systems - RS) đang được ứng dụng rộng rãi trong nhiều lĩnh vực (như thương mại điện
tử, giải trí, giáo dục,...) nhằm dự đoán sở thích của người dùng nhờ vào thông tin cá nhân hoặc những phản hồi (đánh giá) của họ.
Bài viết này đề xuất một giải pháp trong xây dựng hệ thống gợi ý theo ngữ cảnh, áp dụng cho gợi ý du lịch nhằm gợi ý các điểm
du lịch phù hợp nhất với du khách. Hệ thống này kết hợp các phương pháp như gợi ý dựa trên ngữ cảnh đầu vào (contextual pre-
filtering), tích hợp với kỹ thuật phân rã ma trận (matrix factorization) và xử lý ngữ cảnh đầu ra (contextual post-filtering) nhằm tăng độ
chính xác cho hệ thống. Sau khi xây dựng hệ thống và tích hợp các giải thuât gợi ý, chúng tôi thu thập thông tin từ người dùng thực
nhằm đánh giá hiệu quả của hệ thống đã đề xuất. Thực nghiệm cho thấy việc ứng dụng giải pháp này trong hỗ trợ phát triển du lịch là
hoàn toàn khả thi.
Từ khóa: Hệ thống gợi ý theo ngữ cảnh, hệ thống gợi ý du lịch, kỹ thuật phân rã ma trận, lọc cộng tác.
I. GIỚI THIỆU
Ngành du lịch trong những năm qua đã phát triển mạnh mẽ, đem lại lợi ích to lớn về kinh tế - xã hội, góp phần thúc
đẩy các ngành sản xuất và dịch vụ phát triển. Với tiềm năng du lịch đa dạng và phong phú, Việt Nam là một nước có nhiều
danh lam thắng cảnh, từ đó thu hút không ít khách du lịch cả trong và ngoài nước. Tuy nhiên, khách du lịch thường gặp phải
rất nhiều khó khăn khi đi đến những thành phố lạ lẫm. Họ cần phải nhờ đến sự trợ giúp của hướng dẫn viên du lịch hoặc ít
nhất là phải dựa vào sách hướng dẫn hay bản đồ để có được những thông tin mà họ cần tìm. Tuy nhiên những sự trợ giúp
này cũng có những hạn chế nhất định như: Khách du lịch sẽ có thể khó tìm thấy những thông tin chi tiết về những địa điểm
du lịch cần tham quan để có sự chuẩn bị cần thiết. Hoặc là, những hướng dẫn viên du lịch thường hướng dẫn cho cả đoàn
khách, họ đi theo những tour du lịch đã được định sẵn và chỉ được tham quan những điểm du lịch chính, trong khi những
điểm du lịch thú vị lại không được tham quan, mặc dù cách địa điểm chính rất gần.. Như vậy làm thế nào để hỗ trợ khách
khi đi du lịch có thể dễ dàng tìm thấy những địa điểm phù hợp với họ, phù hợp với những điều kiện ngữ cảnh xung quanh
(như thời tiết, tâm trạng, bạn đồng hành,...).
Để đáp ứng những đòi hỏi trên, việc ứng dụng các công nghệ trong hệ thống gợi ý với các yếu tố ngữ cảnh có thể sẽ
cho kết quả phù hợp. Hệ thống gợi ý (Recommender Systems - RS) là một dạng kỹ thuật trong lọc thông tin, RS đang được
ứng dụng rộng rãi trong nhiều lĩnh vực (như thương mại điện tử, giải trí, giáo dục,...) nhằm dự đoán sở thích của người dùng
nhờ vào thông tin cá nhân hoặc những phản hồi (đánh giá) của họ.
Bài viết này đề xuất một giải pháp xây dựng hệ thống gợi ý dựa trên ngữ cảnh, sau đó ứng dụng giải pháp này cho
bài toán gợi ý các điểm du lịch. Hệ thống có thể vận hành trên nền Web để hỗ trợ khách du lịch nhằm đem lại sự thoải mái
và sự tiện dụng tối đa cho họ khi tham gia vào hệ thống.
Để thực hiện, chúng tôi đã nghiên cứu các phương pháp hiện có và đề xuất phương pháp xây dựng hệ thống bằng
cách kết hợp phương pháp gợi ý dựa trên ngữ cảnh đầu vào (contextual pre-filtering), tích hợp với kỹ thuật phân rã ma trận
(matrix factorization) và xử lý ngữ cảnh đầu ra (contextual post-filtering), đồng thời tìm hiểu và đề xuất hướng khắc phục
vấn đề người dùng mới trong hệ thống. Sau khi xây dựng hệ thống hoàn chỉnh, chúng tôi thu thập ý kiến phản hồi từ người
dùng thực, từ đó đánh giá hiệu quả của hệ thống đã xây dựng.
II. HỆ THỐNG GỢI Ý (RECOMMENDER SYSTEMS - RS) VÀ CÁC NGHIÊN CỨU LIÊN QUAN
Hệ thống gợi ý (RS) là hệ thống có khả năng dự đoán và cung cấp cho người dùng những thông tin, sản phẩm hay
dịch vụ mà họ có thể thích/quan tâm. RS sẽ đưa ra các gợi ý dựa trên phản hồi trong quá khứ của người dùng (như bình
luận, đánh giá,) trên sản phẩm, bài hát, bộ phim, điểm du lịch,... Các hệ thống gợi ý nổi tiếng hiện có như: gợi ý sản
phẩm của Amazon/Ebay, gợi ý phim/video clip của NetFlix/Youtube,
RS đã cho thấy được ý nghĩa to lớn của nó trong việc giúp người dùng giải quyết tình trạng quá tải thông tin. Có hai
loại mô hình RS được nghiên cứu và ứng dụng trong thực tiễn đó là: hệ thống gợi ý 2 chiều (2D RS) và hệ thống gợi ý
theo ngữ cảnh (đa chiều, thông thường là 3 chiều – 3D RS).
A. Hệ thống gợi ý hai chiều
Trong hệ thống gợi ý 2 chiều có hai khái niệm chính là người dùng (user) và mục tin (item) cần được gợi ý đến
cho người dùng. Quá trình gợi ý dựa vào các phản hồi (feedbacks/rating) của người dùng về các đối tượng. Ví dụ, đánh giá
của người dùng về các sản phẩm mà họ đã từng mua trên Amazon từ đến . Nhiệm vụ của RS là dự đoán các
đánh giá của những người dùng đối với những item mà họ chưa thấy/mua và sau đó gợi ý cho họ.
Một cách hình thức, gọi U là tập người dùng (users); I là tập mục tin (items). Tập I có thể rất lớn, từ hàng trăm
ngàn (sách, CD,) đến hàng triệu (như bài báo, bản tin,). R là tập các giá trị đánh giá của người dùng trên các mục tin.
4T
m
h
t
d
g
B
n
q
t
g
g
n
b
k
R
v
n
đ
•
86
hông thường
ỗi ô là đánh
àm ̂ݎ đo độ p
Các kỹ
- Dựa t
họ đá
- Lọc c
đánh
- Lai g
Ý tưởn
ập N(ui,i) giữ
ùng u, đầu tiê
iá cao sẽ đượ
. Hệ thống g
Thông
gười dùng v
uyết định của
hể” [3]. Ví dụ
iá của người
Với hệ
ví dụ, t
ian (buổi sán
hỏ). Những
uổi tối mùa x
hông phù hợp
Không
(101,7,1) = 6
ới giá trị đán
gười dùng ch
ến với người
Các ph
Xử lý ngữ
chọn hoặc
chiều sẽ tr
đã chọn.
dữ liệu được
giá của user t
hù hợp (xếp h
thuật trong R
rên nội dung
nh giá cao;
ộng tác (colla
giá cao. Đây
hép (hybrid):
g chính của k
a người dùng
n hệ thống lọ
c dùng để gợi
ợi ý theo ngữ
thường trong
à mục tin là
người dùng
: thời gian, n
dùng đối với
thống gợi ý đ
rong hệ thống
g/tối, cuối tu
đánh giá ch
uân đi cùng
nữa.
gian gợi ý b
có ý nghĩa l
h giá là 6. T
ưa đánh giá.
dùng.
ương pháp tiế
cảnh đầu và
xây dựng cá
ở thành hệ th
biểu diễn tro
rên item tươn
ạng/đánh giá
S thường đượ
(content-base
borative filte
là kỹ thuật thư
kết hợp cả 2 p
ỹ thuật lọc cộ
ui và i, trong
c cộng tác tìm
ý cho u.
cảnh (Contex
RS hai chiều,
chính chứ kh
hay không. “T
ơi chốn, thời
các item, từ đ
a chiều, hàm
̂ݎ: U
gợi ý du lịch
ần, mùa, lễ, t
o một điểm d
gia đình thì đ
a chiều có th
à người dùng
rong khối lập
Mục tiêu của
Hình 1.
p cận trong h
o (Contextua
c thiết lập có
ống hai chiều
ng một ma t
g ứng). Với m
) của người dù
c phân thành
d filtering): n
ring): người d
ờng được sử
hương pháp
ng tác là dự đ
đó ui là ngườ
những ngườ
t-aware RS)
người ta thườ
ông quan tâm
hông tin ngữ
tiết, tâm trạng
ó dẫn đến sự
̂ݎ được bổ sun
× I × C → R
, user là khác
ết,), bạn đ
u lịch bởi mộ
ịa điểm ABC
ể được mô t
có mã số 101
phương này
hệ thống gợi
Minh họa cho
ệ thống gợi ý
l pre-filtering
liên quan đế
và ta có thể
MỘT TIẾP CẬ
rận 2 chiều, t
ỗi người dùn
ng u đạt giá
̂ݎ: U × I → R
ba nhóm [1]:
gười dùng đư
ùng được gợ
dụng nhất;
trên.
oán độ phù h
i có cùng sở t
i dùng khác c
ng biểu diễn
đến các thô
cảnh là nhữn
, là những
ảnh hưởng củ
g thêm thông
(C là th
h du lịch, item
ồng hành (đi
t người dùng
là hấp dẫn n
ả trong khối
đánh giá sản
, không phải
ý là dự đoán
không gian gợ
đa chiều có th
): Trong tiếp
n dữ liệu (xế
sử dụng bất k
N TRONG XÂY
rong đó mỗi
g u ∈ U, cần
trị lớn nhất trê
ợc gợi ý nhữ
i ý các sản ph
ợp của item i
hích với u. V
ó cùng sở thí
dữ liệu vào m
ng tin ngữ c
g thông tin c
thông tin ngữ
a những gợi ý
tin ngữ cảnh
ông tin ngữ c
là những đị
một mình, đi
có thể sẽ phụ
hất, nhưng k
lập phương n
phẩm có mã
ô nào cũng c
giá trị tại nhữ
i ý ba chiều (ng
ể được tóm t
cận này, thô
p hạng). Sau
ỳ phương phá
DỰNG HỆ TH
dòng là một u
tìm mục i ∈ I
n i:
ng item tương
ẩm mà những
được đánh gi
í dụ, để gợi ý
ch với u. Sau
a trận user-it
ảnh (context)
ó thể mô tả đư
cảnh, chúng
trong RS.
(context) và
ảnh)
a điểm du lịch
với bạn trai/
thuộc vào nh
hi đi cùng bạ
hư ở Hình 1
số 7 trong đi
ó giá trị, nhữ
ng ô còn thiế
uồn [3])
ắt như sau [3]
ng tin về ngữ
khi lọc thôn
p gợi ý truyề
ỐNG GỢI Ý TH
ser, mỗi cột
(u chưa xem/
tự như các i
người cùng
á bởi người d
một điểm du
đó, những nơ
em do vậy ch
bên ngoài c
ợc hoàn cản
có thể ảnh h
trở thành:
, và ngữ cản
bạn gái, đi vớ
ững ngữ cảnh
n gái thì có th
. Ô tô đậm c
ều kiện thời g
ng ô không c
u đó, từ đó đ
:
cảnh được s
g tin ngữ cản
n thống nào t
EO NGỮ CẢNH
là một item v
mua i) sao ch
(1
tem từng đượ
sở thích với h
ùng u dựa trê
lịch cho ngườ
i được họ đán
ỉ quan tâm đế
ó tác động đế
h của một thự
ưởng đến đán
h có thể là thờ
i gia đình, tr
đó. Ví dụ và
ể địa điểm đ
ho biết chỉ s
ian có mã số
ó giá trị là d
ưa ra lời gợi
ử dụng để lự
h, hệ thống đ
rên các dữ liệ
à
o
)
c
ọ
n
i
h
n
n
c
h
i
ẻ
o
ó
ố
1
o
ý
a
a
u
L•
•
C
p
R
d
h
đ
T
t
A
t
h
ứ
S
c
c
c
c
ư Chân Thiện, N
Xử lý ngữ
hạng được
được điều
Mô hình h
có thể đưa
đó xác suấ
. Các nghiên
Hiện cũ
háp lọc theo
icci, 2002), (
i động, như tr
Ở đây c
ợp với kỹ thu
ầu ra.
Để xây
rước tiên xử
in ngữ cảnh đ
. Xử lý thông
Phương
rạng,) hoặc
ợp nhất để đư
ng. Sau đó dù
au khi lọc ta
hiều như min
ho người dùn
ảnh được thu
Ví dụ:
ác thông tin n
guyễn Thái Ngh
cảnh đầu ra
dự đoán bằn
chỉnh cho mỗ
óa ngữ cảnh
ra xác suất m
t này được dù
cứu liên qua
ng đã có nhi
nội dung (co
Linaza et al.,
ình bày trong
húng tôi sẽ đ
ật phân rã ma
dựng hệ thốn
lý thông tin n
ầu ra.
tin ngữ cảnh
pháp này dù
từ môi trườn
a ra gợi ý. D
ng điều kiện
có thể bỏ qu
h họa trong H
g. Lợi ích củ
giảm.
Giả sử ta có t
gữ cảnh (thời
user
1
1
1
2
2
3
3
4
e
(Contextual
g cách sử dụ
i người sử dụ
(Contextual m
ột người dù
ng để điều ch
n
ều nghiên cứ
ntent-based
2011). Ngoài
(José et al., 2
ề xuất xây dự
trận (matrix
g gợi ý theo n
gữ cảnh đầu
đầu vào
ng những đi
g (thời gian, t
ữ liệu đầu và
ngữ cảnh hiệ
a thông tin n
ình 3. Từ đâ
a việc này là
ập dữ liệu ngữ
gian, bạn đồ
Bả
item
2 C
5 C
3
2 Ngà
1
5
4 C
3
post-filtering)
ng bất kỳ phư
ng bằng cách
odeling): Ph
ng cụ thể chọ
ỉnh và tìm ra
u về xây dựn
filtering) (Ge
ra, cũng đã c
012), (Damia
ng hệ thống
factorization
III. PHƯƠ
gữ cảnh, chú
vào, kế đến d
Hình 2. Qu
ều kiện ngữ c
hời tiết, vị trí
o là một tập b
n tại của ngườ
gữ cảnh, như
y, ta có thể áp
có thể tái sử
Hình 3. Sử dụ
cảnh gợi ý d
ng hành, thời
ng 1. Minh hoạ
time
uối tuần
uối tuần
Lễ - tết
y trong tuần
Lễ - tết
Lễ - tết
uối tuần
Lễ - tết
: Trong tiếp
ơng pháp gợi
sử dụng các
ương pháp nà
n một sản ph
gợi ý phù hợ
g hệ thống gợ
diminas Ado
ó nhiều nghiê
nos et al., 20
gợi ý có tích
) (Koren et al
NG PHÁP Đ
ng tôi đề xuất
ùng kỹ thuật p
y trình gợi ý th
ảnh hiện tại
hiện tại,) s
ao gồm: ngư
i dùng cung
vậy bài toán
dụng bất kỳ
dụng tất cả n
ng phương phá
u lịch như Bả
tiết) và đánh
tập dữ liệu du
Bạn Đồng
Bạn b
Một m
Gia đì
Bạn b
Gia đì
Gia đì
Bạn b
Gia đì
cận này, ngữ
ý truyền thố
thông tin theo
y xây dựng m
ẩm cụ thể tro
p.
i ý hỗ trợ du
mavicius and
n cứu xây dự
14), (Gavalas
hợp các phươ
., 2009) (Ngu
Ề XUẤT
kết hợp các p
hân rã ma trậ
eo ngữ cảnh
được cung cấ
au đó truy vấn
ời dùng, đối t
cấp để lọc ra
gợi ý đa chiề
phương pháp
hững phương
p Pre-filtering
ng 1, gồm: n
giá của người
lịch với ngữ c
hành
è
ình
nh T
è
nh T
nh T
è
nh T
cảnh thông ti
ng trên toàn b
ngữ cảnh.
ột mô hình d
ng một bối cả
lịch, nhưng
Alexander T
ng hệ thống g
et al., 2013) (
ng pháp như
yễn Thái Ngh
hương pháp
n để dự đoán
p trực tiếp từ
, tìm kiếm nh
ượng, ngữ cả
tập dữ liệu có
u lúc này trở
gợi ý hai ch
pháp gợi ý
gười dùng (us
dùng trên địa
ảnh
Thời tiết
Trời nắng
Trời âm u
rời trong xan
Trời nắng
rời trong xan
rời trong xan
Trời nắng
rời trong xan
n ban đầu bị
ộ dữ liệu. Sa
ự đoán. Ví dụ
nh cụ thể là
đa phần là sử
uzhilin, 2008
ợi ý du lịch t
Manuel et al.
xử lý ngữ cản
e, 2013), và x
như minh họa
kết quả, sau
người dùng
ững nguồn tà
nh và những đ
liên quan đế
về dạng bài
iều nào để dự
hai chiều sau
er), địa điểm
điểm du lịch
ra
4
1
h 5
2
h 3
h 4
3
h 5
48
bỏ qua và xế
u đó, các gợi
, mô hình nà
bao nhiêu. Sa
dụng phươn
), (Francesc
rên nền thiết b
, 2012).
h đầu vào, kế
ử lý ngữ cản
trong Hình 2
đó xử lý thôn
(sở thích, tâm
i nguyên thíc
ánh giá tươn
n ngữ cảnh đó
toán gợi ý ha
đoán các item
khi chiều ng
du lịch (item
tương ứng.
te
7
p
ý
y
u
g
o
ị
t
h
:
g
h
g
.
i
ữ
),
4p
t
n
l
2
B
c
n
w
b
n
s
ư
c
t
88
Để gợi
hương pháp x
Như vậ
hống gợi ý tru
hững phương
iệu đã được x
009).
. Kỹ thuật ph
Kỹ thuậ
ó thể xây dựn
Trong đ
gười dùng u;
uk và hik là cá
ởi công thức:
Như vậ
ày có được bằ
au:
Một tro
u hóa hàm m
húng cho đến
ăng hay nên g
ý cho người d
ử lý ngữ cảnh
y sau khi xử
yền thống để
pháp lọc cộn
ử lý ngữ cảnh
ân rã ma trậ
t phân rã ma
g lại X từ hai
ó, W∈ℜ|U|×K
và H∈ℜ|I|×K
c phần tử tươ
y, vấn đề then
ng cách tối ư
ng những kỹ
ục tiêu (2), tr
khi hàm mục
iảm các giá trị
ùng với các
đầu vào để l
B
lý xong ta sẽ
dự đoán xếp
g tác dựa trê
đầu vào. Kỹ
n (Matrix Fac
trận là việc ch
ma trận nhỏ h
là một ma tr
là một ma trậ
ng ứng của ha
chốt của kỹ
u hóa hàm mụ
thuật có thể d
ước tiên ta kh
tiêu hội tụ v
của W và H
thông tin ngữ
ọc ra (các dòn
ảng 2. Tập dữ l
user
1
2
3
4
được một tập
hạng và gợi
n mô hình đó
thuật MF có
torization - M
ia một ma trậ
ơn này càng c
Hình 4. Minh
ận mà mỗi dò
n mà mỗi dò
i ma trận W
∑
=
=
K
k
uirˆ
thuật MF là l
c tiêu (object
=
MFO
ùng để tối ưu
ởi tạo các gi
ề giá trị nhỏ n
qua mỗi lần c
uk
O
w∂
∂
ik
O
h∂
∂
MỘT TIẾP CẬ
cảnh là: (dịp
g được tô đậ
iệu sau khi sử
item
3
1
5
3
dữ liệu hai ch
ý cho người
là kỹ thuật p
độ tin cậy ca
F)
n lớn X thành
hính xác càng
họa kỹ thuật p
ng u là một v
ng i là một vé
và H, khi đó x
=ikukhw
1
w
àm thế nào để
ive function).
∑
∈
−
trainDiu
uir
,
(
hóa hàm mục
á trị ngẫu nhi
hất (converge
ập nhật, do vậ
ui
MF r(2−=
ui
MF r(2−=
N TRONG XÂY
Lễ - tết, đi cù
m) tập dữ liệu
dụng Pre-filteri
rate
5
3
4
5
iều. Lúc này
dùng. Trong b
hân rã ma trậ
o hơn so với
hai ma trận c
tốt, nghĩa là X
hân rã ma trận
éctơ bao gồm
ctơ bao gồm
ếp hạng của
T.h
tìm được giá
Trong RS, hà
∑
∈
=
tDiu
uir
,
2)ˆ
tiêu là dùng S
ên cho W và
nce). Để làm
y cần phải tìm
ikui hr )ˆ−
ukui wr )ˆ−
DỰNG HỆ TH
ng Gia đình,
như trong B
ng
, ta có thể áp
ài viết này, c
n (Matrix Fac
các kỹ thuật
ó kích thước
~ WHT, như
K nhân tố ti
K nhân tố tiề
người dùng u
trị của hai th
m mục tiêu củ
∑
=
⎜⎝
⎛
−
rain
K
k
ui wr
1
GD (Stochas
H, sau đó từ
được điều đó
đạo hàm từn
ỐNG GỢI Ý TH
Trời trong xa
ảng 2.
dụng các thuậ
húng tôi sử d
torization - M
khác hiện nay
nhỏ hơn W v
minh họa tro
ềm ẩn (latent
m ẩn mô tả c
trên mục tin
am số W và H
a MF hay đượ
⎟⎠
⎞
ikuk h
2
tic Gradient D
ng bước cập n
, ta cần phải x
g phần của ch
EO NGỮ CẢNH
nh) ta sử dụn
t toán trong h
ụng một tron
F) trên tập d
(Koren et al
à H, sao cho t
ng Hình 4.
factors) mô t
ho item i. Gọ
i được dự đoá
(1
. Hai tham s
c sử dụng nh
(2
escent). Để tố
hật giá trị củ
ác định là nê
úng:
(3
(4
g
ệ
g
ữ
.,
a
ả
i
n
)
ố
ư
)
i
a
n
)
)
Lđ
đ
(
H
v
t
h
a
C
v
đ
v
t
đ
d
h
n
l
n
đ
c
k
d
t
ư Chân Thiện, N
Sau khi
Trong đ
ược giá trị nh
Chính t
oán cho kết q
2) bằng cách t
àm mục tiêu
Trong đ
à hik được cập
Quá trìn
rước.
Quá trì
iện theo công
l., 2009) (Ngu
. Xử lý thông
Trong p
ẫn là tập dữ l
ánh giá của n
à gợi ý trên to
hông tin ngữ
Tuy nh
ịa điểm du lịc
ùng rất thích
ọ khó đến đư
gữ cảnh đầu
ại trong một p
Tuỳ the
Ví dụ,
gười dùng đa
ược những g
ăn cứ vào vị
hoảng cách c
ùng nhất để g
heo Google M
guyễn Thái Ngh
tìm đạo hàm,
ó β là tốc độ
ỏ nhất hoặc đạ
ắc hóa (Regul
uả tốt trên dữ
hêm vào một
(2) bây giờ trở
ó λ là hệ số c
nhật qua côn
h cập nhật g
nh dự đoán:
thức (1). Bạ
yễn Thái Ng
tin ngữ cảnh
hương pháp
iệu bao gồm
gười dùng lên
àn bộ tập dữ
cảnh ban đầu
iên phương p
h, khi áp dụn
nhưng cách h
ợc nên những
vào và xử lý t
hạm vi nhất đ
o từng hệ thố
trong hệ thốn
ng ở đâu và p
ợi ý từ kỹ th
trí của người
ủa người dùn
ợi ý cho họ,
ap.
e
các phần tử c
n
ukw
ne
ikh
học (learning
t đến số lần lặ
arization): Để
liệu huấn luyệ
đại lượng gọi
thành:
MO
hính tắc hóa
g thức:
iá trị của W v
Sau quá trình
n đọc có thể
he, 2013).
đầu ra
này, thông tin
cả thông tin n
các đối tượn
liệu ban đầu.
rồi mới chuyể
háp này có th
g phương ph
ọ khá xa (ngữ
gợi ý này ch
hông tin ngữ
ịnh giúp cho
ng khác nhau
g gợi ý du lị
hạm vi mà h
uật phân rã m
dùng để tìm r
g đến từng địa
minh họa như
ủa W và H sẽ
old
uk
ew w −= β
old
ik
w h −= β
rate, 0 < β <1
p được xác đ
ngăn ngừa sự
n, nhưng cho
là chính tắc h
∑
∈
⎜⎝
⎛
=
trainDiu
F
,
(0 ≤ λ<1) và
new
ukw =
new
ikh =
à H được lặp
huấn luyện t
tìm hiểu chi t
ngữ cảnh đư
gữ cảnh. Tuy
g. Sau đó dùn
Sau khi có kế
n đến người
ể chưa phù h
áp trên để dự
cảnh trong t
ưa thật sự có
cảnh đầu ra.
lời gợi ý đó t
Hình 5. Xử
, ta có thể sử
ch, giả sử ba
ọ có thể đến
a trận (ví dụ
a được khoản
điểm với ph
trong Hình
được cập nhậ
MF
uk
O
w∂
∂
⋅
MF
ik
O
h∂
∂
⋅
). Quá trình c
ịnh trước.
quá khớp ha
kết quả kém
óa (regulariza
∑
=
−
K
k
ukui wr
1
2|||| F⋅ là chuẩ
(oldukw ⋅+ β 2
(oldikh ⋅+ β 2
lại cho đến k
a được 2 ma
iết hơn về kỹ
ợc sử dụng s
nhiên, ta giả
g những kỹ t
t quả gợi ý ch
dùng.
ợp cho từng
đoán, hệ thốn
rường hợp nà
nghĩa. Ở đâ
Với đề xuất n
hêm phần chí
lý thông tin ngữ
dụng những t
n đầu hệ thốn
(vị trí và phạm
: có 10 địa đi
g cách từ ngư
ạm vi mà ngư
5. Khoảng cá
t ngược hướn
old
ukw 2+=
old
ikh 2+= β
ập nhật sẽ đư
y còn gọi là h
trên dữ liệu th
tion) để điều
(⋅+⎟⎠⎞ikh
2
λ
n Frobenius.
ikuiui hrr − )ˆ(
uuiui wrr − )ˆ(
hi đạt độ lỗi c
trận W và H đ
thuật này tro
au khi đã có
định các thô
huật gợi ý ha
o người dùng
ứng dụng cụ
g có thể đưa
y là vị trí của
y, chúng tôi k
ày, hệ thống
nh xác và phù
cảnh đầu ra
hông tin ngữ
g biết được
vi có thể th
ểm được dự đ
ời dùng đến m
ời dùng đã ch
ch giữa 2 địa
g với giá trị củ
uiui rr ˆ( −⋅β
uiui wrr )ˆ( −⋅
ợc thực hiện đ
ọc vẹt (overfit
ử nghiệm) ng
khiển độ lớn c
+
FF
HW 22
Với hàm mục
)oldukw⋅− λ
)oldikk h⋅− λ
hấp nhận hoặ
ã tối ưu thì q
ng các tài liệ
lời gợi ý. Đầ
ng tin ngữ cả
i chiều để tiến
, ta sẽ lọc ra
thể, ví dụ tro
ra những địa
người dùng v
ết hợp cả 2 p
sẽ thu nhỏ ph
hợp hơn.
cảnh đầu ra sa
thông tin ngữ
ay đổi được b
oán là người
ỗi địa điểm.
ọn để lọc lại
điểm được tí