Nội dung Chương 3 trình bày sơ lược về web nghĩa, các phương pháp biểu diễn ngữ nghĩa của dịch vụ web. Tiếp theo là trình bày về một số hướng nghiên cứu chính trong lĩnh vực dịch vụ web ngữ nghĩa . Phương pháp tìm kiếm dịch vụ web dựa trên công dụng sẽ được trình bày vào cuối chương này.
11 trang |
Chia sẻ: vietpd | Lượt xem: 1538 | Lượt tải: 2
Bạn đang xem nội dung tài liệu Ngữ nghĩa và các phương pháp biểu diễn ngữ nghĩa, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
21
CHƢƠNG 3 : NGỮ NGHĨA VÀ CÁC PHƢƠNG PHÁP BIỂU
DIỄN NGỮ NGHĨA
Tóm tắt:
Nội dung Chương 3 trình bày sơ lược về web nghĩa, các phương pháp biểu diễn
ngữ nghĩa của dịch vụ web. Tiếp theo là trình bày về một số hướng nghiên cứu chính
trong lĩnh vực dịch vụ web ngữ nghĩa . Phương pháp tìm kiếm dịch vụ web dựa trên
công dụng sẽ được trình bày vào cuối chương này.
3.1 Web ngữ nghĩa
3.1.1 Giới thiệu
Năm 2001, Tim Berners Lee cùng với nhóm tác giả công bố công trình về
web ngữ nghĩa [20]. Nhóm tác giả mở rộng khả năng con ngƣời có thể đọc và hiểu
các thông tin web sang máy có khả năng hiểu và vận dụng nó một cách có ý nghĩa.
Nhóm tác giả đã đƣa ra vài ứng dụng minh họa cho việc sử dụng công nghệ này.
Một ứng dụng cơ bản đó là ứng dụng trong lĩnh vực tìm kiếm thông tin, giúp máy có
khả năng phân biệt các ngữ nghĩa. Các ứng dụng nâng cao khác bao gồm các
software agent có khả năng thực hiện các công việc cho sẵn phụ thuộc vào lúc thực
thi, khi đó các agent tự động tìm ra các dịch vụ đáp ứng đƣợc công việc này một
cách tự động, agent biết bằng cách nào để phát hiện, chọn đúng và thực thi dịch vụ
và trả kết quả theo đúng yêu cầu của ngƣời dùng.
3.1.2 Kiến trúc
Theo thay đổi từng năm 2005, 2006, 2007 có thể thấy rằng có những công
nghệ vẫn còn đang phát triển, có những công nghệ đã ổn định nhƣ là các hình trong
khung màu đỏ, các phần còn lại đang trong quá trình chuẩn hóa và vẫn đang trong
giai đoạn nghiên cứu [41]. Cụ thể các công nghệ đã ổn định là URI/IRI, XML,
22
RDF, RDF-S, OWL và SPARRQL, còn các công nghệ vẫn đang trong quá trình
chuẩn hóa và trong giai đoạn nghiên cứu nhƣ là Rule, Cryto, Proof, Trust, Unifying
Logic. Kiến trúc web ngữ nghĩa thay đổi theo từng năm đƣợc minh họa của thể trong
Hình 3.1.
Hình 3.1 Sự tiến hóa của kiến trúc web ngữ nghĩa theo đề xuất của Berners Lee [41]
23
Các tầng bên dƣới cung cấp các chuẩn web là nền tảng cho các công nghệ
khác. Các tầng bên trên cung cấp các ngôn ngữ dùng để biểu diễn tài nguyên theo
chuẩn giúp máy có khả năng hiểu và có khả năng làm việc với những tài nguyên
này.
3.2 Dịch vụ web ngữ nghĩa
Các nghiên cứu dịch vụ web ngữ nghĩa (Semantic Web Service) đã giải quyết
đƣợc vấn đề còn thiếu sót của dịch vụ web bằng cách thêm ngữ nghĩa vào bên trong
thành phần của dịch vụ vì vậy không chỉ UDDI có khả năng hỗ trợ ngƣời dùng dịch
vụ tìm kiếm dịch vụ tự động mà còn giúp cho việc sử dụng dịch vụ một cách tự động
trong giai đoạn thiết kế cũng nhƣ giai đoạn thực thi của một quy trình nghiệp vụ bên
trong kiến trúc hƣớng dịch vụ [4].
Hình 3.2 Dịch vụ web ngữ nghĩa [43]
Dịch vụ web ngữ nghĩa = web ngữ nghĩa + Dịch vụ web đƣợc minh
họa trong Hình 3.2.
Nhƣ vậy, dịch vụ web ngữ nghĩa là phƣơng pháp ứng dụng web ngữ nghĩa
vào trong dịch vụ web, nói cách khác dịch vụ web ngữ nghĩa là phƣơng pháp mở
rộng dịch vụ web với cách biểu diễn ngữ nghĩa cho nó. Dịch vụ web ngữ nghĩa mở
24
ra khả năng cho phép tìm kiếm, tổng hợp và gọi thực hiện dịch vụ web động trong
lúc thực thi.
Ngôn ngữ biểu diễn ngữ nghĩa cho dịch vụ web đƣợc tổ chức W3C đệ trình
đầu tiên vào tháng 11 năm 2004 là OWL-S [31]. Ngoài ra còn các ngôn ngữ biểu
diễn ngữ nghĩa cho dịch vụ web ra đời sau cũng đƣợc tổ chức w3c đệ trình nhƣ là:
WSMO [32], SAWSDL [33]. Trong đó WSMO đƣợc đệ trình vào 6/2006 và
SAWSDL đƣợc đệ trình sau cùng vào 08/2007. Các ngôn ngữ biểu diễn ngữ nghĩa
cho dịch vụ web này đƣợc tóm tắt trong Bảng 3.1.
STT HƢỚNG
TIẾP CẬN
NỘI DUNG NĂM CÔNG
BỐ
NĂM ĐỆ
TRÌNH
1 OWL-S Ontology mô tả dịch vụ
web:
-ServiceProfile
- ServiceModel
- ServiceGrounding)
2001 11/2004
2 WSMO - Ontologies
- Goals
-Web Services
- Mediators
2002 06/2005
3 SAWSDL Chú giải ngữ nghĩa cho
- WSDL
- XML Schema
2003 08/2007
Bảng 3.1 Ba ngôn ngữ biểu diễn dịch vụ web đƣợc W3C đệ trình
Trong các ngôn ngữ biểu diễn ngữ nghĩa cho dịch vụ web, OWL-S là ngôn
ngữ ra đời đầu tiên và cũng là ngôn ngữ có nhiều dịch vụ đƣợc ứng dụng rộng rãi ,
theo số liệu [18] (đƣợc minh họa trong Hình 3.3) có khoảng 1% dịch vụ web đƣơc
25
chú giải ngữ nghĩa, trong đó OWL-S chiếm 65%, do đó trong đề tại này chúng tôi
sẽ tập trung vào việc phân tích, đánh giá trên ngôn ngữ OWL-S .
Quá trình tìm kiếm dịch vụ web dựa trên các ngữ nghĩa về các thành phần
chức năng và phi chức năng của dịch vụ. Nhiều công trình đƣợc đề xuất nhằm đáp
ứng nhu cầu tìm kiếm dịch vụ động. Nhiều công trình tìm kiếm dịch vụ có hỗ trợ
ngữ nghĩa bao gồm dựa trên input (I) và output(O) nhƣ OWLS-UDDI [9], OWLSM
[10], OWLS-MX[11] trong hệ thống CASCOM, SAWSDL-MX [12], tìm kiếm dựa
trên Precondition (P) và Effect (E): PCEM [8] trong hệ thống CASCOM, tìm kiếm
dựa trên IOPE nhƣ GLUE [13], RFSD [14]. Công trình tìm kiếm dịch vụ dựa trên
vai trò (Role) ROWLS [15] trong hệ thống CASCOM. Tìm kiếm dựa vào toàn bộ
thông tin mô tả của dịch vụ (profile) nhƣ FC-MATCH [16].
Hình 3.3 Tập dữ liệu từ thế giới thực [18], [42]
3.2.1 OWL-S
OWL-S (Ontology Web Language For Services) là một OWL Ontology
đƣợc sử dụng để biểu diễn ngữ nghĩa cho dịch vụ web. OWL-S bao gồm ba
Ontology: ServiceProfile, ServiceModel và ServiceGrounding đƣợc minh họa trong
Hình 3.4. OWL-S có lịch sử bắt nguồn từ DAML-S đƣợc công bố năm 2001, OWL-
26
S chính thức đƣợc tổ chức W3C đệ trình vào ngày 22 tháng 11 năm 2004, phiên bản
hiện tại là 1.2 đƣợc công bố vào tháng 12 năm 2008.
Lý do ra đời ngôn ngữ này [37] là do dịch vụ web thiếu biểu diễn ngữ nghĩa
và cần sự hỗ trợ của con ngƣời.
Hình 3.4 Dịch vụ OWL-S [31]
3.2.2WSMO
WSMO (Web Service Modeling Ontology) là một Ontology đƣợc sử dụng để
biểu diễn ngữ nghĩa cho dịch vụ web. WSMO chứa bốn thành phần thứ nhất là các
Ontology chịu trách nhiệm cung cấp các thuật ngữ sử dụng cho các thành phần khác,
thứ hai là các Goal chịu trách nhiệm định các mục tiêu nên đƣợc giải quyết bởi dịch
vụ web, thứ ba là các Web Service chịu trách nhiệm biễu diễn ngữ nghĩa cho dịch vụ
web và thứ tƣ là các Mediator chịu trách nhiệm xử lý các vấn đề liên quan đến sự
tƣơng kết (interoperability). Các thành phần của WSMO đƣợc minh họa cụ thể trong
Hình 3.5.
27
WSMO có nguồn gốc từ WSMF (Web Service Modeling Framwork) [5]
đƣợc công bố năm 2002 tại hội nghị International Semantic Web Workshop, WSMO
chính thức đƣợc tổ chức W3C đệ trình vào ngày 3 tháng 6 năm 2005.
Lý do ra đời của WSMO [38] là cung cấp một chuẩn cho việc biểu diễn ngữ
nghĩa cho dịch vụ web với 2 nguyên lý cơ bản đó là hỗ trợ strong decoupling &
strong mediation. Các hƣớng tiếp cận hiện tại nhƣ OWL-S đã không cung cấp một
giải pháp thống nhất cho dịch vụ web ngữ nghĩa và đó cũng là lý do ra đời của
WSMO.
Hình 3.5 Các thành phần WSMO [32]
3.2.3 SAWSDL
SAWSDL (Semantic Annotations For WSDL And XML Schema) là một mở
rộng đơn giản của WSDL bằng việc sử dụng các thẻ mở rộng của WSDL. SAWSDL
có 2 kiểu chú giải cơ bản đó là tham chiếu mô hình (model reference) và ánh xạ lƣợc
đồ (schema mapping). Cách thức chú giải SAWSDL đƣợc minh họa cụ thể trong
Hình 3.6.
Các chú giải tham chiếu mô hình (model reference annotation) đƣợc sử dụng
để kết hợp các interfaces/port types, operations, inputs, outputs, xml schema
elements và attributes với các khái niệm ngữ nghĩa (Semantic Concepts). Các chú
giải mô hình tham chiếu hỗ trợ cho việc tìm kiếm động dịch vụ web và thực hiện cấu
hình động cho các tiến trình (processes).
28
Các chú giải ánh xạ lƣợc đồ (Schema Mapping Annotation) đƣợc sử dụng để
giải quyết sự không đồng nhất dữ liệu, đặc biệt là việc chuyển đổi biểu diễn dữ liệu
sang dịch vụ web khác nhƣ là các dữ liệu có thể đƣợc sử dụng bởi các dịch vụ web
khác.
SAWSDL đƣợc phát triển dựa trên WSDL-S, một chuẩn đƣợc w3c đệ trình
vào ngày 7 tháng 11 năm 2005. Còn ý tƣởng đƣa các ngữ nghĩa vào các chuẩn của
dịch vụ web đƣợc công bố vào tháng 6 năm 2003 tại hội nghị International
Conference on Web Service do nhóm các tác giả ở Large Scale Distributed
Information Systems (LSDIS) Lab Department of Computer Science, University of
Georgia đề xuất. Đến ngày 28 tháng 8 năm 2007, tổ chức W3C đệ trình chuẩn
SAWSDL.
Hình 3.6 SAWSDL [33]
Lý do ra đời SAWSDL [39] là cơ chế tìm kiếm hiện tại đƣợc hỗ trợ bởi
UDDI không đủ mạnh cho việc tìm kiếm tự động. Hạn chế chính đó là thiếu các ngữ
29
nghĩa trong quá trình tìm kiếm, UDDI chỉ hỗ trợ tìm kiếm thông qua từ kh óa
(keyword) và phép phân loại (taxonomy), còn WSDL chỉ mô tả các chức năng của
dịch vụ, không đƣợc chú giải ngữ nghĩa, mặt khác các hƣớng tiếp cận khác nhƣ
OWL-S, WSMO cố gắng đƣa ra một ngôn ngữ mới để biểu diễn ngữ nghĩa cho dịch
vụ web. Do đó SAWSDL đƣợc xây dựng dựa trên các chuẩn của dịch vụ web đã có,
độc lập với ngôn ngữ biễu diễn ngữ nghĩa, cho phép nhiều chú giải thuộc nhiều ngôn
ngữ biễu diễn ngữ nghĩa khác nhau. Do phát triển dựa trên các chuẩn đã có của dịch
vụ web vì vậy với SAWSDL có thể nâng cấp các công cụ sẵn có, không nhất thiết
phải đƣa ra các công cụ hoàn toàn mới.
3.3 Một số hƣớng nghiên cứu chính trong lĩnh vực dịch vụ web ngữ nghĩa
Tại hội nghị International Semantic Web Conference 2008, John Domingue
và David Martin trình bày, hiện có 7 hƣớng nghiên cứu chính trong lĩnh vực dịch vụ
web ngữ nghĩa [43], bao gồm:
Ngôn ngữ và từ vựng để biểu diễn ngữ nghĩa cho dịch vụ web.
Phát hiện và chọn lựa dịch vụ web phù hợp với nhu cầu dựa trên ngữ
nghĩa.
Tổng hợp và phối hợp hoạt động của các dịch vụ web dựa trên một qui
trình.
Quản lý giao tác và tài nguyên cho dịch vụ web ngữ nghĩa .
Dịch vụ sử dụng trên các thiết bị di động.
Các vấn đề về bảo mật trong việc sử dụng dịch vụ web ngữ nghĩa.
Các công cụ và môi trƣờng (tự động hay bán tự động) trong việc phát triển
và khai thác dịch vụ web ngữ nghĩa.
3.4 Phƣơng pháp tìm kiếm dịch vụ web dựa trên công dụng
Việc nghiên cứu web ngữ nghĩa nói chung và dịch vụ web ngữ nghĩa nói
riêng đã thu hút sự quan tâm của rất nhiều nhà khoa học trên thế giới. Điều đó đƣợc
minh chứng thông qua việc những hội nghị quốc tế có uy tín liên tục đƣợc tổ chức
30
với quy mô toàn thế giới cũng nhƣ ở khu vực ví dụ nhƣ hội nghị quốc tế ISWC
(International Semantic Web Conference) đƣợc tổ chức từ năm 2002 đến 2010. Tiếp
theo là hội nghị ở châu Âu ESWC (European Semantic Web Conference) đƣợc tổ
chức từ năm 2004 đến năm 2010 và hội nghị ở châu Á là ASWC (Asian Semantic
Web Conference) đƣợc tổ chức từ năm 2006 đến 2010.
Một dịch vụ OWL-S bao gồm 3 phần: Thứ nhất là ServiceProfile phục vụ cho
việc quảng cáo và phát hiện dịch vụ; Thứ hai là ServiceModel chịu trách nhiệm mô
tả hoạt động của dịch vụ và thứ ba là ServiceGrounding chịu trách nhiệm cung cấp
cách tƣơng tác với dịch vụ.
Service Profile đƣợc thiết kế để mô tả dịch vụ làm gì thông qua các Input,
Output, Precondition và Postcondition. Michael C. Jaeger nhận định rằng các
Precondition và Postcondition vẫn chƣa đủ chuẩn hóa để phục vụ cho thuật toán so
khớp dịch vụ [10]. Chúng tôi khảo sát cho đến thời điểm hiện tại là tập dữ liệu dịch
vụ OWL-S đƣợc công bố vào 06/04/2005 và liên tục đƣợc phát triển đến 11/11/2009
bởi nhóm nghiên cứu Matthias Klusch [18] và đƣợc phát triển tiếp bởi cộng đồng
S3Contest [21], chúng tôi thấy rằng Precondion và Postcondition vẫn chƣa đƣợc
thêm vào. Do đó khi nhiều Service Profile cùng các Input và các ouput có thể có
những công dụng khác nhau.
David Martin nhận định rằng việc chú giải ngữ nghĩa cho phƣơng thức bằng
một cách nào đó sẽ hữu dụng trong một số tình huống đặc biệt là trong quá trình tìm
kiếm [17]. Thông qua các Input, Output, Preconditon và Postcondition của Service
Profile cung cấp một cách để xác định ngữ nghĩa của phƣơng thức.
Chúng tôi thấy rằng việc chú giải ngữ nghĩa cho phƣơng thức thông qua các
công dụng dịch vụ cung cấp có thể đƣợc sử dụng cho việc phát hiện các dịch vụ đáp
ứng đƣợc nhu cầu của ngƣời dùng tƣơng ứng với chức năng họ cần thật sự, nhƣ vậy
các chú giải công dụng của dịch vụ có thể đƣợc phục vụ cho việc quyết định lựa
chọn các dịch vụ có công dụng tƣơng ứng trong quá trình tổng hợp dịch vụ động.
31
Thêm vào đó việc tìm kiếm dịch vụ dựa vào các công dụng có thể đƣợc sử dụng nhƣ
một bƣớc tiền xử lý cho các thuật toán tìm kiếm dịch vụ dựa trên các Input, Output
cũng nhƣ các thành phần còn lại của dịch vụ, điều đó sẽ giảm bớt đáng kể số lƣợng
dịch vụ có các Input và Output và các thành phần còn lại phải so khớp .