Truy vấn trực tiếp trên các đối tượng trong cơ sở dữ liệu hướng đối tượng rất tốn kém chi phí lưu trữ dữ liệu
trong quá trình truy vấn và tốn nhiều thời gian để thực hiện truy vấn trên hệ thống dữ liệu thực. Gần đây, có nhiều nghiên cứu tập
trung vào việc giải quyết vấn đề đó bằng cách xây dựng các chỉ mục trên các lớp đơn, phân cấp lớp, hoặc phân cấp đối tượng lồng
nhau. Trong bài báo này, chúng tôi sẽ đề xuất một phương pháp lập chỉ mục mới. Phương pháp này dựa trên kỹ thuật sử dụng tập
tin chữ ký và cây SD-tree trong đó các tập tin chữ ký được tổ chức theo phân cấp để nhanh chóng lọc dữ liệu không thích hợp và
mỗi tập tin chữ ký được lưu theo cấu trúc cây SD-tree nhằm tăng tốc độ quét chữ ký. Kỹ thuật này giúp giảm đáng kể không gian tìm
kiếm và do đó sẽ cải thiện đáng kể độ phức tạp thời gian truy vấn.
8 trang |
Chia sẻ: thuongdt324 | Lượt xem: 525 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Truy vấn hướng đối tượng dựa trên phân cấp tập tin chữ ký và cây Sd-Tree, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015
DOI: 10.15625/vap.2015.000213
TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN PHÂN CẤP TẬP TIN
CHỮ KÝ VÀ CÂY SD-TREE
Trần Minh Bảo1, Trương Công Tuấn2
1, 2 Trường Đại học Khoa học, Đại học Huế
tmbaovn@gmail.com, tctuan_it_dept@yahoo.com
TÓM TẮT - Truy vấn trực tiếp trên các đối tượng trong cơ sở dữ liệu hướng đối tượng rất tốn kém chi phí lưu trữ dữ liệu
trong quá trình truy vấn và tốn nhiều thời gian để thực hiện truy vấn trên hệ thống dữ liệu thực. Gần đây, có nhiều nghiên cứu tập
trung vào việc giải quyết vấn đề đó bằng cách xây dựng các chỉ mục trên các lớp đơn, phân cấp lớp, hoặc phân cấp đối tượng lồng
nhau. Trong bài báo này, chúng tôi sẽ đề xuất một phương pháp lập chỉ mục mới. Phương pháp này dựa trên kỹ thuật sử dụng tập
tin chữ ký và cây SD-tree trong đó các tập tin chữ ký được tổ chức theo phân cấp để nhanh chóng lọc dữ liệu không thích hợp và
mỗi tập tin chữ ký được lưu theo cấu trúc cây SD-tree nhằm tăng tốc độ quét chữ ký. Kỹ thuật này giúp giảm đáng kể không gian tìm
kiếm và do đó sẽ cải thiện đáng kể độ phức tạp thời gian truy vấn.
Từ khóa - Hệ thống cơ sở dữ liệu hướng đối tượng, chỉ mục, tập tin chữ ký, cây SD-Tree, truy vấn hướng đối tượng.
I. MỞ ĐẦU
Truy vấn trực tiếp trên các đối tượng trong cơ sở dữ liệu hướng đối tượng rất tốn kém chi phí lưu trữ dữ liệu và
tốn nhiều thời gian để thực hiện trên hệ thống dữ liệu thực. Bài toán đặt ra là cần mô tả lại hệ thống dữ liệu đơn giản
hơn và xây dựng cấu trúc dữ liệu tương ứng để có thể giảm không gian tìm kiếm trong quá trình thực thi câu truy vấn
mà vẫn đảm bảo được việc truy vấn được các đối tượng cần thiết.
Để giảm không gian truy vấn dữ liệu, các kỹ thuật chỉ mục sử dùng đánh giá truy vấn trong CSDL được đề xuất trong
[6] đã được phát triển dựa trên cơ chế thăng bằng cây nhị phân thêm vào một số tính chất đặc biệt để giảm việc cân bằng cây
hoặc để tối thiểu hóa các truy cập vào tập tin dữ liệu. Các kỹ thuật này đã được phát triển tiếp nhằm tăng tốc truy vấn trong
các CSDL hướng đối tượng [10, 11, 12]. Ý tưởng chính ở đây là mỗi cây SD-tree trên một lớp trong phân cấp lớp vẫn được
duy trì nhưng các chỉ mục sẽ được lồng ghép với nhau bằng mối quan hệ lớp con – lớp mục tiêu. Ngoài các chỉ mục theo cấu
trúc phân cấp thừa kế còn có rất nhiều các phương pháp lập chỉ mục dùng cho truy vấn thuộc tính lồng nhau đã được đề xuất
[1, 2, 3, 7, 9]. Thay vì tập trung vào phân cấp thừa kế các lớp, các nhà nghiên cứu khác đã khám phá ra sự phân cấp tổng hợp
các lớp và đề xuất các cấu trúc lập chỉ mục khác nhau theo các thuộc tính lồng nhau [1, 2, 7, 9] các cấu trúc lưu trữ tập tin
chữ ký sẽ làm giảm không gian tìm kiếm và tối ưu quá trình truy vấn dữ liệu.
Để việc tìm kiếm hiệu quả hơn, cần xây dựng cấu trúc dữ liệu lưu trữ tập tin chữ ký. Cấu trúc lưu trữ tập tin chữ
ký này có thể dưới dạng các tập tin chữ ký tuần tự, các tập tin chữ ký phân mảnh, cấu trúc cây chữ ký, cấu trúc dạng đồ
thị chữ ký, Trong đó, chi phí lưu trữ của tập tin chữ ký phân mảnh lại gấp đôi tập tin chữ ký tuần tự và chi phí cập
nhật của tập tin chữ ký phân mảnh cũng gấp ba lần tập tin chữ ký tuần tự hoặc nhiều hơn [8]. Ưu điểm cơ bản của
phương pháp tập tin chữ ký tuần tự nằm ở hiệu quả xử lý chèn và truy vấn mới lên các phần của từ. Tuy nhiên, khi so
sánh với lập chỉ mục dựa trên cấu trúc cây thì các tập tin chữ ký liên tiếp lại bị hai nhược điểm, thứ nhất không thể
được dùng để đánh giá các truy vấn phạm vi và thứ hai đối với mỗi truy vấn được xử lý thì toàn bộ tập tin chữ ký cần
phải được quét làm tăng chi phí xử lý I/O.
Trong bài báo này, chúng tôi sẽ cố gắng cải thiện vấn đề thứ hai đến một mức độ nào đó. Đầu tiên, chúng tôi tổ
chức các tập tin chữ ký tuần tự sang cấu trúc phân cấp dùng để giảm bớt không gian tìm kiếm trong quá trình đánh giá
truy vấn. Tiếp theo, chúng tôi lưu trữ tập tin chữ ký dưới dạng cây SD-tree, nhằm tiến hành quét chỉ một tập tin chữ ký
đơn nhất. Nếu tập tin chữ ký có kích thước lớn thì khối lượng thời gian tiết kiệm được bằng phương pháp này là rất
đáng kể. Cây SD-tree được xây dựng dựa trên tập tin chữ ký. Do đó, nó có thể tăng tốc quá trình xác định vị trí chữ ký
trong một tập tin chữ ký. Tuy nhiên, trong cây SD-tree, mỗi đường dẫn sẽ tương ứng với một định danh chữ ký có thể
dùng để xác định duy nhất chữ ký tương ứng với nó trong tập tin chữ ký. Cách này giúp nhanh chóng tìm ra một tập
hợp các chữ ký phù hợp với chữ ký truy vấn.
Bài báo này được tổ chức như sau. Trong phần II, chúng tôi đưa ra một số kiến thức cơ sở. Tại phần III, chúng
tôi sẽ giới thiệu cấu trúc dữ liệu và thuật toán truy vấn. Phần IV đề xuất phương pháp kết hợp phân cấp tập tin chữ ký
và cây SD-tree. Cuối cùng, phần V sẽ đưa ra một kết luận.
II. MỘT SỐ KHÁI NIỆM CƠ SỞ
A. Chữ ký thuộc tính
Trong một CSDL hướng đối tượng, mỗi đối tượng được biểu diễn bởi một bộ giá trị của các thuộc tính. Chữ
ký của một giá trị thuộc tính là một chuỗi các bit được mã hóa bằng hàm băm. Cho trước một giá trị thuộc tính, ví
dụ chữ “truong”, phân giải nó thành một chuỗi các bộ ba chữ cái như sau: “tru”, “ruo”, “uon” và “ong”. Sau đó,
dùng hàm băm h, ánh xạ một bộ ba thành một số nguyên k với ý nghĩa là bit thứ k trong chuỗi sẽ được đặt giá trị 1.
730 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN PHÂN CẤP TẬP TIN
Ví dụ, giả sử có h(tru) = 2, h(ruo) = 7, h(uon) = 10, and h(ong) = 11. Sau đó thiết lập một chuỗi bit: 010 000 100
110 làm chữ ký cho từ.
B. Chữ ký đối tượng, tập tin chữ ký
Chữ ký đối tượng được xây dựng bằng phép toán logic OR cho tất cả các chữ ký của các giá trị thuộc tính của
đối tượng. Sau đây là một ví dụ về chữ ký của đối tượng:
Ví dụ 1. Xét một đối tượng có các giá trị thuộc tính lần lượt là “truong”, “12345678”, “giao su”. Giả sử chữ ký
của các đối tượng này là:
010 000 100 110
100 010 010 100
110 100 011 000
Lúc đó chữ ký của đối tượng là 110 110 111 110, nhận được từ chữ ký các giá trị thuộc tính bằng phép toán
logic OR. Các chữ ký đối tượng của một lớp được lưu trữ trong một tập tin, gọi là tập tin chữ ký đối tượng.
C. Chữ ký truy vấn
Một truy vấn đối tượng sẽ được mã hóa thành một chữ ký truy vấn theo cùng hàm băm đã thực hiện đối với
các đối tượng. Khi có một truy vấn cần thực hiện, các chữ ký đối tượng sẽ được quét và những đối tượng không phù
hợp sẽ bị loại trừ. Lúc đó chữ ký truy vấn được so sánh đối với mọi chữ ký đối tượng trong tập tin chữ ký. Có ba
trường hợp có thể xảy ra:
(i) Đối tượng phù hợp với truy vấn, nghĩa là đối với mọi bit trong chữ ký truy vấn ݏ, bit tương ứng trong chữ ký đối
tượng s cũng chính là nó, tức là ݏ ∧ ݏ ൌ ݏ, đối tượng thực sự chứa từ truy vấn;
(ii) Đối tượng không phù hợp với câu truy vấn, nghĩa là ݏ ∧ ݏ ് ݏ;
(iii) Chữ ký được đối sánh và cho ra một kết quả phù hợp nhưng đối tượng không phù hợp với điều kiện tìm kiếm
trong truy vấn. Để loại ra trường hợp này, các đối tượng phải được kiểm tra sau khi các chữ ký đối tượng được
đối sánh phù hợp.
Ví dụ 2. Ví dụ này minh họa việc truy vấn đối với chữ ký đối tượng ở ví dụ 1:
Truy vấn Chữ ký truy vấn Kết quả
truong 010 000 100 110 thành công
binh 011 000 100 100 không thành công
duong 110 100 100 000 thành công nhưng không phù hợp
Nhận xét: Việc so sánh chữ ký truy vấn sq với chữ ký đối tượng s là loại đối sánh không chính xác. Nghĩa là,
chữ ký truy vấn sq phù hợp chữ ký s nếu mọi bit 1 trong sq, các bit tương ứng trong s cũng là bit 1. Tuy nhiên, đối với
mọi bit 0 trong sq thì không quan trọng bit tương ứng trong s là 0 hay 1.
III. CẤU TRÚC DỮ LIỆU VÀ THUẬT TOÁN TRUY VẤN
A. Truy vấn trong cơ sở dữ liệu hướng đối tượng
Trong các hệ thống CSDL hướng đối tượng, một thực thể sẽ được biểu diễn dưới dạng đối tượng bao gồm các
phương thức và thuộc tính. Các đối tượng có cùng tập thuộc tính và phương thức được nhóm lại với nhau trong cùng
một lớp. Nếu một lớp C có một thuộc tính phức hợp với miền C' thì sẽ thiết lập quan hệ giữa C và C'. Quan hệ này
được gọi là mối quan hệ tổng hợp. Khi dùng mũi tên kết nối các lớp này để biểu diễn mối quan hệ tổng hợp thì một
phân cấp tổng hợp có thể được xây dựng để hiển thị cấu trúc lồng nhau của các lớp.
Ví dụ 3. Một ví dụ về hệ thống phân cấp đối tượng lồng nhau được minh họa như sau:
Hình 1. Một ví dụ về hệ thống phân cấp đối tượng lồng nhau
SinhVien
- HoTen: char
- Truong: Truong
- NganhHoc: NganhHoc
- NoiSinh: char
- GioiTinh: byte
- ThanNhan: ThanNhan
Truong
- Khoa: Khoa
- TenTruong: char
- DiaChiTruong: char
Khoa
- TenKhoa: char
- DiaChiKhoa: char
NganhHoc
- MonHoc: MonHoc
- TenNganh: char
MonHoc
- TenMon: char
- SoTC: int
ThanNhan
- HoTen: char
- NoiSinh: char
- GioiTinh: byte
Ttr
th
d
t
T
c
đ
c
tr
t
V
d
c
đ
th
c
t
Đ
c
c
rần Minh Bảo, T
Nếu đố
ong o’ còn o
Trong C
uộc tính. Thu
Ví dụ 4
iễn như sau:
Select S
Where
And Sin
Nếu kh
iên, hệ thống
iếp đó hệ thố
ủa trường. Cu
ược trả về.
B. Phân
1. Phân
Mục đí
hữ ký không
ánh được việ
ập tin chữ ký
(i) Chữ k
phức
(ii) Chữ k
phức
(iii) Giả sử
có mộ
(iv) Gọi S
thì cũ
í dụ 5. Chữ k
Xét lớp
ựng bằng phư
ủa o và s(o) k
ược tạo ra th
uộc tính phứ
ho đối tượng
ập tin chữ ký
2. Thuậ
ịnh nghĩa 1:
ó dạng: <giá
ây truy vấn, k
rương Công Tuấn
i tượng o đượ
’ sẽ được gọi l
SDL hướng
ộc tính này c
. Truy vấn “
inhVien
SinhVien.Noi
hVien.Truon
ông có cấu trú
phải tìm kiếm
ng sẽ tìm các
ối cùng, nhữ
cấp tập tin c
cấp tập tin c
ch của việc sử
phù hợp với c
c truy cập kh
của nó như sa
ý của đối tượ
hợp của nó.
ý của thuộc
hợp là chữ ký
C là ký hiệu
t mục <osig,
i và Sj là hai t
ng ngầm định
ý và phân cấ
“Khoa” trong
ơng pháp nh
ý hiệu chữ k
eo cùng cách
c hợp là chữ k
của lớp “Truo
mà có thể xây
t toán truy v
(Cây truy vấ
trị toán tử thu
ý hiệu là Qt.
c tham chiếu
à các đối tượn
đối tượng, điề
ó thể là thuộc
tìm tất cả các
Sinh = “Bến
g.Khoa.TenK
c chỉ mục th
tất cả các đố
đối tượng trư
ng sinh viên c
hữ ký và thu
hữ ký
dụng tập tin
hữ ký truy vấ
ông cần thiết
u:
ng được tạo
tính nguyên t
của đối tượn
lớp với o1, ..
oid> trong S.
ập tin chữ ký
có một mũi t
p tập tin chữ
H
phân cấp lớp
ư trong hình 2
ý của o. Đối v
thức như đối
ý của đối tượ
ng” và đối tư
dựng cho m
ấn dựa trên t
n) Gọi ଵ ∧
ộc tính>. Lú
là một thuộc
g cha của o.
u kiện tìm ki
tính lồng nha
sinh viên sin
Tre”
hoa = “Công
ì truy vấn nói
i tượng trong
ờng có tham
ó nơi sinh ở
ật toán truy
chữ ký là để
n sẽ đảm bảo
vào các đối tư
ra bằng cách
hủy được tạo
g mà nó tham
., ol là các đối
tương ứng liê
ên từ Si đến S
ký được minh
ình 2. Chữ ký
không các th
(a), trong đó
ới lớp các th
với lớp chỉ c
ng mà nó tha
ợng o của lớ
ột cơ sở dữ liệ
ập tin chữ ký
ଶ ∧ là đ
c đó, tất cả cá
tính của đối
ếm trong truy
u của lớp mụ
h ở Bến Tre
nghệ Thông
trên có thể đư
lớp “SinhVien
chiếu là sinh
“Bến Tre” và
vấn
lọc ra hầu h
rằng đối tượn
ợng này. Đố
xếp chồng cá
ra bằng cách
chiếu.
tượng của lớ
n kết với các
j.
họa như sau
và phân cấp tậ
uộc tính phứ
mỗi s(o, x) k
uộc tính phức
ác thuộc tính
m chiếu được
p “Khoa” là g
u được hiển t
iều kiện tìm k
c đường dẫn x
tượng o’, thì
vấn được biể
c tiêu.
của Khoa Cô
tin”
ợc đánh giá t
” và lọc ra cá
viên có nơi s
thuộc khoa “
ết các đối tượ
g liên quan v
i với phân cấp
c chữ ký của
băm các giá
p đó; tồn tại m
lớp Ci và Cj.
:
p tin chữ ký
c hợp tại hình
ý hiệu chữ k
hợp thì chữ
nguyên thủy.
minh họa ở h
iá trị thuộc tí
hị trong hình
iếm trong tru
uất hiện trong
sau đó o đượ
u diễn dưới d
ng nghệ thôn
heo trình tự t
c đối tượng c
inh ở “Bến Tr
Công nghệ T
ng không đủ
ới chữ ký này
tổng hợp, có
tất cả các thu
trị thuộc tính
ột tập tin chữ
Nếu tồn tại m
1. Chữ ký củ
ý được tạo ra
ký của các đố
Sự khác biệt
ình 2(b). Tron
nh của “Khoa
1 được minh
y vấn Q, tron
điều kiện tìm
c coi là được
ạng một tổ h
g tin” có thể
rên xuống nh
ó nơi sinh ở
e” và kiểm tr
hông tin” của
điều kiện, ng
sẽ bị bỏ qua
thể xây dựng
ộc tính nguy
; chữ ký của
ký S mà oi (
ột mũi tên từ
a đối tượng o
cho giá trị th
i tượng trong
duy nhất là c
g hình 2 (b),
” của o’. Mộ
họa ở hình 2(
g đó mỗi pi là
kiếm sẽ tạo
731
lồng nhau
ợp của các
được biểu
ư sau. Đầu
“Bến Tre”.
a tên khoa
trường sẽ
hĩa là một
. Do đó sẽ
phân cấp
ên thủy và
thuộc tính
i = 1, ..., l)
Ci đến Cj,
được xây
uộc tính x
đó có thể
hữ ký của
o’ ký hiệu
t phân cấp
c).
một vị từ
thành một
732 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN PHÂN CẤP TẬP TIN
Ví dụ 6. Cây truy vấn được minh họa như sau:
Hình 3. Cây truy vấn
Định nghĩa 2: (Cây chữ ký truy vấn) Gọi p1.p2 ... .pn là một đường dẫn trong cây truy vấn Qt. Gọi <pi ... .pn giá trị
toán tử> là một vị từ xuất hiện trong điều kiện tìm kiếm của Q. Lúc đó, chữ ký của pn là svalue. Chữ ký của một nút
không phải nút lá Qt được tạo bằng phép toán logic OR cho các chữ ký của các nút con của nó. Cây chữ ký truy vấn
được ký hiệu là Q(s,t).
Vi dụ 7. Cây chữ ký truy vấn được minh họa như sau:
Hình 4. Cây chữ ký truy vấn
Sử dụng cây chữ ký truy vấn để giảm bớt không gian tìm kiếm. Phương pháp này, cần có hai cấu trúc ngăn xếp
(stack) để điều khiển việc quét ưu tiên chiều sâu của các cấu trúc cây: stackq đối với Q(s,t) và stackc đối với phân cấp
lớp. Trong stackq, mỗi thành phần là một chữ ký trong khi trong stackc, mỗi thành phần là một tập các đối tượng
thuộc về cùng một lớp có thể tiếp cận được bằng cách quét phân cấp lớp.
Thuật toán 1. [4] Tìm kiếm phân cấp theo kiểu trên xuống;
Vào: Một truy vấn đối tượng Q;
Ra: Một tập các OIDs thỏa mãn truy vấn.
Phương pháp:
Bước 1. Tính toán phân cấp chữ ký truy vấn Q(s,t) đối với Q.
Bước 2. Đưa chữ ký gốc của Q(s,t) vào stackq; đẩy tập OID đối tượng của lớp mục tiêu vào stackc.
Bước 3. Nếu stackq không rỗng, sq ← lấy ra stackq; ngược lại chuyển sang (Bước 7).
Bước 4. S ← lấy stackc; với mỗi oidi E S, nếu chữ ký của nó osigi không so sánh với sq, thì loại ra khỏi S; đưa S vào
Sresult.
Bước 5. Gọi C là lớp các đối tượng của S; gọi C1, ..., Ck là các lớp con của C; sau đó phân chia tập OID của các đối
tượng được tham chiếu bởi S vào S1, ..., Sk sao cho Si thuộc Ci; đẩy S1, ..., Sk vào stackc; đẩy các nút con của sq vào
stackq.
Bước 6. Chuyển đến (Bước 3).
Bước 7. Đối với mỗi đối tượng lá, kiểm tra phù hợp nhưng không đúng.
Kỹ thuật này giúp đạt được tối ưu hóa khi thực hiện bước (4). Tại bước này, một số đối tượng được lọc bằng
cách sử dụng chữ ký tương ứng trong cây chữ ký truy vấn. Trong bước (5), các đối tượng được tham chiếu và các chữ
ký của nút con của cây chữ ký truy vấn được tương ứng đưa vào stackc và stackq. Trong bước (7), thực hiện việc kiểm
tra nhằm lẫn.
SinhVien
NoiSinh Truong
Khoa
TenKhoa
SinhVien 110 110 100 110
NoiSinh 100 110 000 100 Truong 010 000 100 110
Khoa 010 000 100 110
TenKhoa 010 000 100 110
Bến Tre 100 110 000 100
Công nghệ Thông tin 010 000 100 110
TV
tr
v
c
“
k
n
“
c
d
t
V
b
x
c
V
tr
t
d
t
đ
k
v
T
c
rần Minh Bảo, T
í dụ 8. Giả
ong hình 1 th
Khi cả
ấn, các chữ k
hữ ký đầu tiê
Truong” đượ
hông phù hợp
ó tham chiếu
tìm kiếm trên
C. Cây S
1. Tổng q
Kỹ thuậ
hữ ký). Trong
ụng phương
ích lũy trong m
í dụ 9. Cây c
Để xử l
it 1 tại vị trí i
ét sự xuất hiệ
hữ ký của nút
í dụ 10. Cho
ị nút được so
ạo thành cho
anh sách chữ
ố 0110010001
ơn.
Tương
iếm chữ ký c
ị trí 11. Như
2. Thuật
huật toán sau
ác thuật toán
rương Công Tuấn
sử rằng một p
uộc dạng đượ
hai chữ ký đầ
ý được tham
n của “Truon
c tham chiếu
với chữ ký t
sẽ không bị k
xuống” vì tro
D-tree
uát về cấu tr
t tạo chỉ mục
công việc n
pháp này cho
ột nút đơn.
hữ ký SD-tre
ý một chữ ký
trong Sq sẽ tì
n cuối cùng c
lá thứ i được
Sq = 011001
sánh với vị t
Sq bằng cách
ký lưu trữ bi
0. Do đó, kh
tự, chúng tôi
ó trọng lượng
vậy nút có giá
toán truy vấn
đây phác thả
đều đến trực
hần của phân
c mô tả trong
u của tập tin
chiếu bởi chú
g” được tham
bởi chữ ký
ương ứng tro
iểm tra (xem
ng “tìm kiếm
úc SD-tree
trong hệ thố
ày, các vị trí
một chữ ký
Việc truy vấn
e được minh
truy vấn Sq:
m thấy với sự
ủa bit 0 tại v
truy cập từ g
000101. Để t
rí các bit của
sử dụng vị trí
t 1 dưới dạng
ông kể tới m
sử dụng SD-t
trên 50%. B
trị là 11 sẽ đ
trên cây SD
o các bước tì
tiếp các nút c
cấp tập tin c
hình 5:
Hình 5. Min
chữ ký cho “
ng trong tập
chiếu bởi ch
thứ hai trong
ng cây chữ ký
minh họa tại
trên xuống” p
ng CSDL hướ
của bit 0 và b
truy vấn cho
, con đường t
họa như sau:
Hình 6.
(1) Đối với c
tạo thành tiề
ị trí i trong Sq
ốc và tất cả c
ìm tất cả các
Sq. Sự xuất hi
của bit 1 là 0
gom cụm và
ẫu bit của Sq,
ree để mô tả
ây giờ, giả sử
ược tìm kiếm
-tree
m kiếm chữ k
hữ ký hồi đáp
hữ ký được x
h họa quá trình
SinhVien” phù
tin chữ ký ch
ữ ký đầu tiên
“SinhVien”.
truy vấn. Vì
phần màu xá
hải tiến hành
ng đối tượng
it 1 trong chữ
sẵn thì tất cả
ìm kiếm tối ư
Cây chữ ký SD
hữ ký có trọn
n tố trung gia
sẽ tìm thấy v
ác chữ ký với
chữ ký khớp
ện cuối cùng
1100100010.
tất cả chữ ký
tất cả các chữ
bit 0 dưới dạn
rằng Sq= 01
trong danh s
ý khớp với ch
lại 1 cuối cùn
ây dựng cho
truy vấn
hợp với chữ
o “Truong” sẽ
trong “Sinh
Có thể thấy r
vậy tất cả cá
m trong hình
kiểm tra tất c
ở đây bằng c
ký được phâ
các chữ ký t
u được tính to
-tree
g lượng dưới
n (B); (2) Đố
ới sự tạo thà
tiền tố (B) đư
với Sq, cây SD
của 1 trong S
Một nút với g
trong danh s
ký trùng khớ
g gom cụm.
1101110101.
ách chữ ký lư
ữ ký truy vấn
g từ gốc.
một CSDL v
ký tương ứn
được kiểm t
Vien” trong k
ằng chữ ký
c chữ ký của
5). Việc này l
ả các chữ ký
ách sử dụng
n bổ qua mộ
rùng khớp đề
án để đẩy nh
50% xét sự x
i với chữ ký c
nh tiền tố trun
ợc truy vấn.
-tree được x
q là ở vị trí 12
iá trị khóa là
ách chữ ký đ
p đều được tr
Điều này giúp
Sự xuất hiện
u trữ bit 0 dư
cho trước Sq
ới sơ đồ được
g trong cây c
ra bổ sung. G
hi chữ ký thứ
thứ hai trong
đối tượng “K
à tối ưu khi s
đối tượng củ
cây SD-tree
t tập hợp các
u có thể đượ
anh toàn bộ q
uất hiện cuố
ó trọng lượng
g gian (B). S
ét kỹ từ gốc
. Tiền tố nhị
12 được truy
ược kiểm tra
ả về trong m
cải thiện thờ
cuối cùng của
ới dạng gom
. Trong quá t
733
minh họa
hữ ký truy
iả sử rằng
hai trong
“Truong”
hoa” được
o sánh với
a “Khoa”.
(Phân cụm
nút lá. Sử
c truy vấn
uá trình.
i cùng của
trên 50%
au đó, nút
và các giá
phân được
cập trong
giá trị tiền
ột truy cập
i gian tìm
bit 0 là ở
cụm.
rình F← 0
7
T
V
R
P
B
B
B
B
B
B
B
tr
v
c
h
tr
c
c
tr
th
2
V
V
c
tr
h
n
34
huật toán 2.
ào: Chữ ký t
a: Danh sách
hương pháp
ước 1. Tính
ước 2. Nếu
ước 3. Nếu
ước 4. Truy
ước 5. So sá
ước 6. Nếu
ước 7. Nếu
A. Mô h
Để cải
úc dữ liệu tư
iệc truy vấn đ
ần kết hợp ph
ơn. Từ [13],
ên cây chữ k
ây SD-tree để
Dựa trê
hữ ký và cây
ình quét tập
ực hiện kỹ th
xác định chín
í dụ 11. Tạo
í dụ 12. Kết
Cấu trú
hữ ký trên câ
úc dữ liệu sẽ
ướng đối tượ
hiều đối tượn
[14] Tìm kiế
ruy vấn.
các chữ ký k
:
trọng lượng c
trọng lượng c
không thì tìm
cập nút lá.
nh tiền tố của
tìm thấy thì đ
không thì báo
IV. PHƯƠ
ình cấu trúc
thiện thời gian
ơng ứng để có
ược các đối t
ân cấp tập tin
độ phức tạp th
ý. Do đó, chú
cải thiện thờ
n cơ sở lý thu
SD-tree như
tin chữ ký; (2
uật lọc theo t
h xác chữ ký
cây SD-tree đ
hợp phân cấp
c dữ liệu đượ
y SD-tree đượ
không thể lư
ng, được lưu
g. Ứng với m
m(Sq)
hớp