Truy vấn hướng đối tượng dựa trên đồ thị chữ ký

Các kỹ thuật lập chỉ mục luôn luôn là một vấn đề quan trọng trong việc tìm kiếm thông tin hiệu quả từ cơ sở dữ liệu (CSDL). Đối với CSDL hướng đối tượng, việc sử dụng các tập tin chữ ký như là một phương pháp chỉ mục đã được thừa nhận là một tiếp cận phổ biến trong việc xử lý truy vấn trên CSDL hướng đối tượng. Các đối tượng của lớp được mã hóa thành các chữ ký đối tượng bằng cách dùng hàm băm và được lưu trữ trong một tập tin chữ ký. Tuy nhiên, mỗi khi xử lý truy vấn thì toàn bộ tập tin chữ ký phải được quét. Vì vậy phương pháp này đòi hỏi chi phí xử lý cao. Để khắc phục nhược điểm này, chúng tôi đề xuất một mô hình cấu trúc đồ thị được xây dựng trên chữ ký của các đối tượng trong một CSDL hướng đối tượng, gọi là đồ thị chữ ký. Đồng thời đề xuất cách thức xây dựng đồ thị chữ ký và thuật toán truy vấn trên đồ thị chữ ký cùng với phần mô phỏng ứng dụng của phương pháp này.

pdf7 trang | Chia sẻ: candy98 | Lượt xem: 599 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Truy vấn hướng đối tượng dựa trên đồ thị chữ ký, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 DOI: 10.15625/vap.2015.000212 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN ĐỒ THỊ CHỮ KÝ Trần Minh Bảo1, Trương Công Tuấn2 1, 2Trường Đại học Khoa học, Đại học Huế tmbaovn@gmail.com, tctuan_it_dept@yahoo.com TÓM TẮT - Các kỹ thuật lập chỉ mục luôn luôn là một vấn đề quan trọng trong việc tìm kiếm thông tin hiệu quả từ cơ sở dữ liệu (CSDL). Đối với CSDL hướng đối tượng, việc sử dụng các tập tin chữ ký như là một phương pháp chỉ mục đã được thừa nhận là một tiếp cận phổ biến trong việc xử lý truy vấn trên CSDL hướng đối tượng. Các đối tượng của lớp được mã hóa thành các chữ ký đối tượng bằng cách dùng hàm băm và được lưu trữ trong một tập tin chữ ký. Tuy nhiên, mỗi khi xử lý truy vấn thì toàn bộ tập tin chữ ký phải được quét. Vì vậy phương pháp này đòi hỏi chi phí xử lý cao. Để khắc phục nhược điểm này, chúng tôi đề xuất một mô hình cấu trúc đồ thị được xây dựng trên chữ ký của các đối tượng trong một CSDL hướng đối tượng, gọi là đồ thị chữ ký. Đồng thời đề xuất cách thức xây dựng đồ thị chữ ký và thuật toán truy vấn trên đồ thị chữ ký cùng với phần mô phỏng ứng dụng của phương pháp này. Từ khóa - Truy vấn hướng đối tượng, chữ ký đối tượng, tập tin chữ ký, đồ thị chữ ký. I. MỞ ĐẦU Việc nghiên cứu các kỹ thuật lập chỉ mục luôn luôn là một vấn đề quan trọng trong việc tìm kiếm thông tin hiệu quả từ cơ sở dữ liệu (CSDL). Đối với CSDL hướng đối tượng, truy vấn trực tiếp trên các đối tượng có chi phí thời gian thực hiện lớn. Đã có nhiều kỹ thuật chỉ mục CSDL nhằm xử lý truy vấn trên CSDL hướng đối tượng, trong đó phương pháp tập tin chữ ký được thừa nhận rộng rãi và là một tiếp cận khá hiệu quả trong việc xử lý truy vấn trên CSDL hướng đối tượng. Đối với phương pháp này, các đối tượng của lớp được mã hóa thành các chữ ký đối tượng bằng cách dùng hàm băm và được lưu trữ trong một tập tin chữ ký. Tuy nhiên, việc truy vấn trên tập tin chữ ký lại có nhược điểm là tốn kém chi phí do phải quét toàn bộ tập tin. Một số các phương pháp chỉ mục khác nhằm khắc phục điều này và có thể tìm thấy trong nhiều công trình nghiên cứu [1] [2] [3] [8] [9]. Trong bài báo này, chúng tôi đề xuất việc tổ chức tập tin chữ ký của một lớp trong CSDL hướng đối tượng trong một đồ thị chữ ký và xây dựng các thuật toán để tạo đồ thị chữ ký và truy vấn đối tượng trên đồ thị chữ ký. Việc sử dụng đồ thị chữ ký có không gian tìm kiếm nhỏ hơn để từ đó giảm thời gian truy vấn dữ liệu. Bài báo này được tổ chức như sau: Phần đầu của bài báo sẽ giới thiệu khái quát về chữ ký đối tượng, tập tin chữ ký, chữ ký truy vấn và cấu trúc đồ thị chữ ký, sau đó bài báo thực hiện việc xây dựng đồ thị chữ ký và thuật toán truy vấn đối tượng trên đồ thị chữ ký, đồng thời xây dựng mô hình ứng dụng, phần cuối của bài báo là kết luận. II. MỘT SỐ KHÁI NIỆM CƠ SỞ Phần này chỉ trình bày một số khái niệm cơ sở liên quan đến chữ ký đối tượng và tập tin chữ ký. Chi tiết đầy đủ hơn có thể xem trong [1] [2]. A. Chữ ký đối tượng, tập tin chữ ký Trong một CSDL hướng đối tượng, mỗi đối tượng được biểu diễn bởi một bộ giá trị của các thuộc tính. Chữ ký của một giá trị thuộc tính là một chuỗi các bit được mã hóa bằng hàm băm. Chữ ký đối tượng được xây dựng bằng phép toán logic OR cho tất cả các chữ ký của các giá trị thuộc tính của đối tượng. Sau đây là một ví dụ về chữ ký của đối tượng: Ví dụ 2.1. Xét một đối tượng có các giá trị thuộc tính lần lượt là “Dung”, “12345678”, “giao su”. Giả sử chữ ký của các đối tượng này là: 010 000 100 110 100 010 010 100 110 100 011 000 Lúc đó chữ ký của đối tượng là 110 110 111 110, nhận được từ chữ ký các giá trị thuộc tính bằng phép toán logic OR. Các chữ ký đối tượng của một lớp được lưu trữ trong một tập tin, gọi là tập tin chữ ký đối tượng. B. Chữ ký truy vấn Một truy vấn đối tượng sẽ được mã hóa thành một chữ ký truy vấn theo cùng hàm băm đã thực hiện đối với các đối tượng. Khi có một truy vấn cần thực hiện, các chữ ký đối tượng sẽ được quét và những đối tượng không phù hợp sẽ bị loại trừ. Lúc đó chữ ký truy vấn được so sánh đối với mọi chữ ký đối tượng trong tập tin chữ ký. Có ba trường hợp có thể xảy ra: TV c m A c th h V d h x lư Đ V rần Minh Bảo, T (1) Đối tư đối tư (2) Đối tư (3) Chữ k trong được í dụ 2.2. Ví Nhận x hữ ký truy vấ ọi bit 0 trong . Đồ thị chữ Để tìm hữ ký đó. Nế iện quá trình iện được do v í dụ 3.1. Xem Giả sử ụng tìm kiếm iện nhiều chữ uất hiện của đ u trữ được d ịnh nghĩa 3. 1. Mỗi n ký sig bit thứ 2. Đặt e nhãn thứ i í dụ 3.2. Hìn rương Công Tuấn ợng phù hợp ợng s cũng ch ợng không p ý được đối sá truy vấn. Để đối sánh phù dụ này minh h T D B D ét: Việc so sá n ݏ௤ phù hợp ݏ௤ thì không ký một chữ ký đ u tập tin là lớ này là sắp xế iệc đối sánh t tập tin chữ k chữ ký truy v nhị phân thì ký giống nh ối tượng phù anh sách các c 1. Đồ thị chữ út u ∈ V có d ሺuሻ trong tập i của chữ ký ൌ ሺu, vሻ ∈ E là 0 và i ൐ 0 của chữ ký đư h vẽ sau min với truy vấn, ính là nó, tức hù hợp với câ nh và cho ra loại ra trườn hợp. ọa việc truy ruy vấn ung inh uong nh chữ ký tru chữ ký s nếu quan trọng bi III. ối tượng tron n thì thời gia p tập tin chữ rên tập tin ch ý đã được sắ 010 0 100 0 010 1 ấn s୯ là 000 chữ ký 100 0 au ứng với cá hợp. Vì lý do hữ ký và cho ký Gୱ đối với ạng ൏ lpሺuሻ, tin chữ ký S v truy vấn s୯ sẽ . Lúc đó e đư thì bit thứ i c ợc trỏ lpሺvሻ l h họa một tập Hìn nghĩa là đối là ݏ௤ ∧ ݏ = ݏ u truy vấn, ng một kết quả p g hợp này, c vấn đối với ch Chữ ký tr 010 000 011 000 110 100 y vấn ݏ௤ với mọi bit 1 tron t tương ứng t ĐỒ THỊ C g tập tin chữ n để tìm kiếm ký và sau đó ữ ký là một đố p xếp gồm 3 c 00 100 110 10 010 100 00 011 000 010 010 100. 10 010 100 k c đối tượng c này, ta sẽ tổ phép truy ng tập tin chữ ký skipሺuሻ ൐, vớ à skipሺuሻ là được kiểm tr ợc gán nhãn ủa chữ ký đư à 1. Một nút v tin chữ ký và h 1. Minh họa với mọi bit tro ௤, đối tượng th hĩa là ݏ௤ ∧ ݏ hù hợp nhưn ác đối tượng ữ ký đối tượn uy vấn 100 110 100 100 100 000 chữ ký đối tư g ݏ௤, các bit rong s là 0 hay HỮ KÝ VÀ T ký có phù hợ trên một tập sử dụng việc t i sánh không hữ ký đối tượ Nó phù hợp v hông thể tìm ó nội dung gi chức tập tin c ược lại vị trí c S là một đồ i lpሺuሻ là dan một số nguyê a khi tìm kiếm là 0 hoặc 1 v ợc trỏ bởi lpሺ với skipሺuሻ đồ thị chữ ký tập tin chữ ký ng chữ ký tru ực sự chứa từ ≠ ݏ௤; g đối tượng k phải được kiể g ở ví dụ 1.1 Kết quả thành công không thàn thành công ợng s là loại tương ứng tro 1. HUẬT TOÁ p với chữ ký tin như vậy ìm kiếm nhị p chính xác. Ta ng: ới chữ ký 10 thấy. Mặt khá ống nhau, quá hữ ký thành ủa dữ liệu tươ thị có hướng h sách các co n i không âm, . Nếu i ൌ 0, s à skipሺuሻ ൐ vሻ là 0. Nếu e ൌ 0 thì không của nó: và đồ thị chữ ký y vấn ݏ௤, bit truy vấn; hông phù hợp m tra sau kh : h công nhưng khôn đối sánh khô ng s cũng là b N truy vấn, ta c là đáng kể. Ý hân. Tuy nhi xem ví dụ sa 0 010 010 10 c, trong tập t trình truy vấ một đồ thị, gọ ng ứng. Ta c Gୱ = (V, E) sa n trỏ tham chi gọi là bước n igሺuሻ sẽ được 0. Đặt skipሺ được gán nh có nút con. tương ứng tro với điều kiện i các chữ ký g phù hợp ng chính xác it 1. Tuy nhi ần phải quét m tưởng trước ên, điều này k u đây: 0. Tuy nhiên in chữ ký có n cần tìm ra t i là đồ thị ch ó định nghĩa s o cho: ếu đến các vị hảy nhảy bit. so sánh với s uሻ ൌ i. Nếu e ãn là 1 và i ൐ 723 ng chữ ký tìm kiếm đối tượng . Nghĩa là, ên, đối với ột tập tin tiên để cải hông thực , nếu ta sử thể sẽ xuất ất cả vị trí ữ ký nhằm au: trí của chữ Nếu i ൐ 0, ୯. được gán 0 thì bit 724 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN ĐỒ THỊ CHỮ KÝ B. Thuật toán 1. Thuật toán tạo đồ thị chữ ký Thuật toán 1: Thuật toán xây dựng đồ thị chữ ký của một lớp các đối tượng: Vào: Lớp đối tượng Ra: Đồ thị chữ ký Phương pháp: Begin objs = {oj | oj∈ class, j = 1,, n} lp(root) = null; sig1 = Hashing(o1); lp(root) = lp(root) ∪ sig1; root = ; j = 2; Bước 1. Tạo chữ ký sigj = Hashing(oj); v ← root; Qua bước 2; Bước 2. if (v không đánh dấu và skip(root) ≠ 0 ) then Qua bước 3; else{i ← skip(v) đánh dấu v; if (sigv[i] = 1) then v = v→right; else v = v→left; Quay lại bước 2; } Bước 3. if (sigj = sigv) then { lp(v) = lp(v) ∪ sigj; j ← j + 1; Quay lại bước 1; } else{o ← v; s=; Qua bước 4;} Bước 4. Gọi k+1 là vị trí khác nhau đầu tiên giữa sigj và sigv; Thay thế nút v trở thành: ; if (sigj[k+1] = 1) then {v → right = s; v → left = o;} else {v → right = o; v → left = s;} j ← j + 1; Quay lại bước 1; End. Trong thuật toán tạo đồ thị chữ ký Gୱ, vì mỗi lớp là hữu hạn có n đối tượng, đặt: objs ൌ ൛o୨หo୨∈ class, j ൌ 1, , nሽ Do đó, sẽ tạo được tập hữu hạn có n chữ ký đối tượng: Sig ൌ ൛sig୨หsig୨ ൌ Hashing൫o୨൯, j ൌ 1, , nሽ Với mỗi giá trị j, thuật toán sẽ duyệt từ nút gốc của đồ thị Gୱ để đi tìm nút phù hợp, quá trình này là hữu hạn vì số nút tạo ra trong đồ thị Gୱ là hữu hạn. Vì vậy thuật toán sẽ tìm được nút phù hợp để đưa chữ ký sig୨ vào hoặc tạo ra một nút mới. Do đó, sau hữu hạn bước ứng với giá trị của j ൌ 1, , n thì thuật toán cho kết quả là một đồ thị chữ ký Gୱ với các nút u có dạng ൏ lpሺuሻ, skipሺuሻ ൐. Gọi n là số đối tượng trong một lớp, khi đó n ൌ |objs|. Mỗi lần duyệt đồ thị chữ ký sẽ duyệt theo nhánh con bên trái hoặc nhánh bên phải, nên sẽ có )1k(2 − lần duyệt, với k ൌ 0, 1, , ሾlogଶnሿ. Vì có n chữ ký lần lượt đưa vào đồ thị ∑ = k i i 0 2 Tc c l V 2 h t v T V R P v đ h tr th rần Minh Bảo, T hữ ký Gୱ, nên hữ ký trong q à n. ሺ2.mሻ. D í dụ 3.3. Mộ . Thuật toán Sau khi iện. Dữ liệu c iến hành tìm k ị trí chữ ký tr huật toán 2: ào: Chữ ký s a: Tập các co hương pháp Begin lp = Bư e i e if s S els Qu } Bư lp = Qu End. Đối với ୨ sẽ được duy Khi duy i qua. Thuật t ạn các nút củ ỏ tham chiếu Trong t ị Gୱ nên số l rương Công Tuấn số lần duyệt uá trình duyệ o đó, độ phức t ví dụ về tạo truy vấn đối tư đã tạo ra đồ ần truy vấn sẽ iếm trên đồ t ong tập tin ch Thuật toán tr ig và đồ thị G n trỏ lp liên k : ∅; v ← roo ớc 1. if (S = ∅ lse Chọn vj∈ f (vj được đá lse { i ← skip ig[i] = 0 then = S ∪ { vj → e S = S ∪ {vj→ ay lại bước 1 ớc 2. if sig đư lp ∪ lp(vj); ay lại bước 1 thuật toán 2, ệt ở các bước ệt một nút v୨ oán sẽ đối sán a đồ thị Gୱ. V đến các vị trí huật toán 2, g ần duyệt đồ th đồ thị tối đa s t đồ thị, gọi m tạp trong trườ đồ thị chữ ký ợng trên đồ t thị chữ ký Gୱ được băm th hị chữ ký Gୱ. ữ ký của cơ s uy vấn chữ ký ୱ ết đến các ch t; S = {v}; ) then retur S; S = S \ {v nh dấu) then (vj); right, vj→lef left}; ; ợc phủ bởi ; vì Gୱ đã tạo r tiếp theo. ∈ S, thì v୨ sẽ h chữ ký truy ì vậy sau hữu của chữ ký tr ọi n là số nút ị sẽ là 2k, với ẽ là ≈ n. Tuy là chiều dài ng hợp này s dựa trên tập t Hình 2 hị chữ ký , quá trình tr ành dạng chữ Kết quả của ở dữ liệu hướn sig trên đồ t ữ ký giống nh n lp; j}; Qua bước 2 t}; sig(vj) then a trong thuật được loại ra vấn và chữ k hạn bước thu uy vấn trong đã được tạo k ൌ 0, 1, 2, nhiên, trong đ của mỗi chữ k ẽ là Oሺn.mሻ. in chữ ký ở ví . Tạo đồ thị ch uy vấn hướng ký theo cùng quá trình tìm g đối tượng t hị Gୱ được thự au nhưng có ; toán 1 là hữu khỏi tập S. Do ý tại các nút. ật toán sẽ cho tập tin chữ ký ra trong Gୱ, m , ሾlogଶnሿ. Kh ồ thị chữ ký ý, chi phí của dụ 3.2 được ữ ký đối tượng ứn phương pháp kiếm này là m ương ứng. c hiện như sa vị trí xuất hiệ hạn nên tập S đó việc duyệ Quá trình đối ra được kết . ỗi lần duyệt đ i đó, chi phí Gୱ sẽ lần lượt thuật toán tạ minh họa như g với yêu cầ băm chữ ký ột danh sách u: n khác nhau t là một tập hữ t đồ thị sẽ kh sánh được th quả là một da ồ thị có thể đ quá trình duy kiểm tra số b o ra đồ thị ch sau: u truy vấn sẽ trên đồ thị Gୱ các con trỏ li rong tập tin ch u hạn chứa c ông quay lại ực hiện trên m nh sách lp gồ i theo hai nh ệt đồ thị để tìm 725 it trên mỗi ữ ký Gୱ sẽ được thực , sau đó sẽ ên kết đến ữ ký. ác phần tử một nút sẽ ột số hữu m các con ánh của đồ kiếm tối 7 đ s D đ ứ p m c tư n tư 6 d A tư n 26 a sẽ là logଶn ánh chữ ký tạ o đó, độ lớn Một ví Xét tập ồ thị được tìm ng với s୯. Rõ hép duyệt tập Cấu trú ột chữ ký trê hữ ký sẽ khôn ợng, chúng hiều đối tượn ợng này sẽ t 4 bit, đó là sự ưới dạng cấu . Một ví dụ Để thực ợng được đư ày để cài đặt . Trong mỗi l i các nút, giả chi phí của th dụ về tìm kiếm tin chữ ký và kiếm. Để tìm ràng cách tì tin chữ ký sẽ c đồ thị chữ k n đồ thị được g thể lưu trữ sẽ được lưu tr g. Ứng với m ạo ra một chữ tổ hợp các th trúc một bảng Hình về mô hình c nghiệm truy a ra ở hình 5 CSDL hướng TT 1 2 3 4 5 6 7 ần duyệt đồ t sử chiều dài c uật toán sẽ là trên đồ thị c đồ thị chữ ký ra nút v, v m kiếm này h kiểm tra 8 ch ý được lưu tr thực hiện dễ trên bộ nhớ c ữ và thực thi ỗi lớp sẽ đư ký đối tượn uộc tính tron băm gồm cá 4. Mô hình cấ ơ sở dữ liệu h vấn hướng đ đồng thời cũ đối tượng ở m Lớp 1 Truong Truong SinhVie Khoa SinhVie SinhVie Chuong hị sẽ kiểm tra ủa mỗi chữ k Oሺm. lognሻ. hữ ký dựa trê Hình 3. Tìm trên, giả sử được đánh dấ iệu quả hơn v ữ ký. IV. MÔ ữ hoàn toàn b dàng. Tuy nh hính mà phải trên bộ nhớ ợc xây dựng g. Chữ ký của g một đối tượ c chữ ký của u trúc lưu trữ đ ướng đối tượ ối tượng trên ng đưa ra nhữ ức vật lý. Bản Lớ Kh Sin n Ch Gi n Nu n Na Trinh Ch TRUY chữ ký tại cá ý là m, chí ph n hình 2 được kiếm trên đồ t rằng s୯ ൌ 10 u hoặc skipሺv iệc tìm kiếm HÌNH ỨNG ên trong bộ n iên, trong cơ được lưu trữ ngoài. Cơ sở thành một cấ mỗi đối tượ ng. Toàn bộ đối tượng để t ồ thị chữ ký ch ng CSDL hướn ng quan hệ t g 1. Quan hệ c p 2 oa hVien uongTrinh angVien m uDe VẤN HƯỚNG Đ c nút để thực í quá trình tì minh họa nh hị chữ ký 11011 là chữ ሻ ൌ 0 thì chữ tuần tự vì ch DỤNG hớ chính, tro sở dữ liệu cá trên bộ nhớ ng dữ liệu hướng u trúc đồ thị ng được xây cơ sở dữ liệu hực hiện quá o cơ sở dữ liệu g đối tượng. M rên các lớp đ ủa các lớp Qun hệ Chứa trong Kết tập Liên kết Liên kết Khái quát q Khái quát q Liên kết ỐI TƯỢNG DỰ hiện bước n m kiếm trên đ ư sau: ký truy vấn, ký của nút v ỉ cần kiểm tra ng trường hợ c tập tin thườ oài. Đối với đối tượng c chữ ký tìm k dựng trong m hướng đối tượ trình truy vấn hướng đối tượ ột ví dụ mô ối tượng ở bả uá uá A TRÊN ĐỒ TH hảy bit và thự ồ thị Gୱ sẽ là lúc đó chỉ mộ sẽ được kiểm 2 chữ ký, tr p này, việc ch ng rất lớn, vì cơ sở dữ liệu ó nhiều lớp, m iếm, đồng th ô hình này có ng sẽ được p . ng hình CSDL ng 1. Dựa trê Ị CHỮ KÝ c hiện đối 2mlogଶn. t phần của tra tương ong khi đó èn và xóa vậy đồ thị hướng đối ỗi lớp có ời mỗi đối chiều dài hân hoạch hướng đối n mô hình Trần Minh Bảo, Trương Công Tuấn 727 Hình 5. Một ví dụ mô hình cơ sở dữ liệu hướng đối tượng B. Xử lý truy vấn trên cơ sở dữ liệu hướng đối tượng Để thực hiện việc truy vấn một đối tượng trên CSDL hướng đối tượng, đầu tiên phải chuyển đổi cơ sở dữ liệu hướng đối tượng thành cấu trúc dữ liệu như trên, ta thực hiện như sau: Bước 1. Thuộc tính của đối tượng được băm thành chữ ký nhị phân và các thuộc tính tạo thành chữ ký đối tượng. Bước 2. Các chữ ký đối tượng của cùng một lớp sẽ tạo thành đồ thị chữ ký. Bước 3. Tạo danh sách đồ thị chữ ký tương ứng với từng lớp. Sau khi có cấu trúc dữ liệu để truy vấn, ta thực hiện quá trình truy vấn đối tượng trong cơ sở dữ liệu hướng đối tượng như sau: Bước 1. Mã hoá từ khóa cần truy vấn thành chữ ký nhị phân. Bước 2. Đối sánh chữ ký từ khóa để xác định thuộc lớp cần truy vấn. Bước 3. Thực hiện truy vấn chữ ký từ khóa trên đồ thị chữ ký tương ứng với các lớp đã xác định. V. KẾT LUẬN Bài báo đã đề xuất việc xây dựng đồ thị chữ ký để lưu trữ chữ ký đối tượng của CSDL hướng đối tượng và xây dựng thuật toán truy vấn đối tượng trên đồ thị chữ ký. Đồng thời dựa trên cấu trúc đồ thị chữ ký đã tạo, bài báo đã đưa ra một mô hình ứng dụng. Phương pháp này có thể áp dụng để truy vấn các đối tượng dữ liệu lớn như đối tượng dữ liệu ảnh, các đối tượng multimedia, các đối tượng trong hệ thống thông tin địa lý, VI. TÀI LIỆU THAM KHẢO [1] Yangjun Chen, Yibin Chen, “On the Signature Tree Construction and Analysis”, IEEE Trans. Knowl. Data Eng., 18(9), 2006, 1207-1224. [2] Yangjun Chen, “Building Signature Trees into OODBs”, Journal of Information Science and Engineering, 20(2), 2004, 275-304. [3] Yangjun Chen, Yibin Chen, “Signature File Hierarchies and Signature Graphs: a New Index Method for Object- Oriented Databases”, Proceedings of the 2004 ACM symposium on Applied computing, Nicosia, Cyprus, 14-17 March 2004, 724-728. [4] D. Dervos, Y. Manolopulos and P. Linardis, “Comparison of signature file models with superimposed coding”, J. of Information Processing Letters 65 (1998) 101 - 106. [5] C. Faloutsos, “Signature Files: Design and Performance Comparaison of Some Signature Extraction Methods”, ACM Sigmod Record, Volume 14, Issue 4, May 1985, pp. 63 – 82. [6] D. L. Lee, Y. M. Kim, G. Patel, “Efficient Signature File Methods for Text Retrieval”, IEEE Trans. Knowl. Data Eng., 7(3), 1995, 423-435. [7] W. C. Lee, D. L. Lee, “Signature File Methods for Indexing Object-Oriented Database systems”, Proceedings of the 2nd International Computer Science Conference, Hong Kong, 1992, 616-622. Truong - Ten: Str - DiaChi: Str Khoa - TenKhoa: Str - ChuongTrinh: TenChuongTrinh[] ChuongTrinh - TenChuongTrinh: Str - ChuDe: TenChuDe[] ChuDe - TenChuDe: Str SinhVien - TenSV: Str - ChuongTrinh: Str Nam - GioiTinh: Str Nu - GioiTinh: Str GiangVien - TenGV: Str - TenKhoa: Str - ChuDe: TenChuDe[] 1..* day 0..1 Tham gia day 0..1 1..* gan cho Thanh phan Chua 1..* gom 1..* Co 1 Tham gia 728 TRUY VẤN HƯỚNG ĐỐI TƯỢNG DỰA TRÊN ĐỒ THỊ CHỮ KÝ [8] P. Mahatthanapiwat, “Flexible Searching for Graph Aggregation Hierarchy”, Proceedings of the World Congress on Engineering, 2010, London, UK, June 30-July 2, 2010, 405-409. [9] E. Tousidoua, P. Bozanis, Y. Manolopoulos, “Signature-based structures for objects with set-valued attributes”, Elsevier Science, Information Systems, 27(2), 2002, 93-121. OBJECT-ORIENTED QUERY PROCESSING BASED SIGNATURE BINARY GRAPH Tran Minh Bao, Truong Cong Tuan ABSTRACT - Indexing is always an important issue in the efficient information retrieval from the databases. For object-oriented databases, the use of signature files as a method of indexing has been recognized as a common approach in searching on object- oriented databases. The objects of the class are encoded into the object signatures using hash functions and stored in a signature file. However, when a query arrives, the entire signature file must be scanned. So this method requires a high processing cost. To overcome this drawback, we propose a graph structure model constructed over signatures of objects for a class in an object- oriented database, called a signature graph. We also suggest an algorithm to build the signature graph and query algorithm on signature graph, as well as an application of this method.