Ngày nay, các ứng dụng và các sản phẩm số trong đó bao gồm cả các cơ sở dữ liệu quan hệ được phát triển và phân phối rộng khắp trong môi trường Internet, vì vậy việc chứng minh quyền sở hữu đối với các sản phẩm này sau khi chuyển giao là một vấn đề rất cần thiết. Việc thực thi quyền sở hữu dữ liệu là một yêu cầu quan trọng đòi hỏi các giải pháp đồng bộ, bao gồm các khía cạnh về kỹ thuật, về tổchức, và cả luật pháp. Mặc dù vẫn chưa có được những giải pháp toàn diện như vậy nhưng trong các năm gần đây, các kỹ thuật thuỷ vân đã đóng một vai trò quyết định nhằm giải quyết vấn đề về quyền sở hữu này.
63 trang |
Chia sẻ: vietpd | Lượt xem: 1373 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận văn Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng giải thuật di truyền, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
Họ và tên tác giả
VŨ VĂN HUY
Tên đề tài
THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA
TRÊN KỸ THUẬT TỐI ƢU HOÁ ÁP DỤNG
GIẢI THUẬT DI TRUYỀN
LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH
Thái Nguyên - 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
Họ và tên tác giả
VŨ VĂN HUY
Tên đề tài
THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA
TRÊN KỸ THUẬT TỐI ƢU HOÁ ÁP DỤNG
GIẢI THUẬT DI TRUYỀN
Chuyên ngành: Khoa học máy tính
Mã số: 604801
LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS BÙI THẾ HỒNG
Thái Nguyên - 2009
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ
thuật tối ƣu hoá áp dụng giải thuật di truyền” này là công trình nghiên cứu
của riêng tôi. Các số liệu sử dụng trong luận văn là trung thực. Các kết quả
nghiên cứu được trình bày trong luận văn chưa từng được công bố tại bất kỳ
công trình nào khác.
Vũ Văn Huy
LỜI NÓI ĐẦU
Để hoàn thành luận văn này, trước tiên tôi xin chân thành cảm ơn sự
chỉ bảo tận tình của TS Bùi Thế Hồng, người đã nhiệt tình chỉ bảo góp ý giúp
tôi hoàn thành luận văn này.
Tôi xin chân thành cảm ơn Khoa Công nghệ thông tin – Đại học Thái
Nguyên, Viện Công nghệ thông tin đã tạo điều kiện giúp tôi hoàn thành luận
văn này.
Tôi xin chân thành cảm ơn bạn Võ Phúc Nguyên – Gv Khoa Điện Tử
- ĐH Kỹ thuật công nghiệp Thái Nguyên đã trợ giúp tôi rất nhiều trong quá
trình hoàn thành luận văn này.
Lời sau cùng tôi xin chân thành cảm ơn những người thân trong gia
đình cùng các bạn đồng nghiệp đã động viên tôi hoàn thành luận văn này.
Vũ Văn Huy
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 1 -
MỤC LỤC
MỤC LỤC ......................................................................................................................... 1
DANH MỤC CÁC THUẬT NGỮ ....................................................................................... 3
DANH MỤC CÁC HÌNH VẼ ............................................................................................. 4
DANH MỤC CÁC BẢNG BIỂU......................................................................................... 5
MỞ ĐẦU ........................................................................................................................... 6
1. Lý do lựa chọn đề tài ................................................................................................. 6
2. Mục tiêu nghiên cứu .................................................................................................. 7
3. Phạm vi nghiên cứu................................................................................................... 7
4. Phƣơng pháp nghiên cứu .......................................................................................... 7
5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài ....................................................... 8
6. Cấu trúc của luận văn ............................................................................................... 8
CHƢƠNG 1 – TỔNG QUAN VỀ THUỶ VÂN VÀ GIẢI THUẬT DI TRUYỀN .................... 9
1.1. Cơ bản về kỹ thuật giấu tin ................................................................................... 10
1.1.1. Khái niệm về giấu tin .................................................................................... 10
1.1.2. Phân loại các kỹ thuật giấu tin ...................................................................... 10
1.1.3. Mục đích của giấu tin ................................................................................... 12
1.1.4. Môi trƣờng giấu tin....................................................................................... 12
1.2. Cơ bản về thuỷ vân ............................................................................................... 14
1.2.1. Khái niệm thuỷ vân ....................................................................................... 14
1.2.2. Một số vấn đề có liên quan đến thuỷ vân ....................................................... 16
1.2.3. Khái niệm thuỷ vân cơ sở dữ liệu .................................................................. 17
1.3. Một số ứng dụng của thuỷ vân .............................................................................. 18
1.3.1. Bảo vệ bản quyền tác giả (copyright protection) ........................................... 18
1.3.2. Phát hiện xuyên tạc thông tin (authentication and tamper detection)............. 18
1.3.3. Lấy dấu vân tay hay dán nhãn (fingerprinting and labeling) ......................... 19
1.3.4. Điều khiển thiết bị (Device control) .............................................................. 19
1.3.5. Theo dõi quá trình sử dụng (Tracking) .......................................................... 19
1.3.6. Theo dõi truyền thông (Broadcast Monitoring) ............................................. 19
1.3.7. Truyền tin bí mật (Concealed Communication) ............................................. 20
1.4. Giải thuật di truyền .............................................................................................. 20
CHƢƠNG 2 – THỰC TRẠNG NGHIÊN CỨU THUỶ VÂN CƠ SỞ DỮ LIỆU QUAN HỆ 22
2.1. Tình hình nghiên cứu trong nƣớc ......................................................................... 22
2.2. Tình hình nghiên cứu trên thế giới ........................................................................ 22
2.2.1. Theo kiểu dữ liệu (Data type) ........................................................................ 23
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 2 -
2.2.2. Theo kiểu biến dạng (Distortion) .................................................................. 23
2.2.3. Theo độ nhạy (Sensitivity) ............................................................................. 24
2.2.4. Theo thông tin thuỷ vân (watermark information) ......................................... 25
2.2.5. Tính kiểm tra đƣợc ........................................................................................ 26
2.2.6. Theo cấu trúc dữ liệu (Data structure) .......................................................... 27
CHƢƠNG 3 – NỘI DUNG VÀ CÁC KẾT QUẢ NGHIÊN CỨU ....................................... 29
3.1. Phân hoạch dữ liệu .............................................................................................. 29
3.2. Nhúng thuỷ vân .................................................................................................... 33
3.2.1. Mã hoá bit đơn ............................................................................................. 34
3.2.2. Áp dụng giải thuật di truyền giải bài toán tối ƣu ........................................... 38
3.2.3. Thuật toán nhúng thuỷ vân ............................................................................ 41
3.2.4. Đánh giá ngƣỡng giải mã ............................................................................. 42
3.3. Giải mã thuỷ vân .................................................................................................. 46
3.4. Kết quả thực nghiệm ............................................................................................ 48
KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................................ 52
PHỤ LỤC ....................................................................................................................... 54
TÀI LIỆU THAM KHẢO.................................................................................................. 57
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 3 -
DANH MỤC CÁC THUẬT NGỮ
MSB (Most significant bit): Bit ý nghĩa nhất
LSB (Least significant bit): Bit ít ý nghĩa nhất
MAC (Message Authentication Code) : Mã xác thực thông điệp
GA (Genetic Algorithms): Giải thuật di truyền
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 4 -
DANH MỤC CÁC HÌNH VẼ
Hình 1.1. 1. Một cách phân loại kỹ thuật giấu tin ............................................................. 11
Hình 3. 1. Cách phân hoạch bộ dữ liệu ........................................................................... 32
Hình 3. 2. Thống kê phân bố tập Xmax, Xmin và cách lấy ngưỡng T*............................ 45
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 5 -
DANH MỤC CÁC BẢNG BIỂU
Bảng 1. Danh mục các ký hiệu ........................................................................................ 30
Bảng 2. Thống kê các tấn công với số lần tấn công là 20 ................................................. 51
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 6 -
MỞ ĐẦU
1. Lý do lựa chọn đề tài
2. Mục tiêu nghiên cứu
3. Phạm vi nghiên cứu
4. Phƣơng pháp nghiên cứu
5. Ý nghĩa khoa học và ý nghĩa thực tiễn
6. Cấu trúc của luận văn
1. Lý do lựa chọn đề tài
Ngày nay, các ứng dụng và các sản phẩm số trong đó bao gồm cả các
cơ sở dữ liệu quan hệ được phát triển và phân phối rộng khắp trong môi
trường Internet, vì vậy việc chứng minh quyền sở hữu đối với các sản phẩm
này sau khi chuyển giao là một vấn đề rất cần thiết. Việc thực thi quyền sở
hữu dữ liệu là một yêu cầu quan trọng đòi hỏi các giải pháp đồng bộ, bao gồm
các khía cạnh về kỹ thuật, về tổ chức, và cả luật pháp. Mặc dù vẫn chưa có
được những giải pháp toàn diện như vậy nhưng trong các năm gần đây, các kỹ
thuật thuỷ vân đã đóng một vai trò quyết định nhằm giải quyết vấn đề về
quyền sở hữu này.
Hiện nay, mới chỉ có một vài cách tiếp cận đối với bài toán thuỷ vân dữ
liệu quan hệ được đề xuất. Tuy nhiên, những kỹ thuật này không bền vững
trước các tấn công thông thường và các tấn công gây hại, vì vậy cần có một
kỹ thuật thủy vân cơ sở dữ liệu quan hệ có độ bền vững cao hơn nhất là đối
với các tấn công xoá, sửa, và chèn các bản ghi.
Luận văn “thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu
hoá áp dụng giải thuật di truyền” trình bày kỹ thuật thuỷ vân cơ sở dữ liệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 7 -
dựa vào kỹ thuật tối ưu hoá. Kỹ thuật này phải đảm bảo bền vững trước các
tấn công thêm, bớt và thay đổi giá trị của các bộ trong quan hệ.
2. Mục tiêu nghiên cứu
Mục tiêu chính của luận văn là đi sâu nghiên cứu kỹ thuật tối ưu hoá để
mã hoá và giải mã thuỷ vân. Trong đó tập trung nghiên cứu kỹ thuật phân
hoạch dữ liệu không phụ thuộc vào các bộ được đánh dấu để định vị các phân
hoạch; nghiên cứu cách giải bài toán tối ưu bằng giải thuật di truyền với các
ràng buộc trên thuộc tính được chọn để tiến hành thủy vân, và nghiên cứu kỹ
thuật phát hiện thủy vân dựa vào một ngưỡng tối ưu.
3. Phạm vi nghiên cứu
Phạm vi nghiên cứu của đề tài là đi sâu nghiên cứu về mặt lý thuyết của
thuỷ vân và áp dụng cho cơ sở dữ liệu quan hệ.
Nghiên cứu về cơ chế mã hoá và giải mã thuỷ vân cơ sở dữ liệu quan
hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán di truyền.
4. Phƣơng pháp nghiên cứu
Luận văn này là luận văn thuộc ngành kỹ thuật chuyên ngành khoa học
máy tính nên phương pháp nghiên cứu chủ yếu ở đây là phương pháp tiếp cận
lý thuyết, sau đó áp dụng lý thuyết vào một ngôn ngữ lập trình cụ thể để kiểm
chứng. Dựa trên những kết quả kiểm chứng đó để đưa ra các kết luận và các
đề xuất nhằm hoàn thành mục tiêu nghiên cứu của luận văn.
Cụ thể trong luận văn này, tác giả lấy thông tin tiêu thụ điện làm cơ sở
dữ liệu phục vụ cho nghiên cứu; nghiên cứu về lý thuyết thuỷ vân; nghiên cứu
về cách giải bài toán tối ưu hoá bằng giải thuật di truyền; sử dụng phần mềm
Matlab để lập trình kiểm chứng lý thuyết.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 8 -
5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài
Đưa ra cơ sở khoa học của việc áp dụng kỹ thuật tối ưu hoá để mã hoá
và giải mã thuỷ vân trong đó sử dụng giải thuật di truyền để giải quyết bài
toán tối ưu hoá.
Kết quả nghiên cứu của đề tài rất có ý nghĩa trong việc chứng minh
quyền sở hữu đối với các sản phẩm số hoá, đặc biệt là trong cơ sở dữ liệu
quan hệ sau khi đã phân phối hoặc chuyển giao. Đồng thời việc chứng minh
quyền sở hữu này cũng là một vấn đề rất quan trọng trong môi trường ứng
dụng dựa trên Internet nhằm phát tán và truyền tải thông tin.
6. Cấu trúc của luận văn
Ngoài phần mở đầu và phần kết luận, luận văn được trình bày thành ba
chương như sau:
- Chƣơng 1. Tổng quan về thuỷ vân và giải thuật di truyền.
Chương này chủ yếu trình bày về các thông tin cơ bản của kỹ thuật
giấu tin, các khái niệm cơ bản về thuỷ vân và ứng dụng thực tiễn của
thuỷ vân, sơ lược về giải thuật di truyền.
- Chƣơng 2. Thực trạng nghiên cứu về thuỷ vân cơ sở dữ liệu
quan hệ.
Chương này chủ yếu trình bày về thực trạng nghiên cứu về thuỷ vân
cơ sở dữ liệu quan hệ ở trong nước và trên thế giới.
- Chƣơng 3. Nội dung và các kết quả nghiên cứu.
Chương này đi sâu mô tả chi tiết lý thuyết các bước tiến hành thí
nghiệm áp dụng kỹ thuật tối ưu hoá cho mã hoá và giải mã thuỷ vân số.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 9 -
CHƢƠNG 1 – TỔNG QUAN VỀ THUỶ VÂN VÀ
GIẢI THUẬT DI TRUYỀN
1. Cơ bản về giấu tin
2. Cơ bản về thuỷ vân
3. Một số ứng dụng của thuỷ vân
4. Giải thuật di truyền
Thông tin kỹ thuật số đã đem lại những thay đổi sâu sắc trong xã hội và
trong cuộc sống của chúng ta ngày nay. Những thuận lợi mà thông tin kỹ
thuật số mang lại cũng sinh ra những thách thức và cơ hội mới cho xã hội hiện
đại. Mạng Internet toàn cầu đã biến thành một xã hội ảo nơi diễn ra quá trình
trao đổi thông tin trong mọi lĩnh vực của đời sống. Và chính trong môi trường
mở và tiện nghi như thế xuất hiện những vấn nạn, tiêu cực đang rất cần đến
các giải pháp hữu hiệu cho các vấn đề an toàn thông tin như nạn ăn cắp bản
quyền, nạn xuyên tạc thông tin, truy nhập thông tin trái phép, sao chép bất
hợp pháp các sản phẩm trí tuệ số v.v..
Giải pháp cho những vấn đề trên đã được biết đến và áp dụng đó là giải
pháp giấu tin (DataHiding), được nghiên cứu phát triển trong khoảng hơn
chục năm gần đây. Trong đó thuỷ vân (watermark) là một thành phần của
phương pháp giấu tin.
Giấu thông tin bao gồm hai kỹ thuật chính là thuỷ ấn (watermarking)
và giấu tin bí mật (steganograph) đang được quan tâm nghiên cứu và phát
triển. Các thành tựu đạt được trong lĩnh vực nghiên cứu này đã bắt đầu được
áp dụng hiệu quả cho mục đích bảo vệ bản quyền, chống sao chép, phân tán
trái phép các sản phẩm trong môi trường số hoá và nhiều mục đích khác.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 10 -
Nhiều phương pháp giấu thông tin khác nhau đã được đề xuất, mỗi phương
pháp có những ưu điểm, nhược điểm riêng và thích hợp cho một nhóm các
ứng dụng.
1.1. Cơ bản về kỹ thuật giấu tin
1.1.1. Khái niệm về giấu tin
Giấu thông tin (Datahiding) là kỹ thuật nhúng (embedding) một lƣợng
thông tin số nào đó vào trong một đối tƣợng dữ liệu số khác. Một trong những
yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu
đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc. Đây là
phương pháp đã và đang được rất nhiều nước trên thế giới nghiên cứu và ứng
dụng rất mạnh mẽ.
Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là mã hoá
làm cho các thông tin hiện rõ là nó có được mã hoá hay không, còn với giấu
thông tin thì người ta sẽ khó biết được là có thông tin giấu bên trong.
1.1.2. Phân loại các kỹ thuật giấu tin
Do kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần
đây nên xu hướng phát triển chưa ổn định. Nhiều phương pháp mới, theo
nhiều khía cạnh khác nhau đang được đề xuất, vì vậy đã tồn tại nhiều cách
phân loại rất khác nhau.
Dựa trên việc thống kê các công trình đã công bố trên các tạp chí, cùng
với thông tin về tên và tóm tắt nội dung của các công trình đã công bố trên
Internet, người ta chia lĩnh vực giấu tin ra làm hai hướng lớn, đó là
watermarking và steganography
Steganography quan tâm tới ứng dụng che giấu các bản tin đòi hỏi độ
bí mật cao và dung lượng lớn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 11 -
Watermark (thủy vân) quan tâm nhiều đến ứng dụng giấu các mẩu tin
ngắn nhưng đòi hỏi độ bền vững lớn của thông tin cần giấu (trước các biến
đổi thông thường của tệp dữ liệu môi trường).
Hình 1.1. 1. Một cách phân loại kỹ thuật giấu tin
Đối với từng hướng lớn trên, quá trình phân loại theo các tiêu chí khác
nhau dựa theo ảnh hưởng các tác động từ bên ngoài, người ta có thể chia
watermark thành hai loại, một loại bền vững với các tác động sao chép trái
phép, loại thứ hai lại cần tính chất hoàn toàn đối lập: dễ bị phá huỷ trước các
tác động nói trên. Cũng có thể chia watermark theo đặc tính, một loại cần
được che giấu để chỉ có một số người tiếp xúc với nó có thể thấy được thông
tin, loại thứ hai đối lập, cần được mọi người nhìn thấy.
Information
hiding
Giấu thông tin
Steganograp
hy
Giấu tin mật
Watermarkin
g
Thuỷ vân số
Robust
Copyright
marking
Thuỷ vân bền
vừng
Fragile
marking
Thuỷ vân “dễ vỡ”
Imperceptible
Watermarking
Thuỷ vân ẩn
Visible
Watermarking
Thuỷ vân hiển
thị
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 12 -
1.1.3. Mục đích của giấu tin
Bảo mật thông tin bằng giấu tin có hai khía cạnh. Một là bảo mật cho
dữ liệu đem giấu (embedded data), chẳng hạn như giấu tin mật: thông tin
mật được giấu kỹ trong một đối tượng khác sao cho người khác không phát
hiện được (steganography). Hai là bảo mật chính đối tượng được dùng để
giấu dữ liệu vào (host data), chẳng hạn như ứng dụng bảo vệ bản quyền, phát
hiện xuyên tạc thông tin (watermarking)...
1.1.4. Môi trƣờng giấu tin
Kỹ thuật giấu tin đã được nghiên cứu và áp dụng trong nhiều môi
trường dữ liệu khác nhau như trong dữ liệu đa phương tiện (text, image,
audio, video), trong sản phẩm phần mềm và gần đây là những nghiên cứu trên
môi trường cơ sở dữ liệu quan hệ. Trong các môi trường dữ liệu đó thì dữ liệu
đa phương tiện là môi trường chiếm tỉ lệ chủ yếu trong các kỹ thuật giấu tin.
a. Giấu tin trong ảnh
Giấu thông tin trong ảnh, hiện nay, là một bộ phận chiếm tỉ lệ lớn nhất
trong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa
phương tiện bởi lượng thông tin được trao đổi bằng ảnh là rất lớn và hơn nữa
giấu thông tin trong ảnh cũng đóng vai trò hết sức quan trọng trong các hầu
hết các ứng dụng bảo vệ an toàn thông tin như: nhận thực thông tin, xác định
xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông
tin mật. Vì vậy vấn đề giấu tin trong ảnh này đang được quan tâm rất lớn của
các nhà nghiên cứu.
Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít bị
thay đổi và không thể nhận biết được bằng thị giác của con người, nó chỉ có
thể bị phát hiện bởi “thị giác máy”. Ngày nay, khi ảnh số đã được sử dụng rất
phổ biến, thì giấu thông tin trong ảnh đã đem lại rất nhiều những ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
- 13 -
quan trọng trên nhiều lĩnh vực trong đời sống xã hội thì việc nhận thực chữ kí
số, xác thực thông tin đã trở thành một vấn đề cực kì quan trọng khi mà việc
ăn cắp thông tin hay xuyên tạc thông tin bởi các tin tặc đang trở thành một
vấn nạn đối với bất kì quốc gia nào, tổ chức nào. Một đặc điểm của giấu
thông tin trong ảnh đó là thông tin được giấu trong ảnh một cách vô hình, nó
như là một cách mà truyền thông tin mật cho nhau mà người khác không thể
biết được bởi sau khi giấu thông tin thì chất lượng ảnh gần như không thay
đổi đặc biệt đối với ảnh mầu hay ảnh xám.
b. Giấu tin trong audio
Giấu thông tin trong audio mang những đặc điểm riêng khác với giấu
thông tin trong các đối tượng đa phương tiện khác. Một trong n