Luận văn Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng giải thuật di truyền

Ngày nay, các ứng dụng và các sản phẩm số trong đó bao gồm cả các cơ sở dữ liệu quan hệ được phát triển và phân phối rộng khắp trong môi trường Internet, vì vậy việc chứng minh quyền sở hữu đối với các sản phẩm này sau khi chuyển giao là một vấn đề rất cần thiết. Việc thực thi quyền sở hữu dữ liệu là một yêu cầu quan trọng đòi hỏi các giải pháp đồng bộ, bao gồm các khía cạnh về kỹ thuật, về tổchức, và cả luật pháp. Mặc dù vẫn chưa có được những giải pháp toàn diện như vậy nhưng trong các năm gần đây, các kỹ thuật thuỷ vân đã đóng một vai trò quyết định nhằm giải quyết vấn đề về quyền sở hữu này.

pdf63 trang | Chia sẻ: vietpd | Lượt xem: 1373 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Luận văn Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng giải thuật di truyền, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN Họ và tên tác giả VŨ VĂN HUY Tên đề tài THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU HOÁ ÁP DỤNG GIẢI THUẬT DI TRUYỀN LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH Thái Nguyên - 2009 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN Họ và tên tác giả VŨ VĂN HUY Tên đề tài THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU HOÁ ÁP DỤNG GIẢI THUẬT DI TRUYỀN Chuyên ngành: Khoa học máy tính Mã số: 604801 LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS BÙI THẾ HỒNG Thái Nguyên - 2009 LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ƣu hoá áp dụng giải thuật di truyền” này là công trình nghiên cứu của riêng tôi. Các số liệu sử dụng trong luận văn là trung thực. Các kết quả nghiên cứu được trình bày trong luận văn chưa từng được công bố tại bất kỳ công trình nào khác. Vũ Văn Huy LỜI NÓI ĐẦU Để hoàn thành luận văn này, trước tiên tôi xin chân thành cảm ơn sự chỉ bảo tận tình của TS Bùi Thế Hồng, người đã nhiệt tình chỉ bảo góp ý giúp tôi hoàn thành luận văn này. Tôi xin chân thành cảm ơn Khoa Công nghệ thông tin – Đại học Thái Nguyên, Viện Công nghệ thông tin đã tạo điều kiện giúp tôi hoàn thành luận văn này. Tôi xin chân thành cảm ơn bạn Võ Phúc Nguyên – Gv Khoa Điện Tử - ĐH Kỹ thuật công nghiệp Thái Nguyên đã trợ giúp tôi rất nhiều trong quá trình hoàn thành luận văn này. Lời sau cùng tôi xin chân thành cảm ơn những người thân trong gia đình cùng các bạn đồng nghiệp đã động viên tôi hoàn thành luận văn này. Vũ Văn Huy Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 1 - MỤC LỤC MỤC LỤC ......................................................................................................................... 1 DANH MỤC CÁC THUẬT NGỮ ....................................................................................... 3 DANH MỤC CÁC HÌNH VẼ ............................................................................................. 4 DANH MỤC CÁC BẢNG BIỂU......................................................................................... 5 MỞ ĐẦU ........................................................................................................................... 6 1. Lý do lựa chọn đề tài ................................................................................................. 6 2. Mục tiêu nghiên cứu .................................................................................................. 7 3. Phạm vi nghiên cứu................................................................................................... 7 4. Phƣơng pháp nghiên cứu .......................................................................................... 7 5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài ....................................................... 8 6. Cấu trúc của luận văn ............................................................................................... 8 CHƢƠNG 1 – TỔNG QUAN VỀ THUỶ VÂN VÀ GIẢI THUẬT DI TRUYỀN .................... 9 1.1. Cơ bản về kỹ thuật giấu tin ................................................................................... 10 1.1.1. Khái niệm về giấu tin .................................................................................... 10 1.1.2. Phân loại các kỹ thuật giấu tin ...................................................................... 10 1.1.3. Mục đích của giấu tin ................................................................................... 12 1.1.4. Môi trƣờng giấu tin....................................................................................... 12 1.2. Cơ bản về thuỷ vân ............................................................................................... 14 1.2.1. Khái niệm thuỷ vân ....................................................................................... 14 1.2.2. Một số vấn đề có liên quan đến thuỷ vân ....................................................... 16 1.2.3. Khái niệm thuỷ vân cơ sở dữ liệu .................................................................. 17 1.3. Một số ứng dụng của thuỷ vân .............................................................................. 18 1.3.1. Bảo vệ bản quyền tác giả (copyright protection) ........................................... 18 1.3.2. Phát hiện xuyên tạc thông tin (authentication and tamper detection)............. 18 1.3.3. Lấy dấu vân tay hay dán nhãn (fingerprinting and labeling) ......................... 19 1.3.4. Điều khiển thiết bị (Device control) .............................................................. 19 1.3.5. Theo dõi quá trình sử dụng (Tracking) .......................................................... 19 1.3.6. Theo dõi truyền thông (Broadcast Monitoring) ............................................. 19 1.3.7. Truyền tin bí mật (Concealed Communication) ............................................. 20 1.4. Giải thuật di truyền .............................................................................................. 20 CHƢƠNG 2 – THỰC TRẠNG NGHIÊN CỨU THUỶ VÂN CƠ SỞ DỮ LIỆU QUAN HỆ 22 2.1. Tình hình nghiên cứu trong nƣớc ......................................................................... 22 2.2. Tình hình nghiên cứu trên thế giới ........................................................................ 22 2.2.1. Theo kiểu dữ liệu (Data type) ........................................................................ 23 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 2 - 2.2.2. Theo kiểu biến dạng (Distortion) .................................................................. 23 2.2.3. Theo độ nhạy (Sensitivity) ............................................................................. 24 2.2.4. Theo thông tin thuỷ vân (watermark information) ......................................... 25 2.2.5. Tính kiểm tra đƣợc ........................................................................................ 26 2.2.6. Theo cấu trúc dữ liệu (Data structure) .......................................................... 27 CHƢƠNG 3 – NỘI DUNG VÀ CÁC KẾT QUẢ NGHIÊN CỨU ....................................... 29 3.1. Phân hoạch dữ liệu .............................................................................................. 29 3.2. Nhúng thuỷ vân .................................................................................................... 33 3.2.1. Mã hoá bit đơn ............................................................................................. 34 3.2.2. Áp dụng giải thuật di truyền giải bài toán tối ƣu ........................................... 38 3.2.3. Thuật toán nhúng thuỷ vân ............................................................................ 41 3.2.4. Đánh giá ngƣỡng giải mã ............................................................................. 42 3.3. Giải mã thuỷ vân .................................................................................................. 46 3.4. Kết quả thực nghiệm ............................................................................................ 48 KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................................ 52 PHỤ LỤC ....................................................................................................................... 54 TÀI LIỆU THAM KHẢO.................................................................................................. 57 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 3 - DANH MỤC CÁC THUẬT NGỮ MSB (Most significant bit): Bit ý nghĩa nhất LSB (Least significant bit): Bit ít ý nghĩa nhất MAC (Message Authentication Code) : Mã xác thực thông điệp GA (Genetic Algorithms): Giải thuật di truyền Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 4 - DANH MỤC CÁC HÌNH VẼ Hình 1.1. 1. Một cách phân loại kỹ thuật giấu tin ............................................................. 11 Hình 3. 1. Cách phân hoạch bộ dữ liệu ........................................................................... 32 Hình 3. 2. Thống kê phân bố tập Xmax, Xmin và cách lấy ngưỡng T*............................ 45 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 5 - DANH MỤC CÁC BẢNG BIỂU Bảng 1. Danh mục các ký hiệu ........................................................................................ 30 Bảng 2. Thống kê các tấn công với số lần tấn công là 20 ................................................. 51 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 6 - MỞ ĐẦU 1. Lý do lựa chọn đề tài 2. Mục tiêu nghiên cứu 3. Phạm vi nghiên cứu 4. Phƣơng pháp nghiên cứu 5. Ý nghĩa khoa học và ý nghĩa thực tiễn 6. Cấu trúc của luận văn 1. Lý do lựa chọn đề tài Ngày nay, các ứng dụng và các sản phẩm số trong đó bao gồm cả các cơ sở dữ liệu quan hệ được phát triển và phân phối rộng khắp trong môi trường Internet, vì vậy việc chứng minh quyền sở hữu đối với các sản phẩm này sau khi chuyển giao là một vấn đề rất cần thiết. Việc thực thi quyền sở hữu dữ liệu là một yêu cầu quan trọng đòi hỏi các giải pháp đồng bộ, bao gồm các khía cạnh về kỹ thuật, về tổ chức, và cả luật pháp. Mặc dù vẫn chưa có được những giải pháp toàn diện như vậy nhưng trong các năm gần đây, các kỹ thuật thuỷ vân đã đóng một vai trò quyết định nhằm giải quyết vấn đề về quyền sở hữu này. Hiện nay, mới chỉ có một vài cách tiếp cận đối với bài toán thuỷ vân dữ liệu quan hệ được đề xuất. Tuy nhiên, những kỹ thuật này không bền vững trước các tấn công thông thường và các tấn công gây hại, vì vậy cần có một kỹ thuật thủy vân cơ sở dữ liệu quan hệ có độ bền vững cao hơn nhất là đối với các tấn công xoá, sửa, và chèn các bản ghi. Luận văn “thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng giải thuật di truyền” trình bày kỹ thuật thuỷ vân cơ sở dữ liệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 7 - dựa vào kỹ thuật tối ưu hoá. Kỹ thuật này phải đảm bảo bền vững trước các tấn công thêm, bớt và thay đổi giá trị của các bộ trong quan hệ. 2. Mục tiêu nghiên cứu Mục tiêu chính của luận văn là đi sâu nghiên cứu kỹ thuật tối ưu hoá để mã hoá và giải mã thuỷ vân. Trong đó tập trung nghiên cứu kỹ thuật phân hoạch dữ liệu không phụ thuộc vào các bộ được đánh dấu để định vị các phân hoạch; nghiên cứu cách giải bài toán tối ưu bằng giải thuật di truyền với các ràng buộc trên thuộc tính được chọn để tiến hành thủy vân, và nghiên cứu kỹ thuật phát hiện thủy vân dựa vào một ngưỡng tối ưu. 3. Phạm vi nghiên cứu Phạm vi nghiên cứu của đề tài là đi sâu nghiên cứu về mặt lý thuyết của thuỷ vân và áp dụng cho cơ sở dữ liệu quan hệ. Nghiên cứu về cơ chế mã hoá và giải mã thuỷ vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán di truyền. 4. Phƣơng pháp nghiên cứu Luận văn này là luận văn thuộc ngành kỹ thuật chuyên ngành khoa học máy tính nên phương pháp nghiên cứu chủ yếu ở đây là phương pháp tiếp cận lý thuyết, sau đó áp dụng lý thuyết vào một ngôn ngữ lập trình cụ thể để kiểm chứng. Dựa trên những kết quả kiểm chứng đó để đưa ra các kết luận và các đề xuất nhằm hoàn thành mục tiêu nghiên cứu của luận văn. Cụ thể trong luận văn này, tác giả lấy thông tin tiêu thụ điện làm cơ sở dữ liệu phục vụ cho nghiên cứu; nghiên cứu về lý thuyết thuỷ vân; nghiên cứu về cách giải bài toán tối ưu hoá bằng giải thuật di truyền; sử dụng phần mềm Matlab để lập trình kiểm chứng lý thuyết. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 8 - 5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài Đưa ra cơ sở khoa học của việc áp dụng kỹ thuật tối ưu hoá để mã hoá và giải mã thuỷ vân trong đó sử dụng giải thuật di truyền để giải quyết bài toán tối ưu hoá. Kết quả nghiên cứu của đề tài rất có ý nghĩa trong việc chứng minh quyền sở hữu đối với các sản phẩm số hoá, đặc biệt là trong cơ sở dữ liệu quan hệ sau khi đã phân phối hoặc chuyển giao. Đồng thời việc chứng minh quyền sở hữu này cũng là một vấn đề rất quan trọng trong môi trường ứng dụng dựa trên Internet nhằm phát tán và truyền tải thông tin. 6. Cấu trúc của luận văn Ngoài phần mở đầu và phần kết luận, luận văn được trình bày thành ba chương như sau: - Chƣơng 1. Tổng quan về thuỷ vân và giải thuật di truyền. Chương này chủ yếu trình bày về các thông tin cơ bản của kỹ thuật giấu tin, các khái niệm cơ bản về thuỷ vân và ứng dụng thực tiễn của thuỷ vân, sơ lược về giải thuật di truyền. - Chƣơng 2. Thực trạng nghiên cứu về thuỷ vân cơ sở dữ liệu quan hệ. Chương này chủ yếu trình bày về thực trạng nghiên cứu về thuỷ vân cơ sở dữ liệu quan hệ ở trong nước và trên thế giới. - Chƣơng 3. Nội dung và các kết quả nghiên cứu. Chương này đi sâu mô tả chi tiết lý thuyết các bước tiến hành thí nghiệm áp dụng kỹ thuật tối ưu hoá cho mã hoá và giải mã thuỷ vân số. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 9 - CHƢƠNG 1 – TỔNG QUAN VỀ THUỶ VÂN VÀ GIẢI THUẬT DI TRUYỀN 1. Cơ bản về giấu tin 2. Cơ bản về thuỷ vân 3. Một số ứng dụng của thuỷ vân 4. Giải thuật di truyền Thông tin kỹ thuật số đã đem lại những thay đổi sâu sắc trong xã hội và trong cuộc sống của chúng ta ngày nay. Những thuận lợi mà thông tin kỹ thuật số mang lại cũng sinh ra những thách thức và cơ hội mới cho xã hội hiện đại. Mạng Internet toàn cầu đã biến thành một xã hội ảo nơi diễn ra quá trình trao đổi thông tin trong mọi lĩnh vực của đời sống. Và chính trong môi trường mở và tiện nghi như thế xuất hiện những vấn nạn, tiêu cực đang rất cần đến các giải pháp hữu hiệu cho các vấn đề an toàn thông tin như nạn ăn cắp bản quyền, nạn xuyên tạc thông tin, truy nhập thông tin trái phép, sao chép bất hợp pháp các sản phẩm trí tuệ số v.v.. Giải pháp cho những vấn đề trên đã được biết đến và áp dụng đó là giải pháp giấu tin (DataHiding), được nghiên cứu phát triển trong khoảng hơn chục năm gần đây. Trong đó thuỷ vân (watermark) là một thành phần của phương pháp giấu tin. Giấu thông tin bao gồm hai kỹ thuật chính là thuỷ ấn (watermarking) và giấu tin bí mật (steganograph) đang được quan tâm nghiên cứu và phát triển. Các thành tựu đạt được trong lĩnh vực nghiên cứu này đã bắt đầu được áp dụng hiệu quả cho mục đích bảo vệ bản quyền, chống sao chép, phân tán trái phép các sản phẩm trong môi trường số hoá và nhiều mục đích khác. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 10 - Nhiều phương pháp giấu thông tin khác nhau đã được đề xuất, mỗi phương pháp có những ưu điểm, nhược điểm riêng và thích hợp cho một nhóm các ứng dụng. 1.1. Cơ bản về kỹ thuật giấu tin 1.1.1. Khái niệm về giấu tin Giấu thông tin (Datahiding) là kỹ thuật nhúng (embedding) một lƣợng thông tin số nào đó vào trong một đối tƣợng dữ liệu số khác. Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc. Đây là phương pháp đã và đang được rất nhiều nước trên thế giới nghiên cứu và ứng dụng rất mạnh mẽ. Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là mã hoá làm cho các thông tin hiện rõ là nó có được mã hoá hay không, còn với giấu thông tin thì người ta sẽ khó biết được là có thông tin giấu bên trong. 1.1.2. Phân loại các kỹ thuật giấu tin Do kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần đây nên xu hướng phát triển chưa ổn định. Nhiều phương pháp mới, theo nhiều khía cạnh khác nhau đang được đề xuất, vì vậy đã tồn tại nhiều cách phân loại rất khác nhau. Dựa trên việc thống kê các công trình đã công bố trên các tạp chí, cùng với thông tin về tên và tóm tắt nội dung của các công trình đã công bố trên Internet, người ta chia lĩnh vực giấu tin ra làm hai hướng lớn, đó là watermarking và steganography Steganography quan tâm tới ứng dụng che giấu các bản tin đòi hỏi độ bí mật cao và dung lượng lớn. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 11 - Watermark (thủy vân) quan tâm nhiều đến ứng dụng giấu các mẩu tin ngắn nhưng đòi hỏi độ bền vững lớn của thông tin cần giấu (trước các biến đổi thông thường của tệp dữ liệu môi trường). Hình 1.1. 1. Một cách phân loại kỹ thuật giấu tin Đối với từng hướng lớn trên, quá trình phân loại theo các tiêu chí khác nhau dựa theo ảnh hưởng các tác động từ bên ngoài, người ta có thể chia watermark thành hai loại, một loại bền vững với các tác động sao chép trái phép, loại thứ hai lại cần tính chất hoàn toàn đối lập: dễ bị phá huỷ trước các tác động nói trên. Cũng có thể chia watermark theo đặc tính, một loại cần được che giấu để chỉ có một số người tiếp xúc với nó có thể thấy được thông tin, loại thứ hai đối lập, cần được mọi người nhìn thấy. Information hiding Giấu thông tin Steganograp hy Giấu tin mật Watermarkin g Thuỷ vân số Robust Copyright marking Thuỷ vân bền vừng Fragile marking Thuỷ vân “dễ vỡ” Imperceptible Watermarking Thuỷ vân ẩn Visible Watermarking Thuỷ vân hiển thị Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 12 - 1.1.3. Mục đích của giấu tin Bảo mật thông tin bằng giấu tin có hai khía cạnh. Một là bảo mật cho dữ liệu đem giấu (embedded data), chẳng hạn như giấu tin mật: thông tin mật được giấu kỹ trong một đối tượng khác sao cho người khác không phát hiện được (steganography). Hai là bảo mật chính đối tượng được dùng để giấu dữ liệu vào (host data), chẳng hạn như ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc thông tin (watermarking)... 1.1.4. Môi trƣờng giấu tin Kỹ thuật giấu tin đã được nghiên cứu và áp dụng trong nhiều môi trường dữ liệu khác nhau như trong dữ liệu đa phương tiện (text, image, audio, video), trong sản phẩm phần mềm và gần đây là những nghiên cứu trên môi trường cơ sở dữ liệu quan hệ. Trong các môi trường dữ liệu đó thì dữ liệu đa phương tiện là môi trường chiếm tỉ lệ chủ yếu trong các kỹ thuật giấu tin. a. Giấu tin trong ảnh Giấu thông tin trong ảnh, hiện nay, là một bộ phận chiếm tỉ lệ lớn nhất trong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phương tiện bởi lượng thông tin được trao đổi bằng ảnh là rất lớn và hơn nữa giấu thông tin trong ảnh cũng đóng vai trò hết sức quan trọng trong các hầu hết các ứng dụng bảo vệ an toàn thông tin như: nhận thực thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật. Vì vậy vấn đề giấu tin trong ảnh này đang được quan tâm rất lớn của các nhà nghiên cứu. Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít bị thay đổi và không thể nhận biết được bằng thị giác của con người, nó chỉ có thể bị phát hiện bởi “thị giác máy”. Ngày nay, khi ảnh số đã được sử dụng rất phổ biến, thì giấu thông tin trong ảnh đã đem lại rất nhiều những ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên - 13 - quan trọng trên nhiều lĩnh vực trong đời sống xã hội thì việc nhận thực chữ kí số, xác thực thông tin đã trở thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin hay xuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức nào. Một đặc điểm của giấu thông tin trong ảnh đó là thông tin được giấu trong ảnh một cách vô hình, nó như là một cách mà truyền thông tin mật cho nhau mà người khác không thể biết được bởi sau khi giấu thông tin thì chất lượng ảnh gần như không thay đổi đặc biệt đối với ảnh mầu hay ảnh xám. b. Giấu tin trong audio Giấu thông tin trong audio mang những đặc điểm riêng khác với giấu thông tin trong các đối tượng đa phương tiện khác. Một trong n