Luận văn Truy tìm ảnh vân tay trên cơ sở dữ liệu được gom nhóm

Hiện nay, việc nhận dạng con người tự động được ứng dụng rộng rãi trong nhiều lĩnh vực của cuộc sống cũng như sử dụng trong các cơ quan hành pháp để nhận biết thông tin tội phạm, chẳng hạn nhúng trong các thiết bị điện tử như các thẻ thông minh, thẻ ATM, máy tính xách tay, máy kiểm tra tại cảng hàng không, thiết bị điều khiển truy cập mạng, ngân hàng điện tử,

pdf10 trang | Chia sẻ: vietpd | Lượt xem: 1490 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Luận văn Truy tìm ảnh vân tay trên cơ sở dữ liệu được gom nhóm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
- 3 - Chương 1 . TỔNG QUAN 1.1 Giới thiệu Hiện nay, việc nhận dạng con người tự động được ứng dụng rộng rãi trong nhiều lĩnh vực của cuộc sống cũng như sử dụng trong các cơ quan hành pháp để nhận biết thông tin tội phạm, chẳng hạn nhúng trong các thiết bị điện tử như các thẻ thông minh, thẻ ATM, máy tính xách tay, máy kiểm tra tại cảng hàng không, thiết bị điều khiển truy cập mạng, ngân hàng điện tử, …. Nhận dạng theo cách truyền thống (ví dụ như mật khẩu, hộ chiếu, giấy phép lái xe, thẻ căn cước, …) có thiên hướng bị gian lận bởi vì mật khẩu có thể bị quên, hoặc thẻ có thể bị đánh cắp, làm giả bởi các tên lừa đảo. Vì vậy, nhận dạng theo cách này không đáp ứng được yêu cầu về an ninh trong xã hội kết nối thông tin, hiện đại. Hệ thống nhận dạng hoàn hảo nhất thiết cần dựa vào sinh trắc học. 1.2 Sinh trắc học Sinh trắc học là công nghệ phân tích và đo lường các đặc điểm cơ thể con người (chẳng hạn như dấu vân tay, võng mạc mắt và tròng đen, mẫu giọng nói, bàn tay, gương mặt, dáng đi, gen, chữ ký) cho mục đích chứng thực [3]. Các đặc điểm sinh trắc học là phân biệt duy nhất của mỗi người, không thể bị quên, hay bị mất và việc xác thực một người cần có sự xuất hiện của người đó. Do đó, sinh trắc học là đáng tin cậy hơn so với phương pháp truyền thống. Đặc điểm sinh trắc học gồm có như vân tay, khuôn mặt, bàn tay, võng mạc và tròng mắt, chữ ký, dáng đi, tiếng nói. Trong các đặc điểm này, hệ thống nhận dạng tự động dựa vào đặc điểm vân tay có chi phí thấp và rất đáng tin cậy. 1.3 Vân tay Vân tay là mẫu hình mà nó biểu diễn cấu trúc những đường vân (ridges) và rãnh (valleys) trên đầu ngón tay. Đặc điểm sinh học của vân tay là duy nhất cho mỗi cá - 4 - nhân. Trong nhiều thập kỷ qua, các cơ quan hành pháp đã phân loại và xác định danh tánh của từng vân tay là dựa vào những điểm kết thúc đường vân hoặc điểm nằm trên ngã rẽ đường vân (còn gọi là minutiae - các chi tiết vụn vặt). Bên cạnh đặc trưng cục bộ minutiae, vân tay còn có những đặc trưng khác như đặc trưng toàn cục - mẫu đường vân, đặc trưng đường vân với độ phân giải lớn [19]. Các đặc trưng này là nhất quán theo thời gian và duy nhất đối với cá nhân, nên được sử dụng trong các hệ thống nhận dạng vân tay. 1.3.1 Đặc trưng mức toàn cục Các đặc trưng mức toàn cục được rút ra từ cấu trúc của đường vân. Độ cong của các đường vân tạo thành các hình dạng đường vân khác nhau. Từ đó, có ba đặc trưng phổ biến được rút trích ra ở cấp độ này [1, 2, 19] bao gồm các điểm nổi bật (còn gọi là điểm delta và điểm core, xem Hình 1-1a), điểm nổi bật này kết hợp với đặc trưng hình dáng đường vân để phân lớp vân tay (thường được phân thành thành 5 nhóm chính vòng trái-left loop, vòng phải-right loop, vòng tròn-whorl, vòng cung- arch, vòng cung dạng lều-tented arch, Hình 1-2) và đặc trưng khoảng cách đường vân (xem Hình 1-1b). Các đặc trưng này có chi phí lưu trữ thấp nhưng nhạy cảm đối với ảnh vân tay chất lượng thấp. Hơn nữa, không thể sử dụng các đặc trưng này để phân biệt vân tay. Do vậy, các đặc trưng này thông thường được sử dụng trong việc tìm kiếm ảnh ở mức thô (phân lớp ảnh vân tay). (a) (b) ĐiểmCore Điểm Delta Khoảng cách đường vân Hình 1-1. (a) điểm nổi bật trên vân tay (điểm delta, điểm core). (b) khoảng cách đường vân - 5 - a) b) c) e) d) Hình 1-2. Các lớp vân tay theo phân lớp Henrry. (a) left loop. (b) right loop. (c) whorl. (d) arch. (e) tented arch. 1.3.2 Đặc trưng mức cục bộ a) b) c) e) d) Hình 1-3. Các đặc trưng cục bộ của vân tay. (a) Crossover. (b) Island. (c) Lake. (d) Bifurcation. (e) Ending - 6 - Francis Galton (1822-1911) là người đầu tiên quan sát và phân loại các đặc trưng minutiae, bao gồm các điểm gán đoạn đường vân như điểm kết thúc đường vân (ending), điểm rẽ nhánh (bifurcation), điểm chéo (crossovers), các đảo (islands), các hồ (lakes), các điểm cựa gà (spur), … (xem Hình 1-3). Hai đặc trưng thường dùng nhất là điểm kết thúc đường vân và điểm rẽ nhánh bởi vì các đặc trưng khác tổ hợp từ hai đặc trưng này. Các thuật toán so khớp tinh để đánh giá mức độ giống nhau của vân tay thường căn cứ vào đặc trưng này. 1.3.3 Đặc trưng đường vân với độ phân giải cao Đặc trưng này là các lỗ nằm trên đường vân của vân tay (đặc trưng sweat pore, xem Hình 1-4a) [12]. sweat pore b) a) pore Hình 1-4. Đặc trưng tuyến mồ hôi - (a) sweat pore. (b) pore Các lỗ này tạo ra là từ các tuyến mồ hôi của ngón tay. Để có được những đặc trưng này, vân tay phải được quét với máy có độ phân giải cao (1000 dpi), khi đó các pore này mới có thể xác định dễ dàng. Đặc trưng này không được sử dụng phổ biến. 1.4 Hệ thống nhận dạng vân tay tự động Tùy thuộc vào bối cảnh ứng dụng, nhìn chung, hệ thống nhận dạng vân tay tự động làm việc ở hai chế độ: xác thực vân tay và nhận biết vân tay [19]. 1.4.1 Hệ thống xác thực vân tay tự động Hệ thống xác thực vân tay tự động là hệ thống nhận dạng vân tay hoạt động theo chế độ xác thực vân tay. Trong chế độ này, người cần xác nhận sẽ cung cấp thông - 7 - tin nhận dạng cho hệ thống (ví dụ tên) cùng với vân tay của người đó. dựa vào thông tin nhận dạng , hệ thống sẽ lấy ảnh vân tay mẫu trong cơ sở dữ liệu kiểm tra có trùng khớp với vân tay truy vấn hay không? Nếu trùng khớp thì người này được xác minh đúng thông tin ngoài ra thì bị từ chối. Các giai đoạn xử lý của hệ thống xác thực được minh họa rõ trong Hình 1-5. Bộ cảm biến thu nhận vân tay Rút trích đặc trưng Cơ sở dữ liệu các mẫu vân tay và thông tin nhân dạng tương ứng Bộ cảm biến thu nhận vân tay Rút trích đặc trưng So khớp đặc trưng Chấp nhận / từ chối nhận dạng Thông tin nhận dạng (tên) Thông tin nhận dạng (tên) Giai đoạn xác nhận Giai đoạn lấy mẫu Hình 1-5. Các giai đoạn xử lý của hệ thống xác nhận vân tay 1.4.2 Hệ thống xác định vân tay tự động Hệ thống xác định vân tay vân tay tự động là hệ thống nhận dạng vân tay hoạt động theo chế độ nhận biết vân tay. Trong chế độ này, người cần nhận biết chỉ cung cấp ảnh dấu vân tay, hệ thống sẽ lấy tất cả các ảnh vân tay lưu trữ trong cơ sở dữ liệu ra để so khớp, từ đó xác định mẫu vân tay nào giống nhất trong cơ sở dữ liệu. Nếu mức độ giống nhau lớn hơn một ngưỡng xác định trước thì hệ thống sẽ lấy những thông tin của dấu vân tay mẫu giống nhất này là thông tin của người cần nhận biết. Các giai đoạn xử lý của hệ thống truy tìm ảnh vân tay được minh họa rõ trong Hình 1-6. - 8 - Bộ cảm biến thu nhận vân tay Rút trích đặc trưng Cơ sở dữ liệu các mẫu vân tay và thông tin liên quan Bộ cảm biến thu nhận vân tay Rút trích đặc trưng So khớp đặc trưng Nhận biết thông tin đối tượng nếu có Giai đoạn truy tìm Giai đoạn lấy mẫu Thông tin nhận dạng (tên) Hình 1-6. Các giai đoạn xử lý trong hệ thống truy tìm ảnh vân tay 1.5 Thách thức trong truy tìm ảnh vân tay Hệ thống truy tìm ảnh vân tay đối với cơ sở dữ liệu vân tay lớn, và phần lớn ảnh chất lượng thấp có nhiều thách thức. Các thách thức ban đầu liên quan đến vấn đề ảnh vân tay chất lượng thấp hoặc chỉ có một phần ảnh (xem Hình 1-7) bởi vì ảnh vân tay được thu nhận trong các tình trạng khác nhau: vị trí ấn, áp lực ấn, độ ẩm của da, bụi bẩn, … hoặc do thiết bị thu nhận kém. Dẫn đến, cần phải có các thuật toán hiệu quả để tiền xử lý ảnh vân tay, để thu được ảnh rõ ràng hơn. Đồng thời, cần phải có thuật toán so khớp vân tay hiệu quả đối với ảnh vân tay với nhiều trạng thái khác nhau như dịch chuyển, bóp méo, xoay. Bên cạnh đó, đối với cơ sở dữ liệu vân tay lớn, hệ thống truy tìm ảnh vân tay cần phải có một thuật toán phân lớp vân tay hiệu quả, nhằm thu hẹp không gian tìm kiếm mức so khớp tinh, đồng thời đảm bảo độ chính xác đối với trường hợp phần lớn vân tay trong cơ sở dữ liệu chất lượng thấp. Do vậy, bài toán này còn thu hút rất nhiều sự quan tâm của các nhà nghiên cứu. - 9 - a) b) c) d) Hình 1-7. Ảnh vân tay chất lượng thấp và biến dạng. (a) ảnh vân tay một phần. (b) ảnh vân tay bị nét đứt. (c) ảnh vân tay vị dính dầu. (d) ảnh vân tay bị xoay 1.6 Hiện trạng nghiên cứu về truy tìm ảnh vân tay. Để giải quyết bài toán thu hẹp không gian tìm kiếm đối với cơ sở dữ liệu lớn, hướng tiếp cận tìm kiếm nhiều mức thường được đề xuất. Trong đó, các đặc trưng toàn cục thường được sử dụng để thực hiện tìm kiếm ở mức độ thô nhằm làm giảm không gian tìm kiếm ở mức tinh. Việc tìm kiếm ở mức tinh thường căn cứ vào đặc trưng cục bộ. Vì vậy, cần thiết phải có một giải pháp thực hiện tìm kiếm vân tay ở mức thô vừa giảm không gian tìm kiếm vừa đảm bảo độ chính xác nhận dạng vân tay. Có nhiều giải pháp đã được đề xuất cho bài toán tìm kiếm ở mức độ thô như phân lớp rõ, đánh chỉ mục vân tay, phân lớp liên tục, gom nhóm vân tay. Phân lớp rõ các ảnh vân tay là hướng tiếp cận truyền thống mà nó được đầu tư nghiên cứu rất nhiều [9, 15, 25, 27]. Vân tay được phân vào một trong các lớp được định nghĩa trước chẳng hạn các lớp Henry. Mặc dù nó có những thuận lợi như con người dễ nhận biết, phân chia cơ sở dữ liệu thành một số lớp định nghĩa trước, nhưng thuật toán phân lớp tự động tốt nhất cũng chỉ có thể phân lớp vân tay thành 4 - 10 - hoặc 5 nhóm. Sự phân phối vân tay tự nhiên của 5 lớp của Henrry là 3.7% plain arch, 2.9 % tented arch, 33.8% left loop, 31.7% right loop và 27.9% whorl. Về trung bình, vân tay truy vấn vẫn cần được so sánh tinh với khoảng 29.48% các mẫu trong cơ sở dữ liệu để nhận dạng. Vì vậy, phân lớp rõ không hiệu quả trong việc thu hẹp không gian tìm kiếm trên cơ sở dữ liệu. Thực tế, không cần thiết phải phân lớp các vân tay thành các lớp mà con người có thể nhận biết rõ cho hệ thống nhận dạng vân tay. Đánh chỉ mục vân tay [3] là phương pháp phân chia cơ sở dữ liệu vân tay thành một số khối dựa vào bộ ba minutiae. Hướng tiếp cận này phân lớp các vân tay thành nhiều lớp hơn việc phân lớp riêng biệt bởi vì nó sử dụng những đặc trưng phân biệt như minutiae. Tuy nhiên, các điểm minutia là đặc trưng cục bộ quan trọng nhất và được sử dụng rộng rãi nhất các thuật toán so khớp vân tay mở mức tinh. Do đó, mặc dù hướng tiếp cận này có thể tăng tốc độ tìm kiếm của hệ thống, nhưng độ chính xác trong việc nhận dạng của hệ thống có thể bị suy giảm đáng kể vì các đặc trưng sử dụng trong tìm kiếm thô và so khớp tinh là có liên hệ nhiều với nhau. Phân lớp liên tục [5, 20] được đề xuất để khắc phục các vấn đề số lớp ít của phương pháp phân lớp rõ bằng cách sử dụng vectơ đặc trưng số hóa để biểu diễn vân tay. Tìm kiếm vân tay được thực hiện bằng cách so sánh ảnh vân tay truy vấn với tất cả các mẫu trong cơ sở dữ liệu và nhận ra mẫu gần nhất. Dù cho, việc so sánh giữa vân tay và mẫu nhanh hơn so với việc so khớp tinh, nhưng việc tìm kiếm vân tay một cách đầy đủ này gặp hạn chế với cơ sở dữ liệu lớn. Hơn nữa, việc phân lớp liên tục chỉ xếp hạng các mẫu trong cơ sở dữ liệu dựa vào mức độ giống nhau với ảnh vân tay truy vấn trong khi đó lại xem thường sự giống nhau giữa các mẫu trong cơ sở dữ liệu. Đây là giới hạn của phương pháp này trong việc tìm kiếm. Gom nhóm dữ liệu vân tay [17] là kĩ thuật đầy tìm năng cho thu gọn không gian truy tìm ảnh dựa vào nội dung bằng cách chỉ so sánh ảnh truy vấn với các đại diện của mỗi nhóm thay vì tất cả. Trong phương pháp này, các vân tay được gom nhóm dựa vào hai vector đặc trưng: vector hướng đường vân và vector khoảng cách đường vân. Sau đó, việc tìm kiếm ở mức thô sẽ diễn ra trên nhiều mức, mỗi mức - 11 - dựa vào một vector đặc trưng. Phương pháp này thu hẹp đáng kể không gian tìm kiếm và chính xác hơn so với các phương pháp khác (xem Bảng 1-1). Bảng 1-1. Minh họa tỉ lệ lỗi của việc truy tìm theo hướng tiếp cận phân lớp rõ và hướng tiếp cận gom nhóm được thực hiện trên cơ sở dữ liệu NIST DB4 [17] Phương pháp Tác giả và năm PR=20% 5 lớp PR=29.5 % 5 lớp PR=28% 4 lớp PR=29.7% 4 lớp Tập kiểm tra Candela (1995) — — 11.4 6.1 Phần 2 Karu và Jain (1996) 14.6 11.9 8.6 9.4 Toàn bộ Jain (1999) 10 7.0 5.2 — Phần 2 Jain và Minut (2002) — — 8.8 9.3 Toàn bộ Cappelli (1999) — 12.9 — — Tập 2 Cappelli (1999) 7.9 6.5 5.5 — Phần 2 Senior (2001) — — — 5.1 Phần 2 Yao (2001) 10.7 9.0 6.9 — Phần 2 Marcialis (2001) 12.1 9.6 — — Phần 2 Zhang (2004) 15.7 — 7.3 — Toàn bộ Park (2005) 9.3 — 6.0 — Toàn bộ Gom nhóm của nhóm tác giả Liu, Jiang, Kot (2007) 4.2 2.9 3.1 2.9 Toàn bộ Tuy nhiên, một số hạn chế trong phương pháp này đó là việc rút trích các vector đặc trưng chưa hiệu quả trong trường hợp vân tay chất lượng thấp chẳng hạn vấn đề phát hiện phương bất biến, điểm lõi để rút trích vector hướng và việc tính khoảng cách đường vân cần chính xác hơn. Ngoài ra còn có phương pháp đề xuất kết hợp việc phân lớp liên tục với phân lớp rõ, nhưng các phương pháp này vẫn chưa hiệu quả. Do đó, các nghiên cứu nhằm cải tiến việc tìm kiếm được hiệu quả hơn đối với cơ sở dữ liệu lớn, phần lớn các ảnh vân tay chất lượng thấp là vẫn hấp dẫn đối với các nhà nghiên cứu. 1.7 Đóng góp của luận văn Luận văn trình bày các công đoạn cần thiết để giải quyết bài toán nhận dạng vân tay. Đối với từng công đoạn xử lý, các phương pháp tiến bộ đã được nghiên cứu và chọn để giải quyết. Một số công đoạn, các phương pháp tiến bộ hiện tại vẫn tồn tại - 12 - nhược điểm. Một số phương pháp mới đã được đề xuất trong luận văn để khắc phục các nhược điểm này. Để tiền lọc vân tay hiệu quả, phương pháp gom nhóm vân tay nhiều mức được sử dụng. Để tăng độ chính xác của tiền lọc vân tay, nhiều đặc trưng vân tay được sử dụng như vector khoảng cách đường vân, vector hướng đường vân và vector mật độ minutiae. Điểm tham chiếu đóng vai trò quan trọng trong việc rút trích vector đặc trưng hướng và mật độ minutiae. Nhằm tăng cường độ chính xác của việc rút trích các vector này, một thuật toán phát hiện điểm tham chiếu hiệu quả đã được đề xuất trong luận văn. Hơn nữa, một thuật toán lai để tính toán đường vân chính xác cũng được để xuất. Để giải quyết bài toán ảnh vân tay chất lượng thấp, luận văn đã đề xuất giải pháp nâng cao chất lượng ảnh hiệu quả dựa vào hàm Gabor và cách tính tần số đường vân chính xác. Thực nghiệm được tiến hành trên cơ sở dữ liệu chuẩn FVC2004 DB2 tập A, và cơ sở dữ liệu 10.000 ảnh vân tay chất lượng thấp của người dân Việt Nam, do Bộ công an cung cấp cho thấy các phương pháp tiến bộ được chọn và đề xuất cho bài toán nhận dạng vân tay trên cơ sở dữ liệu lớn, phần lớn ảnh chất lượng thấp là hợp lý. Tóm lại, chương này đã trình bày các vấn đề cơ bản liên quan đến bài toán nhận dạng vân tay. Những thánh thức đặt ra cho bài toán nhận dạng vân tay trên cơ sở dữ liệu lớn phần lớn ảnh chất lượng thấp được nêu ra. Các hướng nghiên cứu liên quan và đóng góp của đề tài cũng được giới thiệu rõ. Phần tiếp theo trình bày chi tiết các công đoạn tiền xử lý vân tay, các phương pháp tương ứng đã được sử dụng phổ biến cho từng công đoạn.

Các file đính kèm theo tài liệu này:

  • pdf5.pdf
  • pdf0.pdf
  • pdf1.pdf
  • pdf2.pdf
  • pdf3.pdf
  • pdf4.pdf
  • pdf6.pdf
  • pdf7.pdf
  • pdf8.pdf
  • pdf9.pdf
  • pdf10.pdf
  • pdf11.pdf
  • pdf12.pdf
Tài liệu liên quan