Dấu vân tay được hình thành dưới tác động của hệ thống gen di truyền mà thai nhi được thừa hưởng và tác động của môi trường thông qua hệ thống mạch máu và hthống thần kinh nằm giữa hạ bì và biểu bì. Một dấu vân tay được sao chép lại từ lớp biểu bì da khi ấn ngón tay vào một bềmặt phẳng. Cấu trúc của vân tay là các vân lồi và vân lõm (hình 2.1). Vân lồi có màu tối trong khi vân lõm có màu sáng. Vân lồi thường có độ rộng từ100 m μ đến 300 m μ . Độ rộng của một cặp vân lồi lõm cạnh nhau là 500 m μ .
14 trang |
Chia sẻ: vietpd | Lượt xem: 2244 | Lượt tải: 3
Bạn đang xem nội dung tài liệu Tổng quan nhận dạng vân tay, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Trang 19
Chương 2
Tổng quan nhận dạng vân tay
" Nội dung của chương này trình bày tổng quan nhận dạng vân tay, giới thiệu mô
hình cùng với sơ đồ các bước xử lý tiêu biểu trong nhận dạng vân tay. Đặc biệt ở
cuối chương này sẽ trình bày cách đánh giá một hệ thống nhận dạng vân tay.
2.1 Một số loại đặc trưng vân tay
Dấu vân tay được hình thành dưới tác động của hệ thống gen di truyền mà thai nhi
được thừa hưởng và tác động của môi trường thông qua hệ thống mạch máu và hệ
thống thần kinh nằm giữa hạ bì và biểu bì. Một dấu vân tay được sao chép lại từ lớp
biểu bì da khi ấn ngón tay vào một bề mặt phẳng. Cấu trúc của vân tay là các vân lồi
và vân lõm (hình 2.1). Vân lồi có màu tối trong khi vân lõm có màu sáng. Vân lồi
thường có độ rộng từ 100 mμ đến 300 mμ . Độ rộng của một cặp vân lồi lõm cạnh
nhau là 500 mμ . Các chấn thương như: bỏng nhẹ, mòn da, ... không ảnh hưởng đến
cấu trúc bên dưới của vân tay, khi da mọc lại cấu trúc này khôi phục lại như cũ [31].
Hình 2.1 Vân lồi và vân lõm của một ngón tay.
Trang 20
Vân lồi và vân lõm thường nằm song song với nhau, nhưng đôi lúc chúng tạo thành
điểm rẽ nhánh (bifurcation point) hay điểm kết thúc (ending point). Ở mức độ tổng
thể, các mẫu vân tay thể hiện các vùng vân khác nhau mà ở đó các đường vân có hình
dạng khác biệt. Những vùng này (gọi là các vùng đơn) có thể được phân loại thành
các dạng: loop, delta và whorl (hình 2.2) và được ký hiệu tương ứng là ΩΔ∩ ,, . Vùng
whorl có thể được mô tả bởi hai vùng loop đối diện nhau.
Hình 2.2 Hình vuông màu trắng vùng đơn chứa điểm đặc biệt và vòng tròn màu
trắng là điểm core.
Một vài thuật toán đối sánh vân tay căn lề ảnh vân tay theo một điểm trung tâm gọi là
điểm core. Vào năm 1900, Henrry đã định nghĩa điểm core là “điểm nằm về phía bắc
nhất của đường vân nằm trong cùng nhất”. Thực tế, điểm core là điểm trung tâm của
vùng loop nằm về phía bắc nhất. Nếu vân tay không chứa các vùng loop hay whorl
thì điểm core là điểm mà tại đó độ cong của đường vân là lớn nhất.
Định nghĩa các vùng đơn (singular region) thường được sử dụng để phân loại vân tay,
với mục đích làm đơn giản hóa các quá trình tìm kiếm (hình 2.3).
Trang 21
Hình 2.3 5 phân lớp chính của một vân tay
Ở mức độ cục bộ, các đặc tính quan trọng, gọi là các đặc trưng (minutiae), được tìm
thấy trong các mẫu vân tay. Các đặc trưng là điểm kết thúc, hay điểm rẽ nhánh, …
Francis Galton (1822-1911) là người đầu tiên phân loại đặc trưng và phát hiện chúng
không thay đổi trong suốt cuộc đời của một cá nhân. Vào năm 1986, viện chuẩn quốc
gia Mĩ (ANSI) đề nghị phân loại đặc trưng theo bốn loại gồm: điểm kết thúc, điểm rẽ
hai, điểm rẽ ba, và điểm không xác định. Trong khi đó mô hình đặc trưng của cục
điều tra liên bang Mĩ (FBI) chỉ phân thành hai loại: là điểm kết thúc và điểm rẽ hai.
Mỗi đặc trưng được xác định bằng hệ tọa độ (x,y), và góc tạo bởi tiếp tuyến của
đường vân tại đặc trưng và trục ngang.
Hình 2.4 Các loại đặc trưng phổ biến.
Trong các ảnh vân tay, các điểm kết thúc và rẽ hai có thể tráo đổi cho nhau và ở cùng
vị trí, ở ảnh âm bản2 điểm kết thúc xuất hiện như là điểm rẽ hai và ngược lại (hình
2.5).
2 Ảnh âm bản (negative image) trong hình vân tay là ảnh có màu của vân lồi và vân lõm đảo lại cho nhau.
Trang 22
Hình 2.5 b) là ảnh âm bản của hình a).
2.2 Mô hình hệ thống nhận dạng vân tay
Kiến trúc của hệ thống thống nhận dạng vân tay trong hình 2.6 là một mô hình tiêu
biểu. Kiến trúc này bao gồm 4 thành phần chính:
• Phần người dùng (user interface): Cung cấp cơ chế cho người dùng đưa dấu
vân tay của mình vào hệ thống.
• CSDL hệ thống (system database): Dùng để lưu trữ các mẫu vân tay của
người dùng vào CSDL.
• Phần đăng ký (enroll module): Cho phép đăng ký các dấu vân tay của người
dùng vào CSDL của hệ thống.
• Phần xác nhận (authentication module): Cho phép xác nhận một người đã có
đăng ký vào trong một hệ thống hay chưa.
Khi người dùng cần đăng ký dấu vân tay của mình vào hệ thống. Đầu tiên thiết bị sẽ
lấy dấu vân tay của người dùng; tiếp đó, người dùng cung cấp các thông tin cá nhân
của mình cho hệ thống. Sau đó hệ thống dùng thuật toán rút trích đặc trưng (minutiae
extraction) để rút trích các đặc trưng của vân tay người dùng. Một thuật toán kiểm
định chất lượng ảnh vân tay trước khi hệ thống đưa các đặc trưng này vào CSDL.
Khi người dùng cần xác thực dấu vân tay của mình trong hệ thống. Đầu tiên, thiết bị
sẽ lấy dấu vân tay của người dùng; tiếp đó, hệ thống dùng thuật toán rút trích đặc
Trang 23
trưng để rút trích đặc trưng vân tay của người dùng. Sau đó, hệ thống sẽ đối sánh các
đặc trưng dấu vân tay người dùng đưa vào với tất cả các đặc trưng vân tay có trong
CSDL của hệ thống. Cuối cùng, hệ thống sẽ trả kết quả ra cho người dùng.
Hình 2.6 Kiến trúc của hệ thống nhận dạng vân tay tự động.
2.3 Sơ đồ các bước xử lý trong quá trình nhận dạng
Hình 2.6 là một sơ đồ tiêu biểu của các bước xử lý trong quá trình nhận dạng vân tay.
Quá trình xử lý nhận dạng này được chia ra làm hai quá trình lớn: quá trình xử lý ảnh
(image processing) và quá trình đối sánh vân tay (matching).
2.3.1 Quá trình xử lý ảnh (image processing)
Mục đích của quá trình này là tăng cường ảnh vân tay. Sau đó, rút trích đặc trưng vân
tay từ ảnh đã được tăng cường. Quá trình này được thực hiện qua các bước nhỏ sau:
• Tăng cường ảnh (image enhancement): ảnh được lấy từ thiết bị đầu đọc vân
tay sẽ được làm rõ. Do các thiết bị đầu đọc vân tay không lấy ảnh tốt hay do
vân tay của người dùng trong lúc lấy bị hao mòn, dơ bẩn, hay do lực ấn ngón
tay trong lúc lấy vân tay [15]; do vậy, bước này là một trong các bước quan
Trang 24
trọng nhất của quá trình này để làm rõ ảnh vân tay để rút trích các đặc trưng
đúng và đầy đủ.
• Phân tích ảnh (image analysis): thông qua phân tích ảnh, ảnh sẽ được loại bỏ
những thông tin nhiễu hay những thông tin không cần thiết.
• Nhị phân hóa (binarization): nhị phân hóa ảnh vân tay thành ảnh trắng đen.
Bước này phục vụ cho bước Làm mỏng vân tay.
• Làm mỏng (thinning): làm mỏng các đường vân lồi của ảnh vân tay. Bước
này nhằm mục đích cho việc rút trích đặc trưng của vân tay.
• Rút trích đặc trưng (minutiae extraction): rút trích những đặc trưng cần thiết
cho quá trình đối sánh vân tay.
2.3.2 Quá trình đối sánh vân tay (matching)
Mục đích của quá trình này là đối sánh vân tay dựa trên các đặc trưng đã được rút
trích. Quá trình này được thực hiện qua các bước nhỏ sau:
• Phân tích đặc trưng (minutiae analysis): phân tích các đặc điểm cần thiết của
các đặc trưng để phục vụ cho việc đối sánh vân tay.
• Xét độ tương tự cục bộ (local similarity): thuật toán đối sánh vân tay sẽ dựa
vào các thông tin cục bộ của các đặc trưng3 của vân tay để tìm ra các cặp đặc
trưng giống nhau giữa hai vân tay.
• Xét độ tương tự toàn cục (global similarily): từ những khu vực tương tự nhau
trên cục bộ, thuật toán sẽ tiếp tục mở rộng đối sánh trên toàn cục.
• Tính điểm đối sánh (calculate matching score): tính toán tỷ lệ độ giống nhau
giữa các cặp đặc trưng. Điểm đối sánh này sẽ cho biết độ giống nhau của hai
ảnh vân tay là bao nhiêu.
3 Thông tin cục bộ của một đặc trưng là: tọa độ (x,y), hướng của đặc trưng, góc tạo bởi tiếp tuyến của đường vân tại đặc
trưng và trục ngang.
Trang 25
Hình 2.7 Sơ đồ các bước nhận dạng vân tay.
2.4 Cách đánh giá hệ thống nhận dạng vân tay
2.4.1 Đặt vấn đề
Cách đánh giá một hệ thống nhận dạng vân tay tương tự như cách đánh giá của một
hệ thống sinh trắc. Nhóm tác giả Phillips định nghĩa ba kiểu đánh giá của hệ thống
sinh trắc [35]:
• Đánh giá công nghệ (technology evaluation): đánh giá này nhằm mục đích so
sánh các thuật toán với nhau. Việc kiểm tra các thuật toán được thực hiện
trên một hay nhiều CSDL (CSDL này thường là CSDL chuẩn dành cho các
cuộc thi quốc tế).
• Đánh giá toàn cảnh (scenario evaluation): đánh giá này nhằm mục đích xác
định toàn bộ hiệu năng hệ thống nhận dạng trong một ứng dụng giả lập dùng
để kiểm tra. Hệ thống nhận dạng được kiểm tra giống hệt như trong một môi
trường thế giới thực.
• Đánh giá hoạt động (operational evaluation): đánh giá này nhằm mục đích
xác định hiệu năng của một hệ thống sinh trắc hoàn thiện trong một môi
Trang 26
trường ứng dụng cụ thể với một dữ liệu được thu thập trực tiếp từ thiết bị để
kiểm tra; do đó, kết quả kiểm tra của mỗi lần sẽ là khác nhau.
Trong đánh giá toàn cảnh và đánh giá hoạt động, độ chính xác của một hệ thống sinh
trắc phụ thuộc rất nhiều vào các yếu tố như: bộ dữ liệu kiểm tra, môi trường thử
nghiệm, chế độ hoạt động của hệ thống, sự ràng buộc của ứng dụng dùng hệ thống
sinh trắc, …
2.4.2 Các lỗi hệ thống sinh trắc
Để đánh giá độ chính xác của một hệ thống sinh trắc, ta sẽ căn cứ vào điểm đối sánh
giữa hai mẫu, gọi là điểm đối sánh s. Điểm đối sánh, có giá trị nằm trong [0,1], được
dùng để lượng hóa độ tương tự giữa một mẫu đặc trưng đầu vào và một mẫu đặc
trưng đã được lưu trong CSDL. Nếu hai mẫu đặc trưng này càng giống nhau thì điểm
đối sánh s càng có khả năng gần giá trị 1, ngược lại hai mẫu càng không giống nhau
thì điểm đối sánh s càng gần giá trị 0. Quyết định của hệ thống được điều khiển bởi
ngưỡng t. Với điểm đối sánh s, ta có [31]:
• Nếu s ≥ t: cặp đối sánh (nghĩa là hai mẫu của cùng một người).
• Nếu s ≤ t: cặp không đối sánh (nghĩa là hai mẫu không của cùng một người).
• Thông thường một hệ thống xác thực sinh trắc xem xét hai lỗi sau:
o Kiểm tra độ đo sinh trắc từ hai mẫu hoàn toàn khác nhau nhưng kết
quả xác thực lại cho là chúng cùng một mẫu (ta gọi là đối sánh sai).
o Kiểm tra độ đo sinh trắc từ hai mẫu giống nhau nhưng kết quả xác
thực lại cho là hai mẫu hoàn toàn khác nhau (ta gọi là không-đối sánh
sai).
Trong môi trường thương mại, hai lỗi trên tương ứng được dùng là tỷ lệ chấp
nhận sai (false acceptance rate (FAR)) và tỷ lệ từ chối sai (false rejection rate
(FRR)).
Trang 27
2.4.3 Các lỗi hệ thống xác thực
Gọi T là mẫu sinh trắc của một người đã được lưu trữ trước đó, I là mẫu sinh trắc đầu
vào cần được xác thực. Các giả thuyết đặt ra là:
• H0: I ≠ T, mẫu sinh trắc đầu vào và mẫu sinh trắc đã được lưu trước không
phải của cùng một người.
• H1: I = T, mẫu sinh trắc đầu vào và mẫu sinh trắc đã được lưu trước là của
cùng một người.
Tương ứng có các kết luận:
• D0: người này không phải là người có mẫu sinh trắc đã được lưu trữ trong hệ
thống.
• D1: người này đúng là người có mẫu sinh trắc đã được lưu trữ trong hệ
thống.
Đối sánh trong xác thực T và I sử dụng điểm độ tương tự s(T,I). Nếu điểm độ tương
tự nhỏ hơn ngưỡng t thì kết quả là D0, nếu điểm độ tương tự lớn hơn hoặc bằng
ngưỡng t thì cho kết luận D1.
Từ các giả thuyết trên, một hệ thống xác thực có hai loại lỗi sau:
• Dạng I: đối sánh sai (kết luận là D1 khi H0 đúng).
• Dạng II: không-đối sánh sai (kết luận là D0 khi H1 đúng).
Vậy tỷ lệ đối sánh sai (FMR) là xác suất của lỗi loại I, tỷ lệ không-đối sánh sai
(FNMR) là xác suất của lỗi loại II:
• FMR = P(D1| H0 đúng).
• FNMR = P(D0| H1 đúng).
Để đánh giá độ chính xác của một hệ thống sinh trắc, ta phải thống kê các điểm đối
sánh s của các cặp mẫu giống nhau (phân bố p(s|H1 đúng) - thường được gọi là phân
bố đích thật), và điểm đối sánh s của các cặp mẫu khác nhau (phân bố p(s|H0 sai) -
Trang 28
thường được gọi là phân bố mạo danh). Hình 2.8 minh họa cách tính FNMR và FMR.
Trong đó cho trước một ngưỡng t. FMR là phần trăm của các cặp mạo danh có điểm
đối sánh lớn hơn hay bằng t và FNMR là phần trăm các cặp chân thật có điểm đối
sánh nhỏ hơn t.
∫ == t dstrueHspFNMR
0
1 )|( ,
∫ ==
1
0 )|(
t
dstrueHspFMR .
Hình 2.8 Minh họa cách tính FMR và FNMR.
Cả FMR và FNMR thực ra là hàm của ngưỡng hệ thống theo t; do đó, chúng ta có thể
được viết tương ứng là FMR(t) và FNMR(t). Nếu t giảm thì hệ thống sẽ bỏ qua nhiều
lỗi và FMR(t) sẽ tăng, ngược lại khi tăng t hệ thống sẽ an toàn hơn nhưng FNMR(t)
sẽ tăng tương ứng. Một người thiết kế hệ thống xác thực thường không biết trước hệ
thống của mình sẽ ứng dụng ở lĩnh vực nào; do đó, họ báo cáo hiệu năng hệ thống ở
tất cả các điểm hoạt động (ngưỡng t) bằng cách xây dựng đường cong đặc tính hoạt
động (receiver operating characteristic (ROC)). Đường cong này biểu diễn các giá trị
FNMR và FMR theo ngưỡng t.
Trang 29
Bên cạnh các phân bố và đồ thị trên, một vài chỉ số khác được dùng để đánh giá độ
chính xác của một hệ thống xác thực.
• Tỉ lệ lỗi trung bình (EER): là tỷ lệ lỗi tại ngưỡng t mà FMR(t) = FNMR(t).
Trên thực tế, vì các phân bố điểm đối sánh không liên tục nên điểm EER có
thể không tồn tại (hình 2.9). Trong trường hợp này, thay vì đưa ra một giá trị
đơn duy nhất, người ta đưa ra một khoảng [29]. Mặc dù EER là một chỉ số
quan trọng, nhưng các hệ thống kiểm tra vân tay ít khi dùng EER làm
ngưỡng hoạt hoạt động của hệ thống, mà thường dùng một ngưỡng nghiêm
ngặt hơn sao cho FMR thấp, và chấp nhận FNMR cao hơn một chút.
• ZeroFNMR là giá trị FMR nhỏ nhất mà tại đó không xảy ra không-đối sánh
sai.
• ZeroFMR là giá trị FNMR nhỏ nhất mà tại đó không xảy ra đối sánh sai.
• Tỉ lệ thất bại trong việc lấy mẫu sinh trắc (FTC) là tỷ lệ phần trăm mà thiết bị
đầu đọc sinh trắc không thể tự động lấy mẫu sinh trắc từ người dùng.
• Tỷ lệ thất bại trong lúc đăng ký (FTE) là tỷ lệ phần trăm mà người dùng
không đăng ký với hệ thống. Có mối liên hệ giữa FTE và độ chính xác (FMR
và FNMR) của một hệ thống. Nếu việc đăng ký lấy mẫu cho hệ thống có
chất lượng tốt thì độ chính xác của hệ thống (FMR và FNMR) sẽ tăng lên.
• Tỷ lệ thất bại trong đối sánh (FTM) là tỷ lệ phần trăm mẫu đầu vào không
thể được xử lý hay đối sánh với một mẫu sinh trắc đã được lưu trước đó
nhưng không đủ chất lượng.
Trang 30
Hình 2.9 Đánh giá của thuật toán xác thực vân tay qua CSDL DB1 của FVC2002: a)
các phân bố chân thật và mạo danh được tính trên 2800 cặp chân thật và 4950 cặp
mạo danh; b) FMR(t) và FNMR(t) được tính từ các phân bố ở a); c) đường cong
ROC dẫn xuất từ FMR(t) và FNMR(t) ở b) [31].
Trang 31
Hình 2.10 Minh họa EER, ZeroFNMR và ZeroFMR theo đường cong FMR(t) và
FNMR(t) [31].
2.4.4 Các lỗi hệ thống nhận dạng
Các lỗi hệ thống nhận dạng được mở rộng từ định nghĩa Các lỗi hệ thống xác thực.
Hình 2.11 Các điểm hoạt động hệ thống tiêu biểu của các ứng dụng trình bày trên
đường cong ROC.
Trang 32
Giả sử hệ thống không dùng các cơ chế đánh chỉ mục trong truy tìm (nghĩa là hệ
thống sẽ tìm kiếm vét cạn trên toàn bộ tập dữ liệu chứa N mẫu sinh trắc), và mỗi
người chỉ có một mẫu sinh trắc được lưu trữ. Tương ứng ký hiệu FNMRN và FMRN
là tỷ lệ không-đối sánh sai và tỷ lệ đối sánh sai trong một hệ thống nhận dạng thì:
• FNMRN = FNMR: xác suất của lỗi không-đối sánh [6];
• FMRN = 1 – (1 – FMR)N: một lỗi đối sánh sai xảy ra khi mẫu sinh trắc đầu
vào đối sánh nhầm với một hay nhiều mẫu sinh trắc đã được lưu trong
CSDL. (1 – FMR) là xác suất không xảy ra đối sánh sai với một mẫu sinh
trắc đã được lưu trong CSDL, và (1 – FMR)N là xác suất không xảy ra đối
sánh sai với toàn bộ CSDL mẫu. Nếu FMR nhỏ thì FMRN tương đương với
N. Vậy FMR tỷ lệ đối sánh sai tăng tuyến tính với kích thước CSDL mẫu.
Kết quả này hàm ý quan trọng cho những hệ thống nhận dạng lớn. Thông thường tốc
độ xử lý được xem là vấn đề lớn trên các hệ thống dạng này. Nhưng thực ra, độ chính
xác mới là vấn đề lớn hơn. Xét một hệ thống có 10,000 người dùng. Để tăng tốc độ
xử lý người ta có thể kết hợp thuật toán nhanh cùng với một kiến trúc hệ thống mạnh
(xử lý song song). Đối với độ chính xác, nếu hệ thống cần độ chính xác ở 10-5 (chỉ sai
1 trên 100,000 lần đối sánh), thì FMRN gần là 10%.
Nếu trong trường hợp các mẫu sinh trắc trong CSDL được phân loại và đánh chỉ
mục, thì trong quá trình nhận dạng chỉ có một phần CSDL được lấy ra để xác thực.
Khi đó:
• FNMRN = RER + (1 – RER). FNMR; trong đó, RER (tỷ lệ lỗi truy xuất) là
xác suất mẫu sinh trắc cần được tìm trong CSDL nhưng bị bỏ qua khi truy
tìm;
• FMRN = 1 – (1 – FMR)N–P; trong đó, P là tỷ lệ phần trăm trung bình các mẫu
trinh trắc được tìm kiếm trong CSDL trong quá trình nhận dạng [6].