Xử lý ảnh là một trong những ngành khoa học đã đem lại cho con người những bước tiến vượt bậc mang tính cách mạng, nó đã đưa con người tiến sang một kỉ nguyên mới. Một vài năm trở lại đây công nghệ thông tin cùng với sự phát triển của nó đã kéo theo sự phát triển của hàng loạt các ngành khoa học trong nhiều lĩnh vực khác nhau như sinh học, kinh tế, viễn thông, quân sự, giải trí có những bước tiến nhanh hơn so với đúng quy trình mà đáng ra phải trải qua.
                
              
                                            
                                
            
 
            
                 72 trang
72 trang | 
Chia sẻ: vietpd | Lượt xem: 1724 | Lượt tải: 2 
              
            Bạn đang xem trước 20 trang tài liệu Luận văn Nắn chỉnh biến dạng hình học và ứng dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
§¹i häc Th¸i Nguyªn 
khoa c«ng nghÖ th«ng tin 
PHẠM ĐỨC HẬU 
NẮN CHỈNH BIẾN DẠNG 
HÌNH HỌC VÀ ỨNG DỤNG 
LuËn v¨n th¹c sÜ : CÔNG NGHỆ THÔNG TIN 
Th¸i Nguyªn - 2009 
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
§¹i häc Th¸i Nguyªn 
khoa c«ng nghÖ th«ng tin 
PHẠM ĐỨC HẬU 
NẮN CHỈNH BIẾN DẠNG 
HÌNH HỌC VÀ ỨNG DỤNG 
Chuyên ngành: KHOA HỌC MÁY TÍNH 
Mã số: 60 48 01 
LuËn v¨n th¹c sÜ : CÔNG NGHỆ THÔNG TIN 
NGƯỜI HƯỚNG DẪN KHOA HỌC 
PGS.TS ĐỖ NĂNG TOÀN 
Th¸i Nguyªn - 2009 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
1 
MỞ ĐẦU 
 Xử lý ảnh là một trong những ngành khoa học đã đem lại cho con người 
những bước tiến vượt bậc mang tính cách mạng, nó đã đưa con người tiến sang 
một kỉ nguyên mới. Một vài năm trở lại đây công nghệ thông tin cùng với sự 
phát triển của nó đã kéo theo sự phát triển của hàng loạt các ngành khoa học 
trong nhiều lĩnh vực khác nhau như sinh học, kinh tế, viễn thông, quân sự, giải 
trí… có những bước tiến nhanh hơn so với đúng quy trình mà đáng ra phải trải 
qua. Với sự phát triển ngày càng hoàn thiện của công nghệ phần cứng, công 
nghệ phần mềm cũng đang có những bước tiến quan trọng đóng góp một phần 
không nhỏ cho sự phát triển của xã hội loài người đặc biệt là lĩnh vực xử lý ảnh. 
 Trong thực tế đối tượng khi được thu nhận bởi các thiết bị điện tử và 
quang học thường không thể hiện được bản chất thực (nguyên thủy) của mình 
hay nói cách khác là bị biến dạng đi. Ví dụ: ảnh chụp cuốn sách thường có 
một đầu to đầu nhỏ do cách đặt máy ảnh, ảnh chụp bề mặt trái đất từ vệ tinh 
bị méo do bề mặt cong của trái đất v.v.. Nói đến xử lý ảnh người ta sẽ hiểu 
ngay đây là quá trình hiệu chỉnh hay bằng cách nào đó để làm cho đối tượng 
được thu nhận thể hiện được đúng bản chất của mình trên ảnh. Thông thường 
khâu đầu tiên của quá trình xử lý ảnh được gọi là khâu tiền xử lý với mục 
đích nắn chỉnh các điểm sai lệch trên ảnh sao cho kết quả được giống nhất so 
với đối tượng được thu nhận. Nắn chỉnh biến dạng nhằm hiệu chỉnh các 
khuyết điểm của đối tượng là khâu tiền xử lý quan trọng trong xử lý ảnh. 
 Khi sử dụng các thiết bị để thu nhận hình ảnh người ta đã phát hiện ra yếu 
tố sai lệch ở kết quả của hình ảnh thu được và để khắc phục điều này người ta 
đã tìm cách sửa chữa, nắn chỉnh nhằm có được kết quả tốt hơn. Như vậy nắn 
chỉnh biến dạng ban đầu chỉ đơn thuần mang mục đích khắc phục các nhược 
điểm của ảnh do thiết bị thu nhận gây ra. Sau đó nhờ chính những kết quả từ 
khâu nắn chỉnh đã đem lại những hướng phát triển mới quan trọng trong nhận 
dạng và đối sánh. Chẳng hạn nhận dạng tội phạm tự động trong ngành công an 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
2 
thay vì phải cầm ảnh của họ để đối chiếu với hàng trăm đối tượng đáng nghi 
khác có trong máy tính, hoặc xác định độ trùng khớp của một đối tượng với tập 
đối tượng cho trước trong khảo cổ học để nghiên cứu quá trình tiến hóa của sự 
vật, hiện tượng v.v.. Ngày nay, người ta còn dùng nắn chỉnh biến dạng để “cố 
tình” tạo ra các hình dạng theo ý muốn chủ quan. Điển hình là các nhà làm 
phim, họ tạo ra các thước phim miêu tả sự thay đổi của một đối tượng theo thời 
gian, hoặc quá trình biến đổi từ đối tượng này đến đối tượng khác v.v.. nhờ các 
kỹ thuật nắn chỉnh biến dạng với chất lượng không thua kém gì các thước phim 
sử dụng thiết bị thu nhận. Việc nghiên cứu các kỹ thuật nắn chỉnh biến dạng 
hình học là một việc làm không chỉ có ý nghĩa khoa học và còn mang đậm tính 
thực tiễn nhất là trong hoàn cảnh Việt Nam chưa có nhiều hệ thống xử lý ảnh 
trong khi thực tế đang đặt ra những yêu cầu đòi hỏi. 
 Với mong muốn tìm hiểu và nghiên cứu về chủ đề này em đã mạnh dạn 
lựa chọn đề tài: "Nắn chỉnh biến dạng hình học và ứng dụng". 
 Bố cục của luận văn bao gồm phần mở đầu, ba chương chính, phần kết 
luận, tài liệu tham khảo và phụ lục. Nội dung các chương được tổ chức như sau: 
 Chương 1: Khái quát về xử lý ảnh và nắn chỉnh biến dạng. Chương này trình 
bày một số khái niệm trong xử lý ảnh, các vấn đề cơ bản của xử lý ảnh. Trình bày 
khái niệm, cách phân loại và các ứng dụng cơ bản của nắn chỉnh biến dạng. 
 Chương 2: Một số kỹ thuật nắn chỉnh biến dạng hình học. Các kỹ thuật 
được trình bày dựa vào đặc trưng được xác định để phục vụ cho công việc nắn 
chỉnh. Đặc trưng đó có thể dựa trên phân vùng ảnh, trên cơ sở tập các điểm 
đặc trưng, dựa trên cơ sở vector, dựa trên kỹ thuật nắn chỉnh khung lưới, v.v.. 
 Chương 3: Ứng dụng nắn chỉnh biến dạng. Phần này trình bầy ứng dụng 
nắn chỉnh sách dựa trên các điểm đặc trưng. Kèm theo là một số kết quả. 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
3 
Chương 1 
KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NẮN CHỈNH BIẾN DẠNG 
1.1. Khái quát về xử lý ảnh 
 Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một 
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát 
triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc 
biệt là máy tính chuyên dụng riêng cho nó. 
 Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục 
năm nay. Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức 
cơ sở khác. Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ 
bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi 
Fourier, biến đổi Laplace, các bộ lọc hữu hạn…Thứ hai, các công cụ toán 
như Đại số tuyến tính, Xác suất, thống kê. Một số kiến thức cần thiết như Trí 
tuệ nhân tạo, Mạng nơ ron nhân tạo cũng được đề cập trong quá trình phân 
tích và nhận dạng ảnh. 
 Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: Nâng cao 
chất lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao 
chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ 
những năm 20 của thế kỉ XX. Vấn đề nâng cao chất lượng ảnh có liên quan 
tới phân bố mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh 
được phát triển vào khoảng những năm 50 của thế kỉ XX. Điều này có thể giải 
thích được, vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện 
cho quá trình xử lý ảnh số thuận lợi. Năm 1964, máy tính đã có khả năng xử 
lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao 
gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử 
lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
4 
pháp tri thức nhân tạo như mạng nơron nhân tạo, các thuật toán xử lý hiện đại 
và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều 
kết quả khả quan. 
1.2. Một số khái niệm cơ bản trong xử lý ảnh 
1.2.1. Ảnh số 
 Ảnh số được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất 
nhỏ - được coi là những thành tố của bức ảnh và thường được biết dưới tên 
gọi là pixels. 
1.2.2. Điểm ảnh 
 Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. 
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong 
quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông 
qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần 
giá trị mà về nguyên tắc bằng mắt thường không phân biệt được 2 điểm kề 
nhau. Trong quá trình này người ta sử dụng khái niệm điểm ảnh được gọi từ 
picture element. Như vậy, một ảnh là một tập hợp các pixel. 
 Điểm ảnh hay còn gọi là pixel (picture element, pels, image elements) 
được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian 
của đối tượng. 
 Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hoá nó 
thường được biểu diễn là ma trận 2 chiều a[i][j] mà mỗi phần tử có một giá trị 
nguyên hoặc là một véc tơ cấu trúc màu. 
1.2.3. Mức xám (gray level) 
 Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi 
điểm ảnh với một giá trị số - kết quả của quá trình lượng hoá. 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
5 
 Cách mã hoá thường dùng là 16, 32 hay 64 mức. Mã hoá 256 mức là phổ 
biến nhất do lý do kỹ thuật. Vì, 28=256 (0,…,255) nên với 256 mức, mỗi 
pixel sẽ được mã hoá bởi 8 bit. 
1.2.4. Xử lý ảnh số là gì và tại sao chúng ta cần phải xử lý ảnh số 
 Trong các dạng truyền thông cơ bản: lời nói, văn bản, hình ảnh, âm 
thanh thì hình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất. 
 Bằng thị giác, con người có thể nhận biết và hiểu về thế giới xung 
quanh chúng ta. Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong 
dự báo thời tiết… 
 Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận 
biết thông qua thị giác. 
 Việc trang bị cho máy tính có khả năng thị giác như con người không 
phải là việc dễ dàng. Chúng ta đang sống trong một không gian 3D, khi máy 
tính cố gắng phân tích đối tượng trong không gian 3D thì những bộ cảm biến 
có sẵn (camera) lại thường cho ảnh 2D. Như vậy, việc mất mát thông tin của 
hình ảnh sẽ xảy ra. Với những cảnh động thì sự di chuyển của đối tượng hay 
sự di chuyển của camera, tất cả những việc đó làm cho việc mất mát và sai 
lệch thông tin rất lớn. 
 Ngày nay, cùng với sự phát triển của ngành CNTT, chúng ta mong muốn 
đưa được những hình ảnh mà con người có thể nhìn thấy được vào máy tính 
để thực hiện các mục đích khác nhau như: phân tích ảnh, phục hồi ảnh... 
 Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã hoá và 
biểu diễn dưới dạng số gọi là ảnh số. Việc xử lý ảnh trên máy tính nhằm mục 
đích phân tích ảnh và phục hồi các thông tin bị sai lệch của ảnh trong quá 
trình thu nhận. 
 Như vậy, xử lý ảnh số là thực hiện các phép xử lý đối với ảnh số trên 
máy tính. Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
6 
bản hiệu quả của thị lực con người, giúp chúng ta nhận biết tốt hơn về thế giới 
xung quanh. 
1.3. Các vấn đề chung liên quan đến xử lý ảnh số 
 Người ta chia xử lý ảnh thành 2 mức: Xử lý ảnh mức thấp và xử lý ảnh 
mức cao (thị giác máy). 
 Phương pháp xử lý ảnh mức thấp thường sử dụng rất ít kiến thức 
(knowledge) về nội dung hay ngữ nghĩa ảnh. 
 Xử lý ảnh mức cao dựa trên kiến thức, mục tiêu và kế hoạch trong việc 
làm thế nào để hoàn thành những mục tiêu đó. Thị giác máy ở mức cao luôn 
cố gắng mô phỏng nhận thức của con người và có thể đưa ra những quyết 
định dựa vào những thông tin đã biết về ảnh. 
 Xử lý ảnh mức thấp và thị giác máy ở mức cao khác nhau trong việc sử 
dụng dữ liệu ảnh. Dữ liệu ảnh mức thấp bao gồm các ảnh gốc được biểu diễn 
dưới dạng ma trận ảnh, các phần tử của ma trận biểu diễn giá trị độ sáng của 
điểm ảnh. Trong khi đó dữ liệu ảnh mức cao khởi đầu từ những ảnh tốt, 
nhưng chỉ những dữ liệu có liên quan đến các mục đích ở mức cao mới được 
đưa ra, việc giảm số lượng dữ liệu là đáng kể. Dữ liệu ở mức cao diễn tả các 
thông tin về nội dung ảnh. 
1.3.1. Xử lý ảnh mức thấp 
 Các kỹ thuật xử lý ảnh mức thấp được thực hiện với việc thao tác trên 
các ảnh số. Các phương pháp xử lý ảnh mức thấp được đưa ra vào những năm 
1970 của thế kỉ XX. Gần đây, các nhà nghiên cứu đang cố gắng tìm ra những 
giải thuật có hiệu quả hơn và thực hiện các giải thuật đó trên nhiều thiết bị 
tinh vi mang tính kỹ thuật cao. Ví dụ, các máy tương tự (Parallel machines) 
đang được sử dụng giúp cho việc tính toán một khối lượng phép tính khổng lồ 
của quá trình hoạt động trên tập hợp dữ liệu ảnh trở nên dễ dàng hơn. 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
7 
 Một vấn đề phức tạp và chưa giải quyết được là thứ tự các bước trong 
xử lý ảnh mức thấp như thế nào để giải quyết công việc được cụ thể và mục 
tiêu tự động hoá vấn đề đó vẫn chưa được thực hiện. Những năm 1980 của 
thế kỉ XX, nhiều đề án tập trung cho vấn đề này sử dụng các hệ thống 
chuyên gia (expert systems), nhưng các hệ thống chuyên gia vẫn không giải 
quyết được vấn đề của chính họ. 
 Trình tự các bước xử lý như sau đã được công nhận và phổ biến: 
 (1) Thu nhận ảnh: Một ảnh được thu vào bởi một bộ cảm biến (như TV 
camera), từ vệ tinh qua các bộ cảm ứng (sensor) hay ảnh, tranh được quét trên 
scanner. Ảnh có thể được thu nhận từ nhiều thiết bị và bằng nhiều cách. Sau 
đó ảnh được số hoá để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy 
mẫu) và số hoá bằng lượng hoá. 
 (2) Quá trình xử lý: Là quá trình xây dựng lại ảnh, phục hồi ảnh, khử 
nhiễu và tăng cường ảnh. 
 (3) Mã hoá và nén ảnh: Là bước quan trọng trong việc truyền ảnh. 
 (4) Phân đoạn ảnh: Máy tính cố gắng tách các đối tượng ảnh riêng biệt ra 
khỏi ảnh nền. 
 Mô tả và phân loại đối tượng trong một tổng thể ảnh đã được phân đoạn 
cũng được hiểu là một phần của quá trình xử lý ảnh mức thấp. 
1.3.2. Những khó khăn khi xử lý ảnh số 
a. Sự hiểu biết về hệ thống thị giác của con người còn hạn chế 
 Chúng ta không có một sự hiểu biết rõ về vấn đề khi con người quan sát, 
xử lý và lưu trữ thông tin trực quan như thế nào. Chúng ta thậm trí không biết 
con người đo chất lượng ảnh trực quan và phân loại ảnh như thế nào. Với 
cùng một bức ảnh thì sự quan sát ở mỗi người là khác nhau. 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
8 
 Sự chú ý của bạn đến các vùng hay các đường viền khác nhau cũng có 
xu hướng làm thay đổi cảm nhận của bạn về bức ảnh. 
 Thậm chí một ảnh được nhìn với một con mắt không thay đổi thì sự cảm 
nhận về bức ảnh đó của con người vẫn thay đổi cho dù là rất ít. Các nhà 
nghiên cứu đã làm ổn định hình ảnh trực tiếp trên võng mạc để loại trừ bất kỳ 
một hiệu ứng nào xuất hiện từ sự di chuyển của mắt. Và ngay cả trong những 
điều kiện đó, giác quan của con người cũng vẫn có thể thay đổi. 
b. Sự diễn tả về bản chất của ảnh không thể hiểu được ngay lập tức 
 Ảnh tương tự được biểu diễn bằng một hàm 2 biến. Sau khi số hoá, ảnh 
được biểu diễn dưới dạng ma trận ảnh 2 chiều và được gọi là ảnh số. Máy tính 
có thể hiểu và xử lý ảnh số nhưng sự biểu diễn đó không thích hợp cho máy 
móc có thể hiểu được. Những kiến thức về ảnh và những thông tin được rút 
ra từ ảnh là cần thiết trong việc cố gắng để hiểu được những mảng số đó. 
Ví dụ: 
 Đọc và hiển thị ảnh như một hàm 2 chiều (dùng matlab script) 
 Hiển thị ảnh dưới dạng ma trận ảnh (dùng matlab) 
 Hiển thị ảnh với các chương trình hiển thị ảnh (ACDsee trên hệ thống Windows) 
 Cả hai sự biểu diễn hình ảnh đều chứa những thông tin chính xác như 
nhau, nhưng khi quan sát hình ảnh dưới 2 dạng biểu diễn đó thì rất khó để có 
thể tìm ra sự tương đồng. 
1.4. Ứng dụng của hệ thống xử lý ảnh 
 - Văn phòng: hệ thống nhận dạng chữ, nhận dạng tiếng Anh, tiếng Việt 
nhận dạng được cả chữ, ảnh, bảng: 
 - Nhận dạng chữ OCR (Optical charater Recognition), 
 - Nhận dạng nhãn OMR (Optical Mark Recognition) 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
9 
 - Nhận dạng tiếng Anh 
 - Nhận dạng tiếng việt 
 - Kiểm tra sản phẩm 
 - So sánh mầu của sản phẩm mẫu với sản phẩm mới 
 - Kiểm tra độ tròn của chai/lọ 
 - Nhận dạng công nghiệp, y học, thương mại, điều tra khoáng sản 
 - Địa lý: véc tơ hoá bản đồ. 
 - Các phần mềm chuyển đổi ảnh Raster sang 
ảnh vector: MapScan của Viện CNTT, 
TrixSystem R2V và V2R. 
 - Hoạt hình: biến đổi hình học, bóp méo 
hình học. 
 - Quân sự. 
 - Dự báo thời tiết, cháy rừng, lũ lụt, sâu 
bệnh, khoáng sản. 
 - Thiên văn học, vật lý, sinh học. 
 - An ninh: 
 + Nhận dạng vân tay, Water Marking. 
 + Nhận dạng khuôn mặt người, Nhận dạng tội phạm. 
 + Dấu thông tin trong ảnh. 
 + Chống bạo lực: dùng camera để phát hiện ra sự an toàn ở nơi 
công cộng, Siêu thị… 
 - Bar code: nhận dạng mã vạch. 
 - Các robot tự động phục vụ. 
 - Thư viện: Dùng camera để điều khiển robot. 
Hình 1.1 Mô phỏng quá 
trình biến đổi hình học 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
10 
 Ngoài ra có ứng dụng trong y học làm nổi các ảnh, trong thiên văn học 
để khôi phục lại ảnh do tác động của khí quyển hay nén ảnh trong truyền đi xa 
hoặc lưu trữ. 
1.5. Quá trình xử lý ảnh số 
a. Phần thu nhận ảnh (Image Acquisition) 
 Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua 
camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 
25 dòng), cũng có loại camera đã số hoá (như loại CCD - Change Coupled 
Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường 
dùng là loại quét dòng; ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu 
nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh). 
b. Tiền xử lý (Image Processing) 
 Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào 
bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc 
nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn. 
c. Phân đoạn (Segmentation) hay phân vùng ảnh 
 Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để 
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) 
trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về 
địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt 
để nhận dạng. 
 Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, 
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào 
công đoạn này. 
 Nếu thực hiện tách quá chi tiết thì bài toán nhận dạng các thành phần được 
tách ra trở nên phức tạp, còn ngược lại nếu quá trình phân đoạn được thực hiện 
quá thô hoặc phân đoạn sai thì kết quả nhận được cuối cùng sẽ không chính xác. 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
11 
d. Biểu diễn ảnh (Image Representation) 
 Biểu diễn ảnh là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh. Các vật 
thể sau khi phân đoạn có thể được mô tả dưới dạng chuỗi các điểm ảnh tạo nên 
ranh giới một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó. 
Phương pháp mô tả thông qua ranh giới vùng thường được sử dụng khi cần tập 
trung sự chú ý vào hình dạng bên ngoài của chi tiết ảnh như độ cong, các góc 
cạnh v.v. Biểu diễn vùng thường được sử dụng khi chúng ta quan tâm tới đặc 
tính bên trong của vùng ảnh như đường vân (texture) hay hình dạng (skeletal). 
 Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân 
đoạn) cộng với mã liên kết với các vùng lân cận. Việc biến đổi các số liệu này 
thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn 
các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) 
gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng 
hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm 
vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta 
miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác. 
e. Nhận dạng và nắn chỉnh bằng nội suy ảnh 
 Nhận dạng là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô tả 
vật thể đó (ví dụ các phương tiện giao thông có trong ảnh). Nhận dạng ảnh 
còn là quá trình xác định ảnh, quá trình này thường thu được bằng cách so 
sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nắn chỉnh bằng nội suy 
là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét 
gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có 
nhiều cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các 
mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản: 
 - Nhận dạng theo tham số. 
 - Nhận dạng theo cấu trúc. 
 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  
12 
 Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng 
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký 
điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, 
nhận dạng mặt người… 
f. Cơ sở tri thức (Knowledge Base) 
 Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ