Mục tiêu chính của mã hoá ảnh là làm sao trìng bầy ảnh với số bít càng nhỏ càng tốt trong khi vẫn giữ được mức chất lượng và độ dễ hiểu ở mức chất lượng vừa đủ với một ứng dụng đã cho. Có hai lĩnh vực ứng dụng:
Một là giảm bề rộng băng tần cần thiết cho hệ truyền ảnh. Ví dụ truyền hình số, hội nghị video, fax –ứng dụng thứ hai là giảm bớt yêu cầu về lưu trữ.
88 trang |
Chia sẻ: vietpd | Lượt xem: 1615 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Mã hóa ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
chương 4: mã hoá ảnh
167
Chương 4
Mã HOá ảNH
Mở đầu.
Mục tiêu chính của mã hoá ảnh là làm sao trìng bầy ảnh với số bít càng nhỏ càng
tốt trong khi vẫn giữ được mức chất lượng và độ dễ hiểu ở mức chất lượng vừa đủ với
một ứng dụng đã cho. Có hai lĩnh vực ứng dụng:
Một là giảm bề rộng băng tần cần thiết cho hệ truyền ảnh. Ví dụ truyền hình số,
hội nghị video, fax –ứng dụng thứ hai là giảm bớt yêu cầu về lưu trữ. Ví dụ giảm lưu trữ
số liệu ảnh trong các chương trình vũ trụ và số liệu video trong máy ghi hình số. Tuỳ
theo tính chất của ứng dụng, mức độ chất lượng ảnh và độ dễ hiểu có thể biến đổi trong
một phạm vi rộng. Trong lưu trữ ảnh của chương trình vũ trụ hay lưu trữ ảnh lịch sử
(không thể có lại được) phải lưu trữ lại toàn bộ tư liệu số của nguyên bản để sử dụng về
sau.
Những kỹ thuật không làm mất tí thông tin nào và cho phép phục hồi chính xác tư
liệu số ban đầu, gọi là kỹ thuật có tính bảo tồn thông tin. Trong truyền hình số thì bộ mã
hoá không cần phải là loại bảo tồn thông tin như vậy. ở đây chất lượng cao là quan
trọng, nhưng có thể bỏ qua một số thông tin từ tư liệu gốc, trong phạm vi mà tín hiệu
giải mã ra và hiện lên màn hình vẫn vừa mắt người xem. Trong ứng dụng về điều khiển
con tàu từ xa, độ dễ hiểu của ảnh là quan trọng nhất, nhưng có thể hi sinh một phần chất
lượng. Càng giảm yêu cầu về chất lượng và độ dễ hiểu, thì tốc độ bit càng hạ.
Mã hoá ảnh liên quan đến cải thiện ảnh và phục chế ảnh. nếu ta có thể cải thiện
cảm quan thị giác của ảnh được lập lại hay nếu ta có thể giảm sự xuống cấp do algorit
mã hoá hình gây ra (ví dụ như tạp âm lượng tử hoá ) thì ta có thể giảm bớt số lượng bit
cần thiết để biểu diễn một ảnh ở mức độ chất lượng và độ dễ hiểu đã cho, hay có thể giữ
nguyên số bit mà cải thiện chất lượng và độ dễ hiểu .
Môi trường điển hình về mã hoá ảnh như trên hình 4.1. ảnh digital được mã
hoá ảnh mã hoá. Bộ mã hoá này gọi là bộ mã hoá nguồn. Đầu ra bộ mã hoá này là một
chuỗi bit gọi là ảnh gốc.
chương 4: mã hoá ảnh
168
Bộ mã hoá kênh biến chuỗi bit này ra một dạng thích hợp cho việc truyền qua
một kênh thông tin, thông qua một dạng điều chế nào đó. Tín hiệu đã điều chế được
truyền qua kênh thông tin. Kênh thông tin sẽ đưa vào một ít nhiễu và trong bộ mã hoá
kênh phải trữ liệu một biện pháp sửa lỗi để khắc phục tạp âm kênh này. ở đầu thu, tín
hiệu nhận được qua giải điều chế và hoàn nguyên thành chuỗi bit nhờ bộ giải mã kênh.
Bộ giải mã ảnh đem chuỗi bít hoàn nguyên thành ảnh cho hiện lên màn hình và in ra.
Khác với môi trường truyền tin ở hình 4.1, trong những ứng dụng mã hoá ảnh để giảm
lưu trữ, không có kênh thông tin . ở đây chuỗi bit ở đầu ra bộ mã hoá ảnh được lưu trữ
vào môi trường lưu trữ chờ sau lấy ra dùng.
Bộ mã hoá ảnh ở hình 4.1 có ba phần tử cơ bản (Hình 4.2).
Hình 4.2. Ba thành phần chính trong mã hoá ảnh.
Phần tử đầu tiên và quan trọng nhất làm biến đ ổi ảnh vào một không gian (miền)
thích hợp nhất cho việc lượng tử hoá và gán từ mã. Về thực chất phần tử này quyết định
xem cái gì phải đem mã hoá. Algorit mã hoá ảnh chia làm ba loại chính, tuỳ theo đặc
trưng nào của ảnh được mã hoá. Loại thứ nhất gọi là bộ mã hoá dạng sóng, cường độ ảnh
Bộ mã hoá
ảnh
Bộ mã hoá
kênh
Bộ giải mã
ảnh
Bộ giải mã
kênh
Kênh truyền
ảnh phục
hồi
ảnh gốc
Hình 4.1. Môi trường điển hình về mã hoá ảnh.
ảnh gốc Biến đổi Lượng tử hóa Gán từ mã Chuỗi bit
chương 4: mã hoá ảnh
169
hay một biến thiên của cường độ ảnh, ví dụ cường độ của hai pixel kề nhau, được mã
hoá. Loại thứ hai, gọi là bộ mã hoá hệ số biến đổi (hay hàm biến đổi) , ảnh được biến
đổi sang không gian khác, chẳng hạn biến đổi Fourier hoặc biến đổi Cosin, như vậy là
sang một miền (domain) khác với miền cường độ, và các hệ số biến đổi được mã hoá.
Loại thứ ba gọi là bộ mã hoá mô hình (model) tín hiệu, người ta mô hình hoá ảnh hoặc
một mảnh nào đó của ảnh và các thông số của mô hình được mã hoá. Sau đó ảnh được
tổng hợp từ các thông số mô hình đã mã hoá. Phần tử thứ hai là để lượng tử hoá. Để biểu
diễn một ảnh với một số bít hữu hạn, thì cường độ ảnh, hệ số biến đổi hay thông số mô
hình phải được lượng tử hoá. Việc lượng tử hoá bao gồm vi ệc gán mức lượng tử và các
biên quyết định. Phần tử thứ ba để gán từ mã tức là chuỗi bít biểu diễn các mức lượng tử.
Mỗi phần tử đều nhằm để khai thác sự dư thừa trong ảnh gốc và những giới hạn
của thiết bị hiện hình cũng như của hệ thị giác con người .
Vì vậy ba phần tử liên quan chặt chẽ với nhau. Chẳng hạn nếu phần tử biến đổi
trong bộ mã hoá làm cho các số liệu giảm sự tương quan đủ mức thì ưu thế của lượng tử
hóa vectơ so với lượng tử hoá vô hướng giảm đi. Nếu các mức lượng tử trong bộ lượng
tử hoá được chọn sao cho mỗi mức được sử dụng với xác suất như nhau thì ưu thế của từ
mã có độ dài biến đổi so với từ mã có độ dài cố định giảm đi.
1. Lượng tử hoá.
1.1. Lượng tử hoá vô hướng.
Gọi f là một lượng vô hướng liên tục, có thể đại biểu cường độ một pixel hoặc
một hệ số biến đổi hay một thông số của mô hình ảnh. Để biểu diễn f bằng một số lượng
bit hữu hạn, ta chỉ dùng một số lượng hữu hạn mức lượng tử. Giả sử có L mức được dùng
để biễu f. Quá trình gán một giá trị f cho một trong L mức g ọi là lượng tử hoá biên độ
hay gọi tắt là lượng tử hoá. Nếu mỗi đại lượng vô hướng được lượng tử hoá một cách độc
lập thì quá trình gọi là lượng tử hoá vô hướng. Nếu hai hoặc trên hai đại lượng vô hướng
kết hợp cùng lượng tử hoá thì quá trình gọi là lượng tử hoá vectơ hay lượng tử hoá khối.
Gọi fˆ là f đã được lượng tử hoá.
irfQf ˆ ; ii dfd 1 (4.1)
Q=thuật toán lượng tử hoá.
chương 4: mã hoá ảnh
170
ri = với 1 i L là L mức lượng tử.
di = với 0 i L là L mức quyết định hay L bờ quyết định.
Theo (4.1) thì nếu f rơi vào giữa d i-1 và di thì nó được ánh xạ vào mức lượng tử r i .
Nếu ta đã xác định các mức quyết định và mức lượng tử thì quá trình lượng tử
hoá f là một quá trình xác định. Cũng có thể biểu diễn :
Q
effQf ˆ (4.2)
Trong đó eQ là sai số lượng tử tính theo :
ffe
Q
ˆ (4.3)
Sai số lượng tử hoá eQ còn gọi là tạp âm lượng tử . Đại lượng e Q2 coi như trường
hợp đặc biệt của độ đo độ méo ffd ˆ, là một độ đo khoảng cách giữa f và fˆ . Những ví
dụ khác của ffd ˆ, bao gồm ˆ ff và pp ff ˆ .
Các mức lượng tử và mức quyết định thường được xác định bằng cách tối thiểu
hoá một tiêu chuẩn sai số nào đó dựa trên ffd ˆ, chẳng hạn như độ méo trung bình D :
00
0
0
ˆ
,
ˆ
, dffp
f
ffdffdED f
(4.4)
Phương pháp lượng tử hoá chân phương nhất là lượng tử hoá đều trong đó các
mức lượng tử (và mức quyết định) cách đều nhau.
Li1
1
ii dd (4.5a)
Li1
2
1 i
i
dd
r
i (4.5b)
là kích thước bước nhảy bằng khoảng c ách giữa hai mức lượng tử kề nhau hay hai mức
quyết định kề nhau. Ví dụ về lượng tử hoá đều với L=4 và f giả thiết gồm giữa 0 và 1
được trình bày ở hình 4.3. Tạp âm lượng tử e Q thường phụ thuộc tín hiệu. Chẳng hạn tạp
âm lượng tử eQ của bộ lượng tử hoá đều (trong hình 4.3) được biểu diễn ở hình 4.4. Từ
hình này thấy rằng eQ là hàm của f và do đó nó phụ thuộc tín hiệu. Có thể làm cho tạp
âm lượng tử eQ trong bộ lượng tử hoá đều trở thành không tương quan bằng cách dùng kỹ
chương 4: mã hoá ảnh
171
thuật giả tạp âm của Robert . Như sẽ thấy trong tiết 3 phép giải tương quan của nhiễu
lượng tử hoá sẽ hữu dụng trong việc cải thiện chất lượng hệ mã hoá ảnh. Nó làm thay đổi
đặc tính của sự xuống cấp ảnh mã hoá. Ngoài ra có thể làm giảm tạp âm lượng tử đã giải
tương quan bằng cách dùng algori t phục hồi ảnh như chương 3.
Hình 4.3 : Ví dụ về bộ lượng tử hoá đều. Số mức lượng tử là 4, f nằm giữa 0 và 1, fˆ là f
đã lượng tử hoá. Các mức lượng tử và bờ quyết định được ký hiệu là r i và di.
Tuy lượng tử hoá đều là cách tiếp cận tự nhiên nhất, nhưng nó không phải là tối
ưu. Giả sử f tập trung ở một vùng nào đó nhiều hơn ở các vùng khác. Như vậy gán nhiều
mức lượng tử cho vùng đó nhiều hơn các vùng khác là hợp lý. Ta xem lại ví dụ ở hình
4.3. Nếu f ít khi rơi vào giữa d0 và d1 thì mức lượng tử r1 ít dược sử dụng. Sắp xếp các
mức lượng tử r1, r2, r3, và r4 sao cho chúng đều nằm giữa d 1 và d4 sẽ có ý nghĩa hơn.
Lượng tử hoá mà các mức lượng tử và mức quyết định không cách đều gọi là lượng tử
hoá không đều. Việc xác định tối ưu ri và di phụ thuộc vào tiêu chuẩn sai sốđược sử
dụng. Tiêu chuẩn thường dùng nhất là sai số quân phương tối thiểu MMSE*_ giả thiết f
là một biến ngẫu nhiên có hàm mật độ xác suất là p f(f0). Dùng tiêu chuẩn MMSE ta xác
định rk và dk bằng cách tối thiểu hoá độ méo trung bình D, với :
48
7
r
28
3
r
38
5
r
18
1
r
Bộ lượng tử hoá đềuf fˆ
fˆ
f
00d 14
1
d 22
1
d 34
3
d 41 d
chương 4: mã hoá ảnh
172
0
2
00
22
ˆ
0
ˆˆ
dffp
ffEeEffdED
ff
f
f
Q
(4.6)
Lưu ý rằng fˆ là một trong L mức lượng tử tính theo (4.1), ta có thể đem (4.6)
viết ra :
0
2
0
1
0
10
dffrfpD
i
L
i
d
df
f
i
i
(4.7)
Để tìm cực tiểu D :
L
k
d
d
LD
r
D
0
k
1k10
d
Lk10
(4.8)
Từ (4.7) và (4.8) :
Lk
dffp
dffpf
r
k
k
k
k
d
d
o
f
f
d
df
f
k
1,
1
1
00
000
0 (4.9a)
11,
2
1 Lkrrd kk (4.9b)
0d (4.9c)
Ld (4.9d)
chương 4: mã hoá ảnh
173
Phương trình đầu trong (4.9) nói lên rằng mức lượng tử r k là tâm quay (centroid)
của pf(f0) trong khoảng dk-1 f dk .
Những phương trình còn lại nói lên rằng mứ c quyết định dk (trừ d0 và dL) là điểm
chính giữa hai mức lượng tử r k và rk+1 . Phương trình (4.9) là bộ phương trình cần cho lời
giải tối ưu. Với một số hàm mật độ xác suất, trong đó có các mật độ : đều, Gauss, và
Laplace, thì (4.9) cũng là bộ phương trình đủ.
Giải (4.9) là một bài toán phi tuyến. Bài toán phi tuyến đã được giải cho một số
hàm mật độ xác suất. Các lời giải khi p f(f0) là : đều, Gauss, Laplace, như trên bảng 1.
Bộ lượng tử hoá dựa trên tiêu chuẩn MMSE được gọi là bộ lượng tử hoá
Lloyd_Max.
Theo bảng 1, bộ lượng tử hoá đều là bộ lượng tử hoá MMSE tối ưu khi p f(f0) là
hàm mật độ xác suất đều.
Với những mật độ xác suất khác, lời giải tối ưu là một bộ lượng tử hoá không
đều. Hình 4.5 biểu diễn các mức lượng tử và mức quyết định tối ưu ứng với hàm mật độ
xác suất Gauss có phương sai là 1 và L=4.
Cần đánh giá mức độ cải thiện mà bộ lượng tử hoá MMSE tối ưu đem lại so với
bộ lượng tử hoá đều. Chẳng hạn xét một hàm độ xác suất Gauss có giá trị trung bình là 0
và phương sai là 1.
Hình 4.4 : Minh hoạ về sự phụ thuộc của tạp âm lượng tử vào tín hiệu.
Hình 4.6 biểu diễn méo trung bình D theo hàm của số mức lượng tử, đường liền
nét ứng với bộ lượng tử hoá MMSE tối ưu, đường vẽ chấm ứng với bộ lượng tử hoá đều,
trong đó các mức lượng tử r i được chọn đối xứng đối với gốc toạ độ, các mức quyết định
cực tiểu và cực đại giả thiết là - và , bước lượng tử được chọn để độ méo trung bình
D là cực tiểu.
ffˆeQ
1/8
1/8
f
13/41/21/4
chương 4: mã hoá ảnh
174
Bảng 4.1 . Vị trí của các mức lượng tử và quyết định đối với bộ lượng tử hoá
Lloyd_Max. Với hàm mật độ xá c suất đều, giả thiết p f(f0) đều giữa –1 và 1. Với hàm mật
độ xác suất Gauss giả thiết trung vị bằng 0 và phương sai bằng 1. Với hàm mật độ xác
suất Laplace
pf(f0)=
0
2
2
2
f
e
với = 1
Đều Gauss Laplace
Bit ri d i ri d i ri d i
1
2
3
4
-0.5000 -1.0000
0.5000 0.0000
1.0000
-0.7500 -1.0000
-0.2500 -0.5000
0.2500 0.0000
0.7500 0.5000
1.0000
0.8750 -1.0000
-0.6250 -0.7500
-0.3750 -0.5000
-0.1250 -0.2500
0.1250 0.0000
0.3750 0.2500
0.6250 0.5000
0.8750 0.7500
1.0000
-0.9375 -1.0000
-0.8125 -0.8750
-0.6875 -0.7500
-0.5625 -0.6250
-0.4375 -0.5000
-0.3125 -0.3750
-0.1875 -0.2500
-0.0625 -0.1250
0.0625 0.0000
0.1875 0.1250
0.3125 0.2500
0.4375 0.3750
0.5625 0.5000
0.6875 0.6250
0.8125 0.7500
0.9375 0.8750
1.0000
-0.7979 -
0.7979 0.0000
-1.5104 -
-0.4528 -0.9816
0.4528 0.0000
1.5104 0.9816
-2.1519 -
-1.3439 -1.7479
-0.7560 -1.0500
-0.2451 -0.5005
0.2451 0.0000
0.7560 0.5005
1.3439 1.0500
2.1519 1.7479
-2.7326 -
-2.0690 -2.4008
-1.6180 -1.8435
-1.2562 -1.4371
-0.9423 -1.0993
-0.6568 -0.7995
-0.3880 -0.5224
-0.1284 -0.2582
0.1284 0.0000
0.3880 0.2582
0.6568 0.5224
0.9423 0.7995
1.2562 1.0993
1.6180 1.4371
2.0690 1.8435
2.7326 2.4008
-0.7071 -
0.7071 0.0000
-1.8304 -
-0.4198 -1.1269
0.4198 0.0000
1.8340 1.1269
-3.0867 -
-1.6725 -2.3796
-0.8330 -1.2527
-0.2334 -0.5332
0.2334 0.0000
0.8330 0.5332
1.6725 1.2527
3.0867 2.3769
-4.4311 -
-3.0169 3.7240
-2.1773 -2.5971
-1.5778 -1.8776
-1.1110 -1.3444
-0.7287 -0.9198
-0.4048 -0.5667
-0.1240 -0.2664
0.1240 0.0000
0.4048 0.2644
0.7287 0.5667
1.1110 0.9198
1.5778 1.3444
2.1773 1.8776
3.0169 2.5971
4.4311 3.7240
chương 4: mã hoá ảnh
175
Hình 4.5. Ví dụ về bộ lượng tử hoá Lloyd_Max. Số mức lượng tử là 4, hàm mật
độ xác suất là Gauss với trung vị bằng 0 và phương sai bằng 1.
Hình 4.6. So sánh độ méo trung bình D =E[( fˆ -f)2] theo hàm của số mức lượng tử L
trong 2 trường hợp :
Đường liền nét : bộ lượng tử hoá Lloyd_Max (khi hàm mật độ xác suất là
Gauss, trung vị bằng 0 và phương sai bằng 1).
Đường vẽ chấm : bộ lượng tử hoá đều. Trục tung tính theo 10 log 10D.
Bộ
lượng tử hoá
không đều
1.5104
0.9816-0.9816
0.4528
-0.4528
-1.5104
f
f fˆ
fˆ
10
lo
g 10
D
Lượng tử
hoá đều
Lượng tử hoá
Lloyd_Max
2 4 8 16 32 64 128 L
(1bit) (2bit) (3bit) (4bit) (5bit) (6bit) (7bit)
0
-10
-20
-30
-40
chương 4: mã hoá ảnh
176
Trên hình 4.6 nếu dùng từ mã có độ dài đều để biểu diễn các mức lượng tử t hì sự
tiết kiệm bit là 0 ~ 1/2 bit khi L trong khoảng 2 (1 bit) và 128 (7 bit). Trong ví dụ này
giả thiết hàm mật độ xác suất p f(f0) là Gauss. Có thể tiến hành phân tích tương tự với các
hàm mật độ xác suất khác, hàm mật độ xác suất càng khác xa hàm phân b ố đều thì ưu
thế của lượng tử hoá không đều so với lượng tử hoá đều càng lớn. Quan niệm : “ bộ lượng
tử hoá đều là tối ưu khi hàm mật độ xác suất phân bố đều ” lại gợi ý cho ta một cách tiếp
cận khác. Đó là, ta có thể ánh xạ f vào g bằng một phép phi tuyến s ao cho pg(g0) là đều,
ta đem lượng tử hoá g bằng một bộ lượng tử hoá đều, sau đó lại thực hiện phép ánh xạ
ngược. Phương pháp này được minh hoạ trên hình 4.7.
Hình 4.7. Lượng tử hoá không đều bằng phép nén -dãn.
Phép phi tuyến này được gọi là phép nén -dãn (companding). Theo lý thuyết xác
suất, một lựa chọn của phép phi tuyến (hay phép nén -dãn) C[] để tạo ra được pg(g0)
đồng đều là :
2
1
dxxpfCg
f
x
f (4.10)
pg(g0) nhận được đồng đều trong khoảng –1/2 g 1/2 .
Tuy (1.10) dễ giải hơn hệ phương trình phi tuyến (1.9), hệ ở hình 1.7 lại tối thiểu
hoá D’ :
2ˆ' ggED (4.11)
mà méo D’ ở (4.11) không giống D ở (4.6).
Trong tiết này ta đã xét việc lượng tử hoá một đại lượng vô hướng f. Trong mã
hoá ảnh, phải lượng tử hoá nhiều đại lượng vô hướng. Một cách tiếp cận là lượng tử hoá
từng cái độc lập _ Cách này gọi là lượng tử hoá vô hướng một nguồn vectơ. Giả sử có N
vô hướng fi với 1 i N và mỗi vô hướng được lượng tử hoá ra L i mức. Nếu Li được biểu
diễn bằng một luỹ thừa của 2 và nếu mỗi mức lượng tử được mã hoá với một số bit như
nhau (nghĩa là với từ mã có độ dài đều) thì quan hệ giữa L i với một số bit cần thiết B i là :
Phi tuyến Bộ lượng tử
hoá đều
Phi tuyến-1gˆgf fˆ
chương 4: mã hoá ảnh
177
iBL 2 (4.12a)
B i = log2Li (4.12b)
Tổng số bit B cần thiết để mã hoá N vô hướng là :
N
i
iBB
1
(4.13)
Từ (4.12) và (4.13) được tổng số mức lượng tử L :
B
N
i
iLL 2
1
(4.14)
Xét (4.13) và (4.14) nhận thấy tổng số bit B là tổng các B i còn tổng số mức lượng
tử L là tích các L i. Nếu có một số bit cố định B để mã hoá N vô hướng bằng phép lượng
tử hoá vô hướng nguồn vectơ thì phải phân phối B cho N vô hướng. Chiến lược tối ưu để
phân bổ bit phụ thuộc tiêu chuẩn sai số và hàm mật độ xác suất của các vô hướng. Chiến
lược tối ưu thường dùng là cho vô hướng có phương sai lớn nhiều bit, vô hướng có
phương sai bé ít bit. Ví dụ : giả sử cần tối thiểu hoá sai số quân phương
N
i
ii ffE
1
2ˆ đối với Bi (1 i N) trong đó ifˆ là kết quả lượng tử hoá fi. Nếu các vô
hướng có hàm mật độ xác suất giống nhau chỉ có phương sai khác nhau ta sẽ dùng một
phương pháp lượng tử hoá như nhau, chẳng hạn dùng bộ lượng tử hoá Lloyd_Max cho
từng vô hướng. Khi đó lời giải gần đúng về phân bổ bit là:
Ni
N
BB N
N
j
j
i
i
1log
2
1
/1
1
2
2
2
(4.15)
Trong đó i2 là phương sai của vô hướng fi . Từ (4.15) suy ra :
Li = N
N
j
j
iNBBi
/1
1
/22
1 i N (4.16)
Theo (4.16) số mức lượng tử cho fi tỉ lệ với i , là độ lệch chuẩn của fi . Tuy (4.15)
là một lời giải gần đúng với một số giả thiết nhất định, nó vẫn là căn cứ tham khảo trong
những bài toán phân bổ bit. B i trong (4.15) có thể âm và nói chung không phải là số
nguyên. Khi lượng tử hoá vô hướng B i phải là một số nguyên không âm. Đó là điều kiện
ràng buộc khi giải các bài toán phân bổ bit trong thực tế.
chương 4: mã hoá ảnh
178
1.2 . Lượng tử hoá vectơ.
Trong tiết trên, thảo luận về lượng tử hoá vô hướng một vô hướng và một nguồn
vectơ. Một cách tiếp cận khác để mã hoá nguồn vectơ là đem chia các vô hướng thành
những khối, xem mỗi khối như một đơn vị sau đó lượng tử đồng thời những vô hướng
này trong đơn vị đó. Như vậy gọi là lượng tử hoá vectơ hay lượng tử hoá khối .
Gọi f = [f1, f2,..., fN]T là một vectơ M chiều gồm N vô hướng fi có giá trị thực, biên
độ liên tục . Trong phép lượng tử hoá vectơ f được ánh xạ vào một vectơ M chiều khác r
= [r1, r2,..., rN]T. Khác với f mà các phần tử có biên độ liên tục, vectơ r được chọn từ L
mức lượng tử. Gọi fˆ là f đã được lượng tử hoá, ta biểu diễn nó bằng :
fˆ =VQ(f)=ri.fCi (4.17)
VQ là toán tử lượng tử hoá vectơ ri với 1 i N chỉ L mức lượng tử và C i được gọi là tế
bào thứ i . Nếu f nằm trong tế bào C i , thì f được ánh xạ vào ri. Hình 4.8 cho một ví dụ
lượng tử hoá vectơ khi N =2 và L = 9 . Các chấm trên hình là những mức lượng tử, và
các đường liền nét là đường biên tế bào .
Trong lượng tử hoá vectơ tế bào có thể có hình dạng, kích thước bất kỳ. Đó là
điều khác biệt với lượng tử hoá vô hướng, mà tế bào (miền g iữa 2 mức quyết dịnh kề
nhau) có thể có kích thước bất kỳ nhưng hình dạng cố định .
Hình 4.8 . Ví dụ lượng tử hoá vectơ. Số vô hướng trong mỗi vectơ là 2, số
mức lượng tử là 9.
f1
f2
chương 4: mã hoá ảnh
179
Phép lượng tử hoá vectơ khai thác sự mềm dẻo này. Cũng như trong trường hợp
vô hướng, ta định nghĩa độ méo ffd ˆ, là độ đo sự chênh lệch giữa f và fˆ .Một ví dụ
của ffd ˆ, là eQTeQ trong đó tạp âm lượng tử eQ định nghĩa theo :
ffVQffeQ ˆ (4.18)
Các mức lượng tử rI và bờ các tế bào C I xác định bằng cách lấy cực tiểu 1 tiêu
chuẩn sai số nào đó, chẳng hạn độ méo trung bình D :
ffdED ˆ, (4.19)
Nếu ffd ˆ, là eQTeQ thì từ (4.18) và (4.19) suy ra :
...
ˆˆ
..
ˆˆ
1 f
000
0000
0
L
i C
i
T
i
f
T
T
Q
T
Q
i
dffrfr
dffpffff
ffffEeeED
(4.20)
Độ méo trung bình ở (4.20) là sai số quân phương MSE và là dạng tổng quát của (4.7) .
Ưu điểm của eQTeQ so với lượng tử hoá vô hướng một nguồn vectơ là cải thiện
chất lượng. Lượng tử hoá vectơ cho phép giảm thấp độ méo trung bình D khi giữ số mức
lượng tử không đổi, hay cho giảm số mức lượng tử khi giữ độ méo trung bình D không
đổi. Lượng tử hoá vectơ cải thiện chất lượng so với lượng tử hoá vô hướng bằng nhiều
cách. Cách có ý nghĩa nhất là khai thác mối quan hệ thống kê giữa các vô hướng trong
cùng khối.
Để minh hoạviệc lượng tử hoá vectơ có thể khai thác mối quan hệ thống kê ta hãy
xét 2 ví dụ. Trong ví dụ thứ nhất ta khai thác mối quan hệ tuyến tính (tín