Video được cấu thành từmột tập liên tiếp các khung hình - frame, còn được gọi là ảnh, ghi nhận lại các hình ảnh quan sát được của các sự kiện xảy ra trong một khoảng thời gian. Có hai dạng tín hiệu video thông dụng là: tín hiệu tuần tự (analog) và tín hiệu video số (digital). Luận văn này sử dụng dữ liệu hình ảnh thu nhận từ Camera, nên chúng ta chỉ xem xét đến video được biểu diễn dưới dạng số và bỏ qua phần tín hiệu âm thanh của video.
25 trang |
Chia sẻ: vietpd | Lượt xem: 6183 | Lượt tải: 3
Bạn đang xem trước 20 trang tài liệu Bài toán nhận dạng đối tượng chuyển động trong video, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
- 4 -
Chương 2 - BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG CHUYỂN ĐỘNG
TRONG VIDEO
2.1 - Một số khái niệm
2.1.1 - Cấu trúc Video
Video được cấu thành từ một tập liên tiếp các khung hình - frame, còn được gọi là
ảnh, ghi nhận lại các hình ảnh quan sát được của các sự kiện xảy ra trong một
khoảng thời gian. Có hai dạng tín hiệu video thông dụng là: tín hiệu tuần tự (analog)
và tín hiệu video số (digital). Luận văn này sử dụng dữ liệu hình ảnh thu nhận từ
Camera, nên chúng ta chỉ xem xét đến video được biểu diễn dưới dạng số và bỏ qua
phần tín hiệu âm thanh của video.
Mô hình cấu trúc một chuỗi video bao gồm các thành phần sau (Hình 2 - 1):
• Frame - khung hình là thành phần cơ bản trong chuỗi video. Mỗi khung hình
tương ứng với một ảnh trong thế giới thực tại một thời điểm xác định.
• Shot là một dãy các khung hình liên tiếp được camera ghi nhận không có sự
ngắt quãng nào xảy ra. Shot là một đơn vị cơ bản để xây dựng phân tích nội
dung video.
• Các shot liên tiếp nhau được kết hợp lại thành một cảnh (scene) dựa trên nội
dung.
• Tất cả các scene tạo thành một chuỗi video.
- 5 -
Video
Scenes
Shots
Frame
Hình 2 - 1: Mô hình cấu trúc của Video [1]
2.1.2 - Key - frame
Key - frame là một đặc trưng tóm tắt được dùng để mô tả nội dung nổi bật, chính
yếu của một chuỗi Video, nó được xem như là một đại diện của một chuỗi những
khung hình liên tục trong một thời gian của Video. Các frame khác và key - frame
có sự khác nhau nhỏ hơn một ngưỡng cho trước. Việc truy xuất và chỉ mục hóa
Video thường rất hay sử dung key - frame vì nó có khả năng giảm được một lượng
dữ liệu lớn trùng lắp trong Video.
Có nhiều phương pháp xác định key - frame khác nhau, nhưng chúng tựu chung dựa
trên sự so sánh ảnh của từng cặp khung hình.
2.2 - Tổng quan về phương pháp phát hiện đối tượng chuyển động trong video
dựa vào phân đoạn ảnh
Có rất nhiều khái niệm khác nhau về phân đoạn video [2] [4] [5] [6] [7] [9] [10]
[11]. Tổng quát, phân đoạn video là một quá trình chia một chuỗi các khung hình
thành các vùng ngữ nghĩa sao cho mỗi vùng có thể được xem như một đối tượng
ngữ nghĩa độc lập.
- 6 -
frame 0 frame 7 frame 14 frame 21 frame 28
(a) Ảnh gốc
frame 0 frame 7 frame 14 frame 21 frame 28
(b) Kết quả phân đoạn
Hình 2 - 2: Minh họa kết quả phân đoạn video [1]
Có hai hình thức phân đoạn video: phân đoạn theo thời gian và phân đoạn theo
không gian. Mục đích của phân đoạn theo thời gian là để xác định các vùng trong
khung hình mà ở đó xảy ra sự di chuyển của các đối tượng. Phân đoạn theo không
gian mục đích là để chia khung hình thành các vùng ngữ nghĩa theo một tiêu chuẩn
cho trước. Một vài đặc trưng thông dụng được sử dụng để đưa ra các tiêu chuẩn
trong phân đoạn theo không gian như sự di chuyển, màu sắc, kết cấu, các tính chất
hình học... [4] [7] Các đặc trưng khác nhau và chuẩn đồng nhất khác nhau dẫn đến
kết quả khác nhau trên cùng một dữ liệu. Chẳng hạn, phân đoạn dựa trên màu, phân
đoạn dựa trên cấu trúc [7], phân đoạn dựa trên sự di chuyển thường có kết quả các
bản đồ phân đoạn khác nhau.
• Phân đoạn dựa trên màu sử dụng bản đồ màu hoặc các kĩ thuật phân tích đặc
trưng trong không gian màu để chia khung hình thành các vùng đồng nhất về
màu. Tiếp theo là quá trình trộn vùng dựa trên thông tin di chuyển từ sự ước
lượng di chuyển.
• Phân đoạn di chuyển (hay còn được gọi là phân đoạn dòng sáng) là phương
pháp phân đoạn bằng cách phân lớp các điểm ảnh trong mỗi khung hình
thành các nhóm sao cho các điểm ảnh thuộc cùng một nhóm sẽ có sự di
chuyển giống nhau. Những nhóm này có thể có hoặc không có ngữ nghĩa.
- 7 -
Sau đó, các nhóm này được trộn lại dựa trên thông tin di chuyển có được từ
thao tác ước lượng di chuyển.
• Ước lượng di chuyển (motion estimation) là quá trình xác định mức độ di
chuyển của các điểm ảnh trong khung hình.
• Phát hiện sự di chuyển (motion detection) là quá trình xác định các điểm ảnh
có sự di chuyển bề mặt. So với phân đoạn dựa trên sự di chuyển, phát hiện di
chuyển xác định các đường biên tốt hơn và chi phí tính toán thấp hơn.
• Phát hiện sự thay đổi (change dectection) là một công cụ phân đoạn theo thời
gian nhằm mục đích xác định các thay đổi trong một tập hay một chuỗi ảnh
tại hai thời điểm khác nhau. Phát hiện thay đổi sẽ phân chia mỗi khung hình
thành hai vùng: thay đổi và không thay đổi trong trường hợp camera đứng
yên hoặc vùng thay đổi toàn cục và vùng thay đổi cục bộ trong trường hợp
camera di chuyển. Trong trường hợp camera đứng yên thì vùng không đổi
được xem là khung hình nền, vùng thay đổi được xem là ảnh bề mặt và nó
chứa các đối tượng mà ta cần xác định. Trong trường hợp camera di chuyển
tạo ra sự di chuyển toàn cục, chúng ta phải ước lượng chính xác sự di chuyển
của camera. Sau khi ước lượng, ta áp dụng phương pháp phát hiện thay đổi
như trong trường hợp camera đứng yên.
• Kết hợp các phương pháp trên để thống kê được hình nền tĩnh của khung
cảnh. Từ đó sẽ dễ dàng nhận ra được các đối tượng chuyển động. Phương
pháp này dựa trên một ý tưởng đơn giản là một phân đoạn ảnh ở trong trạng
thái tĩnh trong một khoảng thời gian đủ lâu, thì sẽ được xem như là thành
phần của hình nền.
• Thông tin di chuyển là một trong những thành phần chính, là đặc trưng quan
trọng được sử dụng để phân đoạn video. Lý do là:
o Sự di chuyển mang nhiều thông tin về các mối quan hệ không gian - thời
gian giữa các đối tượng trong khung hình.
o Các tính chất ảnh như cường độ và màu, có một sự tương quan rất cao
theo hướng di chuyển, chúng không thay đổi nhiều khi được theo dõi
- 8 -
trong cảnh (ví dụ màu của chiếc xe không thay đổi khi nó di chuyển qua
cảnh), và được dùng để loại bỏ thông tin dư thừa theo thời gian.
Để phân đoạn di chuyển hay phân đoạn màu, đòi hỏi chúng ta phải thực hiện ước
lượng di chuyển trong khung hình, chi phí để thực hiện quá trình này là tương đối
cao và thao tác phức tạp. Trong khi quá trình phát hiện di chuyển có chi phí tính
toán thấp hơn nhưng có độ chính xác về không gian cao. Do đó phương pháp phân
đoạn dựa trên sự phát hiện thay đổi để rút trích các đối tượng ngữ nghĩa trong chuỗi
video đã được áp dụng phổ biến hơn.
Luận văn này chỉ tập trung xét phương pháp phân đoạn dựa trên quá trình phát
hiện thay đổi, kết hợp với phương pháp thống kê khung hình nền trong quá trình
thay đổi.
2.3 - Thuật toán phát hiện đối tượng chuyển động
Chương này trình bày về các phương pháp cơ bản phát hiện các đối tượng chuyển
động trong một đoạn phim video. Bài toán này bao gồm 4 bước chính:
• Rút trích đặc trưng của ảnh.
• Phân tích các đặc trưng.
• Nhận biết các đối tượng chuyển động.
• Lọc nhiễu.
• Thống kê khung hình nền.
2.3.1 - Lý thuyết cơ bản trong phát hiện chuyển động
Phát hiện chuyển động là một kỹ thuật được dùng nhiều trong các ứng dụng liên
quan tới ảnh, đó là các hệ thống video giám sát, các ứng dụng đa phương tiện... Về
cơ bản, phát hiện chuyển động là một quá trình xác định sự khác nhau về trạng thái
của các đối tượng bằng cách quan sát chúng tại các thời điểm khác nhau. Ví dụ, các
camera an ninh sẽ theo dõi và phát hiện có kẻ đột nhập khi thấy có sự thay đổi của
hình ảnh.
- 9 -
Các kĩ thuật phát hiện chuyển động khác nhau có thể được sử dụng trong điều kiện
camera chuyển động hay cố định. Với camera chuyển động, thuật toán phải tính
toán để xác định các điểm ảnh có cùng vector chuyển động so với vector mẫu sẽ
được coi là cố định. Với camera cố định, việc phát hiện chuyển động sẽ đơn giản
hơn, đó là xác định khung hình nền cố định và các đối tượng chuyển động. Trong
luận văn này, bài toán được áp dụng cho một camera đứng yên.
Phát hiện chuyển động là một công việc phân đoạn về thời gian nhằm mục đích xác
định các chuyển động trong các tập khung hình hay trong một chuỗi khung hình tại
hai thời điểm khác nhau. Chúng ta ký hiệu ma trận ảnh cần kiểm tra là Mi tại khung
hình t với:
Mi = Fi(x, y, t).
Trong đó:
• Fi là hàm lấy các giá trị của ảnh.
• x, y là tọa độ của điểm ảnh.
• t chỉ ra khung hình thứ t trong chuỗi hình ảnh video.
Bài toán phát hiện chuyển động bao gồm việc tìm kiếm đối với từng khung hình t
một ma trận nhị phân Mo trong đó các điểm ảnh sẽ chứa giá trị biểu thị cho việc
điểm ảnh (x, y) trong Mi có chuyển động so với khung hình đối chiếu Mis. Ma trận
Mo với hàm xác định Fo(x, y, t) được định nghĩa như sau:
nếu xảy ra sự thay đổi tại vị trí (x, y) tại thời điểm t
ngược lại
Mo = ⎩⎨
⎧=
0
1
),,( tyxFo
Trong đó:
• Mi: Ma trận điểm ảnh của khung hình hiện thời t với hàm giá trị Fi(x, y, t).
• Mis: Ma trận điểm ảnh của khung hình đối chiếu s với hàm giá trị Fi(x, y, s),
thông thường khung hình đối chiếu là khung hình nền.
Có nhiều phương pháp khác nhau để xây dựng ma trận Mo. Hàm Fo được dùng để
xây dựng ma trận Mo được định nghĩa như sau:
- 10 -
Fo(x, y, n) = F( Fi(x, y, t), Fi(x, y, s))
Phát hiện chuyển động là một phương pháp được sử dụng trong hầu hết các ứng
dụng xử lý ảnh video. Về cơ bản, thuật toán phát hiện chuyển động bao gồm bốn
bước chính:
• Rút trích đặc trưng.
• Phân tích đặc trưng.
• Nhận biết chuyển động.
• Lọc nhiễu.
Sơ đồ khối của phương pháp được trình bày trong Hình 2 - 3.
Phân tích
đặc trưng
(Fc)
Rút trích
đặc trưng
(Fa)
Mi Nhận biết
chuyển động
(Fo)
Lọc nhiễu
(Ff)
Ma Mc Mo M’
Hình 2 - 3: Sơ đồ khối phương pháp phát hiện chuyển động
Rút trích đặc trưng
Đây là bước lấy các thông số của các điểm ảnh tại từng khung hình biến đổi thành
một ma trận chứa các giá trị. Phép biến đổi này thường là hàm Fa với các tham số là
độ sáng, màu sắc... Ma trận đặc trưng Ma được định nghĩa như sau:
Ma = Fa(x, y, t) = F(Fi(x, y, t))
Phân tích đặc trưng
Đây là bước quan trọng để xác định độ sai khác của khung hình hiện thời với khung
hình nền mẫu. Kết quả là một ma trận Mc chứa các sai khác giữa 2 khung hình.
Hàm tính khoảng cách Fc giữa 2 giá trị đặc trưng thường là phép trừ bậc một. Hàm
Fc được định nhĩa như sau:
Fc(x, y, t) = F(Fa(x, y, t), Fa(x, y, s))
Trong đó:
- 11 -
• Fa(x, y, t): Giá trị đặc trưng của điểm ảnh (x, y) tại khung hình hiện thời t.
• Fa(x, y, s): Giá trị đặc trưng của điểm ảnh (x, y) tại khung hình đối chiếu s.
Nhận biết chuyển động
Từ kết quả của bước phân tích đặc trưng, thuật toán sẽ nhận biết các điểm ảnh nào
là đứng yên, điểm ảnh nào là chuyển động so với khung hình nền mẫu. Kết quả của
bước phân tích này là một ma trận Mo chứa các giá trị nhị phân: chuyển dộng hay
không chuyển động.
Hàm nhận biết chuyển động Fo này thường là phép so sánh giá trị của Mc với một
ngưỡng Kt, ngưỡng này thường là ngưỡng thực nghiệm. Fo được định nghĩa như
sau:
nếu Mc(x, y, n) > Kt
ngược lại ⎩⎨
⎧=
0
1
),,( tyxFo
Lọc nhiễu
Lọc nhiễu là bước lọc bỏ các nhiễu trong kết quả có được, nhiễu này thường là
nhiễu của camera hay nhiễu trong quá trình rút trích đặc trưng và nhận biết chuyển
động. Đơn giản là lọc bỏ các vùng chuyển động có bao đóng nhỏ hơn một ngưỡng
thực nghiệm nào đó.
2.3.2 - Chi tiết thuật toán phát hiện chuyển động
Dựa trên lý thuyết cơ bản được trình bày ở trên, trong mục này tôi sẽ trình bày chi
tiết về thuật toán phát hiện chuyển động.
Mô hình của thuật toán như sau (Hình 2 - 4)
- 12 -
Phân tích đặc trưng
Nhận biết chuyển động
Khung hình
hiện thời
Tổng hợp
khung hình
nền
Khung hình
đối chiếu
Rút trích
đặc trưng
(Fa)
Đo khoảng cách
đặc trưng (Fc)
Lọc nhiễu
(Ff)
Vùng
chuyển động
Lấy ngưỡng Nhận biết chuyển
động (Fo)
Hậu xử lý
Rút trích đặc trưng
Hình 2 - 4: Mô hình thuật toán phát hiện chuyển động
- 13 -
2.3.2.1 - Rút trích đặc trưng
Đây là quá trình chuyển đổi từ ma trận ảnh đầu vào Fi(x, y, t) thành ma trận chứa
các giá trị đặc trưng. Kết quả của bước rút trích đặc trưng là một chuỗi các ma trận
Ma(x, y, t).
Các đặc trưng cơ bản:
• Cường độ sáng.
• Màu sắc.
• Độ chiếu sáng.
• Độ tương phản.
Chương trình thực nghiệm lấy thông tin cường độ sáng từ mỗi thành phần của
khung hình thông qua thuật toán được trình bày ở Phụ lục 1.
2.3.2.2 - Cường độ sáng
Đây là đặc trưng cơ bản và thường được dùng nhất trong phát hiện chuyển động.
Đối với camera đơn sắc thì chuỗi ảnh đầu vào Mi(x, y, t) chính là chuỗi các ma trận
chứa các giá trị độ sáng. Trường hợp camera màu gồm 3 thành phần màu cơ bản
(RGB), độ sáng sẽ được tính theo công thức sau:
Fa(x, y) = W1R(x, y) + W2G(x, y) + W3B(x, y)
Trong đó:
• Wi là các trọng số mô tả cho các độ nhạy khác nhau của hệ thống HVS đối
với các thành phần màu.
• R(x, y), G(x, y), B(x, y) là 3 giá trị màu của điểm ảnh (x, y).
Chương trình thực nghiệm dùng cường độ sáng làm đặc trưng để phát hiện chuyển
động. Tham khảo source code ở phần Phụ lục 2.
2.3.2.3 - Màu sắc
Đây là đặc trưng quan trọng thứ hai, màu sắc được lấy từ ba bộ cảm biến của
camera (RGB). Trong một số ứng dụng đặc thù, màu sắc của đối tượng chuyển
động sẽ mang một ngữ nghĩa riêng.
- 14 -
2.3.2.4 - Đặc trưng bất biến về độ chiếu sáng
Khi độ chiếu sáng thay đổi, các phương pháp truyền thống dựa trên cường độ sáng
của ảnh không thể phát hiện chuyển động do các dao động của các giá trị cường độ
sáng tạo ra các xác thực sai. Vấn đề này có thể được khắc phục bằng cách sử dụng
các đặc trưng bất biến khi độ chiếu sáng thay đổi, còn được gọi là các đặc trưng bất
biến của độ chiếu sáng. Các đường mức, các bản đồ cạnh, mô tả vector của các
vùng ảnh là các đặc trưng có tính chặt chẽ cao hơn so với đặc trưng cường độ sáng
của ảnh trong việc phát hiện chuyển động ở trường hợp độ chiếu sáng thay đổi.
Phương pháp dựa trên sự biểu diễn ảnh đường mức sử dụng yếu tố sự thay đổi về độ
chiếu sáng toàn cục làm biến đổi về số lượng, nhưng không thay đổi tính chất hình
học của các đường mức. Một đường mức λ là một đường biên của tập mức. Một tập
mức Sλ bao gồm tất cả các vị trí điểm ảnh có giá trị độ sáng ít nhất bằng λ:
}),,(:),{( λλ ≥= tyxFayxS
Ảnh chứa các đường mức có thể được diễn đạt như một bản đồ đường mức, Fa(x, y,
t). Một bản đồ đường mức có thể được định nghĩa như sau:
nếu Fa(x, y, t) = λi với i = 1,..., N
ngược lại ⎩⎨
⎧=
0
1
),,( tyxFa
Trong đó:
• N là số lượng đường mức được xét để tạo bản đồ đường mức.
2.3.3 - Phân tích đặc trưng
Phần này trình bày về thuật toán tính toán ma trận khác biệt giữa khung hình hiện
thời và khung hình nền mẫu. Đồng thời cũng xin trình bày thuật toán lấy khung hình
đối chiếu.
2.3.3.1 - Kỹ thuật lấy khung hình đối chiếu.
Xác định khung hình đối chiếu là một bước rất quan trọng ảnh hưởng tới kết quả
của thuật toán. Có 2 phương pháp xác định khung hình đối chiếu: cố định và động.
Chương trình thực nghiệm dùng phương pháp lấy khung hình đối chiếu động.
- 15 -
2.3.3.2 - Phương pháp xác định khung hình đối chiếu cố định
Trong phương pháp xác định khung hình đối chiếu cố định, khung hình nền được
chụp trước trong những thời điểm khác nhau với những điều kiện khác nhau. Các
khung hình nền này sau đó sẽ được dùng để so sánh trong những điều kiên cụ thể.
Ví dụ trời sáng thì dùng khung hình nền sáng, trời tối, trời mưa thì dùng khung hình
nền khác… Đây là một phương pháp đơn giản, nó cho phép phát hiện các đối tượng
trong cảnh ngay cả khi đối tượng đứng yên. Hơn nữa, nó làm giảm các hiệu ứng
khung hình nền không bị bao phủ và cải tiến việc phát hiện các đối tượng chuyển
động chậm.
2.3.3.3 - Phương pháp xác định khung hình đối chiếu động
Trong phương pháp xác định khung hình đối chiếu động, khung hình đối chiếu sẽ
được xác định trong một tập các khung hình vừa xảy ra. Có nhiều phương pháp lấy
khung hình đối chiếu động, về cơ bản có hai phương pháp sau:
Phương pháp lấy khung hình đối chiếu là khung hình ngay phía trước:
Fc(x, y, n) = T(Mi(x, y, t), Mi(x, y, t - 1))
Phương pháp này có ưu điểm là làm giảm sự phát hiện các bóng. Tuy nhiên, nó tạo
ra nhiễu cho phần khung hình nền không bị bao phủ bởi đối tượng chuyển động, chỉ
nhận được vùng biên của đối tượng chuyển động chứ không nhận được hoàn toàn
đối tượng. Một hạn chế nữa là phương pháp này phát hiện các vùng ảnh chuyển
động chậm kém. Một cải tiến đưa ra là chuẩn hóa khung hình Mi(x, y, t - 1) (khung
hình trước đó) trước khi so sánh. Bước tối ưu này sẽ chuẩn hóa sự biến đổi bên
trong ảnh chịu tác động bởi các yếu tố môi trường.
Phương pháp sử dụng khung hình nền làm khung hình đối chiếu:
Thông thường thì khung hình đầu tiên của chuỗi video sẽ được chọn để làm khung
hình đối chiếu, phương pháp này giả thiết rằng không có các đối tượng bề mặt trong
cảnh lúc bắt đầu chuỗi video. Khi đó hàm khác biệt có dạng:
Fc(x, y, t) = F(Fa(x, y, t), Fa(x, y, 0))
- 16 -
Trong đó:
• Fa(x, y, t) là giá trị đặc trưng của điểm ảnh (x, y) tại khung hình hiện thời t.
• Fa(x, y, 0) là giá trị đặc trưng của điểm ảnh (x, y) tại khung hình đầu tiên t =
0.
Hình 2 - 5: Ví dụ mô tả phương pháp đối chiếu khung hình nền [10]
Đây là một phương pháp đơn giản, gần giống như phương pháp lấy khung hình đối
chiếu là khung hình nền cố định. Tuy nhiên, lời giải này không phải luôn phù hợp
với thực tế. Vì trong nhiều ứng dụng, khung hình đầu tiên của chuỗi thường chứa
đối tượng bề mặt. Và nó sẽ không thích hợp trong trường hợp chuỗi video dài như
bài toán điều khiển nút giao thông mà luận văn này đang nhắm đến.
Có nhiều thuật giải được đưa ra để xây dựng lại khung hình đối chiếu bằng cách
tích hợp thông tin khung hình nền từ một chuỗi các khung hình, các kĩ thuật này còn
được gọi là phương pháp lấy khung hình nền phù hợp hoàn cảnh (adaptive
background). Một vùng nhớ của khung hình nền sẽ lưu giữ khung hình nền đã được
cập nhật (updated - background) trong quá trình phát hiện chuyển động. Một bộ lọc
về thời gian sẽ tích hợp thông tin từ các khung hình trong quá khứ để cập nhật
khung hình nền này. Khung hình nền động trong bộ nhớ này sẽ được dùng trong
phép so sánh với khung hình hiện thời để phát hiện các vùng chuyển động. Ma trận
giá trị đặc trưng của khung hình nền Fa(x, y, t) = F’a(x, y, t) là kết quả của trung
bình trọng số các khung hình trong quá khứ:
F’a(x, y, t) = (1 - α)Fa(x, y, t) + α F’a(x, y, t - 1)
- 17 -
Với F’a(x, y, 0) = Fa(x, y, 0) và 0 < α < 1. Giá trị α có thể được xác định dựa trên
kết quả thống kê trong một cửa sổ các điểm ảnh trong chuỗi khung hình. Trong
trường hợp đơn giản hơn giá trị α là một hằng số. Chỉ những điểm ảnh không bị
chuyển động mới thật sự được cập nhật. Quá trình cập nhật sẽ tạo ra một khung
hình nền cho dù chuỗi ảnh có các đối tượng khác đang nằm trên nền, tức là nền bị
bao phủ bởi các đối tượng di động khác. Với khung hình đối chiếu được cập nhật
động sẽ khắc phục việc thay đổi khung hình nền khi các điều kiện thời tiết và ánh
sáng thay đổi. Một nhược điểm của phương pháp này là bóng của các đối tượng
chuyển động (shadow) cũng được xem như một đối tượng chuyển động. Giải pháp
để khắc phục khuyết điểm này sẽ được giải quyết trong phần mở rộng.
2.3.3.4 - So sánh kết quả hai phương pháp sử dụng khung hình đối
chiếu:
Hình 2 - 6: Khung hình có đối tượng đang di chuyển
- 18 -
Hình 2 - 7: Kết quả theo phương pháp đối chiếu khung hình trước đó
Hình 2 - 8: Ảnh nền
Hình 2 - 9: Kết quả theo phương pháp đối chiếu với khung hình nền cập nhật động
- 19 -
Trong trường hợp này, kết quả nhận được bằng phương pháp sử dụng khung hình
nền làm khung hình đối chiếu tốt hơn so với phương pháp sử dụng khung hình trước
đó. Tuy nhiên với phương pháp sử dụng khung hình nền cố định, nếu trường hợp
khung hình nền có chứa đối tượng đang di chuyển vào thời điểm bắt đầu thì hiệu
quả sẽ không cao hơn so với phương pháp dùng khung hình nền động.
Trong hai phương pháp sử dụng khung hình nền động, phương pháp sử dụng khung
hình trước đó làm khung hình đối chiếu có kết quả không tốt bằng phương pháp sử
dụng khung hình nền được cập nhật động. Ngoài ra phương pháp sử dụng khung
hình n