Chương 3 trình bày ba thuật toán nhận dạng khuyết tật của dầm: thuật toán VTKT-NL [3], VTKTNF [4], và KTKT-WL [6]; giới thiệu phương pháp xác định mức độ khuyết tật dựa vào hệ số wavelet trung bình, và đề xuất thuật toán dự báo các thông số động theo chuỗi thời gian, thuật toán TSPA [5] được xây dựng dựa trên hệ thống suy diễn neuro-fuzzy. Đây là các đóng góp khoa học của luận án trong chương này.
29 trang |
Chia sẻ: vietpd | Lượt xem: 1508 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Chương 3 Nhận dạng và dự báo khuyết tật, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
71 Luận án Tiến sĩ Kỹ thuật
Nguyễn Sỹ Dũng
Chương 3
NHẬN DẠNG VÀ DỰ BÁO KHUYẾT TẬT
Chương 3 trình bày ba thuật toán nhận dạng khuyết tật của dầm: thuật toán VTKT-NL [3], VTKT-
NF [4], và KTKT-WL [6]; giới thiệu phương pháp xác định mức độ khuyết tật dựa vào hệ số
wavelet trung bình, và đề xuất thuật toán dự báo các thông số động theo chuỗi thời gian, thuật toán
TSPA [5] được xây dựng dựa trên hệ thống suy diễn neuro-fuzzy. Đây là các đóng góp khoa học của
luận án trong chương này.
Khuyết tật xuất hiện trên dầm sẽ làm thay đổi thế năng biến dạng đàn hồi của dầm chịu uốn.
Tuy nhiên, sự thay đổi này tại khu vực xuất hiện khuyết tật và tại các khu vực khác lại không giống
nhau. Đây là dấu hiệu nhận diện khuyết tật được sử dụng trong thuật toán VTKT-NL được trình bày
trong [3]. Trong đó, nhằm gia tăng độ chính xác của phương pháp khi dầm dao động ở tần số gần
với tần số riêng của hệ, giải pháp trung bình khi tính thế năng biến dạng đàn hồi cho từng phần tử
được đề xuất.
Trên hệ thống ND-DBTX, hệ thống cảm biến cũng như hệ thống xử lý, truyền dẫn và lưu trữ
dữ liệu đã được lắp đặt trước nhằm tạo điều kiện để đo thường xuyên các tín hiệu dao động của cầu
tại nhiều điểm đo ở các thời điểm khác nhau. Đây là điều kiện thuận lợi cho phép sử dụng và phát
huy tính ưu việt của hệ thống suy diễn neuro-fuzzy thích nghi trong nhận dạng sự thay đổi về đặc
trưng ứng xử động lực học của cơ hệ thông qua tín hiệu dao động. Khi cơ hệ xuất hiện khuyết tật thì
đáp ứng động lực học của cơ hệ cũng sẽ thay đổi theo. Sự thay đổi của tín hiệu tương ứng ở hai thời
điểm, thời điểm khảo sát và thời điểm cơ hệ được xem là không bị hư, được hệ thống suy diễn
neuro-fuzzy nhận diện. Đây là giải pháp xác định khuyết tật trên dầm được trình bày trong thuật
toán VTKT-NF [4].
72 Luận án Tiến sĩ Kỹ thuật
Nguyễn Sỹ Dũng
Thuật toán KTKT-WL [6] được xây dựng dựa trên phép phân tích wavelet tín hiệu dao động
của cơ hệ. Một giải pháp mới về định lượng hệ số wavelet, hệ số wavelet trung bình, được đề xuất
làm cơ sở để tìm khu vực suy giảm độ cứng chống biến dạng. Hệ số wavelet trung bình nhạy với sự
thay đổi khả năng tải của cơ hệ nhưng lại không nhạy với chế độ kích thích dao động. Đây là đặc
điểm quan trọng, mở ra khả năng sử dụng giải pháp được đề xuất trong việc xây dựng cơ sở dữ liệu
cho hệ thống suy diễn neuro-fuzzy để xây dựng hệ thống kiểm tra khuyết tật trên cầu theo tải giao
thông. Đối với cầu giao thông, làm sao có thể đánh giá thường xuyên tình trạng làm việc của cầu
nhưng không làm ảnh hưởng tới việc lưu thông qua cầu diễn ra liên tục hằng ngày? Sử dụng tải giao
thông trong các hệ thống ND-DBTX là một giải pháp hợp lý cho vấn đề nêu trên.
Thuật toán TSPA [5] được xây dựng dựa trên ứng dụng hệ thống suy diễn neuro-fuzzy thích
nghi của [9]. TSPA phù hợp với bài toán dự báo các thông số phi tuyến, nhiều ràng buộc và cho độ
chính xác động, nghĩa là quy mô, cách tổ chức và độ chính xác của tập dữ liệu sẽ quyết định độ
chính xác dự báo. Thuật toán có thể sử dụng trong dự báo online và offline.
Chương 3 được tổ chức như sau. Ở phần đầu trình bày cơ sở lý thuyết của bài toán xác định
khuyết tật trên cơ hệ. Phần tiếp theo đề cập tới cơ sở lý thuyết của một số thuật toán thường được sử
dụng để giải bài toán tối ưu nói chung và để kiểm tra khuyết tật trên cơ hệ nói riêng. Cuối chương
trình bày các thuật toán mới, VTKT-NL, VTKT-NF, KTKT-WL và TSPA, về nhận dạng và dự báo
khuyết tật.
3.1 CƠ SỞ LÝ THUYẾT
Luận án đề cập tới hai nhóm phương pháp xác định khuyết tật trên dầm và trên cầu giao thông được
ứng dụng nhiều trong thời gian gần đây, đó là phương pháp phân tích wavelet và phương pháp dựa
trên lời giải bài toán ngược động lực học cơ hệ. Mặc dù phân tích wavelet cũng có thể xem như một
dạng ứng dụng bài toán ngược trong xác định khuyết tật, tuy nhiên phương pháp này thiên về phân
tích tín hiệu hơn là phân tích đặc trưng ứng xử động lực học cơ hệ, do đó trong luận án chúng tôi
tách ra thành hai nhóm riêng để tiện trong khảo sát.
3.1.1 Phương pháp phân tích wavelet
3.1.1.1 Khái niệm về phân tích wavelet
Gọi ( )f t là hàm khả tích theo biến thời gian t. Biến đổi wavelet của ( )f t được định nghĩa:
0,,1)(),( *
aRbadt
a
bt
a
tfbaWf (3.1)
73 Luận án Tiến sĩ Kỹ thuật
Nguyễn Sỹ Dũng
trong đó, dấu (*) thể hiện liên hợp phức của wavelet cơ sở ( )t (mother wavelet); ),( baWf được
gọi là hệ số wavelet.
Nếu sử dụng định nghĩa hàm wavelet sau:
* *,
1( )a b
t bt
aa
thì (3.1) có thể viết lại dưới dạng sau:
dtttfbaWf ba )()(),(
*
,
(3.2)
Trong phép biến đổi wavelet hàm ( )f t , khi tăng hoặc giảm độ lớn của a thì đặc tính wavelet
sẽ bị kéo giãn ra hoặc bị nén lại, do đó a được gọi là hệ số tỷ lệ (scale), phản ánh tần số wavelet địa
phương được sử dụng trong phép biến đổi này. Giá trị b thể hiện khoảng dịch chuyển thời điểm phân
tích wavelet hàm khảo sát, do đó b được gọi là thông số vị trí (position).
Trong nhiều ứng dụng, chẳng hạn trong lọc nhiễu tín hiệu, ta cần phải xác lập lại tín hiệu gốc.
Việc xác lập lại tín hiệu ban đầu của tập tín hiệu wavelet được gọi là phép biến đổi ngược wavelet.
Nếu phân tích wavelet được thực hiện trong một dãy liên tục các giá trị của a và b thì ta gọi là
phân tích wavelet liên tục, CWT. Ngược lại, nếu phân tích tại một số giá trị rời rạc của a và (hoặc) b
thì ta gọi là phân tích wavelet rời rạc, DWT. Trong nghiên cứu này chúng tôi sử dụng CWT.
3.1.1.2 Sơ lược về ứng dụng wavelet
Phân tích wavelet là một công cụ toán học được sử dụng để giải quyết nhiều vấn đề liên quan tới xử
lý tín hiệu trong miền thời gian. Phân tích wavelet được sử dụng trong nhiều lĩnh vực khác nhau,
chẳng hạn trong lọc nhiễu, xử lý tín hiệu hoặc trong kiểm tra “sức khỏe” của một cơ hệ, bao gồm
nhận dạng sự hiện diện của khuyết tật, xác định vị trí của chúng, xác định khả năng tải của cơ hệ ở
thời điểm hiện tại cũng như quy luật suy giảm độ cứng chống biến dạng và dự báo khả năng tải của
cơ hệ trong tương lai.
Khi một cơ hệ bị khuyết tật thì tín hiệu đáp ứng động lực của cơ hệ cũng sẽ thay đổi theo,
trong đó mức độ và đặc điểm của lượng thay đổi này phụ thuộc vào vị trí và mức độ của khuyết tật.
Các thay đổi nhỏ của tín hiệu gốc có thể không thấy được trên đặc tính của chúng nhưng có thể làm
xuất hiện các điểm thay đổi bất thường, được gọi là các điểm kỳ dị, KD, trên đặc tính wavelet khi
chuyển tín hiệu gốc qua tín hiệu wavelet – đây là các dấu hiệu về khuyết tật. Đặc biệt, trong nghiên
74 Luận án Tiến sĩ Kỹ thuật
Nguyễn Sỹ Dũng
cứu này chúng tôi nhận thấy rằng hệ số wavelet trung bình (sẽ được trình bày chi tiết trong mục 3.2)
biến thiên đồng biến với mức độ khuyết tật; tín hiệu này không nhạy với sự thay đổi chế độ kích
thích dao động. Các đặc điểm này mở ra hướng ứng dụng mới của phân tích wavelet: xác định mức
độ khuyết tật, nhận dạng và dự báo khuyết tật của cầu theo tải giao thông.
Thông qua phân tích wavelet ta có thể phát hiện sự xuất hiện các điểm KD trên đường đặc
tính wavelet được phân tích từ tập tín hiệu đáp ứng động lực học cơ hệ. Tuy nhiên, dễ thấy rằng các
điểm KD trong một số trường hợp có thể do tính không đồng đều về khả năng chống biến dạng của
hệ tại một hoặc một số vị trí so với các khu vực khác trên cơ hệ, nghĩa là do đặc điểm cấu trúc của
hệ, hoàn toàn không phải do khuyết tật xuất hiện. Do đó để xác định vị trí khuyết tật theo phương
pháp này ta cần so sánh tín hiệu wavelet ở thời điểm khảo sát với tín hiệu wavelet tương ứng ở thời
điểm cơ hệ được xem là không bị khuyết tật. Chính vì vậy mà phương pháp này sẽ hiệu quả hơn nếu
sử dụng ANN, FL, hoặc các mô hình kết hợp giữa ANN và FL để nhận dạng cơ hệ ở thời điểm cơ
hệ còn nguyên vẹn. Trong luận án này chúng tôi nghiên cứu ứng dụng phương pháp phân tích
wavelet theo hướng kết hợp với hệ thống suy diễn neuro-fuzzy.
3.1.2 Ứng dụng phương pháp giải bài toán ngược
Mục này trình bày cơ sở toán học của các phương pháp nhận dạng và dự báo khuyết tật trên cơ hệ
theo hướng ứng dụng phương pháp giải bài toán ngược động lực học cơ hệ.
3.1.2.1 Ứng xử động lực học của cơ hệ
Có thể phân thành hai dạng bài toán liên quan tới đặc trưng ứng xử động lực học của cơ hệ, đó là
bài toán thuận và bài toán ngược động lực học cơ hệ, gọi tắt là bài toán thuận và bài toán ngược.
Bài toán thuận Cho trước dữ liệu về cơ hệ và tình trạng phân bố của tải, phải xác định đặc trưng
ứng xử của hệ. Chẳng hạn phải tính chuyển vị, độ võng, góc xoay, ứng suất, tần số và biên độ dao
động…khi cho trước tải, điều kiện biên, các đặc trưng hình học, các thuộc tính về vật liệu.
Rất nhiều phương pháp giải bài toán thuận được xây dựng trên cơ sở hệ các phương trình vi
phân đặc trưng của hệ, chẳng hạn: phương pháp phần tử hữu hạn, FEM, phương pháp phần tử dải,
SEM, phương pháp phần tử biên, BEM, hoặc phương pháp mắt lưới, MFM.
Bài toán ngược Thường cho trước các đại lượng phản ánh sự ứng xử của cơ hệ, một số đại lượng
liên quan tới tải, tới điều kiện biên, tới đặc trưng hình học của cơ hệ và đặc trưng vật liệu của cơ hệ,
phải xác định một số (hoặc tất cả) các đại lượng còn lại của tải, điều kiện biên, đặc trưng hình học
hoặc đặc tính vật liệu được sử dụng trong cơ hệ. Chẳng hạn cho trước chuyển vị, vận tốc, gia tốc,
75 Luận án Tiến sĩ Kỹ thuật
Nguyễn Sỹ Dũng
tần số dao động (thường là những giá trị rời rạc được đo bằng thực nghiệm), cho trước chế độ tải và
các đặc trưng hình học của cơ hệ, phải xác định các thuộc tính cơ học của vật liệu…
Lời giải bài toán ngược được ứng dụng hữu ích trong rất nhiều bài toán kỹ thuật, chẳng hạn
xác định và ước lượng mức độ hư hỏng trong cơ hệ dựa trên sóng dao động và sóng siêu âm, thăm
dò thám hiểm đại dương, về trái đất, về không gian, hướng dẫn và định hướng rada…dựa vào tín
hiệu phản hồi.
Một số phương pháp giải bài toán ngược thường được sử dụng như phương pháp tối ưu,
phương pháp sử dụng mạng ANN, sử dụng FL hoặc nhóm những phương pháp kết hợp.
3.1.2.2 Hàm mục tiêu
Có nhiều phương pháp kiểm tra khuyết tật trên cơ hệ. Đa số các phương pháp đều được phát triển
theo hướng ứng dụng đáp ứng động lực học khi dao động của cơ hệ theo mô hình hộp đen. Đầu tiên
cơ hệ được kích thích dao động, sau đó đo tín hiệu dao động của hệ, phân tích tập tín hiệu ra trong
mối liên hệ ràng buộc giữa tín hiệu ra và tín hiệu vào hoặc phân tích thuần túy tín hiệu ra để phát
hiện những thay đổi trong đáp ứng động lực của cơ hệ. Dữ liệu về sự thay đổi của tín hiệu đáp ứng
động lực tại hai thời điểm, thời điểm cơ hệ được xem là không hư hỏng và thời điểm đang khảo sát,
chính là dấu hiệu để nhận biết về sự xuất hiện khuyết tật, vị trí và mức độ của chúng. Sự khác nhau
của các phương pháp thường nằm ở công cụ toán và giải pháp công nghệ được sử dụng để phát hiện
những thay đổi này cũng như phương thức và giải pháp tìm ra mối liên hệ giữa đặc điểm cũng như
mức độ của sự thay đổi trong tín hiệu đáp ứng động lực học của cơ hệ với vị trí và mức độ của
khuyết tật.
Gọi ( )c ciy W là tín hiệu ra của cơ hệ khảo sát được tính theo mô hình bài toán thuận ứng với
ma trận các thông số hệ thống giả định cW ; gọi ( )m tiy W là tín hiệu ra được đo trực tiếp trên cơ hệ
ứng với ma trận các thông số hệ thống chưa biết tW . Hàm mục tiêu trong bài toán ngược thường là
hàm sai số Er. Nếu sử dụng chuẩn LMS để đánh giá độ chính xác của lời giải thì hàm mục tiêu của
bài toán ngược sẽ là:
P
i
tm
i
cc
i
c
r WyWyP
WE
1
2)()(1)( (3.3)
trong đó P là số mẫu trong tập dữ liệu. Vì c tW W do đó 0)( cr WE . Vấn đề đặt ra cho bài toán
nhận dạng khuyết tật cơ hệ là phải xác định cW sao cho:
76 Luận án Tiến sĩ Kỹ thuật
Nguyễn Sỹ Dũng
min)( cr WE (3.4)
Nghiệm của (3.4), coptimal
c WW , sẽ cung cấp các thông tin cần thiết về sự tồn tại khuyết tật trên cơ
hệ, vị trí xuất hiện khuyết tật cũng như mức độ của khuyết tật.
Ví dụ, nếu tín hiệu khảo sát là độ võng và thông số hệ thống được sử dụng trong khảo sát là
độ cứng chống biến dạng của cơ hệ thì mô hình toán của bài toán nhận dạng khuyết tật theo phương
pháp ứng dụng lời giải bài toán ngược động lực học cơ hệ nêu trên sẽ được xây dựng như sau.
Trước hết, thực hiện việc phân chia cơ hệ thành các phần tử nhỏ theo cách chia của phương pháp
phần tử hữu hạn (FEM) cho cấu trúc đàn hồi tuyến tính. Sau đó kích thích cho hệ dao động và tiến
hành đo độ võng của cơ hệ tại từng nút phần tử. Phương trình động lực học của cơ hệ khi dao động
sẽ là:
[K - f2M0] = F (3.5)
trong đó, K và M0 là các ma trận độ cứng và ma trận khối lượng, f là tần số kích thích, là vector
chuyển vị nút, và F là vector biên độ ngoại lực. Thông thường, sự thay đổi bên trong của cơ hệ
không phải do sự mất mát về khối lượng mà là sự thay đổi về độ cứng chống biến dạng. Do đó có
thể xem ma trận khối lượng M0 không thay đổi, chỉ có ma trận độ cứng K thay đổi theo thời gian. Để
nhận dạng và dự báo khuyết tật dựa trên đáp ứng chuyển vị nút phần tử, ma trận độ cứng của hệ
được cập nhật theo sự thay đổi của ma trận độ cứng của từng phần tử. Trong bài toán thuận, ma trận
độ cứng của cơ hệ được cập nhật cho các thí nghiệm khác nhau ứng với các thông số khác nhau của
khuyết tật. Sau đó trong bài toán ngược, đáp ứng chuyển vị của hệ tại những vị trí cắt mẫu của bài
toán thuận được đo làm dữ liệu để xây dựng hàm mục tiêu. Nếu sử dụng chuẩn LMS thì lời giải bài
toán nhận dạng phần tử hư hỏng được tìm bằng cách tìm cực tiểu hàm mục tiêu.
Ma trận độ cứng (hay còn được gọi là ma trận độ cứng chống biến dạng) của cơ hệ là sự kết
hợp tất cả độ cứng phần tử có trong cơ hệ. Đối với vật liệu đẳng hướng, ma trận độ cứng các phần tử
luôn luôn tỷ lệ với môđyn đàn hồi E của vật liệu và đặc trưng hình học tiết diện ngang của phần tử,
thường là mô men quán tính chính trung tâm của tiết diện ngang, xJ . Ma trận độ cứng phần tử của
phần tử thứ i sẽ là:
ixi JEK
Đây là những thông số chưa biết trong bài toán ngược. Ma trận độ cứng tổng thể bao giờ cũng có thể
biểu diễn được dưới dạng:
77 Luận án Tiến sĩ Kỹ thuật
Nguyễn Sỹ Dũng
1
N
e
i i
i
K K
(3.6)
trong đó, N là số lượng phần tử được chia trên cơ hệ theo mô hình FEM, , 1...i i N là các thông số
chưa biết của mô đun đàn hồi, hay còn gọi là các hệ số độ cứng phần tử, eiK là độ cứng chống biến
dạng của phần tử thứ i khi chưa bị hư hỏng. Trong (3.6), toán tử (.) không phải là phép lấy tổng
thông thường mà ở đây thể hiện việc kết nối phần tử để xây dựng ma trận độ cứng tổng thể theo
phương pháp của FEM.
Thay (3.6) vào phương trình (3.5) ta được:
FMK
N
i
e
ii
0
2
1
f (3.7)
Trong (3.7) ngoại lực F, tần số dao động f, ma trận khối lượng M0 và , 1...eiK i N là những
đại lượng đã biết, do đó sẽ tính được vector chuyển vị trong bài toán thuận, cũng như sẽ tính
được hệ số cứng phần tử , 1...i i N trong bài toán ngược. Cụ thể, việc dựa vào bài toán thuận và
bài toán ngược để xác định vị trí và mức độ hư hỏng thông qua , 1...i i N được thực hiện như sau:
- Trong bài toán thuận, tập các chuyển vị của các phần tử thuộc hệ được tính theo hệ số cứng
phần tử giả định , 1...ci i N khi thay đổi chế độ kích thích dao động.
- Trong bài toán ngược, bộ thông số Nic optimali
c
i ...1,_ được chọn sao cho nếu dựa vào
bộ thông số này thì tín hiệu ra của cơ hệ (được tính theo bài toán thuận) phải phù hợp hoàn hảo với
tập dữ liệu ra thực nghiệm của các đại lượng tương ứng. Nếu dữ liệu thực nghiệm là tập các giá trị
chuyển vị thì hàm mục tiêu có thể được định nghĩa dựa trên hàm tổng bình phương trung bình các
giá trị sai lệch giữa dữ liệu đo chuyển vị và các giá trị đáp ứng tương ứng của cơ hệ:
P
i
tm
i
cc
i
t
P
E
1
2)]()([1)( (3.8)
trong đó, P là số mẫu trong tập dữ liệu được sử dụng cho bài toán ngược; c là vector các hệ số
cứng phần tử giả định được sử dụng trong tính toán theo mô hình bài toán thuận, t là vector các
hệ số cứng phần tử thực tế, đang là ẩn số của bài toán; ci là giá trị đáp ứng chuyển vị thứ i, i=1…P,
của cơ hệ được tính theo mô hình bài toán thuận ứng với vector các hệ số cứng phần tử giả định c ;
78 Luận án Tiến sĩ Kỹ thuật
Nguyễn Sỹ Dũng
m
i là giá trị đáp ứng chuyển vị thứ i, i=1…P, của cơ hệ được đo trực tiếp ứng với vector các hệ số
cứng phần tử thực tế t . Lời giải của bài toán sẽ là tcoptimalc sao cho hàm sai số đạt cực
tiểu
min)( crE (3.9)
theo các ràng buộc liên quan tới điều kiện biên của bài toán [84].
3.1.2.3 Một số phương pháp giải
Có thể thấy rằng hàm mục tiêu của bài toán nhận dạng khuyết tật được xây dựng như trên chính là
mô hình toán của bài toán tối ưu, do đó bài toán nhận dạng khuyết tật cơ hệ hoàn toàn có thể được
giải bằng cách ứng dụng các thuật toán tối ưu hoặc các kỹ thuật được phát triển từ các thuật toán tối
ưu, chẳng hạn kỹ thuật mạng ANN hoặc mạng neuro-fuzzy. Phần tiếp theo sẽ trình bày cơ sở lý
thuyết của một số thuật toán tối ưu thường dùng trong kiểm tra khuyết tật trên cơ hệ.
3.1.2.3.1 Phương pháp tối ưu
Có nhiều thuật toán có thể ứng dụng để giải bài toán tối ưu, ở đây chỉ trình bày cơ sở lý thuyết của
các thuật toán được xây dựng theo hướng cực tiểu khai triển Taylor hàm sai số [18][26][84][103].
Theo hướng tiếp cận này, hàm sai số Er(W) được khai triển tới vi phân bậc nhất hoặc bậc hai, sau đó
tìm cực trị của hàm khai triển. Nghiệm bài toán, là tập các đại lượng chưa biết toptimalW thỏa mệnh đề
(3.9), cho biết vị trí xuất hiện khuyết tật cũng như mức độ hư hỏng. Một số nhóm phương pháp
thường được ứng dụng cho giải pháp này:
- Nhóm phương pháp Gradient Descent;
- Nhóm phương pháp Conjugate Gradient;
- Nhóm phương pháp Newton;
- Nhóm phương pháp Gauss Newton;
- Nhóm phương pháp Levenberg-Marquardt.
Mục này sẽ trình bày tóm tắt nội dung của từng nhóm phương pháp nêu trên.
1/ Nhóm phương pháp Gradient Descent
Các phiên bản của thuật toán Gradient Decent được xây dựng dựa trên cơ sở lý thuyết tìm kiếm
điểm cực trị hàm nhiều biến trên hướng giảm nhanh nhất của hàm, đó là hướng triệt tiêu các đạo
79 Luận án Tiến sĩ Kỹ thuật
Nguyễn Sỹ Dũng
riêng bậc nhất hàm sai số theo từng biến. Tuy nhiên, vì bề mặt của hàm sai số là mặt cong không
gian nhiều chiều nên tại mỗi vòng lặp sẽ tiệm cận tới cực trị của hàm theo từng biến riêng biệt, do
đó phải thực hiện nhiều vòng lặp mới tiệm cần tới điểm cực trị toàn cục. Ngoài ra, quá trình tìm
kiếm có thể bị kẹt ở các điểm cực trị địa phương, do đó thường các thuật toán sử dụng các bước
nhảy đột biến để thoát khỏi vùng này và tiếp tục quá trình tìm kiếm tiếp theo.
Có thể tóm tắt cơ sở lý thuyết chung của nhóm phương pháp Gradient Decent như sau :
Hàm sai số theo chuẩn L2:
2
1
1( )
P
r i
i
E W e
P
(3.10)
Khai triển Taylor hàm (3.10) tới vi phân bậc nhất:
( ) ( ) ( ) | ( )
n
T
r r n r W W nE W E W E W W W (3.11)
do đó hướng tìm kiếm điểm trọng số Wn+1 từ điểm Wn sao cho giảm giá trị hàm sai số Er(W) là:
1 ( ) | n
T
n n n r W WW W E W (3.12)
trong đó ( )rE W là vector các đạo hàm bậc nhất hàm sai số theo các trọng số. Nếu ma trận trọng
số 1 2[ , ,..., ]
T
NW w w w thì ( )rE W sẽ là:
1
2( )
r
r
r
r
N
E
w
E
wE W
E
w
(3.13)
k được gọi là hệ số học, có giá trị là hằng số hoặc được chọn thích nghi theo từng vòng lặp tùy
thuộc vào trạng thái biến thiên của Er(W).
Nếu cập nhật trọng số theo (3.12) với giá trị hệ số học đủ nhỏ để đảm bảo tính ổn định của
quá trình học, tốc độ hội tụ rất chậm. Để khắc phục, thường người ta bổ sung lượng gia tăng trọng
số quán tính tại bước học thứ n-1, ( ( 1))W n , vào bước lặp thứ n:
1 ( ) | ( 1)n
T
n n n r W WW W E W W n
80 Luận án Tiến sĩ Kỹ thuật