3.1.1.1 Bó nghiệm: Giả sử 0H là một tập đóng bị chặn chứa trong tập Q, trong đó 0 0x(0) x H = ? . Như vậy ứng với mỗi hàm điều khiển u(t) tạo ra một họ nghiệm 0x(t) x(t,x ,u) = - đó là một họ nghiệm xuất phát từ 0H mà chúng ta sẽ gọi là bó nghiệmtương ứng với điều khiển u(t).
11 trang |
Chia sẻ: vietpd | Lượt xem: 1644 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Điều khiển tối ưu bó dạng mờ, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
25
Chương III: ĐIỀU KHIỂN TỐI ƯU BÓ DẠNG MỜ
§3.1 BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU BÓ
3.1.1 Đặt bài toán
Giải bài toán điều khiển hệ vi phân
n p
dx f (t, x(t),u(t)), x(t) R ,u(t) R
dt
= ∈ ∈ (3.1.1)
Với hàm vectơ f (t,x(t),u(t)) mà n px(t) R ,u(t) R∈ ∈ cùng liên tục với các đạo
hàm riêng
2
k k
j i j
f (t,x,u) f (t, x,u)
,
x x x
∂ ∂
∂ ∂ ∂
trên [0,T] Q U× × . T là giá trị cố định, Q là
tập mở trong nR , còn U là tập đóng giới nội trong pR , hàm u(t) xác định trên
D [0,T]= có giá trị trong U.
3.1.1.1 Bó nghiệm: Giả sử 0H là một tập đóng bị chặn chứa trong tập Q, trong
đó 0 0x(0) x H= ∈ . Như vậy ứng với mỗi hàm điều khiển u(t) tạo ra một họ nghiệm
0x(t) x(t,x ,u)= - đó là một họ nghiệm xuất phát từ 0H mà chúng ta sẽ gọi là bó
nghiệm tương ứng với điều khiển u(t).
3.1.1.2 Thiết diện cắt ngang bó nghiệm: Giả sử
{ }t ,u t 0 0 0H x x(t,x ,u) |x H= = ∈ (3.1.2)
là ảnh của tập hợp 0H thông qua hệ vi phân (3.1.1) với điều khiển u(t) tại thời
điểm t được gọi là thiết diện cắt ngang bó nghiệm. Có thể nhận thấy rằng tập
(3.1.2) là compact. Chúng ta có thể đưa ra khái niệm độ đo của tập này như sau:
t ,u 0
0
t,u t 0M M
0
x(t,x ,u)
mesH dx | det | dx
x
∂
= = ∂ ∫ ∫
,
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
26
Ở đây 0
0
x(t,x ,u)det
x
∂
∂
là jacobian của ma trận chuyển đổi, nó có dạng Liuville
sau:
t
0 0
0 0 0
x(t,x ,u) f ( ,x( ,x ,u),u( )det exp sp
x x
∂ ∂
= ∂ ∂ ∫
τ τ τ
, trong đó sp là vết của ma
trận Jacobi
f
x
∂
∂
.
3.1.1.3 Bài toán tối ưu hóa điều khiển bó nghiệm: Giả sử hai hàm số
(t, x),g(x)ϕ lần lượt xác định và liên tục cùng các đạo hàm của chúng trên các tập
D× Q và Q khả tích trên thiết diện cắt ngang bó nghiệm
{ }t ,u t 0 0 0H x x(t,x ,u) |x H= = ∈ . Trên các tập bó nghiệm chúng ta lập một phiếm
hàm:
t ,u t ,u
T
t t T TH H
0
I(u) (t,x )dx dt g(x )dx= +∫ ∫ ∫ϕ (3.1.3)
Bài toán tối ưu hóa điều khiển bó nghiệm là tối thiểu hóa hàm I(u) theo điều
khiển u(t) xác định trên D và nhận giá trị trong U.
Điều khiển u u (t)∗ ∗= để I(u ) min I(u(t))∗ = được gọi là điều khiển tối ưu.
Trong trường hợp (t, x) 0=ϕ bài toán tối ưu chỉ xảy ra trên thiết diện đầu ra của
bó nghiệm, chúng ta gọi đó là điều khiển khu vực (Terminal) bó nghiệm. Quá
trình tối ưu chính là bó nghiệm tối ưu của bài toán trên. Điều khiển chấp nhận được
là điều khiển xác định trên D nhận giá trị trong U.
3.1.1.4 Sự thay đổi bó nghiệm khi có biến phân điều khiển: Chúng ta sẽ gọi
u(t)∆ của điều khiển chấp nhận được u(t) nếu u(t) u(t)∆ + xác định trên D có giá
trị trong U là biến phân của điều khiển.
Trong [11] các tác giả đã đưa ra một số so sánh bó nghiệm. Điều đó khẳng định
tính phụ thuộc liên tục của bó nghiệm vào điều khiển trong trường hợp có biến
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
27
phân u(t)∆ . Trong [13] cũng đưa ra một kết quả về sự phụ thuộc liên tục này(
Xem [13], bổ đề 2.1 trang 14).
Đặt: a. C([0,T])
t [0,T]
u(t) max | u(t) |
∈
= hoặc chỉ đơn giản là u(t) hoặc Cu(t)
b.
T
L[0,T]
0
u(t) u(t) dt= ∫ hoặc chỉ đơn giản là Lu(t)
c.
T
L
0
u u(t) dt∆ = ∆∫
d. uf (t, x,u) f (t, x,u u) f (t, x,u)∆ = + ∆ − (3.1.4)
Từ đó chúng ta có:
Bổ đề 3.1.1: Với mọi 0>ε nhỏ tùy ý, có thể tìm được 0>δ sao cho:
T
L
0
u u(t) dt∆ = ∆ <∫ δ để:
i/ C([0,T])
t [0,T]
x(t) max | x(t) |
∈
∆ = ∆ < ε (3.1.5)
ii/
t
u 0
0
f (s,x(s,x ,u)u(s)) dt , t [0,T]∆ < ∀ ∈∫ ε (3.1.5)
iii/ 0
t C
x(t,x(t,x ,u))
x
∂∆
<
∂
ε (3.1.5)
đối với điểm 0 0x H∈ bất kỳ cho trước.
Chứng minh bổ đề này có thể xem các bổ đề 2.1 - 2.5 tài liệu đã dẫn [12 ].
3.1.2 Điều kiện cần của bài toán điều khiển tối ưu bó nghiệm
3.1.2.1 Bất biến tích phân như là điều kiện cần của bài toán điều khiển tối
ưu bó nghiệm: Xét bài toán điều khiển hệ vi phân
n p
dx f (t, x(t),u(t)), x(t) R ,u(t) R
dt
= ∈ ∈ (3.1.6)
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
28
Với hàm vectơ f (t,x(t),u(t)) mà n px(t) R ,u(t) R∈ ∈ cùng liên tục với các đạo
hàm riêng
2
k k
j i j
f (t,x,u) f (t, x,u)
,
x x x
∂ ∂
∂ ∂ ∂
trên [0,T] Q U× × . T là giá trị cố định, Q là
tập mở trong nR , còn U là tập đóng giới nội trong pR , hàm u(t) xác định trên
D [0,T]= có giá trị trong U.
Trên các tập bó nghiệm chúng ta lập một phiếm hàm:
t ,u t ,u
T
t t T TH H
0
I(u) (t,x )dx dt g(x )dx= +∫ ∫ ∫ϕ (3.1.7)
Tìm điều kiện cần cho bài toán điều khiển tối ưu bó nghiệm (3.1.6)-(3.1.7).
Thiết lập một phương trình đạo hàm riêng cho hàm V(t,x), như sau:
V V f (t,x,u(t)) Vdivf (t,x,u(t)) (t, x,u(t)) 0
t x
∂ ∂
+ + + =
∂ ∂
ϕ (3.1.8)
với điều kiện hữu hạn V(T,x) g(x)= (3.1.9)
Như vậy hàm V(t,x) trở thành hằng trên với mọi t [0,T]∈ . Giả sử phương trình
(3.1.8) với điều kiện (3.1.9) có nghiệm với mỗi điều khiển chấp nhận được u(t).
Ngoài ra chúng ta xét thêm một hàm số:
V(t,x) V(t,x)W(t,x,u) f (t, x,u) V(t,x)divf (t,x,u) (t, x,u)
t x
∂ ∂
= + + +
∂ ∂
ϕ
(3.1.10)
được xây dựng dựa trên hàm V(t,x) lấy tích phân theo bó nghiệm của hệ phương
trình (3.1.6) nói trên, tương ứng với điều khiển chấp nhận được u(t) và xuất phát từ
tập 0H . Chúng ta nhận được kết quả:
t ,u
T
t tH
0
W(t,x ,u(t))dx dt 0=∫ ∫ (3.1.11)
Mặt khác, chúng ta lại có:
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
29
t ,u t ,u t ,u
T T T
t t t t t tH H H
0 0 0
dW(t,x ,u(t))dx dt V(t,x )dx dt (t,x ,u(t))dx dt
dt
= +∫ ∫ ∫ ∫ ∫ ∫ ϕ =
=
0
0 0H
I(u) V(0,x )dx− ∫ (3.1.12).
3.1.2.2 Định lý về điều kiện cần của bài toán điều khiển tối ưu bó
nghiệm:
Định lý 3.1.1. Giả sử u *(t) là điều khiển tối ưu của bài toán điều khiển tối ưu
bó nghiệm (3.1.6)-(3.1.7). Khi đó điều kiện cần là có một hàm số V(t,x) xác định
bởi bài toán Cauchy (3.1.8)-(3.1.9) sao cho hàm W(t,x,u) từ (3.1.10) thỏa mãn:
tW(t,x ,u *(t)) 0= (3.1.13) .
Chứng minh định lý 3.1.1: Giả sử u*(t) là điều khiển tối ưu của bài toán điều khiển
tối ưu bó nghiệm (3.1.6) - (3.1.7). Khi đó với mọi t [0,T]∈ chúng ta có hệ thức:
t ,u t ,u
t t t t t tH Hu U
inf W(t,x ,u(t,x ))dx W(t,x ,u *(t,x ))dx
∈
=∫ ∫ (3.1.14)
trong đó u*(t,x) là điều khiển chấp nhận được.
Nhưng nếu xét một điều khiển khác u(t,x), chúng ta lại có:
t ,u
T
t t tH
0
I(u) I(u*) W(t,x ,u(t,x ))dx dt− = ∫ ∫ (3.1.15).
Với điều khiển này do (3.1.14) ta có I(u) I(u*) 0− ≥ , nghĩa là u*(t) là điều khiển
tối ưu và do đó hàm tW(t,x ,u *(t)) 0= .
3.1.3 Điều kiện đủ của bài toán điều khiển tối ưu bó nghiệm
Định lý 3.1.2. Giả sử u *(t) là điều khiển chấp nhận được thỏa mãn bài toán
Cauchy (3.1.8)-(3.1.9) . Khi đó nếu :
i/ Tồn tại hàm số V(t,x) xác định bởi bài toán Cauchy (3.1.8)-(3.1.9);
ii/ Ứng với hàm V*(t,x) luôn có hàm tW *(t,x ,u(t,x)) 0≥ (3.1.16)
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
30
thì u *(t) là điều khiển tối ưu của bài toán điều khiển tối ưu bó nghiệm (3.1.6)-
(3.1.7).
Chứng minh định lý 3.2.2: Giả sử u(t)% là một điều khiển nữa của bài toán điều
khiển tối ưu bó nghiệm (3.1.6)-(3.1.7). Khi đó chúng ta có:
t ,u
T
t t tH
0
I(u) I(u) W(t,x ,u(t,x ))dx dt− = ∫ ∫% % % % (3.1.17)
Mà theo định nghĩa thì hàm số
V(t,x) V(t,x)W(t,x,u(t)) f (t,x,u(t)) V(t,x)divf (t, x,u(t)) (t,x,u(t))
t x
∂ ∂
= + + +
∂ ∂
% % % %ϕ
(3.1.18)
khả tích theo bó nghiệm xuất phát từ tập 0H tương ứng hàm điều khiển u(t)% . Khi
đó hàm trung gian V(t,x) là nghiệm của phương trình vi phân đạo hàm riêng:
V V f (t,x,u(t)) Vdivf (t,x,u(t)) (t, x,u(t)) 0
t x
∂ ∂
+ + + =
∂ ∂
ϕ
với điều kiện hữu hạn V(T,x) g(x)= . Suy ra (3.1.16)
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
31
§3.2 VỀ BÀI TOÁN MINIMAX CỦA ĐIỀU KHIỂN
TỐI ƯU BÓ NGHIỆM
3.2.1 Đặt bài toán minimax
Giải bài toán điều khiển hệ vi phân
dx f (t,x(t),u(t),v(t))
dt
= (3.2.1)
Với hàm vectơ f (t,x(t),u(t),v(t))
mà 1 2p pn 1 2x(t) Q R ,u(t) D R ,v(t) D R∈ ⊆ ∈ ∈ ∈ ∈ , 1 2U D D= ∪ cùng liên tục với
các đạo hàm riêng
2
k k
j i j
f (t,x,u) f (t, x,u)
,
x x x
∂ ∂
∂ ∂ ∂
trên [0,T] Q U× × . T là giá trị cố
định, Q là tập mở trong nR , còn U là tập đóng giới nội trong pR , hàm u(t) , v(t)
xác định trên [0,T] là các điều khiển.
Trên các tập bó nghiệm chúng ta lập một phiếm hàm mục tiêu:
t ,u ,v t ,u ,v
T
t t T TH H
0
I(u,v) (t, x ,u(t(,v(t))dx dt g(x )dx= +∫ ∫ ∫ϕ (3.2.2)
Trong đó t ,u,vH là thiết diện của bó nghiệm tại thời điểm t [0,T]∈ đi ra từ tập
compact n0H R⊂ tương ứng với các hàm điều khiển
1 2p p
1 2u(t) D R ,v(t) D R∈ ∈ ∈ ∈ . Chúng ta lần lượt xét các bài toán minimax theo
các hàm điều khiển khác nhau nói trên và theo bó nghiệm dưới hai dạng bài toán:
điều kiện cần và điều kiện đủ.
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
32
3.2.1.1 Bài toán minimax theo hàm điều khiển thứ nhất:
Bài toán Minimax theo hàm điều khiển thứ nhất được định nghĩa như sau:
t ,u ,v t ,u ,v1 12 2
T
t t T TH Hu D u Dv D v D 0
min max I(u,v) min max (t,x ,u(t),v(t))dx dt g(x )dxϕ
∈ ∈∈ ∈
= +∫ ∫ ∫
(3.2.3),
3.2.1.2 Bài toán minimax theo hàm điều khiển thứ hai:
Bài toán Minimax theo hàm điều khiển thứ hai được định nghĩa hoàn toàn
tương tự, ta có:
t ,u ,v t ,u ,v1 12 2
T
t t T TH Hu D u Dv D v D 0
max min I(u,v) max min (t,x ,u(t),v(t))dx dt g(x )dxϕ
∈ ∈∈ ∈
= +∫ ∫ ∫
(3.2.4).
3.2.1.3 Bài toán điều khiển tối ưu minimax :
Nếu chúng ta có
1 12 2
0 0
u D u Dv D u D
min max I(u,v) max min I(u,v) I(u ,v )
∈ ∈∈ ∈
= = (3.2.5) thi
điểm 0 0(u ,v ) U∈ được gọi là điểm cân bằng của hàm mục tiêu, hay nó là điều
khiển tốâi ưu của bài toán minimax (3.2.3).
3.2.1.4 Bài toán minimax theo bó nghiệm:
Trên các tập bó nghiệm chúng ta lập một phiếm hàm mục tiêu:
t ,ut R x H
I(u) max max (t,x, (t,x))
∈ ∈
= ϕ ρ (3.2.6)
Với (t, x)ρ thỏa mãn phương trình sau: d (t,x) divf (t,x,u)
dt
= −
ρ ρ (3.2.7)
như là hàm mật độ xác định bởi giá trị trên thiết diện bó nghiệm và giá trị hàm
điều khiển.
3.2.2 Điều kiện cần của bài toán minimax
Theo định nghĩa bài toán minimax thì điều kiện cần của bài toán này, chính là
bài toán tìm điều kiện cần để có điểm cân bằng hàm mục tiêu.
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
33
3.2.2.1 Điều kiện cần để có điểm cân bằng:
Định lý 3.2.1. ( Xem Định lý 9.1 [ ]21 ) Giả sử 0 0(u ,v ) là điều khiển tối ưu của bài
toán minimax (3.2.3), nghĩa là điểm cân bằng của phiếm hàm (3.2.2). Khi đó với
mọi t [0,T]∈ điều kiện cần để có điểm cân bằng là:
0 0t ,u ,v
t t
u U v V H
min max M(t,x , (t,x), (t, x),u,v)dx
∈ ∈
λ ψ∫
=
0 0t ,u ,v
t t
u Uv V H
max min M(t,x , (t,x), (t, x),u,v)dx
∈∈
λ ψ∫
=
0 0t ,u ,v
0 0 0 0 0
t t
H
M (t,x , (t,x), (t, x),u (t), v (t))dx 0λ ψ =∫ (3.2.8)
Với (t,x), (t, x)λ ψ lần lượt là nghiệm của các phương trình vi phân sau:
d divf 0
dt
λ
+ λ − ϕ = (3.2.9)
* *d f divfEdivf 0
dt x x x
ψ ∂ ∂ ∂ϕ
+ + ψ + λ + = ∂ ∂ ∂
(3.2.10)
3.2.2.2 Điều kiện cần của bài toán minimax:
Chúng ta sẽ tìm điểu kiện cần của bài toán dự trên sự tồn tại nghiệm của
phương trình vi phân sau:
z z f zdivf 0
t x
∂ ∂
+ + + =
∂ ∂
ϕ (3.2.11)
Và đặt W(t,x,u,v) = z z f zdivf
t x
∂ ∂
+ + +
∂ ∂
ϕ (3.2.12)
Định lý 3.2.2. ( Xem Định lý 9.2 [ ]21 ) Giả sử 0 0(u ,v ) là điều khiển tối ưu
của bài toán minimax (3.2.3), nghĩa là điểm cân bằng của phiếm hàm (3.2.2), còn
hàm z(t,x) là nghiệm của phương trình (3.2.11) khi 0 0(u ,v ) U∈ là các điều khiển
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
34
tối ưu thỏa mãn điều kiện z(T,x) g(x)= . Khi đó với mọi t [0,T]∈ điều kiện cần
của bài toán là:
0 0t ,u ,v
t t
u U v V H
min max W(t,x ,u,v)dx
∈ ∈
∫ =
0 0t ,u ,v
t t
u Uv V H
max min W(t,x ,u,v)dx
∈∈
∫
=
0 0t ,u ,v
0 0 0
t t
H
W (t,x ,u (t),v (t))dx 0=∫ (3.2.13)
3.2.3 Điều kiện đủ của bài toán minimax
Giả sử các điều khiển u,v là chấp nhận được thuộc hai lớp điều khiển
1 2K ,K , nghĩa là 1 2u u(t,x) K ,v v(t,x) K= ∈ = ∈ , còn Ω là tập tất cả quỹ đạo của
hệ (3.2.1). Chúng ta có định lý về điều kiện đủ của bài toán minimax:
Định lý 3.2.3. ( Xem Định lý 9.3 [ ]21 ) Giả sử:
i/ Hàm z(t,x) là nghiệm của phương trình (3.2.11) khi
0 0 0 01 2u u (t,x) K ,v v (t,x) K= ∈ = ∈
ii/ 0tW(t,x ,u(t, x),v (t,x)) 0≥ (3.2.14)
0tW(t,x ,u (t, x),v(t,x)) 0≥ (3.2.15)
với mọi t [0,T]∈ , 1 2x ,u K ,v K∈Ω ∈ ∈ .
Khi đó 0 0(u ,v ) là điều khiển tối ưu của bài toán minimax (3.2.3), nghĩa là điểm cân
bằng của phiếm hàm (3.2.2).
3.2.4 Ứng dụng
3.2.4.1 Điều khiển mật độ phân bố các hạt cơ bản
Giả sử nR - không gian thực Euclide n - chiều là không gian pha trong đó
hàm (t, x)ρ là phân bố mật độ các hạt vật chất. Chúng ta xem mặt cong S là biên
của tập H với tính chất trơn từng phần. Tại thời điểm 0t [0,T]∈ mật độ (t, x)ρ có
dạng 0 0(t ,x) (x)=ρ ρ .
Tối ưu hóa điều khiển bó dạng mờ
Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống
35
Phiếm hàm
0 0t ,u ,v
H
I(u) g(x) (T,x)dx= ∫ ρ (3.2.16)
sẽ đặc trưng cho phân bố mật độ các hạt vật chất trong không gian pha chứa tập H.
Giải bài toán điều khiển hệ vi phân
n p
dx f (t, x(t),u(t)), x(t) R ,u(t) R
dt
= ∈ ∈ (3.2.17)
Với hàm vectơ f (t,x(t),u(t)) mà n px(t) R ,u(t) R∈ ∈ cùng liên tục với các đạo
hàm riêng
2
k k
j i j
f (t,x,u) f (t, x,u)
,
x x x
∂ ∂
∂ ∂ ∂
trên [0,T] Q U× × . T là giá trị cố định, Q là
tập mở trong nR , còn U là tập đóng giới nội trong pR , hàm u(t) xác định trên
D [0,T]= có giá trị trong U.
3.2.4.2 Bài toán: Giả sử 0H là một tập đóng bị chặn chứa trong tập Q, trong
đó 0 0x(0) x H= ∈ . Như vậy ứng với mỗi hàm điều khiển u(t) tạo ra một họ nghiệm
0x(t) x(t,x ,u)= - đó là một họ nghiệm xuất phát từ 0H mà chúng ta sẽ gọi là bó
nghiệm tương ứng với điều khiển u(t). Còn H là một tập compact có độ đo dương
trong không gian nR và S là mặt trơn từng vùng bao tập H. Hàm mật độ phân bố
(T,x)ρ , hàm khối lượng g(x) các hạt cơ bản. Bài toán tối ưu có thể lấy min của
phiếm hàm :
H
I(u) g(x) (T,x)dx= ∫ ρ (3.2.18)