Điều khiển tối ưu bó dạng mờ

3.1.1.1 Bó nghiệm: Giả sử 0H là một tập đóng bị chặn chứa trong tập Q, trong đó 0 0x(0) x H = ? . Như vậy ứng với mỗi hàm điều khiển u(t) tạo ra một họ nghiệm 0x(t) x(t,x ,u) = - đó là một họ nghiệm xuất phát từ 0H mà chúng ta sẽ gọi là bó nghiệmtương ứng với điều khiển u(t).

pdf11 trang | Chia sẻ: vietpd | Lượt xem: 1656 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Điều khiển tối ưu bó dạng mờ, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 25 Chương III: ĐIỀU KHIỂN TỐI ƯU BÓ DẠNG MỜ §3.1 BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU BÓ 3.1.1 Đặt bài toán Giải bài toán điều khiển hệ vi phân n p dx f (t, x(t),u(t)), x(t) R ,u(t) R dt = ∈ ∈ (3.1.1) Với hàm vectơ f (t,x(t),u(t)) mà n px(t) R ,u(t) R∈ ∈ cùng liên tục với các đạo hàm riêng 2 k k j i j f (t,x,u) f (t, x,u) , x x x ∂ ∂ ∂ ∂ ∂ trên [0,T] Q U× × . T là giá trị cố định, Q là tập mở trong nR , còn U là tập đóng giới nội trong pR , hàm u(t) xác định trên D [0,T]= có giá trị trong U. 3.1.1.1 Bó nghiệm: Giả sử 0H là một tập đóng bị chặn chứa trong tập Q, trong đó 0 0x(0) x H= ∈ . Như vậy ứng với mỗi hàm điều khiển u(t) tạo ra một họ nghiệm 0x(t) x(t,x ,u)= - đó là một họ nghiệm xuất phát từ 0H mà chúng ta sẽ gọi là bó nghiệm tương ứng với điều khiển u(t). 3.1.1.2 Thiết diện cắt ngang bó nghiệm: Giả sử { }t ,u t 0 0 0H x x(t,x ,u) |x H= = ∈ (3.1.2) là ảnh của tập hợp 0H thông qua hệ vi phân (3.1.1) với điều khiển u(t) tại thời điểm t được gọi là thiết diện cắt ngang bó nghiệm. Có thể nhận thấy rằng tập (3.1.2) là compact. Chúng ta có thể đưa ra khái niệm độ đo của tập này như sau: t ,u 0 0 t,u t 0M M 0 x(t,x ,u) mesH dx | det | dx x  ∂ = =  ∂ ∫ ∫ , Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 26 Ở đây 0 0 x(t,x ,u)det x  ∂  ∂  là jacobian của ma trận chuyển đổi, nó có dạng Liuville sau: t 0 0 0 0 0 x(t,x ,u) f ( ,x( ,x ,u),u( )det exp sp x x    ∂ ∂ =   ∂ ∂   ∫ τ τ τ , trong đó sp là vết của ma trận Jacobi f x ∂ ∂ . 3.1.1.3 Bài toán tối ưu hóa điều khiển bó nghiệm: Giả sử hai hàm số (t, x),g(x)ϕ lần lượt xác định và liên tục cùng các đạo hàm của chúng trên các tập D× Q và Q khả tích trên thiết diện cắt ngang bó nghiệm { }t ,u t 0 0 0H x x(t,x ,u) |x H= = ∈ . Trên các tập bó nghiệm chúng ta lập một phiếm hàm: t ,u t ,u T t t T TH H 0 I(u) (t,x )dx dt g(x )dx= +∫ ∫ ∫ϕ (3.1.3) Bài toán tối ưu hóa điều khiển bó nghiệm là tối thiểu hóa hàm I(u) theo điều khiển u(t) xác định trên D và nhận giá trị trong U. Điều khiển u u (t)∗ ∗= để I(u ) min I(u(t))∗ = được gọi là điều khiển tối ưu. Trong trường hợp (t, x) 0=ϕ bài toán tối ưu chỉ xảy ra trên thiết diện đầu ra của bó nghiệm, chúng ta gọi đó là điều khiển khu vực (Terminal) bó nghiệm. Quá trình tối ưu chính là bó nghiệm tối ưu của bài toán trên. Điều khiển chấp nhận được là điều khiển xác định trên D nhận giá trị trong U. 3.1.1.4 Sự thay đổi bó nghiệm khi có biến phân điều khiển: Chúng ta sẽ gọi u(t)∆ của điều khiển chấp nhận được u(t) nếu u(t) u(t)∆ + xác định trên D có giá trị trong U là biến phân của điều khiển. Trong [11] các tác giả đã đưa ra một số so sánh bó nghiệm. Điều đó khẳng định tính phụ thuộc liên tục của bó nghiệm vào điều khiển trong trường hợp có biến Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 27 phân u(t)∆ . Trong [13] cũng đưa ra một kết quả về sự phụ thuộc liên tục này( Xem [13], bổ đề 2.1 trang 14). Đặt: a. C([0,T]) t [0,T] u(t) max | u(t) | ∈ = hoặc chỉ đơn giản là u(t) hoặc Cu(t) b. T L[0,T] 0 u(t) u(t) dt= ∫ hoặc chỉ đơn giản là Lu(t) c. T L 0 u u(t) dt∆ = ∆∫ d. uf (t, x,u) f (t, x,u u) f (t, x,u)∆ = + ∆ − (3.1.4) Từ đó chúng ta có: Bổ đề 3.1.1: Với mọi 0>ε nhỏ tùy ý, có thể tìm được 0>δ sao cho: T L 0 u u(t) dt∆ = ∆ <∫ δ để: i/ C([0,T]) t [0,T] x(t) max | x(t) | ∈ ∆ = ∆ < ε (3.1.5) ii/ t u 0 0 f (s,x(s,x ,u)u(s)) dt , t [0,T]∆ < ∀ ∈∫ ε (3.1.5) iii/ 0 t C x(t,x(t,x ,u)) x ∂∆ < ∂ ε (3.1.5) đối với điểm 0 0x H∈ bất kỳ cho trước. Chứng minh bổ đề này có thể xem các bổ đề 2.1 - 2.5 tài liệu đã dẫn [12 ]. 3.1.2 Điều kiện cần của bài toán điều khiển tối ưu bó nghiệm 3.1.2.1 Bất biến tích phân như là điều kiện cần của bài toán điều khiển tối ưu bó nghiệm: Xét bài toán điều khiển hệ vi phân n p dx f (t, x(t),u(t)), x(t) R ,u(t) R dt = ∈ ∈ (3.1.6) Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 28 Với hàm vectơ f (t,x(t),u(t)) mà n px(t) R ,u(t) R∈ ∈ cùng liên tục với các đạo hàm riêng 2 k k j i j f (t,x,u) f (t, x,u) , x x x ∂ ∂ ∂ ∂ ∂ trên [0,T] Q U× × . T là giá trị cố định, Q là tập mở trong nR , còn U là tập đóng giới nội trong pR , hàm u(t) xác định trên D [0,T]= có giá trị trong U. Trên các tập bó nghiệm chúng ta lập một phiếm hàm: t ,u t ,u T t t T TH H 0 I(u) (t,x )dx dt g(x )dx= +∫ ∫ ∫ϕ (3.1.7) Tìm điều kiện cần cho bài toán điều khiển tối ưu bó nghiệm (3.1.6)-(3.1.7). Thiết lập một phương trình đạo hàm riêng cho hàm V(t,x), như sau: V V f (t,x,u(t)) Vdivf (t,x,u(t)) (t, x,u(t)) 0 t x ∂ ∂ + + + = ∂ ∂ ϕ (3.1.8) với điều kiện hữu hạn V(T,x) g(x)= (3.1.9) Như vậy hàm V(t,x) trở thành hằng trên với mọi t [0,T]∈ . Giả sử phương trình (3.1.8) với điều kiện (3.1.9) có nghiệm với mỗi điều khiển chấp nhận được u(t). Ngoài ra chúng ta xét thêm một hàm số: V(t,x) V(t,x)W(t,x,u) f (t, x,u) V(t,x)divf (t,x,u) (t, x,u) t x ∂ ∂ = + + + ∂ ∂ ϕ (3.1.10) được xây dựng dựa trên hàm V(t,x) lấy tích phân theo bó nghiệm của hệ phương trình (3.1.6) nói trên, tương ứng với điều khiển chấp nhận được u(t) và xuất phát từ tập 0H . Chúng ta nhận được kết quả: t ,u T t tH 0 W(t,x ,u(t))dx dt 0=∫ ∫ (3.1.11) Mặt khác, chúng ta lại có: Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 29 t ,u t ,u t ,u T T T t t t t t tH H H 0 0 0 dW(t,x ,u(t))dx dt V(t,x )dx dt (t,x ,u(t))dx dt dt = +∫ ∫ ∫ ∫ ∫ ∫ ϕ = = 0 0 0H I(u) V(0,x )dx− ∫ (3.1.12). 3.1.2.2 Định lý về điều kiện cần của bài toán điều khiển tối ưu bó nghiệm: Định lý 3.1.1. Giả sử u *(t) là điều khiển tối ưu của bài toán điều khiển tối ưu bó nghiệm (3.1.6)-(3.1.7). Khi đó điều kiện cần là có một hàm số V(t,x) xác định bởi bài toán Cauchy (3.1.8)-(3.1.9) sao cho hàm W(t,x,u) từ (3.1.10) thỏa mãn: tW(t,x ,u *(t)) 0= (3.1.13) . Chứng minh định lý 3.1.1: Giả sử u*(t) là điều khiển tối ưu của bài toán điều khiển tối ưu bó nghiệm (3.1.6) - (3.1.7). Khi đó với mọi t [0,T]∈ chúng ta có hệ thức: t ,u t ,u t t t t t tH Hu U inf W(t,x ,u(t,x ))dx W(t,x ,u *(t,x ))dx ∈ =∫ ∫ (3.1.14) trong đó u*(t,x) là điều khiển chấp nhận được. Nhưng nếu xét một điều khiển khác u(t,x), chúng ta lại có: t ,u T t t tH 0 I(u) I(u*) W(t,x ,u(t,x ))dx dt− = ∫ ∫ (3.1.15). Với điều khiển này do (3.1.14) ta có I(u) I(u*) 0− ≥ , nghĩa là u*(t) là điều khiển tối ưu và do đó hàm tW(t,x ,u *(t)) 0= . 3.1.3 Điều kiện đủ của bài toán điều khiển tối ưu bó nghiệm Định lý 3.1.2. Giả sử u *(t) là điều khiển chấp nhận được thỏa mãn bài toán Cauchy (3.1.8)-(3.1.9) . Khi đó nếu : i/ Tồn tại hàm số V(t,x) xác định bởi bài toán Cauchy (3.1.8)-(3.1.9); ii/ Ứng với hàm V*(t,x) luôn có hàm tW *(t,x ,u(t,x)) 0≥ (3.1.16) Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 30 thì u *(t) là điều khiển tối ưu của bài toán điều khiển tối ưu bó nghiệm (3.1.6)- (3.1.7). Chứng minh định lý 3.2.2: Giả sử u(t)% là một điều khiển nữa của bài toán điều khiển tối ưu bó nghiệm (3.1.6)-(3.1.7). Khi đó chúng ta có: t ,u T t t tH 0 I(u) I(u) W(t,x ,u(t,x ))dx dt− = ∫ ∫% % % % (3.1.17) Mà theo định nghĩa thì hàm số V(t,x) V(t,x)W(t,x,u(t)) f (t,x,u(t)) V(t,x)divf (t, x,u(t)) (t,x,u(t)) t x ∂ ∂ = + + + ∂ ∂ % % % %ϕ (3.1.18) khả tích theo bó nghiệm xuất phát từ tập 0H tương ứng hàm điều khiển u(t)% . Khi đó hàm trung gian V(t,x) là nghiệm của phương trình vi phân đạo hàm riêng: V V f (t,x,u(t)) Vdivf (t,x,u(t)) (t, x,u(t)) 0 t x ∂ ∂ + + + = ∂ ∂ ϕ với điều kiện hữu hạn V(T,x) g(x)= . Suy ra (3.1.16) Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 31 §3.2 VỀ BÀI TOÁN MINIMAX CỦA ĐIỀU KHIỂN TỐI ƯU BÓ NGHIỆM 3.2.1 Đặt bài toán minimax Giải bài toán điều khiển hệ vi phân dx f (t,x(t),u(t),v(t)) dt = (3.2.1) Với hàm vectơ f (t,x(t),u(t),v(t)) mà 1 2p pn 1 2x(t) Q R ,u(t) D R ,v(t) D R∈ ⊆ ∈ ∈ ∈ ∈ , 1 2U D D= ∪ cùng liên tục với các đạo hàm riêng 2 k k j i j f (t,x,u) f (t, x,u) , x x x ∂ ∂ ∂ ∂ ∂ trên [0,T] Q U× × . T là giá trị cố định, Q là tập mở trong nR , còn U là tập đóng giới nội trong pR , hàm u(t) , v(t) xác định trên [0,T] là các điều khiển. Trên các tập bó nghiệm chúng ta lập một phiếm hàm mục tiêu: t ,u ,v t ,u ,v T t t T TH H 0 I(u,v) (t, x ,u(t(,v(t))dx dt g(x )dx= +∫ ∫ ∫ϕ (3.2.2) Trong đó t ,u,vH là thiết diện của bó nghiệm tại thời điểm t [0,T]∈ đi ra từ tập compact n0H R⊂ tương ứng với các hàm điều khiển 1 2p p 1 2u(t) D R ,v(t) D R∈ ∈ ∈ ∈ . Chúng ta lần lượt xét các bài toán minimax theo các hàm điều khiển khác nhau nói trên và theo bó nghiệm dưới hai dạng bài toán: điều kiện cần và điều kiện đủ. Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 32 3.2.1.1 Bài toán minimax theo hàm điều khiển thứ nhất: Bài toán Minimax theo hàm điều khiển thứ nhất được định nghĩa như sau: t ,u ,v t ,u ,v1 12 2 T t t T TH Hu D u Dv D v D 0 min max I(u,v) min max (t,x ,u(t),v(t))dx dt g(x )dxϕ ∈ ∈∈ ∈ = +∫ ∫ ∫ (3.2.3), 3.2.1.2 Bài toán minimax theo hàm điều khiển thứ hai: Bài toán Minimax theo hàm điều khiển thứ hai được định nghĩa hoàn toàn tương tự, ta có: t ,u ,v t ,u ,v1 12 2 T t t T TH Hu D u Dv D v D 0 max min I(u,v) max min (t,x ,u(t),v(t))dx dt g(x )dxϕ ∈ ∈∈ ∈ = +∫ ∫ ∫ (3.2.4). 3.2.1.3 Bài toán điều khiển tối ưu minimax : Nếu chúng ta có 1 12 2 0 0 u D u Dv D u D min max I(u,v) max min I(u,v) I(u ,v ) ∈ ∈∈ ∈ = = (3.2.5) thi điểm 0 0(u ,v ) U∈ được gọi là điểm cân bằng của hàm mục tiêu, hay nó là điều khiển tốâi ưu của bài toán minimax (3.2.3). 3.2.1.4 Bài toán minimax theo bó nghiệm: Trên các tập bó nghiệm chúng ta lập một phiếm hàm mục tiêu: t ,ut R x H I(u) max max (t,x, (t,x)) ∈ ∈ = ϕ ρ (3.2.6) Với (t, x)ρ thỏa mãn phương trình sau: d (t,x) divf (t,x,u) dt = − ρ ρ (3.2.7) như là hàm mật độ xác định bởi giá trị trên thiết diện bó nghiệm và giá trị hàm điều khiển. 3.2.2 Điều kiện cần của bài toán minimax Theo định nghĩa bài toán minimax thì điều kiện cần của bài toán này, chính là bài toán tìm điều kiện cần để có điểm cân bằng hàm mục tiêu. Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 33 3.2.2.1 Điều kiện cần để có điểm cân bằng: Định lý 3.2.1. ( Xem Định lý 9.1 [ ]21 ) Giả sử 0 0(u ,v ) là điều khiển tối ưu của bài toán minimax (3.2.3), nghĩa là điểm cân bằng của phiếm hàm (3.2.2). Khi đó với mọi t [0,T]∈ điều kiện cần để có điểm cân bằng là: 0 0t ,u ,v t t u U v V H min max M(t,x , (t,x), (t, x),u,v)dx ∈ ∈ λ ψ∫ = 0 0t ,u ,v t t u Uv V H max min M(t,x , (t,x), (t, x),u,v)dx ∈∈ λ ψ∫ = 0 0t ,u ,v 0 0 0 0 0 t t H M (t,x , (t,x), (t, x),u (t), v (t))dx 0λ ψ =∫ (3.2.8) Với (t,x), (t, x)λ ψ lần lượt là nghiệm của các phương trình vi phân sau: d divf 0 dt λ + λ − ϕ = (3.2.9) * *d f divfEdivf 0 dt x x x ψ ∂ ∂ ∂ϕ      + + ψ + λ + =     ∂ ∂ ∂      (3.2.10) 3.2.2.2 Điều kiện cần của bài toán minimax: Chúng ta sẽ tìm điểu kiện cần của bài toán dự trên sự tồn tại nghiệm của phương trình vi phân sau: z z f zdivf 0 t x ∂ ∂ + + + = ∂ ∂ ϕ (3.2.11) Và đặt W(t,x,u,v) = z z f zdivf t x ∂ ∂ + + + ∂ ∂ ϕ (3.2.12) Định lý 3.2.2. ( Xem Định lý 9.2 [ ]21 ) Giả sử 0 0(u ,v ) là điều khiển tối ưu của bài toán minimax (3.2.3), nghĩa là điểm cân bằng của phiếm hàm (3.2.2), còn hàm z(t,x) là nghiệm của phương trình (3.2.11) khi 0 0(u ,v ) U∈ là các điều khiển Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 34 tối ưu thỏa mãn điều kiện z(T,x) g(x)= . Khi đó với mọi t [0,T]∈ điều kiện cần của bài toán là: 0 0t ,u ,v t t u U v V H min max W(t,x ,u,v)dx ∈ ∈ ∫ = 0 0t ,u ,v t t u Uv V H max min W(t,x ,u,v)dx ∈∈ ∫ = 0 0t ,u ,v 0 0 0 t t H W (t,x ,u (t),v (t))dx 0=∫ (3.2.13) 3.2.3 Điều kiện đủ của bài toán minimax Giả sử các điều khiển u,v là chấp nhận được thuộc hai lớp điều khiển 1 2K ,K , nghĩa là 1 2u u(t,x) K ,v v(t,x) K= ∈ = ∈ , còn Ω là tập tất cả quỹ đạo của hệ (3.2.1). Chúng ta có định lý về điều kiện đủ của bài toán minimax: Định lý 3.2.3. ( Xem Định lý 9.3 [ ]21 ) Giả sử: i/ Hàm z(t,x) là nghiệm của phương trình (3.2.11) khi 0 0 0 01 2u u (t,x) K ,v v (t,x) K= ∈ = ∈ ii/ 0tW(t,x ,u(t, x),v (t,x)) 0≥ (3.2.14) 0tW(t,x ,u (t, x),v(t,x)) 0≥ (3.2.15) với mọi t [0,T]∈ , 1 2x ,u K ,v K∈Ω ∈ ∈ . Khi đó 0 0(u ,v ) là điều khiển tối ưu của bài toán minimax (3.2.3), nghĩa là điểm cân bằng của phiếm hàm (3.2.2). 3.2.4 Ứng dụng 3.2.4.1 Điều khiển mật độ phân bố các hạt cơ bản Giả sử nR - không gian thực Euclide n - chiều là không gian pha trong đó hàm (t, x)ρ là phân bố mật độ các hạt vật chất. Chúng ta xem mặt cong S là biên của tập H với tính chất trơn từng phần. Tại thời điểm 0t [0,T]∈ mật độ (t, x)ρ có dạng 0 0(t ,x) (x)=ρ ρ . Tối ưu hóa điều khiển bó dạng mờ Luận văn thạc sĩ – Ngành toán tối ưu và hệ thống 35 Phiếm hàm 0 0t ,u ,v H I(u) g(x) (T,x)dx= ∫ ρ (3.2.16) sẽ đặc trưng cho phân bố mật độ các hạt vật chất trong không gian pha chứa tập H. Giải bài toán điều khiển hệ vi phân n p dx f (t, x(t),u(t)), x(t) R ,u(t) R dt = ∈ ∈ (3.2.17) Với hàm vectơ f (t,x(t),u(t)) mà n px(t) R ,u(t) R∈ ∈ cùng liên tục với các đạo hàm riêng 2 k k j i j f (t,x,u) f (t, x,u) , x x x ∂ ∂ ∂ ∂ ∂ trên [0,T] Q U× × . T là giá trị cố định, Q là tập mở trong nR , còn U là tập đóng giới nội trong pR , hàm u(t) xác định trên D [0,T]= có giá trị trong U. 3.2.4.2 Bài toán: Giả sử 0H là một tập đóng bị chặn chứa trong tập Q, trong đó 0 0x(0) x H= ∈ . Như vậy ứng với mỗi hàm điều khiển u(t) tạo ra một họ nghiệm 0x(t) x(t,x ,u)= - đó là một họ nghiệm xuất phát từ 0H mà chúng ta sẽ gọi là bó nghiệm tương ứng với điều khiển u(t). Còn H là một tập compact có độ đo dương trong không gian nR và S là mặt trơn từng vùng bao tập H. Hàm mật độ phân bố (T,x)ρ , hàm khối lượng g(x) các hạt cơ bản. Bài toán tối ưu có thể lấy min của phiếm hàm : H I(u) g(x) (T,x)dx= ∫ ρ (3.2.18)