Mạng neuron, logicmờ và hệ thống suy diễn neuro-Fuzzy

Chương 2 trình bày công cụ toán học sẽ được sử dụng ở chương 3 trong nhận dạng và dự báo khuyết tật của cơ hệ, đó là hệ thống suy diễn neuro-fuzzy, m ột mô hình kết hợp giữa mạng ANNvàFL. Phần đầu chương trình bày tóm t ắt lý thuyết chung về ANN và FL. Tiếp theo và phần cuốichương trình bàycác thuật toán mới về huấn luyện mạng ANN và về tổng hợp hệ thống suy diễn neuro-fuzzy thích nghi , với tiêu chí đặt ra làgia tăng tốc độ hội tụ và tăng độ chính xác đáp ứng so với các phiên bản cùng loại đã được công bố gần đây.

pdf50 trang | Chia sẻ: vietpd | Lượt xem: 1912 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Mạng neuron, logicmờ và hệ thống suy diễn neuro-Fuzzy, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
21 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng Chương 2 MẠNG NEURON, LOGIC MỜ VÀ HỆ THỐNG SUY DIỄN NEURO-FUZZY Chương 2 trình bày công cụ toán học sẽ được sử dụng ở chương 3 trong nhận dạng và dự báo khuyết tật của cơ hệ, đó là hệ thống suy diễn neuro-fuzzy, một mô hình kết hợp giữa mạng ANN và FL. Phần đầu chương trình bày tóm tắt lý thuyết chung về ANN và FL. Tiếp theo và phần cuối chương trình bày các thuật toán mới về huấn luyện mạng ANN và về tổng hợp hệ thống suy diễn neuro-fuzzy thích nghi, với tiêu chí đặt ra là gia tăng tốc độ hội tụ và tăng độ chính xác đáp ứng so với các phiên bản cùng loại đã được công bố gần đây. Các thuật toán mới được trình bày trong chương 2 gồm TT* [1], CBMM, HLM [2] và CSHL, HLM1, HLM2 [9] – đây là các đóng góp khoa học của luận án trong chương 2. Một số đặc điểm của các thuật toán nêu trên như sau: - TT* là thuật toán huấn luyện mạng ANN dựa trên phương pháp CG, trong đó hiệu chỉnh bước di chuyển trên các hướng liên hợp và tính gần đúng ma trận Hessian là những giải pháp được đưa ra nhằm gia tăng độ chính xác, tốc độ hội tụ và tính ổn định trong quá trình huấn luyện mạng. - CBMM và CSHL là hai thuật toán về phân chia không gian dữ liệu để xây dựng các bó mờ dạng siêu hộp, làm cơ sở để xác lập các tập mờ và các hàm liên thuộc trong hệ thống suy diễn mờ. Đối với thuật toán CBMM, việc chia bó dữ liệu min-max được thực hiện trong mối liên hệ qua lại giữa không gian vào và không gian ra nhằm mục đích xác lập mối ràng buộc chặt chẽ giữa các tập mờ ở hai không gian vào-ra, phản ánh tốt hơn quan hệ dữ liệu trong tập mẫu. Đối với thuật toán CSHL, hàm thuần chủng j và hàm định hướng j được tác giả luận án đề xuất nhằm mục đích thực hiện việc chọn lựa các giải pháp cắt tạo ra các bó dữ liệu có độ thuần chủng cao hơn, làm gia tăng độ chính xác và rút ngắn thời gian xây dựng các tập mờ của hệ mờ. 22 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng - HLM1, HLM2 và HLM là ba thuật toán được dùng để tổng hợp hệ thống suy diễn neuro- fuzzy thích nghi xấp xỉ hàm chưa biết ( )y f x diễn tả mối quan hệ giữa tín hiệu vào và tín hiệu ra của đối tượng thông qua một tập dữ liệu số. Đây là những công cụ toán học cho các bài toán nhận dạng, dự báo, đo lường và điều khiển theo mô hình hộp xám và hộp đen. Hệ thống suy diễn neuro- fuzzy được tổng hợp gồm ba khối: khối mờ hóa, khối hợp thành và khối giải mờ. Cả ba thuật toán HLM1, HLM2 và HLM đều sử dụng các thuật toán CBMM và CSHL để xây dựng các bó mờ, xác lập khối mờ hóa. Tuy nhiên, khác với HLM1, thuật toán HLM2 và HLM có những hướng phát triển riêng nhằm gia tăng độ chính xác của hệ thống suy diễn neuro-fuzzy. Thuật toán HLM2 quan tâm tới việc tối ưu hóa biên dạng hàm liên thuộc của các tập mờ thuộc khối mờ hóa và khối giải mờ. Theo một hướng đi khác, HLM lại quan tâm tới việc xác định số luật mờ tối ưu của hệ thống suy diễn neuro-fuzzy, nghĩa là tối ưu hóa cấu trúc của khối hợp thành. Hiệu quả của từng giải pháp sẽ được kiểm chứng ở chương 4. Đặc điểm và phạm vi ứng dụng của từng thuật toán nêu trên sẽ được trình bày chi tiết trong chương 5. 2.1 MÔ HÌNH TOÁN CỦA CƠ HỆ 2.1.1 Khái niệm Để có thể tác động vào đối tượng một cách có hiệu quả ta cần phải biết mô hình toán của đối tượng. Đối với các đối tượng có các quá trình diễn ra bên trong có thể xác định đầy đủ và tường minh bằng các phương trình toán học thì quá trình xây dựng mô hình toán của đối tượng được gọi là mô hình hóa hệ thống, và mô hình toán nhận được còn được gọi là mô hình hộp trắng. Trong nhiều trường hợp các quá trình tự nhiên diễn ra bên trong chưa thể xác định hoặc xác định chưa đầy đủ thì việc xây dựng mô hình toán của đối tượng thường được dựa vào dữ liệu vào-ra thực nghiệm và những thông tin chưa đầy đủ về đối tượng. Cách này được gọi là nhận dạng hệ thống. Thông tin biết trước có thể là những hiểu biết không đầy đủ về các quy luật vật lý, hóa học, cơ học… hoặc là các phát biểu ngôn ngữ mô tả đặc tính của đối tượng. Tùy theo mức độ thông tin biết trước được sử dụng mà ta có mô hình hộp xám (grey-box) hoặc mô hình hộp đen (black-box). Trong bài toán xác định sự tồn tại khuyết tật, định vị và dự báo khả năng tải của cơ hệ theo hướng dựa vào đặc trưng ứng xử động lực học cơ hệ, khi mà khuyết tật xuất hiện bên trong làm thay đổi độ cứng chống biến dạng xJE nhưng chưa biết vị trí và mức độ suy giảm thì việc xây dựng mô 23 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng hình toán của đối tượng phải dựa vào dữ liệu vào-ra thực nghiệm và những thông tin chưa đầy đủ về đối tượng, nghĩa là thực hiện nhận dạng hệ thống theo mô hình hộp đen. L Hình 2.1 Dầm dao động cưỡng bức Xét ví dụ về nhận dạng quan hệ động lực học của một dầm kim loại dao động cưỡng bức có sơ đồ như trên hình 2.1. Động cơ điện xoay chiều ba pha Đ mang khối lượng m cách tâm quay một khoảng d. Đ có thể được lắp đặt tại những tọa độ 0z khác nhau trên dầm. Sử dụng bộ biến tần để thay đổi tốc độ quay n0 của động cơ. Thay đổi d để điều chỉnh độ lệch tâm. Như vậy, độ lệch tâm md, tốc độ quay n0, và tọa độ lắp đặt động cơ 0z là những đại lượng có thể điều chỉnh được, phản ánh sự thay đổi chế độ kích thích dao động cưỡng bức của dầm (CĐKT). Xét biên độ dao động Y tại một điểm trên dầm. Ứng với CĐKT thứ i, ])[( 00 iiii znmdx  , biên độ dao động tại điểm khảo sát sẽ là yi=Yi. Như vậy, nếu thay đổi P CĐKT ta sẽ nhận được tập dữ liệu T có P mẫu dữ liệu Piyx ii ...1),,(  , phản ánh quan hệ input-output của hệ, là quan hệ giữa chế độ kích thích dao động và biên độ dao động của cơ hệ. Vấn đề đặt ra ở đây là xây dựng mô hình toán học của dầm khi dao động. Trong trường hợp lý tưởng, khi mà đặc trưng hình học và cơ học của dầm hoàn toàn xác định thì lời giải của bài toán này khá đơn giản và đã được trình bày trong nhiều tài liệu chuyên ngành. Mô hình toán nhận được, trong trường hợp này, là mô hình hộp trắng. Tuy nhiên nếu dầm là một dầm cầu trên một hệ thống cầu giao thông đang được khai thác thì ở một vị trí bất kỳ trên dầm, tại thời điểm khảo sát, tiết diện ngang của dầm lại là đại lượng chưa biết do có thể tại đó đang tồn tại khuyết tật làm thay đổi đặc trưng hình học; cũng vậy, tính chất cơ học của vật liệu tại đó cũng là đại lượng chưa biết do tác động của môi trường, do ảnh hưởng của chế độ tải trọng cũng như do hiện tượng mỏi của vật liệu. Chính vì vậy mà trong trường hợp này bài toán nhận dạng động lực học cơ hệ cần được giải theo mô hình hộp đen thông qua tập dữ liệu số T .    0z Y  m d Đ n0 24 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng Mạng ANN, FL, hoặc các mô hình kết hợp giữa ANN và FL, ví dụ mạng neuro-fuzzy, là những công cụ hữu dụng trong nhận dạng động lực học cơ hệ theo mô hình hộp đen [7-8][19][22] [55][58][119][136]. Hướng ứng dụng này được trình bày tóm tắt trong các mục 2.1.2 tới 2.1.4. 2.1.2 Sử dụng mạng ANN Thông qua tập dữ liệu đáp ứng động lực học T ta có thể sử dụng ANN để nhận dạng cơ hệ theo mô hình hộp đen, làm cơ sở để xây dựng và giải bài toán thuận và bài toán ngược động lực học cơ hệ, là hai dạng bài toán cơ bản liên quan tới rất nhiều thuật toán xác định khuyết tật cơ hệ (sẽ được trình bày ở chương 3). Mặt khác, thông qua khả năng nhận dạng và khả năng nội suy, mạng ANN có thể dự báo các thông số cơ học của cơ hệ theo chuỗi thời gian, làm cơ sở để xây dựng các thuật toán dự báo mức độ suy giảm khả năng tải của hệ. Sau khi chọn cấu trúc của mạng, tiến trình học giám sát để cập nhật ma trận trọng số của mạng, hay còn được gọi là quá trình huấn luyện mạng ANN (hình 2.2), là bước không thể thiếu theo hướng ứng dụng này. Mức độ tiệm cận của tín hiệu ra của mạng yˆ theo tín hiệu ra khảo sát y trong T phản ánh mức độ hoàn hảo của bộ nhận dạng hệ thống. Hình 2.2 Sơ đồ huấn luyện ANN trong học giám sát. Tín hiệu vào và tín hiệu ra của mạng ix , ˆ ( )iy W , i=1…P; tín hiệu ra tương ứng của đối tượng yi, 2.1.3 Sử dụng hệ thống suy diễn mờ Quá trình xây dựng bộ nhận dạng mờ thông qua T là quá trình lặp, theo đó các thông số của bộ mờ được điều chỉnh và đánh giá liên tục thông qua các chuẩn định lượng, chẳng hạn chuẩn LMS. Hình 2.3 giới thiệu cấu trúc của bộ nhận dạng mờ và quy trình xây dựng hệ mờ. Huấn luyện bộ nhận dạng mờ nhận dạng hệ thống là một quá trình điều chỉnh cả cấu trúc lẫn thông số của bộ mờ trong các khối mờ hóa, khối hợp thành và khối giải mờ, như trên hình 2.3 sao Mạng Neuron (Trọng số kết nối W) ˆ( )i i ie W y y  Điều chỉnh trọng số ix ˆiy yi 25 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng cho tín hiệu ra của hệ mờ phải tiệm cận tới tín hiệu ra trong tập dữ liệu thực nghiệm T được sử dụng để huấn luyện. Mức độ hoàn hảo của hệ mờ có thể được đánh giá thông qua hàm sai số được tính theo LMS: min)'(1)( 1 2    P i ii yyP fuzzyE (2.1) x0 Điều chỉnh Hình 2.3 Cấu trúc của bộ nhận dạng mờ và quy trình xây dựng bộ nhận dạng mờ 2.1.4 Sử dụng mô hình kết hợp Việc kết hợp giữa ANN và FL sẽ nhận được các hệ thống tích hợp được gọi là mạng neuro-fuzzy, hoặc mạng fuzzy-neuron mang ưu điểm của mạng ANN và ưu điểm của FL. Mô hình kết hợp đem khả năng học, nhớ và tính toán của ANN vào hệ mờ và khả năng suy diễn theo kiểu của con người trên hệ mờ vào ANN. Kết quả là mô hình kết hợp ưu việt hơn so với hệ ANN và FL thuần túy. Do đó rất nhiều nghiên cứu đi theo hướng ứng dụng các mô hình này trong các bài toán nhận dạng, dự báo, đo lường và điều khiển. Trong luận án này chúng tôi đề cập tới ứng dụng hệ thống neuro-fuzzy trong bài toán cơ học – nhận dạng và dự báo khuyết tật trên phần tử dầm – sẽ được trình bày chi tiết trong chương 3, chương 4 và chương 5. BỘ NHẬN DẠNG MỜ B Mờ hóa (Fuzzy hóa) Thiết bị hợp thành (R1 NẾU…THÌ… … RM NẾU…THÌ…) Giải mờ  B’ )( T xi )( Tyi - +  i y ' 26 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng 2.2 MẠNG ANN 2.2.1 Sơ lược về ANN Mạng ANN được giới thiệu lần đầu tiên vào năm 1943 bởi Warren McCulloch và Walter Pits, là một mô hình mô phỏng cách tổ chức và phương thức xử lý thông tin của hệ thần kinh con người. Hình 2.4 Mô hình một neuron sinh học Hệ thần kinh của con người có khoảng 1011 đến 1014 neuron được cấu trúc trong nhiều lớp. Mỗi neuron được xem như một đơn vị xử lý. Cấu trúc một neuron sinh học gồm các ngõ vào dendrites, thân neuron body, và các ngõ ra axon như trên hình 2.4. Thân neuron tổng hợp tất cả các thông tin từ các ngõ vào dendrites, xử lý và ra quyết định ở các ngõ ra axon. Synapses cho phép kết nối tín hiệu giữa các ngõ ra của các neuron này với ngõ vào của các neuron khác. Tín hiệu truyền đi là tín hiệu điện áp. Lượng tín hiệu qua synapses được gọi là cường độ kết nối. Mô hình toán của một neuron nhân tạo, theo đề xuất của McCulloch và Pitts, như trên hình 2.5, trong đó, , 1... ,ijx j n và iy là các ngõ vào (input) và ngõ ra (output) của neuron thứ i; ib là ngưỡng; trọng số jiw là cường độ kết nối đơn vị thứ j tới đơn vị thứ i; ma trận iW chứa tất cả các jiw của neuron thứ i và được gọi là ma trận trọng số của neuron này. Tín hiệu ra được tính:  i i i iy f W x b  trong đó, 1 2[ ... ], 1... ,i i i inx x x x i P  là vector mẫu dữ liệu ở không gian dữ liệu vào thứ i; P là số mẫu dữ liệu trong tập dữ liệu; n là số chiều của không gian dữ liệu vào; (.)f là hàm tác động. Synapses Synapses Dendrites Neuron body Axon 27 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng Hình 2.5 Mô hình toán của một neuron nhân tạo Mô hình toán tổng quát của mỗi đơn vị xử lý mạng, có sơ đồ khối như trên hình 2.5, được trình bày trên hình 2.6. Trong đó, kết hợp các ngõ vào của mỗi đơn vị xử lý 1 2[ ... ],i i i inx x x x 1... ,i P là một hàm tổng hợp (thường là hàm tuyến tính, chẳng hạn hàm SUM,  ) có tác dụng như một đơn vị tổ hợp thông tin; kết hợp với ngõ ra y của mỗi đơn vị xử lý là hàm tác động, có chức năng tạo tín hiệu ra cho đơn vị khi đã nhận được tín hiệu vào. Hàm tác động (.)if của mỗi đơn vị, còn được gọi hàm truyền. Hàm tổng hợp Thông thường hàm SUM được chọn làm hàm tổng hợp: 1 n i i ji ij j u b w x    Hàm tác động Yêu cầu của hàm tác động là hàm bị chặn trên và chặn dưới, có tính đơn điệu liên tục. Thường người ta chọn các hàm sau làm hàm tác động: yi Neuron body xi2 w2i xin wni … ANNi ib 1 2[ ... ] i i i ni W w w w Hình 2.6 Mô hình toán của neuron nhiều ngõ vào iu iy ( ) ( )i i i i iy f u f W x b      1 ii i ij in Wx x x x   xi1 w1i i (.)if ib 28 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng 1/ Hàm bậc thang đơn vị: 1 0 ( ) 0 0 if u f u if u     (2.2a) 2/ Hàm Ramp: 1 ( ) 0 if u a f u u if a u a if u a         (2.2b) 3/ Hàm sigmoid: 1( ) 1; 0 1 u f u e       (2.2c) 4/ Hàm hyperbolic tangent: ( ) u u u u e ef u e e      (2.2d) Cấu trúc ANN Có rất nhiều mô hình ANN khác nhau, trong đó hai mô hình kết nối mạng thường được sử dụng là mô hình kết nối truyền thẳng và mô hình kết nối lan truyền ngược. Mạng sử dụng mô hình truyền thẳng được gọi là mạng truyền thẳng. Mạng sử dụng mô hình kết nối lan truyền ngược được gọi là mạng lan truyền ngược, hay còn được gọi là mạng hồi quy. - Mạng truyền thẳng nhiều lớp có cấu trúc gồm một lớp vào, một hoặc nhiều lớp ẩn và một lớp ra. Lớp vào đóng vai trò như nơi nhận tín hiệu vào từ không gian dữ liệu vào. Các lớp ẩn chứa các đơn vị ẩn, đóng vai trò như các đơn vị xử lý. Lớp ra chứa các đơn vị tạo tín hiệu ra cho mạng. Tín hiệu truyền từ lớp vào qua các lớp ẩn, tới lớp ra thông qua các trọng số liên kết của mạng. - Mạng hồi quy có mô hình kết nối lan truyền ngược. Lớp vào của mạng đóng vai trò như nơi nhận tín hiệu vào và tín hiệu hồi tiếp. Lớp ra của mạng đóng vai trò tạo tín hiệu ra cho mạng. Lớp ẩn đóng vai trò là tập các đơn vị xứ lý thông tin. Ngõ ra của các đơn vị ẩn và các đơn vị ra có thể được lan truyền ngược về các đơn vị ở lớp trước hoặc cùng lớp và mỗi đơn vị ẩn cũng có thể tự tạo ra một vòng khép kín. Mạng hồi quy cũng có thể có một lớp, hai lớp, hoặc nhiều lớp. Một số phương pháp học của ANN Học là tiến trình quan trọng của con người, nhờ học mà bộ não ngày càng tích lũy những kinh nghiệm để thích nghi với môi trường và xử lý tình huống tốt hơn. Mạng ANN được xây dựng dựa 29 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng vào cấu trúc và cách xử lý thông tin của bộ não người, do đó ANN cần phải có năng lực ứng xử được tích lũy thông qua tiến trình học. Có hai hình thức học: học thông số và học cấu trúc. Học thông số là quá trình học dùng để cập nhật trọng số kết nối của mạng. Học cấu trúc là hình thức học quan tâm tới việc thay đổi cấu trúc của mạng, bao hàm số các đơn vị xử lý trong một lớp, số lớp và loại kết nối giữa các đơn vị xử lý. Hai hình thức học này có thể tách rời hoặc thực hiện đồng thời. Việc định hướng cho tiến trình huấn luyện ANN được dựa vào các luật học. Có ba nhóm luật học cơ bản thường được sử dụng, đó là học giám sát, học củng cố và học không giám sát. - Học giám sát Mạng được cung cấp các cặp vào ra tương ứng tại mỗi thời điểm, nghĩa là cho ANN biết rằng giá trị ra chính xác cần phải tiệm cận tới của mạng. Nếu tín hiệu ra mong muốn là yi thì tín hiệu học là ei, chính là giá trị sai lệch giữa tín hiệu ra mong muốn yi và tín hiệu ra thực sự của đơn vị xử lý này ˆiy , ˆi i ie y y  . - Học củng cố Học củng cố là một hình thức của học giám sát, tuy nhiên tín hiệu ra của mạng là tín hiệu chỉ trích để cho ANN biết rằng tín hiệu ra của nó đúng hay sai. Nếu tín hiệu chỉ trích là yi thì tín hiệu học cũng chính là tín hiệu này. - Học không giám sát Theo phương pháp này, mạng ANN được cung cấp các mẫu vào nhưng không được cung các mẫu ra mong muốn, do đó ANN sẽ tự khám phá với các mẫu vào mong muốn để tìm cho nó ngõ ra thích hợp. Nghĩa là, tín hiệu học là ngõ ra thực sự của từng đơn vị xử lý vào của mạng. 2.2.2 Đặc điểm của ANN - ANN có cấu trúc mạng đơn giản. - Có khả năng thích nghi cao khi tập mẫu ( , ), 1...i ix y i P được cập nhật thường xuyên. Khác với các cách tiếp cận truyền thống (nội suy, ngoại suy), là giả thuyết mô hình hay một hàm tường minh thể hiện mối liên hệ giữa các biến vào ra, ANN tích lũy các tri thức mạng thông qua ma trận trọng số liên kết W của mạng, thông qua các thông số về cấu trúc mạng và thông qua các ngưỡng kích hoạt tại chính các neuron. Tất cả các yếu tố này dễ dàng thay đổi để chỉnh định, bổ sung hoặc cập nhật thông qua quá trình huấn luyện mạng, huấn luyện lại hoặc quá trình tự học. - Có tính phi tuyến cao. - Phù hợp với các bài toán nhận dạng, dự báo, điều khiển... theo mô hình black-box. 30 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng Các ưu điểm trên càng được gia tăng khi kết hợp giữa kỹ thuật neuron và fuzzy logic để xây dựng mô hình neuro-fuzzy hoặc fuzzy-neuron. 2.2.3 Huấn luyện ANN Luận án đề cập tới các kỹ thuật về huấn luyện thông số theo luật học giám sát – khi đã chọn trước một cấu trúc ANN cho một đối tượng – dựa trên tập mẫu huấn luyện thể hiện mối quan hệ về dữ liệu giữa input và output của đối tượng này. Do đó, từ mục này về sau thuật ngữ huấn luyện mạng ANN được hiểu theo nghĩa hẹp, là huấn luyện thông số theo luật học giám sát. Trong học giám sát, các cặp tín hiệu input-output được dùng để huấn luyện mạng sao cho tín hiệu ra của mạng tiệm cận tới tín hiệu ra mong muốn của hệ thống. Nghĩa là trong suốt quá trình học, giá trị đầu vào của các mẫu dữ liệu huấn luyện mạng được đưa vào mạng và theo dòng chảy lan tỏa dữ liệu trong mạng tạo thành các giá trị tín hiệu ra của mạng. Tiếp đến là quá trình so sánh giá trị tạo ra bởi mạng neuron với giá trị ra mong muốn. Hai giá trị này giống nhau là trường hợp lý tưởng, khi đó quá trình huấn luyện kết thúc. Nếu sai lệch giữa hai giá trị này vẫn vượt quá giá trị sai số mong muốn thì tiếp tục quá trình huấn luyện để thay đổi ma trận trọng số kết nối W. Huấn luyện mạng là một quá trình lặp liên tục và có thể không dừng khi không tìm được các giá trị W sao cho đầu ra tạo bởi mạng neuron bằng đúng đầu ra mong muốn. Do đó trong thực tế ta phải thiết lập tiêu chuẩn dừng dựa trên giá trị sai số cho phép của hai giá trị này, hoặc dựa trên số lần lặp xác định. Sai số dự báo ứng với một mẫu dữ liệu huấn luyện mạng là giá trị sai lệch giữa tín hiệu ra mong muốn và tín hiệu ra của mạng ˆ( ) ( )i i ie W y W y  . Bộ trọng số của mạng nhận được sau huấn luyện là ma trận W làm tối thiểu tiêu chuẩn ước lượng: 1 1( ) ( ( )) min P r i i E W l e W P    trong đó, P là số mẫu dữ liệu huấn luyện; l(.) là chuẩn xác định dương, ở nghiên cứu này sử dụng chuẩn L2. Có nhiều thuật toán huấn luyện ANN được xây dựng dựa trên cực tiểu hoá khai triển Taylor hàm sai lệch tín hiệu ra. Có thể phân làm ba nhóm chính: nhóm các phương pháp Gradient Descent, nhóm các phương pháp Conjugate Gradient và nhóm các phương pháp Newton. Các phương pháp tối ưu thường được sử dụng để tìm giá trị cực tiểu của hàm sai số dạng khai triển Taylor tới vi phân bậc nhất hoặc bậc hai [18][26][84[103][111]. 31 Luận án Tiến sĩ Kỹ thuật Nguyễn Sỹ Dũng 2.2.4 Thiết kế ANN Quá trình thiết kế mạng ANN thường được thực hiện theo các bước sau: Bước 1. Xác định các biến vào ra của mạng Bước 2. Thu thập dữ liệu Một số yêu cầu đối với tập dữ liệu: - Đủ lớn và phải đảm bảo nguyên tắc ngẫu nhiên, khách quan và phủ toàn bộ không gian đầu vào. - Đối với các dữ liệu biến động kiểu chuỗi thời gian thì cần đảm bảo trình tự các sự kiện sao cho tạo ra những thông tin cốt lõi về đối tượng. - Đối với các dữ liệu ngẫu nhiên hoàn toàn độc lập với nhau thì phải đảm bảo đã “vét hết” các dạng cần thiết. Phân dữ liệu thành hai tập con, tập mẫu học (training set) và tập mẫu kiểm tra (test set), sao cho tập mẫu học mang tính đại diện còn tập kiểm tra mang