Đề tài Dự báo tốc độ tăng trưởng kinh tế Việt Nam: Sự vượt trội của mô hình Mạng thần kinh nhân tạo (ANN) so với mô hình Hồi quy tuyến tính truyền thống

Tốc độ tăng trưởng Tổng sản phẩm quốc nội (Gross Domestic Product - GDP) là một chỉ số kinh tế có ý nghĩa rất quan trọng đối với các nhà điều hành kinh tế và các doanh nghiệp trong việc xem xét mức tăng trưởng của nền kinh tế, là tiền đề hỗ trợ cho các quyết định về chính sách, chiến lược cho một giai đoạn trong tương lai. Vì các thông tin về tốc độ tăng trưởng GDP được công bố ra công chúng có một độ trễ nhất định nên vấn đề cấp thiết hiện nay là cần có một mô hình dự báo tốc độ tăng trưởng GDP có hiệu quả. Do vậy, các công trình hướng đến việc xây dựng mô hình dự báo các biến số vĩ mô, đặc biệt là tốc độ tăng trưởng GDP luôn nhận được sự quan tâm của nhiều nhà nghiên cứu trong và ngoài nước. Những năm gần đây, mô hình Mạng thần kinh nhân tạo (Artificial Neural Network – ANN) được mô phỏng theo cách thức tổ chức và vận hành của bộ não con người, với các ưu điểm vượt trội trong việc xác định và dự báo một cách chính xác các biến số kinh tế có quan hệ phi tuyến đã được các nhà kinh tế học tập trung nghiên cứu và ứng dụng rộng rãi. Tuy nhiên, ở thời điểm hiện tại việc ứng dụng mô hình Mạng thần kinh nhân tạo cho việc dự báo các biến số kinh tế ở Việt Nam vẫn chưa phổ biến. Từ các lý do trên, nhóm nghiên cứu đã thực hiện đề tài: “Dự báo tốc độ tăng trưởng kinh tế Việt Nam: Sự vượt trội của mô hình Mạng thần kinh nhân tạo (ANN) so với mô hình Hồi quy tuyến tính truyền thống”.

pdf109 trang | Chia sẻ: oanhnt | Lượt xem: 1737 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Đề tài Dự báo tốc độ tăng trưởng kinh tế Việt Nam: Sự vượt trội của mô hình Mạng thần kinh nhân tạo (ANN) so với mô hình Hồi quy tuyến tính truyền thống, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ TP. HỒ CHÍ MINH  CÔNG TRÌNH DỰ THI GIẢI THƢỞNG NGHIÊN CỨU KHOA HỌC SINH VIÊN “NHÀ KINH TẾ TRẺ – NĂM 2011” Thuộc nhóm ngành : KHOA HỌC KINH TẾ Tp. Hồ Chí Minh, tháng 06/2011 TÓM TẮT ĐỀ TÀI 1. Lý do chọn đề tài Tốc độ tăng trưởng Tổng sản phẩm quốc nội (Gross Domestic Product - GDP) là một chỉ số kinh tế có ý nghĩa rất quan trọng đối với các nhà điều hành kinh tế và các doanh nghiệp trong việc xem xét mức tăng trưởng của nền kinh tế, là tiền đề hỗ trợ cho các quyết định về chính sách, chiến lược cho một giai đoạn trong tương lai. Vì các thông tin về tốc độ tăng trưởng GDP được công bố ra công chúng có một độ trễ nhất định nên vấn đề cấp thiết hiện nay là cần có một mô hình dự báo tốc độ tăng trưởng GDP có hiệu quả. Do vậy, các công trình hướng đến việc xây dựng mô hình dự báo các biến số vĩ mô, đặc biệt là tốc độ tăng trưởng GDP luôn nhận được sự quan tâm của nhiều nhà nghiên cứu trong và ngoài nước. Những năm gần đây, mô hình Mạng thần kinh nhân tạo (Artificial Neural Network – ANN) được mô phỏng theo cách thức tổ chức và vận hành của bộ não con người, với các ưu điểm vượt trội trong việc xác định và dự báo một cách chính xác các biến số kinh tế có quan hệ phi tuyến đã được các nhà kinh tế học tập trung nghiên cứu và ứng dụng rộng rãi. Tuy nhiên, ở thời điểm hiện tại việc ứng dụng mô hình Mạng thần kinh nhân tạo cho việc dự báo các biến số kinh tế ở Việt Nam vẫn chưa phổ biến. Từ các lý do trên, nhóm nghiên cứu đã thực hiện đề tài: “Dự báo tốc độ tăng trưởng kinh tế Việt Nam: Sự vượt trội của mô hình Mạng thần kinh nhân tạo (ANN) so với mô hình Hồi quy tuyến tính truyền thống”. 2. Mục tiêu nghiên cứu Để tiến hành nghiên cứu việc xây dựng và kiểm chứng khả năng dự báo của mô hình Mạng thần kinh nhân tạo, bài nghiên cứu đã đặt ra các vấn đề cần giải quyết trong suốt quá trình nghiên cứu: Thứ nhất, mô hình Mạng thần kinh nhân tạo là gì ?, cơ chế hoạt động như thế nào ? Thứ hai, những ưu điểm, khuyết điểm và các vấn đề vẫn chưa được giải quyết từ các công trình nghiên cứu trên thế giới ? Thứ ba, mô hình Hồi quy tuyến tính truyền thống là một mô hình đã rất phổ biến hiện nay ở Việt Nam, và rằng nó khác biệt như thế nào so với mô hình Mạng thần kinh nhân tạo ? Thứ tư, có nhiều quan điểm liên quan đến việc cần phải điều chỉnh dữ liệu trước khi đưa vào mô hình Mạng thần kinh nhân tạo, liệu rằng nó có cần thiết cho bài nghiên cứu này khi tiến hành xây dựng mô hình Mạng thần kinh nhân tạo hay không ? Thứ năm, mô hình Mạng thần kinh nhân tạo nào sẽ được lựa chọn để xây dựng mô hình dự báo tốc độ tăng trưởng GDP Việt Nam? Thứ sáu, khả năng ứng dụng mô hình Mạng thần kinh nhân tạo trong việc dự báo tốc độ tăng trưởng GDP Việt Nam nói riêng và các biến kinh tế nói chung ?, mô hình Mạng thần kinh nhân tạo có thể kết hợp với mô hình Hồi quy tuyến tính để cho ra một mô hình dự báo tốt ở Việt Nam như một số công trình trên thế giới đã thực hiện hay không ? Cuối cùng, hướng nghiên cứu mở rộng nào trong tương lai mà bài nghiên cứu đặt ra cho những vấn đề còn hạn chế? 3. Phƣơng pháp nghiên cứu Trong bài nghiên cứu này, nhóm sử dụng phương pháp định lượng sẽ là phương pháp chủ yếu để xây dựng mô hình Mạng thần kinh nhân tạo và mô hình Hồi quy tuyến tính truyền thống cho dự báo. Tuy nhiên, phương pháp định tính cũng sẽ được nhóm sử dụng làm cơ sở lựa chọn các nhân tố kinh tế tác động đến tốc độ tăng trưởng GDP. Bên cạnh đó, phương pháp so sánh sẽ được áp dụng để tìm kiếm mô hình dự báo hiệu quả từ các mô hình trên. Mô hình Mạng thần kinh nhân tạo được xây dựng trên phần mềm NeuroSolutions phiên bản 6.01 (bản dùng thử), và mô hình Hồi quy tuyến tính truyền thống được xây dựng bằng phần mềm EViews 5.0. Về bộ dữ liệu dùng cho xây dựng mô hình được thu thập từ Ngân hàng nhà nước Việt Nam và Tổng cục thống kê Việt Nam. 4. Nội dung nghiên cứu Thứ nhất, bài nghiên cứu sẽ tiến hành lược khảo các bài nghiên cứu trước đây trong và ngoài nước để có tổng quan về vấn đề cần nghiên cứu. Thứ hai, nhóm sẽ trình bày lý thuyết về Mạng thần kinh nhân tạo để đặt nền tảng cho việc xây dựng mô hình. Thứ ba, xây dựng các mô hình dự báo tốc độ tăng trưởng GDP. Cuối cùng, bài nghiên cứu thực hiện so sánh và rút ra kết luận cho một mô hình dự báo tốc độ tăng trưởng GDP hiệu quả. 5. Đóng góp của đề tài Trong giới hạn và mục tiêu của nghiên cứu, bài nghiên cứu này cung cấp một cái nhìn tổng quan trong việc ứng dụng mô hình Mạng thần kinh nhân tạo để dự báo các biến số kinh tế. Bên cạnh đó, thông qua quá trình thực nghiệm xây dựng các mô hình dự báo tốc độ tăng trưởng Tổng sản phẩm quốc nội (GDP) Việt Nam, nhóm nghiên cứu đã tiến hành so sánh hiệu quả dự báo giữa mô hình Mạng thần kinh nhân tạo và mô hình Hồi quy tuyến tính truyền thống để tìm ra mô hình dự báo tốt nhất. Vì vậy, bài nghiên cứu này sẽ là một đóng góp tích cực cho hướng nghiên cứu mới trong lĩnh vực dự báo các biến số kinh tế. 6. Hƣớng phát triển sắp tới của đề tài Bên cạnh những gì bài nghiên cứu đã thực hiện được thì thật sự cần thiết để nói rằng vấn đề ứng dụng mô hình Mạng thần kinh nhân tạo trong việc xử lý thông tin và dự báo các biến số kinh tế sẽ không ngừng lại, mà nó cần phải liên tục được nghiên cứu, hoàn thiện, khắc phục những điểm yếu, cũng như vận dụng, khai thác các ưu điểm của mô hình. Từ đó, góp phần đưa mô hình Mạng thần kinh nhân tạo như là một sự lựa chọn tốt cho công tác dự báo biến số kinh tế bên cạnh các mô hình kinh tế lượng truyền thống ở Việt Nam. MỤC LỤC PHẦN MỞ ĐẦU ........................................................................................................... 1 Chƣơng 1: GIỚI THIỆU .............................................................................................. 2 1.1. Mô hình Mạng thần kinh nhân tạo và công tác dự báo ........................................ 2 1.2. Lược khảo các nghiên cứu trước đây .................................................................... 3 1.3. Mục tiêu của bài nghiên cứu ................................................................................. 7 Chƣơng 2: MÔ HÌNH MẠNG THẦN KINH NHÂN TẠO ...................................... 9 2.1. Đặc điểm của Mạng thần kinh nhân tạo ............................................................... 9 2.1.1. Nơ-ron sinh học .......................................................................................... 9 2.1.2. Nơ-ron nhân tạo ........................................................................................ 11 2.1.3. Mạng thần kinh nhân tạo .......................................................................... 13 2.2. Các dạng mô hình Mạng thần kinh nhân tạo ...................................................... 14 2.2.1. Mạng thần kinh truyền thẳng ....................................................................... 14 2.2.1.1. Mạng thần kinh truyền thẳng đơn giản nhất ......................................... 14 2.2.1.2. Mạng thần kinh truyền thẳng đa lớp ..................................................... 15 2.2.1.3. Mạng thần kinh bổ sung ........................................................................ 17 2.2.2. Mạng thần kinh nhân tạo hồi tiếp ................................................................ 18 2.2.2.1. Mạng thần kinh hồi tiếp Jordan ............................................................ 19 2.2.2.2. Mạng thần kinh hồi tiếp Elman ............................................................. 19 2.3. Huấn luyện Mạng thần kinh nhân tạo ................................................................. 20 2.3.1. Quá trình học của Mạng thần kinh .............................................................. 20 2.3.2. Các phương pháp học .................................................................................. 20 2.3.2.1. Học theo tham số .................................................................................. 20 2.3.2.2. Học cấu trúc ........................................................................................... 22 2.3.3. Hàm truyền .................................................................................................. 22 2.3.4. Thuật toán truyền ngược .............................................................................. 26 2.3.4.1. Điều chỉnh trọng số của Mạng thần kinh .............................................. 28 2.3.4.2. Nguyên tắc giảm độ dốc ........................................................................ 29 2.3.4.3. Truyền ngược sai số .............................................................................. 30 2.4. Các vấn đề của mô hình Mạng thần kinh nhân tạo ............................................. 34 2.4.1. Tổng quát hóa và học quá mức .................................................................... 34 2.4.2. Thủ tục ngừng đúng lúc ............................................................................... 35 2.5. Ưu điểm và khuyết điểm của mô hình Mạng thần kinh nhân tạo ....................... 37 2.5.1.Ưu điểm ........................................................................................................ 37 2.5.2. Khuyết điểm ................................................................................................ 38 2.6. So sánh mô hình Mạng thần kinh nhân tạo và mô hình hồi quy tuyến tính ....... 39 Chƣơng 3: XÂY DỰNG MÔ HÌNH DỰ BÁO TỔNG SẢN PHẨM QUỐC NỘI (GDP) CỦA VIỆT NAM ............................................................................................ 41 3.1. Dữ liệu ................................................................................................................ 41 3.1.1. Giải thích biến ............................................................................................. 43 3.1.2. Kỳ vọng về dấu ............................................................................................ 46 3.2. Xây dựng mô hình Hồi quy tuyến tính truyền thống cho dự báo tốc độ tăng trưởng GDP Việt Nam ............................................................................................... 47 3.3. Xây dựng mô hình Mạng thần kinh nhân tạo để dự báo tốc độ tăng trưởng Tổng sản phẩm quốc nội (GDP) của Việt Nam .................................................................. 50 3.3.1. Quy trình xây dựng mô hình Mạng thần kinh nhân tạo ................................ 50 3.3.1.1. Lựa chọn các biến số và thu thập dữ liệu ................................................. 50 3.3.1.2. Tiền xử lý dữ liệu ..................................................................................... 51 3.3.1.3. Lựa chọn các thông số cho mô hình ......................................................... 54 3.3.1.4. Tiến hành thực hiện xây dựng mô hình .................................................... 57 3.3.1.5. Dự báo và phân tích kết quả ..................................................................... 58 3.3.2. Xây dựng mô hình Mạng thần kinh nhân tạo một cách độc lập để dự báo tốc độ tăng trưởng GDP ................................................................................................ 59 3.3.3. Xây dựng mô hình Mạng thần kinh nhân tạo với sự hỗ trợ từ mô hình hồi quy tuyến tính truyền thống .......................................................................................... 62 Chƣơng 4: KẾT QUẢ DỰ BÁO VÀ KẾT LUẬN ................................................... 67 4.1 So sánh kết quả dự báo tốc độ tăng trưởng GDP Việt Nam của các mô hình ..... 67 4.2 Kết luận ................................................................................................................ 72 PHẦN KẾT LUẬN ..................................................................................................... 73 PHỤ LỤC .................................................................................................................... 74 TÀI LIỆU THAM KHẢO .......................................................................................... 94 DANH MỤC THUẬT NGỮ Tiếng Anh Tiếng Việt Activity Function Hàm kích hoạt Adaptive Linear Neuron – ADALINE Mạng nơ-ron tuyến tính thích ứng Amplitude Biên độ Artificial Neural Network – ANN Mạng thần kinh nhân tạo Augmented Neural Networks Mạng thần kinh bổ sung Backpropagation Thuật toán truyền ngược Backpropagation Algorithm Thuật toán truyền ngược Batch Training Huấn luyện hàng loạt Black Box Hộp đen Cost Function Hàm chi phí Desired Output Các giá trị đầu ra mục tiêu Early Stopping Procedure Thủ tục ngừng đúng lúc Elman Recurrent Neural Networks – ERNN Mạng thần kinh hồi tiếp Elman Epoch Số vòng lặp Error Backpropagation Thuật toán sai số truyền ngược Error Tolerance Sai số cho phép Feed-Forward Neural Networks – FFNN Mạng thần kinh truyền thẳng Forward Procedure Thủ tục đưa dần vào Global Minimum Tối thiểu hóa toàn cục Gradient Descent Nguyên tắc giảm độ dốc Gross Domestic Product – GDP Tổng sản phẩm quốc nội Hidden Layer Lớp nơ-ron ẩn Input Các giá trị (tín hiệu) đầu vào Input Layer Lớp nơ-ron đầu vào Jordan Recurrent Neural Networks – JRNN Mạng thần kinh hồi tiếp Jordan Layer Lớp mạng Learning Curve Đường cong học hỏi Learning Rate Tỷ lệ học Linearly Inseparable Functions Hàm không phân tách tuyến tính Local Minimum Tối thiểu hóa cục bộ Lower Bound Biên dưới Mean Absolute Error – MAE Sai số tuyệt đối trung bình Mean Absolute Percentage Error – MAPE Sai số phần trăm tuyệt đối trung bình Mean Error – ME Sai số trung bình Mean Percentage Error – MPE Sai số phần trăm trung bình Mean Square Error – MSE Sai số bình phương trung bình Momentum Động lượng Multilayer Feed- Forward Perceptron Mạng thần kinh đa lớp truyền thẳng Multilayer Perceptrons – MLPs Mạng thần kinh truyền thẳng đa lớp Multiple Adaptive Linear Neuron – MADALINE Mạng nơ-ron tuyến tính thích ứng đa lớp Offset Độ lệch On-Line Training Huấn luyện từng dòng Output Các giá trị đầu ra Output Layer Lớp nơ-ron đầu ra Over – learned Học quá mức Parameter Learning Học theo tham số Perceptron Mạng thần kinh truyền thẳng đơn giản nhất Recurrent Neural Networks Mạng thần kinh hồi tiếp Recurrent Neural Networks –RNN Mạng thần kinh nhân tạo hồi tiếp Root Mean Squared Error – RMSE Căn bậc hai của sai số bình phương trung bình Self Organizing Networks Mạng thần kinh tự tổ chức Step Size Kích thước bước Straight Gradient Descent Giảm độ dốc thẳng Structure Learning Học cấu trúc Supervised Learning Học có giám sát Test Set Dữ liệu kiểm tra Theil’U Hệ số không ngang bằng Training Set Dữ liệu huấn luyện Transfer Functions Hàm truyền Unsupervised Learning Học không giám sát Upper Bound Biên trên Validation Set Dữ liệu phê duyệt Weights Trọng số DANH MỤC BẢNG Bảng 3.1: Các biến được cân nhắc đưa vào mô hình dự báo GDP theo quý ............... 42 Bảng 3.2: Tên biến và kỳ vọng về dấu .......................................................................... 46 Bảng 3.3: Thống kê mô tả các biến .............................................................................. 47 Bảng 3.4: Các thông số huấn luyện .............................................................................. 63 Bảng 4.1: So sánh dự báo trong mẫu và dự báo ngoài mẫu ......................................... 68 DANH MỤC HÌNH Hình 2.1: Minh họa cấu tạo của một nơ-ron sinh học ................................................. 11 Hình 2.2: Nơ-ron nhân tạo. .......................................................................................... 11 Hình 2.3: Mô hình Mạng thần kinh nhân tạo ............................................................... 14 Hình 2.4: Mô hình thần kinh nhân tạo đơn giản nhất .................................................. 15 Hình 2.5: Mô hình Mạng thần kinh truyền thẳng đa lớp ............................................ 16 Hình 2.6: Mô hình Mạng thần kinh nhân tạo bổ sung ................................................. 17 Hình 2.7: Mô hình Mạng thần kinh nhân tạo hồi tiếp ................................................. 18 Hình 2.8: Mô hình Mạng thần kinh hồi tiếp Jordan .................................................... 19 Hình 2.9: Mô hình Mạng thần kinh hồi tiếp Elman .................................................... 20 Hình 2.10: Đồ thị biểu diễn hàm truyền Heaviside ..................................................... 23 Hình 2.11: Đồ thị biểu diễn hàm truyền Xích ma ....................................................... 23 Hình 2.12: Đồ thị biểu diễn hàm Hyperbol ................................................................. 24 Hình 2.13: Đồ thị biểu diễn hàm LinearTanhAxon ...................................................... 25 Hình 2.14: Đồ thị biểu diễn hàm LinearSigmoidAxon ................................................ 25 Hình 2.15: Mô hình Mạng thần kinh nhân tạo có sử dụng thuật toán truyền ngược ... 27 Hình 2.16: Biểu diễn việc điều chỉnh các trọng số theo nguyên tắc giảm độ dốc ....... 29 Hình 2.17: Việc giảm độ dốc trên mặt phẳng sai số .................................................... 34 Hình 2.18: Biểu diễn thủ tục ngừng đúng lúc .............................................................. 36 Hình 3.1: Mô hình Mạng thần kinh nhân tạo được xây dựng một cách độc lập tốt nhất cho dự báo tốc độ tăng trưởng GDP Việt Nam ............................................................ 60 Hình 3.2: Đồ thị thể hiện giá trị MSE của quá trình huấn luyện mô hình Mạng thần kinh nhân tạo được xây dựng một cách độc lập tốt nhất .............................................. 60 Hình 3.3: Các trọng số ước lượng của mô hình Mạng thần kinh độc lập.................... 61 Hình 3.4: Mô hình Mạng thần kinh nhân tạo tốt nhất với sự hỗ trợ từ mô hình Hồi quy tuyến tính truyền thống cho dự báo tốc độ tăng trưởng GDP Việt Nam ...................... 64 Hình 3.5: Đồ thị thể hiện giá trị MSE của quá trình huấn luyện mô hình Mạng thần kinh nhân tạo với sự hỗ trợ từ mô hình Hồi quy tuyến tính truyền thống .................... 64 Hình 3.6: Các trọng số ước lượng của mô hình Mạng thần kinh dựa trên kết quả của Mô hình truyền thống ................................................................................................... 65 Hình 4.1: Đồ thị dự báo trong mẫu .............................................................................. 69 Hình 4.2: Đồ thị dự báo ngoài mẫu ............................................................................. 69 Hình 4.3: Đồ thị dự báo trong mẫu của mô hình ANN ............................................... 70 Hình 4.4: Đồ thị dự báo trong mẫu của mô hình ANN & HQTT ............................... 70 Hình 4.5: Đồ thị dự báo ngoài mẫu của mô hình ANN ............................................... 71 Hình 4.6: Đồ thị dự báo ngoài mẫu của mô hình ANN & HQTT ............................... 71 DANH MỤC PHỤ LỤC PHỤ LỤC 1: KẾT QUẢ ƢỚC LƢỢNG VÀ KIỂM ĐỊNH TRONG MÔ HÌNH HỒI QUY TUYẾN TÍNH .......................................................................................... 74 Hình A.1: Kết quả kiểm định phân phối chuẩn của phần dư....................................... 74 Bảng A.1: Kết quả hồi quy tăng trưởng GDP theo các nhân tố tác động ................... 74 Bảng A.2: Các chỉ số thống kê .................................................................................... 75 Bảng A.3: Kết quả kiểm định phương sai thay đổi...................................................... 75 Bảng A.4: Kết quả kiểm định tự tương quan với độ trễ là 1 ........................................ 75 Bảng A.5: Kết quả kiểm định tự tương quan với độ trễ là 4 ....................................... 75 Bảng A.6: Kết quả kiểm đinh đa cộng tuyến .........................................................