Bài giảng Nhập môn Kinh tế lượng - Chương 9: Dự báo bằng hồi quy

 Có hai cách để tiến hành dự báo: đó là dự báo điểm và dự báo khoảng, người ta còn gọi là ước lượng điểm hay ước lượng khoảng cho giá trị dự báo.  Dự báo điểm thực chất chỉ cho ta một giá trị của biến phụ thuộc tương ứng với giá trị cho trước của biến độc lập.  Nhưng điều này trong thực tế ít có ý nghĩa vì giá trị thực tế thường sai lệch so với giá trị dự báo điểm một sai số nào đó, mà với dự báo điểm thì ta không đánh giá được sai số này.

pdf10 trang | Chia sẻ: thanhlam12 | Lượt xem: 4982 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Nhập môn Kinh tế lượng - Chương 9: Dự báo bằng hồi quy, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
22/8/2015 1 Dự báo bằng hồi quy Lê Minh Tiến 1 Bài giảng Kinh tế lượng © Tien M. Le Mở đầu  Mối quan hệ giữa biến phụ thuộc và biến độc lập là quan hệ không chính xác theo nghĩa, ứng với một giá trị của biến độc lập có thể có nhiều giá trị khác nhau của biến phụ thuộc, mà thuật ngữ gọi là những giá trị cá biệt.  Tuy nhiên, thực tế ta thường quan tâm đến giá trị trung bình của những giá trị cá biệt, nghĩa là ứng với một giá trị của biến độc lập thì giá trị trung bình của biến phụ thuộc sẽ là bao nhiêu. 2 Bài giảng Kinh tế lượng © Tien M. Le Mở đầu  Thực chất, giá trị đó là kỳ vọng có điều kiện của biến phụ thuộc ứng với một giá trị xác định của biến độc lập.  Nội dung của chương này sẽ đề cập đến cả hai loại dự báo: dự báo giá trị trung bình và dự báo giá trị cá biệt. 3 Bài giảng Kinh tế lượng © Tien M. Le Mở đầu  Có hai cách để tiến hành dự báo: đó là dự báo điểm và dự báo khoảng, người ta còn gọi là ước lượng điểm hay ước lượng khoảng cho giá trị dự báo.  Dự báo điểm thực chất chỉ cho ta một giá trị của biến phụ thuộc tương ứng với giá trị cho trước của biến độc lập.  Nhưng điều này trong thực tế ít có ý nghĩa vì giá trị thực tế thường sai lệch so với giá trị dự báo điểm một sai số nào đó, mà với dự báo điểm thì ta không đánh giá được sai số này. 4 Bài giảng Kinh tế lượng © Tien M. Le Mở đầu  Dự báo khoảng, nghĩa là chỉ ra một khoảng tin cậy mà giá trị dự báo có thể thuộc vào khoảng đó với một độ tin cậy cho trước. 5 Bài giảng Kinh tế lượng © Tien M. Le Dự báo với mô hình 2 biến  Xét mô hình hồi quy 2 biến:  Khi mô hình ước lượng SRF được xác định là phù hợp tốt, người ta có thể dùng để dự báo giá trị trung bình E(Y/X) hay giá trị cá biệt Y. 6     1 2 1 2 PRF : E Y/X = β +β X PRM: Y = β +β X +u ˆ ˆˆ ˆ ˆ    1 2 1 2 SRF : Y = β +β X SRM: Y = β +β X +e 22/8/2015 2 Bài giảng Kinh tế lượng © Tien M. Le  Dự báo điểm (Point Prediction)  Giả sử biến độc lập X nhận giá trị X0 cho trước. Dự báo giá trị trung bình chính là dự báo cho E(Y/X = X0), dự báo cá biệt ký hiệu là Y0.  Khi thay X0 vào SRF, ta được Y0^= 1^+ 2^X0  Người ta chứng minh được Y0^ là ước lượng tuyến tính, không chệch tốt nhất của E(Y/X0) và Y0, do đó người ta sử dụng Y0^ là dự báo điểm cho cả giá trị trung bình và giá trị cá biệt của biến phụ thuộc Y.  Nghĩa là: E(Y/X = X0)  Y0^, Y0 Y0^ 7 Bài giảng Kinh tế lượng © Tien M. Le  Dự báo khoảng (Interval Prediction)  Để dự báo khoảng, người ta cũng phải căn cứ vào dự báo điểm Y0^.  Lưu ý rằng về bản chất, Y0^ cũng là đại lượng ngẫu nhiên, vì nó phụ thuộc vào các đại lượng ngẫu nhiên 1^, 2^ 8 Bài giảng Kinh tế lượng © Tien M. Le  Dự báo khoảng (Interval Prediction)  Dễ chứng minh được khi hạng nhiễu ui có phân phối chuẩn thì Y0^ cũng có phân phối chuẩn với kì vọng là E(Y/X0)=β1+β2X0 và phương sai tức là Y0^~N(E(Y/X0); se 2(Y0^)), 9    ˆ          2 02 0 2 i X - X1 Var Y = σ + n x    ˆ ˆ0 0se Y = var Y Bài giảng Kinh tế lượng © Tien M. Le Dự báo khoảng cho trung bình E(Y/X0) (Mean Prediction)  Với tính chất Y0^ có phân phối chuẩn, và sử dụng σ^2 là ước lượng không chệch cho phương sai tổng thể σ2, thì lúc đó  Với độ tin cậy 1–α cho trước, khoảng tin cậy của giá trị trung bình E(Y/X0) là: 10     ˆ ˆ 0 0 0 Y -E Y/X t = ~ t(n - 2) se Y     ˆ ˆ ˆ ˆ0 0 α/2;n-2 0 0 α/2;n-2 0E(Y/X ) Y - t .se Y ;Y + t .se Y Bài giảng Kinh tế lượng © Tien M. Le Dự báo khoảng cho giá trị cá biệt Y0 (Individual Prediction)  Sai số e0=Y0-Y0^ của dự báo là đại lượng ngẫu nhiên có phương sai:  Lưu ý rằng các phương sai đang xét là phương sai với điều kiện X=X0. 11        ˆ ˆ          2 02 2 0 0 0 02 i X - X1 var e = var Y - Y = σ 1+ + = var Y +σ n x Bài giảng Kinh tế lượng © Tien M. Le Dự báo khoảng cho giá trị cá biệt Y0 (Individual Prediction)  Sai số của dự báo thực chất là do hai nguồn:  do tác động của thành phần nhiễu  do sử dụng ước lượng điểm Y0^.  Khi dùng σ^2 thay thế cho σ2, ta có:  Với độ tin cậy 1–α cho trước, khoảng tin cậy của giá trị cá biệt Y0 là: 12   ˆ 0 0 0 Y - Y t = ~ t(n - 2) se e     ˆ ˆ0 0 α/2;n-2 0 0 α/2;n-2 0Y Y - t .se e ;Y + t .se e 22/8/2015 3 Bài giảng Kinh tế lượng © Tien M. Le Dự báo khoảng cho giá trị cá biệt Y0 (Individual Prediction)  Với cùng độ tin cậy thì khoảng dự báo của giá trị cá biệt sẽ rộng hơn và bao hàm khoảng dự báo của giá trị trung bình vì se(e0)>se(Y0^).  Ta không thể nói dự báo khoảng cho giá trị trung bình có độ chính xác cao hơn bởi vì mục đích nghiên cứu của ta là khác nhau, một cái ta nghiên cứu riêng lẻ từng giá trị cá biệt, còn một cái ta nghiên cứu trung bình của các giá trị cá biệt này. 13 ! Bài giảng Kinh tế lượng © Tien M. Le Dự báo với mô hình nhiều biến  Giả sử mô hình hồi quy nhiều biến dạng ma trận như sau: PRM: Y = X.β + u SRM: Y = X.β^ + e 14 Bài giảng Kinh tế lượng © Tien M. Le  Dự báo điểm  Giả sử các biến độc lập nhận các giá trị là X10, X20,..., X(k-1)0, ta thiết lập véc tơ X0 như sau:  Thay vào SRF ta được Y0^=X0 T.β^=β^T.X0  Y0^ là ước lượng điểm BLU của E(Y/X0) và Y0 15                   0 10 20 k-1 0 1 X XX = ... X Bài giảng Kinh tế lượng © Tien M. Le  Dự báo khoảng: cho giá trị trung bình  Với độ tin cậy 1–α cho trước, ta có trong đó: cov(^) là ma trận hiệp phương sai của các hệ số hồi quy 16     ˆ ˆ ˆ ˆ0 0 α/2;n-k 0 0 α/2;n-k 0E(Y/X ) Y - t .se Y ;Y + t .se Y          ˆˆ ˆ ˆ 0 -1T 2 T T0 0 0 0 0 0se Y = var Y ,var Y = X .cov β X = σ X . X X .X Bài giảng Kinh tế lượng © Tien M. Le  Dự báo khoảng: cho giá trị cá biệt  Với độ tin cậy 1–α cho trước, ta có trong đó 17     ˆ ˆ0 0 α/2;n-k 0 0 α/2;n-k 0Y Y - t .se e ;Y + t .se e        ˆ 20 0 0 0se e = var e ,var e = var Y +σ Bài giảng Kinh tế lượng © Tien M. Le Đánh giá độ chính xác của dự báo  Một trong những tiêu chuẩn để đánh giá mô hình tốt theo tiêu chuẩn của Harvey là mô hình có khả năng dự báo chính xác.  Tuy nhiên, việc đánh giá mức độ chính xác trong dự báo của mô hình hồi quy đòi hỏi phải có số liệu thực tế để đối chiếu với giá trị dự báo từ mô hình. Điều này có thể thực hiện bằng cách thu thập thêm số liệu mới, nhưng thực tế việc thu thập thêm số liệu mới không phải lúc nào cũng dễ dàng thực hiện được. 18 22/8/2015 4 Bài giảng Kinh tế lượng © Tien M. Le  Phân chia mẫu  Người ta giải quyết bằng cách phân chia mẫu, nghĩa là từ mẫu đang có tách thành hai mẫu con.  Mẫu con thứ nhất được sử dụng để ước lượng mô hình hồi quy và gọi là “mẫu khởi động” (initialization set).  Mẫu con thứ hai được sử dụng để kiểm tra độ chính xác của các giá trị dự báo từ mô hình hồi quy tìm được từ mẫu khởi động. Mẫu con thứ hai được gọi là “mẫu kiểm tra” (test set). 19 Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Giả sử mẫu kiểm tra gồm m quan sát, trong đó ký hiệu Yi là giá trị thực tế của biến phụ thuộc Y; Yi^ là giá trị dự báo điểm của mô hình hồi quy; ei=Yi-Yi^ là sai số của dự báo.  Đánh giá khả năng dự báo của mô hình được dựa trên các sai số dự báo trong mẫu kiểm tra mà không dựa trên mẫu khởi động vì thực tế khi xây dựng mô hình hồi quy, người ta đã tìm cách cực tiểu các phần dư trong mẫu khởi động để xác định các tham số ước lượng. 20 Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Vấn đề ở đây là kết quả ước lượng có còn khớp (fitted) với các quan sát ngoài mẫu khởi động hay không?  Sai số trung bình ME (Mean Error):  Sai số tuyệt đối trung bình MAE (Mean Absolute Error): 21  m i i=1 1 ME = e m  m i i=1 1 MAE = e m Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Sai số bình phương trung bình MSE (Mean Squared Error):  Căn bậc hai của sai số bình phương trung bình RMSE (Root Mean Squared Error): 22  m 2 i i=1 1 MSE = e m RMSE = MSE Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  ME có thể cho chúng ta biết có hay không khuynh hướng dự báo thấp hơn hay cao hơn giá trị thực tế, nghĩa là nếu ME > 0, thì khuynh hướng chung các sai số dự báo ei>0, nên Yi>Yi^, nói cách khác Yi^ có khuynh hướng dự báo thấp hơn giá trị thực Yi.  ei có thể âm hoặc dương nên chúng có thể bù trừ cho nhau khi tính ME. Điều này dẫn đến hạn chế khi sử dụng giá trị ME để đánh giá cho năng lực dự báo của mô hình vì |ME| có thể nhỏ nhưng không có gì bảo đảm là sai số của dự báo |ei| là nhỏ. 23 Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  MAE và MSE hạn chế được ảnh hưởng bù trừ của giá trị sai số dự báo âm và dương.  MSE phóng đại các sai số dự báo có giá trị tuyệt đối lớn, và như vậy chú trọng tới ảnh hưởng của các giá trị biệt trong mẫu kiểm tra.  Hạn chế của việc so sánh giá trị của MSE với các chỉ số khác (ME, MAE) là vấn đề đơn vị, do đó thường người ta sử dụng RMSE thay cho MSE để so sánh. 24 22/8/2015 5 Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Các đo lường thống kê ME, MAE, MSE, RMSE chỉ có ý nghĩa khi được đối chiếu hay so sánh giữa các mô hình hồi quy (cùng dạng biến phụ thuộc và cùng cỡ mẫu), hay nói cách khác, việc phân tích độc lập các giá trị của những chỉ số này ít có ý nghĩa.  Các chỉ số trên đều phụ thuộc vào đơn vị đo của biến, do đó việc đánh giá các chỉ số trên lớn hay nhỏ không chỉ chú ý thuần túy về mặt giá trị mà còn phải quan tâm đến đơn vị của biến. 25 ! Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo Người ta còn sử dụng các tiêu chuẩn đo lường thống kê không phụ thuộc vào đơn vị đo của biến:  Sai số phần trăm PE (Percentage Error):  Sai số phần trăm trung bình MPE (Mean Percentage Error): 26 ˆ i i i i i i Y - Y e PE = = Y Y 1 1 m m i i    ii i e1 1 MPE = PE m m Y Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Sai số phần trăm tuyệt đối trung bình MAPE (Mean Absolute Percentage Error):  Ngoài ra ta còn có hệ số bất đẳng thức Theil (Theil Inequality Coefficient) như sau: 27 1 1 m m i i    ii i e1 1 MAPE = PE m m Y  1 ˆ 1 1ˆ m m m    m 2 i i i=1 m m 2 2 i i i=1 i=1 Y - Y TIC = Y + Y Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Hệ số TIC có giá trị trong [0;1].  Khi TIC = 0, tức sai lệch giữa giá trị dự báo điểm với giá trị thực tế bằng 0, khi đó hàm hồi quy dự báo chính xác hoàn toàn.  Trong thực tế hiếm khi có được giá trị lý tưởng TIC = 0, mà chỉ kỳ vọng TIC càng gần 0 thì các tốt - kinh nghiệm là TIC<0.55. 28 Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Ta có thể phân tích tử số thành các thành phần sau: trong đó: : giá trị trung bình của dự báo điểm trong mẫu kiểm tra : giá trị trung bình thực tế trong mẫu kiểm tra; 29         22 2 ˆ ˆ ˆ ˆ ˆ/ 2 1i i Y YY YY YY Y m Y Y s s R s s       ˆ ˆ /iY Y m /iY Y m Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo : độ lệch chuẩn của giá trị dự báo trong mẫu kiểm tra; : độ lệch chuẩn của giá trị thực tế trong mẫu kiểm tra; 30   2 ˆ 1 ˆ ˆ iY s Y Y m     21 Y is Y Y m   22/8/2015 6 Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo : hệ số tương quan giữa các giá trị dự báo và giá trị thực tế trong mẫu kiểm tra. 31        ˆ 2 2 ˆ ˆ ˆ ˆ . i i YY i i Y Y Y Y R Y Y Y Y         Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo Ta có các tỷ lệ tương ứng như sau:  Tỷ lệ chệch (Bias Proportion): cho biết trung bình các giá trị dự báo khác biệt như thế nào so với trung bình các giá trị thực tế 32     2 2 ˆ ˆ /i i Y Y BP Y Y m    Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Tỷ lệ phương sai (Variance Proportion): cho biết mức độ biến thiên của các giá trị dự báo khác biệt như thế nào so với độ biến thiên của các giá trị thực tế. 33     2 ˆ 2 ˆ / YY i i s s VP Y Y m    Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Tỷ lệ hiệp phương sai (Covariance Proportion): cho biết tỉ lệ phần sai số của dự báo không mang tính hệ thống. 34     ˆ ˆ 2 2 1 ˆ / YYY Y i i R s s CP Y Y m    Bài giảng Kinh tế lượng © Tien M. Le  Các tiêu chuẩn thống kê của dự báo  Tỷ lệ chệch, tỷ lệ phương sai và tỷ lệ hiệp phương sai có tổng luôn bằng 1.  Nếu dự báo là tốt, tỷ lệ chệch và tỷ lệ phương sai sẽ có khuynh hướng nhỏ, và như vậy phần lớn sai số trong dự báo sẽ thuộc về tỷ lệ hiệp phương sai, là phần đo lường thể hiện tính chất không hệ thống (không quy luật).  Các tiêu chuẩn BP, VP, CP và TIC có thể được phân tích để xem xét khả năng dự báo của một mô hình hồi quy có tốt hay không. 35 Bài giảng Kinh tế lượng © Tien M. Le  Dự báo ngoài mẫu  Nếu mục đích chỉ là để kiểm tra khả năng dự báo của mô hình thì giá trị biến độc lập (X0) được sử dụng để dự báo được lấy từ trong mẫu kiểm tra. Tuy nhiên ứng dụng của phân tích hồi quy là sử dụng mô hình hồi quy để dự báo cho biến phụ thuộc – dự báo ngoài phạm vi mẫu phân tích.  Một mô hình hồi quy sau khi tiến hành dự báo trong mẫu nhằm mục đích đánh giá khả năng dự báo chính xác của mô hình có thể được vận dụng để dự báo ngoài mẫu. 36 22/8/2015 7 Bài giảng Kinh tế lượng © Tien M. Le  Dự báo ngoài mẫu  Thông thường đối với dự báo ngoài mẫu người ta thường tiến hành dự báo khoảng cho cả giá trị trung bình và giá trị cá biệt.  Sai số chuẩn của dự báo sẽ càng nhỏ khi giá trị của biến độc lập dùng để dự báo nằm trong khoảng biến thiên của mẫu và càng gần với giá trị trung bình mẫu. 37 ! Bài giảng Kinh tế lượng © Tien M. Le  Dự báo khi X nhận Xi trong mẫu:  Lệnh Forecast  Dự báo khi X nhận Xi ngoài mẫu:  Mở rộng Range  Thêm giá trị Xi vào  Chạy lại hồi quy rồi chạy dự báo. Thực hành dự báo trên Eviews 38 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101  Y là số tiền mua xổ số trong tuần ($)  X là thu nhập khả dụng (sau thuế) trong tuần ($)  Dự báo mức chi tiêu mua Lotto trung bình của những người có mức thu nhập khả dụng 340$/tuần, với độ tin cậy là 95%?  Dự báo số tiền mua Lotto của một người có mức thu nhập 340$/tuần, với độ tin cậy là 95%? 39 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101 40 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101  SRM: Yi = 7.618182 + 0.081455*Xi + ei  X= (Y- 1^)/2^  R2=1-RSS/TSS  TSS  ESS  xi 2=ESS/2^ 2 41                0 0 2 2 02 0 2 0 0 ˆ 7.618182 0.081455 7.618182 0.081455. 340 35.31273 340 262.51 1ˆ ˆ 6.486364 1.404199 10 51562.5 ˆ ˆ 1.404199 1.184989 i Y X X X var Y n x se Y var Y                             Bài giảng Kinh tế lượng © Tien M. Le  c10-td101  Ước lượng điểm: E(Y/X0=340)35.31$  Với độ tin cậy 95%, ta có ước lượng khoảng:  Vậy với độ tin cậy là 95%, mức chi tiêu mua Lotto trung bình của những người có mức thu nhập 340$/tuần nằm trong khoảng từ 32.58$ đến 38.05$. 42        0 0 / 2; 2 0ˆ ˆ/ 340 . 32.58;38.05nE Y X Y t se Y     22/8/2015 8 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101  Ước lượng điểm: Y0/X0=340 35.31$  Với độ tin cậy 95%, ta có ước lượng khoảng: 43             2 0 0 0 0 ˆ ˆ 1.404199 6.486364 7.890563 7.890563 2.809015 var e var Y se e var e              0 0 / 2; 2 0ˆ . 28.84;41.79nY Y t se e    Bài giảng Kinh tế lượng © Tien M. Le  c10-td101  Như vậy, mỗi người có thu nhập khả dụng ở mức 340$/tuần thì số tiền để mua Lotto không giống nhau, nhưng dao động trong khoảng từ 28.83$ đến 41.79$, với độ tin cậy của dự báo này là 95%. 44 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101: thêm giá trị ngoài mẫu 45 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101: thêm giá trị ngoài mẫu 46 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101: sai số chuẩn của sai số dự báo 47 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101: đồ thị khoảng tin cậy của giá trị cá biệt 48 22/8/2015 9 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101: ước lượng điểm của E(Y/X0) và Y0 49 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101: Khoảng tin cậy của giá trị cá biệt 50 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101: Khoảng tin cậy của giá trị trung bình 51 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101 52 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101 53 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101 54 22/8/2015 10 Bài giảng Kinh tế lượng © Tien M. Le  c10-td101 55 Bài giảng Kinh tế lượng © Tien M. Le Review  Học gì?  Hiểu gì?  Hỏi gì?  Hành gì?  Nhớ gì? 56
Tài liệu liên quan