Có hai cách để tiến hành dự báo: đó là dự báo
điểm và dự báo khoảng, người ta còn gọi là ước
lượng điểm hay ước lượng khoảng cho giá trị dự báo.
Dự báo điểm thực chất chỉ cho ta một giá trị của
biến phụ thuộc tương ứng với giá trị cho trước của biến độc lập.
Nhưng điều này trong thực tế ít có ý nghĩa vì giá trị thực tế
thường sai lệch so với giá trị dự báo điểm một sai số nào đó, mà
với dự báo điểm thì ta không đánh giá được sai số này.
10 trang |
Chia sẻ: thanhlam12 | Lượt xem: 5028 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Nhập môn Kinh tế lượng - Chương 9: Dự báo bằng hồi quy, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
22/8/2015
1
Dự báo bằng hồi quy
Lê Minh Tiến
1
Bài giảng Kinh tế lượng © Tien M. Le
Mở đầu
Mối quan hệ giữa biến phụ thuộc và biến độc
lập là quan hệ không chính xác theo nghĩa, ứng
với một giá trị của biến độc lập có thể có nhiều
giá trị khác nhau của biến phụ thuộc, mà thuật
ngữ gọi là những giá trị cá biệt.
Tuy nhiên, thực tế ta thường quan tâm đến giá
trị trung bình của những giá trị cá biệt, nghĩa là
ứng với một giá trị của biến độc lập thì giá trị
trung bình của biến phụ thuộc sẽ là bao nhiêu.
2
Bài giảng Kinh tế lượng © Tien M. Le
Mở đầu
Thực chất, giá trị đó là kỳ vọng có điều kiện của
biến phụ thuộc ứng với một giá trị xác định của
biến độc lập.
Nội dung của chương này sẽ đề cập đến cả hai
loại dự báo: dự báo giá trị trung bình và dự báo
giá trị cá biệt.
3
Bài giảng Kinh tế lượng © Tien M. Le
Mở đầu
Có hai cách để tiến hành dự báo: đó là dự báo
điểm và dự báo khoảng, người ta còn gọi là ước
lượng điểm hay ước lượng khoảng cho giá trị
dự báo.
Dự báo điểm thực chất chỉ cho ta một giá trị của
biến phụ thuộc tương ứng với giá trị cho trước
của biến độc lập.
Nhưng điều này trong thực tế ít có ý nghĩa vì giá trị thực tế
thường sai lệch so với giá trị dự báo điểm một sai số nào đó, mà
với dự báo điểm thì ta không đánh giá được sai số này.
4
Bài giảng Kinh tế lượng © Tien M. Le
Mở đầu
Dự báo khoảng, nghĩa là chỉ ra một khoảng tin
cậy mà giá trị dự báo có thể thuộc vào khoảng
đó với một độ tin cậy cho trước.
5
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo với mô hình 2 biến
Xét mô hình hồi quy 2 biến:
Khi mô hình ước lượng SRF được xác định là
phù hợp tốt, người ta có thể dùng để dự báo giá
trị trung bình E(Y/X) hay giá trị cá biệt Y.
6
1 2
1 2
PRF : E Y/X = β +β X
PRM: Y = β +β X +u
ˆ ˆˆ
ˆ ˆ
1 2
1 2
SRF : Y = β +β X
SRM: Y = β +β X +e
22/8/2015
2
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo điểm (Point Prediction)
Giả sử biến độc lập X nhận giá trị X0 cho trước.
Dự báo giá trị trung bình chính là dự báo cho
E(Y/X = X0), dự báo cá biệt ký hiệu là Y0.
Khi thay X0 vào SRF, ta được Y0^= 1^+ 2^X0
Người ta chứng minh được Y0^ là ước lượng
tuyến tính, không chệch tốt nhất của E(Y/X0) và
Y0, do đó người ta sử dụng Y0^ là dự báo điểm
cho cả giá trị trung bình và giá trị cá biệt của
biến phụ thuộc Y.
Nghĩa là: E(Y/X = X0) Y0^, Y0 Y0^
7
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo khoảng (Interval Prediction)
Để dự báo khoảng, người ta cũng phải căn cứ
vào dự báo điểm Y0^.
Lưu ý rằng về bản chất, Y0^ cũng là đại lượng
ngẫu nhiên, vì nó phụ thuộc vào các đại lượng
ngẫu nhiên 1^, 2^
8
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo khoảng (Interval Prediction)
Dễ chứng minh được khi hạng nhiễu ui có phân
phối chuẩn thì Y0^ cũng có phân phối chuẩn với
kì vọng là E(Y/X0)=β1+β2X0 và phương sai
tức là Y0^~N(E(Y/X0); se
2(Y0^)),
9
ˆ
2
02
0 2
i
X - X1
Var Y = σ +
n x
ˆ ˆ0 0se Y = var Y
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo khoảng cho trung bình E(Y/X0)
(Mean Prediction)
Với tính chất Y0^ có phân phối chuẩn, và sử
dụng σ^2 là ước lượng không chệch cho
phương sai tổng thể σ2, thì lúc đó
Với độ tin cậy 1–α cho trước, khoảng tin cậy của
giá trị trung bình E(Y/X0) là:
10
ˆ
ˆ
0 0
0
Y -E Y/X
t = ~ t(n - 2)
se Y
ˆ ˆ ˆ ˆ0 0 α/2;n-2 0 0 α/2;n-2 0E(Y/X ) Y - t .se Y ;Y + t .se Y
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo khoảng cho giá trị cá biệt Y0
(Individual Prediction)
Sai số e0=Y0-Y0^ của dự báo là đại lượng ngẫu
nhiên có phương sai:
Lưu ý rằng các phương sai đang xét là phương
sai với điều kiện X=X0.
11
ˆ ˆ
2
02 2
0 0 0 02
i
X - X1
var e = var Y - Y = σ 1+ + = var Y +σ
n x
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo khoảng cho giá trị cá biệt Y0
(Individual Prediction)
Sai số của dự báo thực chất là do hai nguồn:
do tác động của thành phần nhiễu
do sử dụng ước lượng điểm Y0^.
Khi dùng σ^2 thay thế cho σ2, ta có:
Với độ tin cậy 1–α cho trước, khoảng tin cậy của
giá trị cá biệt Y0 là:
12
ˆ
0 0
0
Y - Y
t = ~ t(n - 2)
se e
ˆ ˆ0 0 α/2;n-2 0 0 α/2;n-2 0Y Y - t .se e ;Y + t .se e
22/8/2015
3
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo khoảng cho giá trị cá biệt Y0
(Individual Prediction)
Với cùng độ tin cậy thì khoảng dự báo của giá trị
cá biệt sẽ rộng hơn và bao hàm khoảng dự báo
của giá trị trung bình vì se(e0)>se(Y0^).
Ta không thể nói dự báo khoảng cho giá trị trung
bình có độ chính xác cao hơn bởi vì mục đích
nghiên cứu của ta là khác nhau, một cái ta
nghiên cứu riêng lẻ từng giá trị cá biệt, còn một
cái ta nghiên cứu trung bình của các giá trị cá
biệt này.
13
!
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo với mô hình nhiều biến
Giả sử mô hình hồi quy nhiều biến dạng ma trận
như sau:
PRM: Y = X.β + u
SRM: Y = X.β^ + e
14
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo điểm
Giả sử các biến độc lập nhận các giá trị là X10,
X20,..., X(k-1)0, ta thiết lập véc tơ X0 như sau:
Thay vào SRF ta được Y0^=X0
T.β^=β^T.X0
Y0^ là ước lượng điểm BLU của E(Y/X0) và Y0
15
0
10
20
k-1 0
1
X
XX =
...
X
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo khoảng: cho giá trị trung bình
Với độ tin cậy 1–α cho trước, ta có
trong đó:
cov(^) là ma trận hiệp phương sai của các hệ
số hồi quy
16
ˆ ˆ ˆ ˆ0 0 α/2;n-k 0 0 α/2;n-k 0E(Y/X ) Y - t .se Y ;Y + t .se Y
ˆˆ ˆ ˆ 0 -1T 2 T T0 0 0 0 0 0se Y = var Y ,var Y = X .cov β X = σ X . X X .X
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo khoảng: cho giá trị cá biệt
Với độ tin cậy 1–α cho trước, ta có
trong đó
17
ˆ ˆ0 0 α/2;n-k 0 0 α/2;n-k 0Y Y - t .se e ;Y + t .se e
ˆ 20 0 0 0se e = var e ,var e = var Y +σ
Bài giảng Kinh tế lượng © Tien M. Le
Đánh giá độ chính xác của dự báo
Một trong những tiêu chuẩn để đánh giá mô
hình tốt theo tiêu chuẩn của Harvey là mô hình
có khả năng dự báo chính xác.
Tuy nhiên, việc đánh giá mức độ chính xác trong
dự báo của mô hình hồi quy đòi hỏi phải có số
liệu thực tế để đối chiếu với giá trị dự báo từ mô
hình. Điều này có thể thực hiện bằng cách thu
thập thêm số liệu mới, nhưng thực tế việc thu
thập thêm số liệu mới không phải lúc nào cũng
dễ dàng thực hiện được.
18
22/8/2015
4
Bài giảng Kinh tế lượng © Tien M. Le
Phân chia mẫu
Người ta giải quyết bằng cách phân chia mẫu,
nghĩa là từ mẫu đang có tách thành hai mẫu
con.
Mẫu con thứ nhất được sử dụng để ước lượng mô
hình hồi quy và gọi là “mẫu khởi động” (initialization
set).
Mẫu con thứ hai được sử dụng để kiểm tra độ chính
xác của các giá trị dự báo từ mô hình hồi quy tìm
được từ mẫu khởi động. Mẫu con thứ hai được gọi là
“mẫu kiểm tra” (test set).
19
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Giả sử mẫu kiểm tra gồm m quan sát, trong đó
ký hiệu Yi là giá trị thực tế của biến phụ thuộc Y;
Yi^ là giá trị dự báo điểm của mô hình hồi quy;
ei=Yi-Yi^ là sai số của dự báo.
Đánh giá khả năng dự báo của mô hình được
dựa trên các sai số dự báo trong mẫu kiểm tra
mà không dựa trên mẫu khởi động vì thực tế khi
xây dựng mô hình hồi quy, người ta đã tìm cách
cực tiểu các phần dư trong mẫu khởi động để
xác định các tham số ước lượng.
20
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Vấn đề ở đây là kết quả ước lượng có còn khớp
(fitted) với các quan sát ngoài mẫu khởi động
hay không?
Sai số trung bình ME (Mean Error):
Sai số tuyệt đối trung bình MAE (Mean Absolute
Error):
21
m
i
i=1
1
ME = e
m
m
i
i=1
1
MAE = e
m
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Sai số bình phương trung bình MSE (Mean
Squared Error):
Căn bậc hai của sai số bình phương trung bình
RMSE (Root Mean Squared Error):
22
m
2
i
i=1
1
MSE = e
m
RMSE = MSE
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
ME có thể cho chúng ta biết có hay không
khuynh hướng dự báo thấp hơn hay cao hơn
giá trị thực tế, nghĩa là nếu ME > 0, thì khuynh
hướng chung các sai số dự báo ei>0, nên
Yi>Yi^, nói cách khác Yi^ có khuynh hướng dự
báo thấp hơn giá trị thực Yi.
ei có thể âm hoặc dương nên chúng có thể bù trừ cho
nhau khi tính ME. Điều này dẫn đến hạn chế khi sử
dụng giá trị ME để đánh giá cho năng lực dự báo của
mô hình vì |ME| có thể nhỏ nhưng không có gì bảo
đảm là sai số của dự báo |ei| là nhỏ.
23
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
MAE và MSE hạn chế được ảnh hưởng bù trừ
của giá trị sai số dự báo âm và dương.
MSE phóng đại các sai số dự báo có giá trị tuyệt đối
lớn, và như vậy chú trọng tới ảnh hưởng của các giá
trị biệt trong mẫu kiểm tra.
Hạn chế của việc so sánh giá trị của MSE với các chỉ
số khác (ME, MAE) là vấn đề đơn vị, do đó thường
người ta sử dụng RMSE thay cho MSE để so sánh.
24
22/8/2015
5
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Các đo lường thống kê ME, MAE, MSE, RMSE
chỉ có ý nghĩa khi được đối chiếu hay so sánh
giữa các mô hình hồi quy (cùng dạng biến phụ
thuộc và cùng cỡ mẫu), hay nói cách khác, việc
phân tích độc lập các giá trị của những chỉ số
này ít có ý nghĩa.
Các chỉ số trên đều phụ thuộc vào đơn vị đo của
biến, do đó việc đánh giá các chỉ số trên lớn hay
nhỏ không chỉ chú ý thuần túy về mặt giá trị mà
còn phải quan tâm đến đơn vị của biến.
25
!
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Người ta còn sử dụng các tiêu chuẩn đo
lường thống kê không phụ thuộc vào đơn vị đo
của biến:
Sai số phần trăm PE (Percentage Error):
Sai số phần trăm trung bình MPE (Mean
Percentage Error):
26
ˆ
i i i
i
i i
Y - Y e
PE = =
Y Y
1 1
m m
i i
ii
i
e1 1
MPE = PE
m m Y
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Sai số phần trăm tuyệt đối trung bình MAPE
(Mean Absolute Percentage Error):
Ngoài ra ta còn có hệ số bất đẳng thức Theil
(Theil Inequality Coefficient) như sau:
27
1 1
m m
i i
ii
i
e1 1
MAPE = PE
m m Y
1 ˆ
1 1ˆ
m
m m
m 2
i i
i=1
m m
2 2
i i
i=1 i=1
Y - Y
TIC =
Y + Y
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Hệ số TIC có giá trị trong [0;1].
Khi TIC = 0, tức sai lệch giữa giá trị dự báo điểm
với giá trị thực tế bằng 0, khi đó hàm hồi quy dự
báo chính xác hoàn toàn.
Trong thực tế hiếm khi có được giá trị lý tưởng
TIC = 0, mà chỉ kỳ vọng TIC càng gần 0 thì các
tốt - kinh nghiệm là TIC<0.55.
28
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Ta có thể phân tích tử số thành các thành phần
sau:
trong đó:
: giá trị trung bình của dự báo
điểm trong mẫu kiểm tra
: giá trị trung bình thực tế trong
mẫu kiểm tra;
29
22 2
ˆ ˆ ˆ
ˆ ˆ/ 2 1i i Y YY YY YY Y m Y Y s s R s s
ˆ ˆ /iY Y m
/iY Y m
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
: độ lệch chuẩn của giá trị
dự báo trong mẫu kiểm tra;
: độ lệch chuẩn của giá trị
thực tế trong mẫu kiểm tra;
30
2
ˆ
1 ˆ ˆ
iY
s Y Y
m
21
Y is Y Y
m
22/8/2015
6
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
: hệ số tương quan giữa
các giá trị dự báo và giá trị thực tế trong mẫu kiểm
tra.
31
ˆ 2 2
ˆ ˆ
ˆ ˆ .
i i
YY
i i
Y Y Y Y
R
Y Y Y Y
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Ta có các tỷ lệ tương ứng như sau:
Tỷ lệ chệch (Bias Proportion): cho biết trung
bình các giá trị dự báo khác biệt như thế nào so
với trung bình các giá trị thực tế
32
2
2
ˆ
ˆ /i i
Y Y
BP
Y Y m
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Tỷ lệ phương sai (Variance Proportion): cho biết
mức độ biến thiên của các giá trị dự báo khác
biệt như thế nào so với độ biến thiên của các giá
trị thực tế.
33
2
ˆ
2
ˆ /
YY
i i
s s
VP
Y Y m
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Tỷ lệ hiệp phương sai (Covariance Proportion):
cho biết tỉ lệ phần sai số của dự báo không
mang tính hệ thống.
34
ˆ ˆ
2
2 1
ˆ /
YYY Y
i i
R s s
CP
Y Y m
Bài giảng Kinh tế lượng © Tien M. Le
Các tiêu chuẩn thống kê của dự báo
Tỷ lệ chệch, tỷ lệ phương sai và tỷ lệ hiệp
phương sai có tổng luôn bằng 1.
Nếu dự báo là tốt, tỷ lệ chệch và tỷ lệ phương
sai sẽ có khuynh hướng nhỏ, và như vậy phần
lớn sai số trong dự báo sẽ thuộc về tỷ lệ hiệp
phương sai, là phần đo lường thể hiện tính chất
không hệ thống (không quy luật).
Các tiêu chuẩn BP, VP, CP và TIC có thể được
phân tích để xem xét khả năng dự báo của một
mô hình hồi quy có tốt hay không.
35
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo ngoài mẫu
Nếu mục đích chỉ là để kiểm tra khả năng dự
báo của mô hình thì giá trị biến độc lập (X0)
được sử dụng để dự báo được lấy từ trong mẫu
kiểm tra. Tuy nhiên ứng dụng của phân tích hồi
quy là sử dụng mô hình hồi quy để dự báo cho
biến phụ thuộc – dự báo ngoài phạm vi mẫu
phân tích.
Một mô hình hồi quy sau khi tiến hành dự báo
trong mẫu nhằm mục đích đánh giá khả năng
dự báo chính xác của mô hình có thể được vận
dụng để dự báo ngoài mẫu.
36
22/8/2015
7
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo ngoài mẫu
Thông thường đối với dự báo ngoài mẫu người
ta thường tiến hành dự báo khoảng cho cả giá
trị trung bình và giá trị cá biệt.
Sai số chuẩn của dự báo sẽ càng nhỏ khi giá trị
của biến độc lập dùng để dự báo nằm trong
khoảng biến thiên của mẫu và càng gần với giá
trị trung bình mẫu.
37
!
Bài giảng Kinh tế lượng © Tien M. Le
Dự báo khi X nhận Xi trong mẫu:
Lệnh Forecast
Dự báo khi X nhận Xi ngoài mẫu:
Mở rộng Range
Thêm giá trị Xi vào
Chạy lại hồi quy rồi chạy dự báo.
Thực hành dự báo trên Eviews
38
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
Y là số tiền mua xổ số trong tuần ($)
X là thu nhập khả dụng (sau thuế) trong tuần ($)
Dự báo mức chi tiêu mua Lotto trung bình của
những người có mức thu nhập khả dụng
340$/tuần, với độ tin cậy là 95%?
Dự báo số tiền mua Lotto của một người có
mức thu nhập 340$/tuần, với độ tin cậy là 95%?
39
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
40
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
SRM: Yi = 7.618182 + 0.081455*Xi + ei
X= (Y- 1^)/2^
R2=1-RSS/TSS TSS ESS
xi
2=ESS/2^
2
41
0 0
2 2
02
0 2
0 0
ˆ 7.618182 0.081455 7.618182 0.081455. 340 35.31273
340 262.51 1ˆ ˆ 6.486364 1.404199
10 51562.5
ˆ ˆ 1.404199 1.184989
i
Y X
X X
var Y
n x
se Y var Y
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
Ước lượng điểm: E(Y/X0=340)35.31$
Với độ tin cậy 95%, ta có ước lượng khoảng:
Vậy với độ tin cậy là 95%, mức chi tiêu mua
Lotto trung bình của những người có mức thu
nhập 340$/tuần nằm trong khoảng từ 32.58$
đến 38.05$.
42
0 0 / 2; 2 0ˆ ˆ/ 340 . 32.58;38.05nE Y X Y t se Y
22/8/2015
8
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
Ước lượng điểm: Y0/X0=340 35.31$
Với độ tin cậy 95%, ta có ước lượng khoảng:
43
2
0 0
0 0
ˆ ˆ 1.404199 6.486364 7.890563
7.890563 2.809015
var e var Y
se e var e
0 0 / 2; 2 0ˆ . 28.84;41.79nY Y t se e
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
Như vậy, mỗi người có thu nhập khả dụng ở
mức 340$/tuần thì số tiền để mua Lotto không
giống nhau, nhưng dao động trong khoảng từ
28.83$ đến 41.79$, với độ tin cậy của dự báo
này là 95%.
44
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101: thêm giá trị ngoài mẫu
45
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101: thêm giá trị ngoài mẫu
46
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101: sai số chuẩn của sai số dự báo
47
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101: đồ thị khoảng tin cậy của giá
trị cá biệt
48
22/8/2015
9
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101: ước lượng điểm của E(Y/X0)
và Y0
49
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101: Khoảng tin cậy của giá trị cá
biệt
50
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101: Khoảng tin cậy của giá trị
trung bình
51
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
52
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
53
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
54
22/8/2015
10
Bài giảng Kinh tế lượng © Tien M. Le
c10-td101
55
Bài giảng Kinh tế lượng © Tien M. Le
Review
Học gì?
Hiểu gì?
Hỏi gì?
Hành gì?
Nhớ gì?
56