Khái niệm Đa cộng tuyến:
l Là hiện tượng các biến độc lập có tương quan với nhau
l Mô hình lý tưởng khi các biến độc lập không tương quan
l Có thể có nhiều mức độ tương quan:
l Tương quan hoàn toàn (đa cộng tuyến hoàn hảo) r223 =1
λ2X2 + λ3X3 =0
X2 = λX3
l tương quan không hoàn toàn (đa cộng tuyến không hoàn hảo)
λ2X2 + λ3X3 + v =0
v: sai số ngẫu nhiên
X2 = λX3 + u
5 trang |
Chia sẻ: thanhlam12 | Lượt xem: 610 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Kinh tế lượng - Chương V: Các sai lầm cơ bản trong quá trình xây dựng mô hình hồi qui đa biến, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1Chương V: Các sai lầm cơ bản trong
quá trình xây dựng mô hình hồi qui đa
biến
Đa cộng tuyến
TS Nguyễn Minh Đức
Prepared by NMDUC 2009
Đa cộng tuyến
(Multicollinearity)
Khái niệm Đa cộng tuyến:
l Là hiện tượng các biến độc lập có tương quan với nhau
l Mô hình lý tưởng khi các biến độc lập không tương quan
l Có thể có nhiều mức độ tương quan:
l Tương quan hoàn toàn (đa cộng tuyến hoàn hảo) r223 =1
λ2X2 + λ3X3 =0
X2 = λX3
l tương quan không hoàn toàn (đa cộng tuyến không hoàn hảo)
λ2X2 + λ3X3 + v =0
v: sai số ngẫu nhiên
X2 = λX3 + u
2Prepared by NMDUC 2009
Đa cộng tuyến
(Multicollinearity)
Nguyên nhân:
l Phương pháp thu thập số liệu: mẫu không
đặc trưng
l Bản chất của các biến có mối tương quan
l Mô hình: biến có số mũ cao
l Kích cỡ mẫu nhỏ
Prepared by NMDUC 2009
Các hệ số ước lượng:
Yi = β1 + β2 X2i + β3 X3i + ei
l Trường hợp đa cộng tuyến hoàn hảo:
l Không thể tách ảnh hưởng của
từng biến độc lập lên biến phụ
thuộc
l Không thể có giá trị duy nhất của
từng hệ số hồi quy, mặc dù có đáp
số duy nhất cho tổ hợp tuyến tính.
Đa cộng tuyến
(Multicollinearity)
3Prepared by NMDUC 2009
l X2 = λX3
l không xác định
2
1
,3,2
1
2
3
1
2
2
1
,3,2
1
,2
1
2
2
1
,3
3
ˆ
−
−
=
∑∑∑
∑∑∑∑
===
====
n
i
ii
n
i
i
n
i
i
n
i
ii
n
i
ii
n
i
i
n
i
ii
xxxx
xxxyxxy
β
^
321
,ˆ,ˆ βββ
3
^
32
^
2
^
1 XXY βββ −−=
2
1
,3,2
1
2
3
1
2
2
1
,3,2
1
,3
1
2
3
1
,2
2
ˆ
−
−
=
∑∑∑
∑∑∑∑
===
====
n
i
ii
n
i
i
n
i
i
n
i
ii
n
i
ii
n
i
i
n
i
ii
xxxx
xxxyxxy
β
Đa cộng tuyến
(Multicollinearity)
Prepared by NMDUC 2009
l Trường hợp đa cộng tuyến không hoàn hảo:
l Có thể xác định được giá trị của các hệ số
hồi quy
Đa cộng tuyến
(Multicollinearity)
4Prepared by NMDUC 2009
Hậu quả của đa cộng tuyến
l Phương sai, hiệp phương sai và sai số chuẩn là
vô hạn
∑ −
=
)1(
var
2
23
2
2
2^
2
rx i
δβ
∑ −
=
)1(
var
2
23
2
3
2^
3
rx i
δβ
∑ ∑−
−
=
2
3
2
2
2
23
2
23
^
^
32
)1(
,cov
ii xxr
r δββ
∑−
=
22
23
^
)1(
)(
i
i
xr
se
δβ
Đa cộng tuyến
(Multicollinearity)
Prepared by NMDUC 2009
Hậu quả của đa cộng tuyến
l Khoảng tin cậy rộng hơn
l Xác suất chấp nhận giả thuyết H0 -tăng (tăng sai lầm loại
II)
l R2 cao, nhưng nhiều giá trị t thấp
l Hệ số ước lượng và sai số chuẩn rất nhạy cảm với
những thay đổi trong số liệu
l Dấu của các hệ số ước lượng có thể sai
l Thêm hay bớt biến cộng tuyến, sẽ có thay đổi về độ lớn
và dấu của các hệ số ước lượng.
Đa cộng tuyến
(Multicollinearity)
5Prepared by NMDUC 2009
l Cách phát hiện đa cộng tuyến:
l Do đa cộng tuyến hoàn hảo rất hiếm khi xảy ra, trong
khi đa cộng tuyến không hoàn hảo xảy ra rất thường
xuyên cho nên ta thường xác định mức độ tương quan
chứ không xác định loại cộng tuyến.
l Các cách xác định đa cộng tuyến phổ biến:
1/ Dựa vào R2 và t
2/ Xác định hệ số tương quan cặp giữa các biến độc lập
(>0.8)
3/ Hồi quy phụ: hồi quy một biến X theo các biến X còn lại
Đa cộng tuyến
(Multicollinearity)
Prepared by NMDUC 2009
Cách khắc phục:
l Không có biện pháp hoàn hảo. Phụ thuộc vào tính nghiêm trọng của
đa cộng tuyến và bản chất của số liệu mẫu. Đôi khi áp dụng biện
pháp khắc phục không phù hợp sẽ dẫn đến sai lầm nghiêm trọng
hơn.
1/ Sử dụng thông tin đã biết
2/ Tăng cỡ mẫu, hoặc lấy thêm mẫu mới: có thể mẫu mới có các biến
độc lập ít tương quan
3/ Bỏ bớt biến: dựa vào R2 để quyết định biến nên bỏ. Tuy nhiên trong
những trường hợp không thể bỏ biến được thì nên cân nhắc giữa
sai lệch khi bỏ biến và việc tăng phương sai của các hệ số ước
lượng.
4/ Sử dụng biến trễ.
5/ Giảm tương quan trong hồi quy đa thức: các biến độc lập có bậc lũy
thừa khác nhau
6/ Khác: hồi quy thành phần chính, sử dụng các ước lượng từ bên
ngoài.
Đa cộng tuyến
(Multicollinearity)