Bài giảng Kinh tế lượng - Chương 5: Hiện tượng đa cộng tuyến (multicollinearity)
1. Bản chất, nguyên nhân của đa cộng tuyến 2 Ước lượng các tham số 3 Hậu quả 4 Phát hiện đa cộng tuyến 5 Khắc phục đa cộng tuyến
Bạn đang xem nội dung tài liệu Bài giảng Kinh tế lượng - Chương 5: Hiện tượng đa cộng tuyến (multicollinearity), để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
09/09/2014
1
HIỆN TƯỢNG ĐA CỘNG TUYẾN
(MULTICOLLINEARITY)
CHƯƠNG 5
Đa cộng tuyến
Hi ểu b ản ch ấ
t
v à h ậ u
tuyến
1.
quả của cộngđa
MỤC
TIÊU Biết
cộng
khắc
hiện đa2. cách phát
tuyến
phục
và biện pháp
2
NỘI DUNG
Bản chất, nguyên nhân của đa cộng tuyến1
Ước lượng các tham số2
3 Hậu quả
Phát hiện đa cộng tuyến4
Khắc phục đa cộng tuyến5
3
5.1 Bản chất của đa cộng tuyến
Đa cộng tuyến
Trong mô hình hồi quy bội
βˆ βˆ
2
βˆ X
3 3i
βˆ X
k ki
ˆ = + + + ... +Yi X2i1
4
Có sự phụ thuộc tuyến tính cao giữa các
biến giải thích
5.1 Bản chất của đa cộng tuyến
a. Đa cộng tuyến hoàn hảo
Tồn tại λ2, λ3, λk không đồng thời bằng 0
sao cho
λ2X2 + λ3X3 + + λkXk = 0
b. Đa cộng tuyến không hoàn hảo
λ2X2 λ3X3 λkXk+ + + + vi= 0
với vi là sai số ngẫu nhiên.
5
6.1 Bản chất của đa cộng tuyến
VD
X2 10 15 18 24 30
X3 50 75 90 120 150
X4
V
52
2
75
0
97
7
129
9
152
2
X3i = 5X2i, có cộng tuyến hoàn hảo giữa X2 và
X3 ; r23 = 1
X2 và X4 có cộng tuyến không hoàn hảo
6
09/09/2014
2
6.1 Bản chất của đa cộng tuyến
Không có đa cộng tuyến Đa cộng tuyến thấp
Y Y
X3 X3X2 X2
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
7
6.1
cộng
Bản chất của đa cộng tuyến
Đa tuyến cao Đa cộng tuyến hoàn hảo
Y Y
X3
X2 X2
X3
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
8
6.1 Nguyên nhân của đa cộng tuyến
- Chọn các biến độc lập có mối quan có
quan hệ nhân quả hay có tương quan cao
vì đồng phụ thuộc vào một điều kiện khác.
- Số quan sát nhỏ hơn số biến độc lập.
- Cách thu thập mẫu: mẫu không đặc trưng
cho tổng thể
- Chọn biến Xi có độ biến thiên nhỏ.
9
6.2 Ước lượng khi có đa cộng tuyến
1. Trường hợp có đa cộng tuyến hoàn hảo
Xét mô hình hồi qui 3 biến dưới dạng sau:
Yi = β2 + β3X2i X3i + ei
được= λX2i, mô hìnhgiả sử X3i biến đổi
thành:
Yi = (β2+ λβ3)X2i β0+ ei = X2i + ei
Phương pháp OLS ∑ x2iyi
∑ x 2
βˆ = (βˆ + λβˆ ) =o 2 3
2i
ˆ ˆβ 2 , β 3� Không thể tìm được lời giải duy nhất cho
10
6.2 Ước lượng khi có đa cộng tuyến
∑yx 2 ∑x 3 −∑yx 3 ∑x 2 x 3 2ˆ i i i i i i iβ =2 ∑ 2i∑ ∑2 23i )2− (x x x x2i 3i
λ∑
λ2
yi x3i∑x3i − λ ∑yi x3i∑x3i x3i2 0
0
βˆ = =2 ∑ 3i∑ ∑ 3i∑2 2 2 2 2x −λx x x3i 3i
� Các hệ số ước lượng không xác định
� Phương sai và sai số chuẩn của β2 và β3
là vô hạn
11
6.2 Ước lượng khi có đa cộng tuyến
2. Trường hợp có đa cộng tuyến không
hoàn hảo
Đa cộng tuyến hoàn hảo thường không
xảy ra trong thực tế.
Xét mô hình hồi qui 3 biến dưới dạng sau:
�
�
yi = β2 + β3x2i x3i + ei
= λGiả sử x3i x2i + vi
Với λ ≠ 0 và vi là sai số ngẫu nhiên
12
09/09/2014
3
6.2 Ước lượng khi có đa cộng tuyến
( yx )(λ2 x 2 + v 2 )−(λ2 yx + yv)(λ x 2 )∑ i 2i ∑ 2i ∑ i ∑ i 2i ∑ i i ∑ 2i
βˆ =
( )(λ
2
v 2 )−
(λ2
)22 ∑ 2i ∑ 2i ∑ i ∑ 2ix 2 x 2 x 2+
� Có thể ước lượng được các hệ số hồi
quy nhưng sai số chuẩn rất lớn.
13
6.3 Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo
� Phương sai và hiệp phương sai của các
ước lượng OLS lớn.
� Khoảng tin cậy rộng hơn.
� Tỉ số t "không có ý nghĩa"
� R2 cao nhưng tỉ số t ít có ý nghĩa
14
6.3 Hậu quả của đa cộng tuyến
5. Các ước lượng OLS và sai số chuẩn của
chúng trở nên rất nhạy với những thay
đổi
Dấu
qui
nhỏ trong dữ liệu.
của các ước lượng của các hệ số hồi
có thể sai
6.
7. Thêm vào hay bớt đi các biến cộng tuyến
với các biến khác, mô hình sẽ thay đổi
về dấu hoặc thay đổi về độ lớn của các
ước lượng.
15
6.3 Hậu quả của đa cộng tuyến
Đa cộng tuyến là một hiện tượng theo
mẫu, nghĩa là cho dù các biến độc lập
Xi không tương
tổng thể nhưng
quan tuyến tính
quan tuyến tính trong
chúng có thể tương
trong một mẫu cụ thể
nào đó. Do đó cỡ mẫu lớn thì hiện
tượng đa cộng tuyến ít nghiêm trọng
hơn cỡ mẫu nhỏ
16
6.4 Cách phát hiện đa cộng tuyến
1.
2.
Hệ số R2 lớn nhưng tỷ số t nhỏ
Tương quan cặp giữa các biến giải
thích cao
3.
4.
Sử dụng
Sử dụng
(VIF)
mô hình hồi qui phụ
yếu tố phóng đại phương sai
17
6.4 Cách phát hiện đa cộng tuyến
lớn nhưng tỷ số t nhỏ1.
2.
R2
Tương quan cặp giữa các biến giải thích
cao
∑(Xi−X )(Zi−Z )
=rXZ
∑
Z
(X − X) 2 (Z − Z) 2i
2
i
thíchTrong đó
hình
X, là biến giải trong mô
18
09/09/2014
4
6.4 Cách phát hiện đa cộng tuyến
3. Sử dụng mô hình hồi quy phụ
Hồi qui một biến giải thích X theo các biến còn lại
ˆ ˆ ˆˆ = β1 + β 3 X + ... + β kXX 2i 3i mi
Tính R2 và F cho mỗi mô hình
2 ( n −R m )
F =
2(1 − )( m − 1 )R
Lập giả thiết H0: R2 = 0 ~ H0: không có đa cộng tuyến
Nếu F > Fα(m-1,n-k):
Nếu F < Fα(m-1,n-k):
cộng tuyến
bác bỏ H0 hay có đa cộng tuyến
chấp nhận H0 hay không có đa
19
6.4 Cách phát hiện đa cộng tuyến
4. Sử dụng nhân tử phóng đại phương sai (VIF)
Đối với hàm hồi quy 2 biến giải thích
1
VIF =
r2(1 − )23
Đối với trường hợp tổng quát, có (k-1)
1
biến giải thích
VIF =
R2(1 − )j
�R2j: là giá trị R2 trong hàm hồi quy của Xj theo (k-2)
biến giải thích còn lại.
�Thông thường khi VIF > 10, thì biến này được coi là
có cộng tuyến cao
20
6.5 Cách khắc phục
1. Dùng thông tin tiên nghiệm
Ví dụ mô hình sản xuất Cobb-Douglas
Ln(Yi)=β1 + β2ln(Ki)+ β3ln(Li) + ui Có
thể xảy ra đa cộng tuyến do K và L cùng tăng
theo quy mô sản xuất. Nếu biết hiệu suất
quy mô tức là β2+β3=1 thìkhông đổi theo
Ln(Yi)=β1 + β2ln(Ki)+ (1-β2)ln(Li) + ui
= β1 + β2[ln(Ki) - ln(Li)]
+ β2ln(Ki /Li) + ui
Ln(Yi) – Ln(Li)
Ln(Yi /Li ) = β1
+ ui
=> mất đa cộng tuyến (vì đây là mô hình hồi
quy đơn)
21
6.5 Cách khắc phục
2. Loại trừ một biến giải thích ra khỏi mô
hình
B1: Xem cặp biến giải thích nào có quan hệ
chặt chẽ. Giả sử X2, X3Xk là các biến độc
lập, Y là biến phụ thuộc và X2, X3 có tương
quan chặt chẽ với nhau.
B2: Tính R2 đối với các hàm hồi quy: có mặt
cả 2 biến; không có mặt một trong 2 biến
B3: Loại biến mà giá trị R2 tính được khi
không có mặt biến đó là lớn hơn.
22
6.5 Cách khắc phục
3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới
2σ
var(βˆ ) =2 ∑ 22i 2(1−x r )23
23
6.5 Cách khắc phục
4. Dùng sai phân cấp
Có hàm hồi qui: yt = α1
suy ra
1
+ β1x1t β2x2t+ + ut
= α1 + β1x1,t-1 β2x2,t-1yt-1 + + ut-1
Trừ hai vế cho nhau, được:
β1(x1,t β2(x2,tyt – yt
(ut – ut
Hay:
= – x1,t 1) + – x2,t 1) +–
–
1 – –
1)
∆yt = β1 ∆ + β2 ∆x1,t x2,t + et,
24