Sau khi học xong chương này, bạn có thể:
Hiểu được các nguyên nhân gây ra đa cộng tuyến
Biết được hậu quả của đa cộng tuyến
Thực hiện được các phương pháp phát hiện đa cộng tuyến
Thực hiện được các biện pháp khắc phục đa cộng tuyến
13 trang |
Chia sẻ: thanhlam12 | Lượt xem: 736 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Bài giảng Nhập môn Kinh tế lượng - Chương 6: Đa cộng tuyến, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
22/8/2015
1
Đa cộng tuyến
Lê Minh Tiến
Bài giảng Kinh tế lượng © Tien M. Le
Mục tiêu của chương
Sau khi học xong chương này, bạn có thể:
Hiểu được các nguyên nhân gây ra đa cộng
tuyến
Biết được hậu quả của đa cộng tuyến
Thực hiện được các phương pháp phát hiện đa
cộng tuyến
Thực hiện được các biện pháp khắc phục đa
cộng tuyến
2
Bài giảng Kinh tế lượng © Tien M. Le
Nội dung
Nguyên nhân gây ra đa cộng tuyến
Hậu quả của đa cộng tuyến
Các phương pháp phát hiện đa cộng tuyến
Các biện pháp khắc phục đa cộng tuyến
3
Bài giảng Kinh tế lượng © Tien M. Le
Khái niệm đa cộng tuyến
Xét mô hình hồi quy bội:
Y = β1 + β2X1 + + βkXk-1 + u
Mô hình lý tưởng là các biến độc lập không có
tương quan với nhau. Khi đó ta nói không có
hiện tượng đa cộng tuyến.
Nếu ∃ ít nhất 2 biến độc lập cùng chứa đựng
một số thông tin chung về Y thì ta nói có hiện
tượng đa cộng tuyến (multicollinearity).
4
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
Mô hình lý tưởng là các biến độc lập không có
tương quan với nhau, mỗi biến chứa đựng một
số thông tin riêng về Y và thông tin đó không có
trong biến độc lập khác, khi đó hệ số hồi quy
riêng cho biết ảnh hưởng của từng biến độc lập
đối với biến phụ thuộc khi giả định các biến độc
lập còn lại không đổi. Trong trường hợp này ta
nói không có hiện tượng đa cộng tuyến.
5
Bài giảng Kinh tế lượng © Tien M. Le
Các loại đa cộng tuyến
Nếu tồn tại các số thực λ1,, λk-1 không đồng
thời bằng 0 sao cho:
λ1X1 ++ λk-1Xk-1 = 0
thì ta nói giữa các biến Xj (j = 1,, k-1) xảy ra hiện
tượng đa cộng tuyến hoàn hảo (perfect
multicollinearity).
Nói cách khác: Xj= λ1X1 ++ λk-1Xk-1
6
22/8/2015
2
Bài giảng Kinh tế lượng © Tien M. Le
Các loại đa cộng tuyến
Nếu tồn tại các số λj,, λk-1 không đồng thời
bằng 0 sao cho:
λ1X1 ++ λk-1Xk-1 + v = 0
với v là sai số ngẫu nhiên thì ta có đa cộng tuyến
không hoàn hảo (imperfect multicollinearity) giữa
các biến Xi.
Nói cách khác: Xj= λ1X1 ++ λk-1Xk-1 + v
7
Bài giảng Kinh tế lượng © Tien M. Le
Nguyên nhân gây ra đa cộng tuyến
Phương pháp thu thập số liệu
Do bản chất của mối quan hệ giữa các biến
Đặc trưng mô hình
Mô hình xác định quá mức
8
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
• Phương pháp thu thập số liệu: Mẫu không đặc trưng cho
tổng thể.
• Do bản chất của các mối quan hệ giữa các biến đã ngầm
chứa hiện tượng đa cộng tuyến: Thí dụ như hồi quy lượng
điện năng tiêu thụ (Y) theo thu nhập (X1) và diện tích nhà ở
(X2). Trong mối quan hệ này ẩn chứa đa cộng tuyến vì
thông thường những gia đình có thu nhập cao thì có nhà
rộng hơn những gia đình có thu nhập thấp.
• Đặc trưng mô hình: Thí dụ khi bổ sung những biến có luỹ
thừa bậc cao vào mô hình, đặc biệt khi phạm vi dữ liệu của
biến độc lập là nhỏ.
• Một mô hình xác định quá mức: xảy ra khi số biến giải
thích nhiều hơn cỡ mẫu. Trong trường hợp này ta không
xác định được duy nhất các hệ số hồi quy.
9
Bài giảng Kinh tế lượng © Tien M. Le
Hậu quả của đa cộng tuyến hoàn hảo
Không xác định được duy nhất các hệ số hồi
quy riêng βj^ ứng với mẫu cụ thể.
Không thể tách riêng ảnh hưởng của từng biến
Xj đến biến phụ thuộc Y, chỉ có thể ước lượng
ảnh hưởng chung của các biến cộng tuyến đối
với biến phụ thuộc.
10
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
Điều này là hợp lý vì trong trường hợp có đa
cộng tuyến hoàn hảo, khi một biến độc lập thay
đổi thì sẽ kéo theo sự thay đổi của những biến
có cộng tuyến với nó, nên giả định cố định các
biến độc lập còn lại là không hợp lý. Trong thực
tế thì trường hợp đa cộng tuyến hoàn hảo hiếm
khi xảy ra, mà ta thường gặp đa cộng tuyến
không hoàn hảo với các mức độ khác nhau.
11
Bài giảng Kinh tế lượng © Tien M. Le
Hậu quả của đa cộng tuyến không hoàn hảo
Các hệ số hồi quy ước lượng có phương sai và
hiệp phương sai của lớn.
Khoảng tin cậy của các hệ số hồi quy có khuynh
hướng rộng hơn.
Khả năng mắc sai lầm loại 2 khi kiểm định giả
thuyết H0: βj = βj* sẽ cao.
Mặc dù tỉ số |tqs| bé, nhưng hệ số xác định R
2 có
thể rất cao.
12
22/8/2015
3
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
• Như được trình bày ở mục 2.6, các ước lượng OLS có tính chất
BLUE khi 5 giả thiết của mô hình hồi quy tuyến tính cổ điển được
thoả mãn. Các giả thiết này không đề cập đến sự tương quan giữa
các biến độc lập, nên tính chất BLUE của các hệ số ước lượng vẫn
được bảo toàn khi xảy ra hiện tượng cộng tuyến.
• Phương sai và hiệp phương sai của các hệ số hồi quy lớn bất
thường, nghĩa là các giá trị ước lượng thay đổi nhiều từ mẫu này sang
mẫu khác, điều này làm cho việc xác định giá trị ước lượng chính xác
trở nên khó khăn.
• Khoảng tin cậy của các hệ số hồi quy có khuynh hướng rộng hơn,
điều này dẫn đến độ chính xác của ước lượng khoảng cho tham số hồi
quy βj giảm đi.
• Khi kiểm định giả thuyết H0: βj = βj* ta có thể sử dụng thống kê
tqs=(βj^-βj*)/se(βj^). Trong trường hợp có đa cộng tuyến cao, sai số
chuẩn của các ước lượng có xu hướng tăng mạnh, dẫn đến giá trị |tqs|
có khuynh hướng nhỏ đi. Do đó ta có xu hướng chấp nhận giả thiết H0.
13
Bài giảng Kinh tế lượng © Tien M. Le
Hậu quả của đa cộng tuyến không hoàn hảo
Các ước lượng OLS của βj và các se(βj^) trở
nên rất nhạy với những thay đổi nhỏ trong số
liệu.
Dấu của các hệ số ước lượng βj^ có thể sai.
Thêm vào hay bớt đi các biến cộng tuyến với
các biến khác, mô hình sẽ thay đổi về độ lớn
của các ước lượng hoặc dấu của chúng.
14
Bài giảng Kinh tế lượng © Tien M. Le
Phát hiện đa cộng tuyến
Dấu của hệ số hồi quy ngược với kì vọng
Hệ số xác định R2 cao nhưng tồn tại tỉ số |tqs|
thấp
Kinh nghiệm: R2 > 0.8 đồng thời |tqs|<2.
Khi thấy có nghịch lý này, người ta thường nghĩ đến
nguyên nhân là do có đa cộng tuyến.
Hạn chế của quy tắc này là nó chỉ thể hiện rõ khi có
đa cộng tuyến ở mức độ cao.
15
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
* Khi hệ số xác định R2 cao, kinh nghiệm cho thấy R2 > 0.8,
thì thường giả thiết về các hệ số hồi quy đồng thời bằng 0
bị bác bỏ, nói cách khác thừa nhận có ít nhất một hệ số hồi
quy riêng khác 0.
* Tuy nhiên tỷ số |t| thấp thì ta có xu hướng chấp nhận giả
thiết hệ số hồi quy riêng bằng 0.
16
Bài giảng Kinh tế lượng © Tien M. Le
Phát hiện đa cộng tuyến
Hệ số tương quan giữa các cặp biến độc lập
cao
Mô hình 2 biến độc lập:
Kinh nghiệm: ĐCT cao ⇔ rXjXs > 0.8
Mô hình ≥3 biến độc lập:
Kinh nghiệm: rXjXs > 0.8 ⇒ ĐCT cao
Lưu ý: Với mô hình ≥3 biến độc lập thì rXjXs> 0.8 là điều kiện
đủ chứ không phải là điều kiện cần.
17
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
* Trong một số tình huống đặc biệt ta có đa cộng
tuyến cao giữa các biến độc lập nhưng hệ số tương
quan cặp giữa các biến có thể thấp.
Thí dụ : Xét mô hình hồi quy có ba biến độc lập
X1, X2, X3, với số liệu mẫu như sau :
X1 = (1,0,0,0)
X2 = (0,1,0,0)
X3 = (1,1,0,0)
Nhận thấy ta có đa cộng tuyến hoàn hảo vì X3 =
X1 + X2, nhưng hệ số tương quan cặp tương ứng
là : r12 = - 0.333, r13 = r23 = 0.57 không cao.
18
22/8/2015
4
Bài giảng Kinh tế lượng © Tien M. Le
Phát hiện đa cộng tuyến
Hồi quy phụ:
Hồi quy tuyến tính 1 biến độc lập Xj theo các biến độc
lập còn lại:
Xj = λ0 + λ1X1 +...+ λj-1Xj-1 + λj+1Xj+1 +...+ λk-1Xk-1 + v
Tính được Rj
2 (theo mô hình phụ)
Kiểm định giả thuyết H0: Rj
2 =0 (không có ĐCT)
Thống kê quan sát là:
Quy tắc bác bỏ H0 là: Fj > Fα;(k–2, n–k+1)
19
2
2
/ 2
1 / 1
j
j
j
R k
F
R n k
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
* Bởi vì đa cộng tuyến đề cập tới quan hệ tuyến
tính giữa các biến độc lập, nghĩa là một biến độc
lập có thể được biểu diễn xấp xỉ dưới dạng tổ
hợp tuyến tính của các biến độc lập khác, do đó
ta có thể đánh giá mức độ đa cộng tuyến bằng
cách hồi quy một biến độc lập Xj theo các biến
độc lập còn lại dưới dạng mô hình tuyến tính,
gọi là hồi quy phụ (auxiliary regression).
20
Bài giảng Kinh tế lượng © Tien M. Le
Phát hiện đa cộng tuyến
Trên nguyên tắc ta cần kiểm định giá trị Rj
2 của
tất cả các hồi quy phụ.
Ta có thể áp dụng “Rule of Thumb” của Klein:
Đa cộng tuyến trở thành vấn đề nghiêm trọng
nếu như ∃ R2phụ > R
2.
21
Bài giảng Kinh tế lượng © Tien M. Le
Phát hiện đa cộng tuyến
Dùng nhân tử phóng đại phương sai: VIF
VIFj=1/(1-Rj
2)
Kinh nghiệm: VIFj > 10 (tức Rj
2 > 0.9) ⇒ ĐCT cao
22
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
* Rj
2 càng gần 1, nghĩa là mức độ cộng tuyến giữa Xj
với những biến độc lập còn lại càng cao, thì VIFj càng
lớn, Rj
2→1 thì VIFj →∞.
• Tuy nhiên việc đánh giá mức độ cộng tuyến thông
qua giá trị VIF cũng có ý nghĩa tương đối. Tức là giá trị
VIF cao thì không có nghĩa là phương sai và sai số
của các ước lượng cao. Nhắc lại công thức tính
phương sai của các ước lượng trong mô hình hồi quy
có hai biến độc lập :
Var(βj^)=(1/Σxji
2).(1/1-Rj
2)=(1/Σxji
2).VIFj
Phương sai của βj^ phụ thuộc vào 3 thành phần
σ2,Σxji
2 và VIFj. Như vậy một giá trị VIF cao chưa đủ
để xác định phương sai của ước lượng là cao.
23
Bài giảng Kinh tế lượng © Tien M. Le
Vài điều về đa cộng tuyến
Trong thực tế hầu như các biến độc lập đều có
đa cộng tuyến với nhau, chỉ là với mức độ cao
hay thấp mà thôi
Khi có đa cộng tuyến thì các ước lượng thu
được vẫn có tính chất BLUE: là ước lượng
tuyến tính, không chệch, có phương sai bé nhất
trong lớp các ước lượng tuyến tính không chệch
24
22/8/2015
5
Bài giảng Kinh tế lượng © Tien M. Le
Vài điều về đa cộng tuyến
Trong thực nghiệm, người ta quan tâm đến mức
độ ảnh hưởng của đa cộng tuyến đối với kết quả
ước lượng hơn là việc xác định đa cộng tuyến
có tồn tại hay không.
Khi ảnh hưởng của đa cộng tuyến được xem là
nghiêm trọng, người ta có thể dùng nhiều công
cụ khác nhau để tìm cách hạn chế ảnh hưởng
của nó, và mỗi công cụ tỏ ra thích hợp trong
những hoàn cảnh cụ thể.
25
Bài giảng Kinh tế lượng © Tien M. Le
Vài điều về đa cộng tuyến
Khi vấn đề đa cộng tuyến được đánh giá là ảnh
hưởng không nghiêm trọng đến kết quả nghiên
cứu, đôi khi người ta có thể bỏ qua, bởi vì việc
khắc phục đa cộng tuyến có thể gây ra những
hậu quả khác nghiêm trọng hơn.
Có thể bỏ qua đa cộng tuyến khi:
∀ |tstat|>2
R2 > ∀R2phụ
26
Bài giảng Kinh tế lượng © Tien M. Le
Khắc phục đa cộng tuyến
Bỏ bớt biến độc lập
Sử dụng sai phân cấp 1
Thay đổi dạng hàm
Hồi quy độ lệch (khi hàm hồi quy đa thức)
Kết hợp số liệu chéo và số liệu chuỗi thời gian
Thu thập thêm số liệu hoặc lấy thêm mẫu mới
Sử dụng thông tin tiên nghiệm
27
Bài giảng Kinh tế lượng © Tien M. Le
Bỏ bớt biến độc lập
Bỏ bớt một trong các biến có cộng tuyến với
nhau có thể làm cho hệ số hồi quy của những
biến còn lại trong mô hình từ kết quả ban đầu là
≠ 0 không có ý nghĩa chuyển thành ≠ 0 có ý
nghĩa về mặt thống kê.
Nên bỏ cùng lúc hay bỏ lần lượt?
Nên bỏ lần lượt vì nếu bỏ cùng lúc thì mô hình bị
thiếu biến quan trọng -> ước lượng bị chệch-> không
tốt
Nếu bỏ lần lượt thì bỏ biến nào trước?
Bỏ biến có p-value lớn nhất hoặc có R2f lớn nhất
28
Bài giảng Kinh tế lượng © Tien M. Le
Bỏ bớt biến độc lập
Việc bỏ bớt biến có thể dẫn đến hậu quả là ước
lượng của các hệ số trong mô hình bị chệch
Trong một số tình huống, việc bỏ bớt biến nhằm tránh
vấn đề đa cộng tuyến lại gây ra hậu quả nghiêm trọng
hơn. (Tại sao?)
bởi vì, đa cộng tuyến có thể làm cho sai số của các ước
lượng lớn nhưng vẫn là ước lượng không chệch, trong khi
đó bỏ bớt biến có thể dẫn đến ước lượng chệch nhiều so với
giá trị tham số thực.
29
!
Bài giảng Kinh tế lượng © Tien M. Le
Hồi quy sai phân cấp 1
Dưới góc độ thời gian, các biến số kinh tế
thường chịu tác động ảnh hưởng của xu hướng
và do đó dễ tương quan (cộng tuyến) với nhau
Sử dụng sai phân cấp 1 có thể làm giảm những
hậu quả nghiêm trọng của đa cộng tuyến
30
22/8/2015
6
Bài giảng Kinh tế lượng © Tien M. Le
Hồi quy sai phân cấp 1
Trong một số trường hợp thì ut không có tự tương
quan nhưng vt = ut – ut-1 có thể có tự tương quan.
Điều này vi phạm giả thiết tự tương quan. Vậy ta có
thể làm giảm bớt vi phạm này nhưng lại mắc phải vi
phạm khác.
Bậc tự do bị giảm đi 1 do bị mất một quan sát trong
quá trình biến đổi số liệu, điều này có thể ảnh hưởng
đến kết quả ước lượng khi cỡ mẫu nhỏ.
31
!
Bài giảng Kinh tế lượng © Tien M. Le
Hồi quy sai phân cấp 1
Việc sử dụng sai phân cấp 1 có thể không thích hợp
đối với số liệu chéo.
Khi sử dụng sai phân cấp 1 ta có hồi quy qua gốc tọa
độ. Đây cũng là điều mà ta nên cân nhắc.
Lưu ý: lệnh hồi quy qua gốc toạ độ không có hệ số chặn C
32
!
Bài giảng Kinh tế lượng © Tien M. Le
Hồi quy theo độ lệch
Đối với hồi quy đa thức, nếu biến độc lập tương
ứng với các bậc lũy thừa khác nhau có khuynh
hướng cộng tuyến cao thì ta có thể giảm ảnh
hưởng của đa cộng tuyến bằng cách sử dụng
hàm hồi quy độ lệch theo giá trị trung bình.
33
Bài giảng Kinh tế lượng © Tien M. Le
Hồi quy theo độ lệch
Thí dụ, ta có mô hình hồi quy đa thức ban đầu
như sau:
Y = β1 + β2X + β3X
2 + β4X
3 + u
= β1 + β2Z1 + β3Z2 + β4Z3 + u
Ta có thể chuyển về dạng:
34
1 2 1 1 3 2 2 4 3 3Y = β +β Z -Z +β Z -Z +β Z -Z + v
Bài giảng Kinh tế lượng © Tien M. Le
Kết hợp số liệu chéo và số liệu chuỗi thời
gian
Kết hợp giữ liệu chéo và giữ liệu chuỗi thời gian
ta được dữ liệu hỗn hợp (Panel data).
Kỹ thuật này được áp dụng nhiều, vì khắc phục được
những khó khăn khi ta chỉ sử dụng một loại dữ liệu
thuần chuỗi thời gian hay chéo. Tuy nhiên, việc diễn
giải kết quả với dữ liệu hỗn hợp sẽ khó khăn hơn.
Đối với dữ liệu chuỗi thời gian, thường gặp phải
vấn đề đa cộng tuyến giữa các biến, trong khi
với dữ liệu chéo thường các biến không thay đổi
nhiều về giá trị khi xét tại một thời điểm (thí dụ
như yếu tố giá).
35
Bài giảng Kinh tế lượng © Tien M. Le
Thu thập thêm số liệu hoặc lấy thêm mẫu
mới
Đa cộng tuyến đặc biệt là một hiện tượng mẫu
theo nghĩa cho dù các biến độc lập Xj không
tương quan tuyến tính trong tổng thể, chúng
cũng có thể tương quan tuyến tính trong một
mẫu cụ thể nào đó. Do đó:
với cỡ mẫu lớn thì vấn đề đa cộng tuyến ít nghiêm
trọng hơn với cỡ mẫu nhỏ.
có thể trong mẫu khác thì đa cộng tuyến ít nghiêm
trọng hơn với mẫu đã có
36
22/8/2015
7
Bài giảng Kinh tế lượng © Tien M. Le
Thu thập thêm số liệu hoặc lấy thêm mẫu
mới
Việc thu thập thêm số liệu hay lấy mẫu mới không
phải lúc nào cũng thực hiện được vì thông thường
đòi hỏi chi phí cao, hoặc là các quan sát mới bổ sung
không có cùng quan hệ cấu trúc kinh tế (economic
structure) như các quan sát đã có
37
!
Bài giảng Kinh tế lượng © Tien M. Le
Sử dụng thông tin tiên nghiệm
Thông tin tiên nghiệm có thể có từ các nghiên
cứu thực nghiệm trước đây, mà trong đó hiện
tượng cộng tuyến có thể xảy ra nhưng ít nghiêm
trọng hơn (và như vậy kết quả nghiên cứu thực
nghiệm này có thể tin cậy để sử dụng như là
những thông tin tiên nghiệm), hoặc từ các lý
thuyết liên quan đến lĩnh vực nghiên cứu.
38
Bài giảng Kinh tế lượng © Tien M. Le
Sử dụng thông tin tiên nghiệm
Thí dụ như khảo sát mô hình hồi quy giữa chi
tiêu tiêu dùng Y theo thu nhập X1 và sự giàu có
X2:
Yi = β1 + β2X1i + β3X2i + ui
Thu nhập và giàu có là hai biến có khuynh
hướng cộng tuyến cao.
39
Bài giảng Kinh tế lượng © Tien M. Le
Sử dụng thông tin tiên nghiệm
Giả sử rằng nghiên cứu thực nghiệm trước đây
cho ta biết quan hệ giữa các hệ số hồi quy riêng
là β3 = 0.1β2, nghĩa là mức độ ảnh hưởng của
thu nhập đối với chi tiêu gấp 10 lần mức độ ảnh
hưởng của sự giàu có đối với chi tiêu. Như vậy
ta có thể sử dụng mô hình hồi quy thay thế là:
Yi = β1 + β2X1i + β3X2i + ui
= β1 + β2(X1i + 0.1X2i) + ui
= β1 + β2Xi + ui
40
Bài giảng Kinh tế lượng © Tien M. Le
Sử dụng thông tin tiên nghiệm
trong đó Xi = X1i + 0.1X2i
Khi ước lượng được β2^, ta dễ dàng ước lượng
được β3^=0.1β2^
41
Bài giảng Kinh tế lượng © Tien M. Le
c6-td62: data
Y: chi tiêu cho tiêu dùng ($)
X1 : thu nhập ($)
X2 : sự giàu có ($)
Nguồn: Ramanathan
Lý thuyết?
Mô hình hồi quy ? Dấu kì vọng?
42
22/8/2015
8
Bài giảng Kinh tế lượng © Tien M. Le
c6-td62: kết quả hồi quy
43
Bài giảng Kinh tế lượng © Tien M. Le
c6-td62: Phân tích kết quả hồi quy
Ý nghĩa của các hệ số hồi quy?
Dấu của các hệ số hồi quy có phù hợp với lý
thuyết kinh tế không? (Dấu kì vọng và dấu thực
tế?)
Ý nghĩa thống kê của các hệ số? Có mâu thuẫn
gì với lí thuyết kinh tế hay không? Nếu có mâu
thuẫn bạn nghĩ đến điều gì?
44
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
Dựa vào kết quả hồi quy, dễ dàng nhận thấy dấu
của hệ số hồi quy của biến X2 không phù hợp
với lý thuyết kinh tế (- 0.042435 < 0).
Ngoài ra ta thấy p-value (X1) = 0.2902 và p-
value (X2) = 0.6151 nên X1 và X2 không có ý
nghĩa thống kê, tuy nhiên R2 = 0.963504 lớn.
Điều này làm ta nghĩ đến việc có thể xảy ra hiện
tượng cộng tuyến cao giữa hai biến thu nhập
(X1) và sự giàu có (X2). Điều này hoàn toàn có lý
vì thông thường người có thu nhập cao thì được
xem là giàu có.
45
Bài giảng Kinh tế lượng © Tien M. Le
c6-td62: Nhận dạng đa cộng tuyến
Phát hiện ĐCT:
Kết luận chung: có ĐCT
46
Dấu hiệu Kết luận:
Dấu hệ số ngược kì vọng có
R2 >0.8 & ∃ |tqs|<2 có
rXjXs > 0.8 có
Hồi quy phụ có
VIFj có
Bài giảng Kinh tế lượng © Tien M. Le
c6-td62: Khắc phục đa cộng tuyến
Đổi dạng hàm: vẫn còn ĐCT
Hồi quy sai phân: vẫn còn ĐCT
Bỏ biến: Dùng các kiểm định bỏ bớt biến.
Chấp nhận H0: c(3)=0, nghĩa là có thể bỏ X2. (1)
Chấp nhận H0: c(2)=0, nghĩa là có thể bỏ X1. (2)
Bác bỏ H0: c(2)=c(3)=0, nghĩa là không thể bỏ cùng
lúc cả X1 và X2. (3)
Từ (1), (2), (3) không thể xảy ra c(2)0 & c(3)0,
và do đó chỉ có thể xảy ra (1) hoặc (2).
So sánh kết quả trước và sau khi bỏ X2; X1 đi tới kết
luận: nên bỏ X2.
47
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
Hồi quy Y theo X1, X2:
p-value (X1) = 0.2902, p-value (X2) = 0.6151.
Hồi quy Y theo X1: R
2 = 0.962062.
Hồi quy Y theo X2: R
2 = 0.956679.
Nhận thấy X2 ít ý nghĩa thống kê hơn X1 (p-value
(X2) > p-value (X1)), và mô hình hồi quy Y theo
X1 có mức độ phù hợp cao hơn mô hình hồi quy
Y theo X2, vậy ta có thể bỏ bớt biến X2.
48
22/8/2015
9
Bài giảng Kinh tế lượng © Tien M. Le
c6-td62: Khắc phục đa cộng tuyến
49
Phương pháp Khuyến nghị Kết quả
Bỏ bớt biến độc lập
Sử dụng sai phân cấp 1
Đổi dạng hàm
Hồi quy độ lệch
Kết hợp số liệu chéo và số liệu
chuỗi thời gian
Thu thập thêm số liệu
Sử dụng thông tin tiên nghiệm
Bài giảng Kinh tế lượng © Tien M. Le
c6-td61: data
Y: lượng tiêu dùng thịt gà tính theo đầu người
(pounds)
X1: thu nhập khả dụng thực theo đầu người ($)
X2: giá bán lẻ thực của thịt gà (cents/pound)
X3: giá bán lẻ thực của thịt heo (cents/pound)
X4: giá bán lẻ thực của thịt bò (cents/pound)
Thời kì: 1960-1982
Địa điểm: Mỹ
Nguồn: Gujarati
50
Bài giảng Kinh tế lượng © Tien M. Le
c6-td61: kết quả hồi quy
51
Bài giảng Kinh tế lượng © Tien M. Le
c6-td61: phân tích kết quả hồi quy
Ý nghĩa của các hệ số hồi quy?
Cầu thịt gà có co giãn theo giá không? Tại sao?
Dấu của các hệ số hồi quy có phù hợp với lý
thuyết kinh tế không? (Dấu kì vọng và dấu thực
tế?)
Ý nghĩa thống kê của các hệ số? Có mâu thuẫn
gì với lí thuyết kinh tế hay không? Nếu có mâu
thuẫn bạn nghĩ đến điều gì?
52
Bài giảng Kinh tế lượng © Tien M. Le
Ghi chú
Lý thuyết vĩ mô: Y = f(X1,X2,X3,X4)
Mô hình hồi quy ? Dấu kì vọng?
• hệ số co giãn của cầu thịt gà theo giá thịt gà có giá trị tuyệt
đối < 1, điều này chứng tỏ rằng thịt gà là mặt hàng không co
giãn theo giá
• Hệ số hồi quy của cầu thịt gà theo giá thịt heo hay thịt bò > 0
chứng tỏ giá của các mặt hàng thay thế cho thịt gà có tác
động đồng biến đối với lượng cầu của thịt gà.
• Nếu xem xét ở mức độ ý nghĩa thống kê của các giá trị ướ