Bài giảng Kinh tế lượng - Chương V: Các sai lầm cơ bản trong quá trình xây dựng mô hình hồi qui đa biến

Khái niệm Đa cộng tuyến: l Là hiện tượng các biến độc lập có tương quan với nhau l Mô hình lý tưởng khi các biến độc lập không tương quan l Có thể có nhiều mức độ tương quan: l Tương quan hoàn toàn (đa cộng tuyến hoàn hảo) r223 =1 λ2X2 + λ3X3 =0 X2 = λX3 l tương quan không hoàn toàn (đa cộng tuyến không hoàn hảo) λ2X2 + λ3X3 + v =0 v: sai số ngẫu nhiên X2 = λX3 + u

pdf5 trang | Chia sẻ: thanhlam12 | Lượt xem: 515 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Bài giảng Kinh tế lượng - Chương V: Các sai lầm cơ bản trong quá trình xây dựng mô hình hồi qui đa biến, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1Chương V: Các sai lầm cơ bản trong quá trình xây dựng mô hình hồi qui đa biến Đa cộng tuyến TS Nguyễn Minh Đức Prepared by NMDUC 2009 Đa cộng tuyến (Multicollinearity) Khái niệm Đa cộng tuyến: l Là hiện tượng các biến độc lập có tương quan với nhau l Mô hình lý tưởng khi các biến độc lập không tương quan l Có thể có nhiều mức độ tương quan: l Tương quan hoàn toàn (đa cộng tuyến hoàn hảo) r223 =1 λ2X2 + λ3X3 =0 X2 = λX3 l tương quan không hoàn toàn (đa cộng tuyến không hoàn hảo) λ2X2 + λ3X3 + v =0 v: sai số ngẫu nhiên X2 = λX3 + u 2Prepared by NMDUC 2009 Đa cộng tuyến (Multicollinearity) Nguyên nhân: l Phương pháp thu thập số liệu: mẫu không đặc trưng l Bản chất của các biến có mối tương quan l Mô hình: biến có số mũ cao l Kích cỡ mẫu nhỏ Prepared by NMDUC 2009 Các hệ số ước lượng: Yi = β1 + β2 X2i + β3 X3i + ei l Trường hợp đa cộng tuyến hoàn hảo: l Không thể tách ảnh hưởng của từng biến độc lập lên biến phụ thuộc l Không thể có giá trị duy nhất của từng hệ số hồi quy, mặc dù có đáp số duy nhất cho tổ hợp tuyến tính. Đa cộng tuyến (Multicollinearity) 3Prepared by NMDUC 2009 l X2 = λX3 l không xác định 2 1 ,3,2 1 2 3 1 2 2 1 ,3,2 1 ,2 1 2 2 1 ,3 3 ˆ       −                        −            = ∑∑∑ ∑∑∑∑ === ==== n i ii n i i n i i n i ii n i ii n i i n i ii xxxx xxxyxxy β ^ 321 ,ˆ,ˆ βββ 3 ^ 32 ^ 2 ^ 1 XXY βββ −−= 2 1 ,3,2 1 2 3 1 2 2 1 ,3,2 1 ,3 1 2 3 1 ,2 2 ˆ       −                        −            = ∑∑∑ ∑∑∑∑ === ==== n i ii n i i n i i n i ii n i ii n i i n i ii xxxx xxxyxxy β Đa cộng tuyến (Multicollinearity) Prepared by NMDUC 2009 l Trường hợp đa cộng tuyến không hoàn hảo: l Có thể xác định được giá trị của các hệ số hồi quy Đa cộng tuyến (Multicollinearity) 4Prepared by NMDUC 2009 Hậu quả của đa cộng tuyến l Phương sai, hiệp phương sai và sai số chuẩn là vô hạn ∑ − =      )1( var 2 23 2 2 2^ 2 rx i δβ ∑ − =      )1( var 2 23 2 3 2^ 3 rx i δβ ∑ ∑− − =         2 3 2 2 2 23 2 23 ^ ^ 32 )1( ,cov ii xxr r δββ ∑− = 22 23 ^ )1( )( i i xr se δβ Đa cộng tuyến (Multicollinearity) Prepared by NMDUC 2009 Hậu quả của đa cộng tuyến l Khoảng tin cậy rộng hơn l Xác suất chấp nhận giả thuyết H0 -tăng (tăng sai lầm loại II) l R2 cao, nhưng nhiều giá trị t thấp l Hệ số ước lượng và sai số chuẩn rất nhạy cảm với những thay đổi trong số liệu l Dấu của các hệ số ước lượng có thể sai l Thêm hay bớt biến cộng tuyến, sẽ có thay đổi về độ lớn và dấu của các hệ số ước lượng. Đa cộng tuyến (Multicollinearity) 5Prepared by NMDUC 2009 l Cách phát hiện đa cộng tuyến: l Do đa cộng tuyến hoàn hảo rất hiếm khi xảy ra, trong khi đa cộng tuyến không hoàn hảo xảy ra rất thường xuyên cho nên ta thường xác định mức độ tương quan chứ không xác định loại cộng tuyến. l Các cách xác định đa cộng tuyến phổ biến: 1/ Dựa vào R2 và t 2/ Xác định hệ số tương quan cặp giữa các biến độc lập (>0.8) 3/ Hồi quy phụ: hồi quy một biến X theo các biến X còn lại Đa cộng tuyến (Multicollinearity) Prepared by NMDUC 2009 Cách khắc phục: l Không có biện pháp hoàn hảo. Phụ thuộc vào tính nghiêm trọng của đa cộng tuyến và bản chất của số liệu mẫu. Đôi khi áp dụng biện pháp khắc phục không phù hợp sẽ dẫn đến sai lầm nghiêm trọng hơn. 1/ Sử dụng thông tin đã biết 2/ Tăng cỡ mẫu, hoặc lấy thêm mẫu mới: có thể mẫu mới có các biến độc lập ít tương quan 3/ Bỏ bớt biến: dựa vào R2 để quyết định biến nên bỏ. Tuy nhiên trong những trường hợp không thể bỏ biến được thì nên cân nhắc giữa sai lệch khi bỏ biến và việc tăng phương sai của các hệ số ước lượng. 4/ Sử dụng biến trễ. 5/ Giảm tương quan trong hồi quy đa thức: các biến độc lập có bậc lũy thừa khác nhau 6/ Khác: hồi quy thành phần chính, sử dụng các ước lượng từ bên ngoài. Đa cộng tuyến (Multicollinearity)