Chương 4 Phân tích hồi quy và tương quan

NHỮNG CHỦ ĐỀ CHÍNH Mối liên hệ giữa các hiện tượng KT-XH và phương pháp hồi quy tương quan Xác định mô hình hồi quy tuyến tính đơn Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình Ước lượng giá trị trong tương lai dựa vào mô hình hồi quy Mô hình hồi quy bội

pptx50 trang | Chia sẻ: thanhlam12 | Lượt xem: 742 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Chương 4 Phân tích hồi quy và tương quan, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUANCHƯƠNG 4NHỮNG CHỦ ĐỀ CHÍNHMối liên hệ giữa các hiện tượng KT-XH và phương pháp hồi quy tương quanXác định mô hình hồi quy tuyến tính đơnĐánh giá cường độ của mối liên hệ và sự phù hợp của mô hìnhƯớc lượng giá trị trong tương lai dựa vào mô hình hồi quyMô hình hồi quy bội1. Mối quan hệ giữa các hiện KT – XH và phương pháp hồi quy tương quanPhân tích hồi quy được sử dụng đầu tiên để dự đoán Một mô hình thống kê được sử dụng để dự đoán giá trị của biến phụ thuộc (biến kết quả) dựa trên những giá trị của ít nhất một biến độc lập (biến nguyên nhân) Phân tích tương quan được sử dụng làm thước đo độ lớn trong mối liên hệ giữa các biến định lượng.Biểu đồ phân tán (Scatter)Đồ thị gồm tất cả các cặp Các loại mô hình hồi quyMối liên hệ tuyến tính thuậnMối liên hệ tuyến tính nghịchMối liên hệ phi tuyếnKhông có mối liên hệ2. Xác định mô hình hồi quy tuyến tính đơnMối liên hệ giữa các biến là một phương trình đường thẳngĐường thẳng là phù hợp nhất với dữ liệuY: biến phụ thuộc; X: biến độc lập; b0: Hệ số chặnb1 : Hệ số góc (độ dốc của đường hồi quy)ei : Sai số mô hìnhGiả địnhMối quan hệ giữa X và Y là tuyến tínhX và Y là biến định lượngX không có sai số ngẫu nhiên; Các giá trị của Y độc lập với nhau ( ví dụ Y1 không liên quan tới Y2)Sai số ngẫu nhiên EPI 809/Spring 20088Mô hình hồi quy của tổng thể chungGiá trị quan sátGiá trị quan sáti : Sai số ngẫu nhiênEPI 809/Spring 20089Tổng thể và mô hình hồi quy mẫuTổng thể     EPI 809/Spring 200810Tổng thể và mô hình hồi quy mẫuUnknown RelationshipTổng thể     EPI 809/Spring 200811Tổng thể và mô hình hồi quy mẫuUnknown RelationshipTổng thểMẫu ngẫu nhiên       EPI 809/Spring 200812Tổng thể và hàm hồi quy mẫuUnknown RelationshipTổng thểMẫu ngẫu nhiên       13Ước lượng mô hình hồi quyMô hình được ước lượng bằng cáchThu thập mẫu từ tổng thểTính toán các giá trị thống kê của tổng thể mẫu.Xác định đường thẳng đi qua tập dữ liệuwwwww w w www www wwđường thẳng nào là tốt nhất?xyPhương pháp bình phương tối thiểu (Ordinary Least Square ) Đường hồi quy tìm được là đường thẳng sao cho tổng bình phương sai số từ điểm quan sát tới đường thẳng đó là nhỏ nhất15Phương pháp bình phương tối thiểu33wwww4114(1,2)22(2,4)(3,1.5)Sum of squared differences =(2 - 1)2 +(4 - 2)2 +(1.5 - 3)2 +(4,3.2)(3.2 - 4)2 = 6.89Sum of squared differences =(2 -2.5)2 +(4 - 2.5)2 +(1.5 - 2.5)2 +(3.2 - 2.5)2 = 3.992.5Let us compare two linesThe second line is horizontalThe smaller the sum of squared differencesthe better the fit of the line to the data.Phương pháp bình phương tối thiểusao choSuy rathỏa mãnCần tìm17Ước lượng hệ số hồi quyTa thu được công thức sau: Hàm hồi quy có dạngVí dụ 1Giả sử cần nghiên cứu chi tiêu tiêu dùng của hộ gia đình phụ thuộc thế nào vào thu nhập của họ, người ta tiến hành điều tra, thu được một mẫu gồm 10 hộ gia đình với số liệu như sau :Y: Chi tiêu của hộ gia đình (USD/Tuần)Thu nhập của hộ gia đình (USD/Tuần)Y70659095110115120140155150X80100120140160180200220240260Thuyết minh kết quảY = 24.46 + 0.509 XHệ số chặn: 24.46  dù không có thu nhập thì mỗi gia đình cũng phải tiêu ít nhất 24.46 usd/tuầnĐộ dốc: 0.509  mỗi khi thu nhập tăng lên 10 usd thì trung bình mỗi gia đình sẽ tiêu thêm khoảng 5 usd một tuầnƯớc tính bằng RChúng ta muốn ước tính mối liên quan giữa việc thích mua sắm và xu hướng mua hàng ngẫu nhiên của người tiêu dùngMô hình hồi quy tuyến tínhR: lm(IB~ShopEnjoy)>library(foreign)>ibdata = read.spss("DataIBforpractice.sav", to.data.frame=T)# Tạo biến trung gian>ibdata$ShopEnjoy = (ibdata$Shopenjoy1+ ibdata$Shopenjoy2+ ibdata$Shopenjoy3+ ibdata$Shopenjoy4+ ibdata$Shopenjoy5+ ibdata$Shopenjoy6)/6>ibdata$IB = (ibdata$IB1+ibdata$IB2)>attach(ibdata)# Phân tích hồi quy >f = lm(IB~ShopEnjoy)>summary (f)Diễn giải kết quảMô hình mô tả tương quan giữa IB và ShopEnjoyIB = 1.7433 + 0.34936*ShopEnjoy Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.74330 0.10349 16.85 0)Giá trị thống kê Với df = n-2 và3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình 3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hìnhCác mức độ biến đổiXác định hệ số xác địnhMiền xác định của R  1 hàm hồi quy càng phù hợpR 0 hàm hồi quy càng không phù hợpHệ số tương quan Thước đo cường độ của mối liên hệTrả lời câu hỏi “Mối liên hệ tuyến tính giữa hai biến mạnh như thế nào”?Chứng minh được r > 0,8 : tương quan mạnh r = 0,4 - 0,8 : tương quan trung bình r 2 hàm hồi quy có ý nghĩa4. Ước lượng các giá trị trong tương lai dựa vào mô hình hồi quyƯớc lượng giá trị trung bình cho Y khi X đạt giá trị cá biệt nào đóƯớc lượng khoảng tin cậy của Y tại một giá trị cá biệt của X4. Ước lượng các giá trị trong tương lai dựa vào mô hình hồi quy5. Mô hình hồi quy bội5.1 Mô hình hồi bội5.2 Xác định hệ số hồi quy5.3 Xây dựng mô hình5.1 Mô hình hồi quy bộiMỗi liên hệ giữa 1 biến phụ thuộc với 2 hoặc hơn 2 biến độc lập5.1 Mô hình hồi quy bộiVí dụKết quả chạy mô hìnhSử dụng mô hình để dự đoánƯớc lượng nhiên liệu bình quân một tháng cho mỗi hộ gia đình nếu nhiệt độ trung bình là 30 độ F và độ dày tấm cách nhiệt là 6 inchesXác định hệ số xác định bộiKiểm định mức ý nghĩa chungChỉ ra có mối liên hệ giữa tất cả các biến X với Y hay khôngSử dụng kiểm định F (Không có mối quan hệ tuyến tính)Có ít nhất 1 biến độc lập ảnh hưởng tới YF>2 Hàm hồi quy có nghĩaKiểm định ý nghĩa cá biệt Ước lượng khoảng tin cậy cho độ dốc5.3 Xây dựng mô hình1. Mục đích để xây dưng mô hình với số biến nguyên nhân ít nhấtDễ dàng thuyết minhXác suất cộng tuyến nhỏ hơnThực hiện hồi quy từng bướcNhằm lựa chọn mô hình phù hợpTiếp cận tập hợp con một cách tốt nhấtNghiên cứu các yếu tố ảnh hưởng đến hành vi mua hàng ngẫu hứng#Tạo các biến trung gian>Modern = (Modern1+ Modern2+ Modern3+ Modern4+ Modern5)/5>Trad =(Trad1 +Trad2+Trad3+Trad4+Trad5)/5>Indiv =(Indiv1+Indiv2+Indiv3+Indiv4+Indiv5+Indiv6+Indiv7)/7#phân tích>f2 = lm(IB~ShopEnjoy+Modern+Trad+Indiv+Age)>summary(f2)Phân tích kết quảCoefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.615644 0.279454 9.360 < 2e-16 ***ShopEnjoy 0.325801 0.030045 10.844 < 2e-16 ***Modern 0.125704 0.054355 2.313 0.02101 * Trad -0.232754 0.052500 -4.433 1.06e-05 ***Indiv -0.064620 0.060412 -1.070 0.28511 Age -0.008635 0.003124 -2.764 0.00584 ** Tóm tắtCác loại mô hình hồi quyXác định mô hình hồi quy tuyến tính đơnCác mức độ biến đổi trong hồi quy tương quanƯớc lượng các giá trị dự đoánXác định mô hình hồi quy bối