Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay còn gọi là biến được giải thích) vào một biến hay nhiều biến khác (biến độc lập hay còn gọi là biến giải thích) với ý tưởng cơ bản là ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị đã biết của biến độc lập.
30 trang |
Chia sẻ: vietpd | Lượt xem: 2227 | Lượt tải: 4
Bạn đang xem trước 20 trang tài liệu Đề tài Phương pháp hồi quy và tương quan - Phân tích dãy số thời gian và dự báo, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 1
CƠ SỞ LÝ LUẬN
1.1. Phương pháp hồi quy và tương quan
1.1.1. Hồi qui tuyến tính một chiều ( tuyến tính đơn)
Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay còn gọi là biến được giải thích) vào một biến hay nhiều biến khác (biến độc lập hay còn gọi là biến giải thích) với ý tưởng cơ bản là ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị đã biết của biến độc lập.
1.1.1.1. Phương trình hồi qui tuyến tính một chiều
Đặt (x1, y1), (x2, y2),…, (xn, yn) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể:
y = + +
Theo phương pháp bình phương bé nhất thì ước lượng các hệ số và là các giá trị a và b sao cho tổng bình phương sai số của phương trình sau đây là bé nhất:
SS = =
Các hệ số a và b được tính như sau:
b = =
Suy ra : a = - b
Và phương trình hồi qui tuyến tính mẫu của y trên x là: y = a + b
1.1.1.2. Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều
Giả sử đường hồi qui tuyến tính có dạng: = + +
Và đặt là phương sai của sai số và được ước lượng từ công thức sau:
= =
Đặt b là ước lượng mẫu của thì phương sai của b là
= =
Ước lượng không chênh lệch của được xác định bởi:
= = =
Giả sử, sai số hồi qui () có phân phối chuẩn thì ngẫu nhiên (t) dùng để kiểm định giả thuyết về và ước lượng khoảng tin cậy của được tính như sau:
t =
Và khoảng tin cậy 100 (1 - )% cho là:
Trong đó, là một số sao cho P( >) =
1.1.1.3. Kiểm định tham số hồi qui tổng thể ()
Ở mức ý nghĩa , giả thuyết H0 có thể được kiểm định dưới các trường hợp:
Đặt giả thuyết: (1) (2) (3)
Giá trị kiểm định: t =
Quyết định bác bỏ giả thuyết H0 khi: t < t <
Giả thuyết H0: = 0
1.1.1.4. Phân tích phương sai hồi qui
* Hệ số xác định: R2 là hệ số nhằm xác định mức độ quan hệ giữa X và Y có quan hệ hay không hoặc bao nhiêu phần trăm sự biến thiên của Y có thể giải thích bởi sự phụ thuộc tuyến tính của Y vào X.
Giá trị thực tế yi = a + bx1 +e1
Giá trị dự đoán theo phương trình hồi qui: y = a + bx1
y1 = + e1
Vậy e1 là sự khác biệt giữa giá trị thực tế với giá trị dự đoán của phương trình hồi qui tuyến tính. Như vậy e1 thể hiện phần biến thiên của Y không thể giải thích bởi mối quan hệ tuyến tính giữ Y và X.
Ta có:
= +
Hay SST = SSR+ SSE
SSR càng lớn thì mô hình hồi qui tuyến tính càng có độ tin cậy cao trong việc giải thích sự biến động của Y
Hệ số xác định R2 = = 1 - là phần trăm biến động của Y được giải thích bởi mối quan hệ tuyến tính của Y vào X.
* Phân tích phương sai
Trong ước lượng các tham số của mô hình hồi qui tuyến tính đơn theo phương pháp bình quân nhỏ nhất, có thể chứng minh được rằng:
∑ ( yi – ytb)2 = ∑ ( yi - i )2 + ∑ ( i – ytb)2
Trong đó:
∑ ( yi – ytb)2 = SST là tổng biến động của y
∑ ( i – ytb)2 = SSR là tổng bình phương hồi qui, là đại lượng biến động của y được giải thích bởi đường hồi qui.
∑ ( yi - i )2 = SSE là phần biến động còn lại hay còn gọi là dư số, là đại lượng biến động tổng gộp của nguồn biến động do các nhân tố khác gây ra mà không hiện diện trong mô hình hồi qui và phần biến động ngẩu nhiên.
● SSR càng lón thì mô hình hồi qui càng có độ tin cậy cao trong việc giải thích biến động của y.
● Hệ số xác định: r2 = SSR/ SST = 1 – ( SSE/ SST) là phần trăm biến động của y được giải thích bởi mối quan hệ tuyến tính của y đối với x.
● Số thống kê F = SSR/ [ SSE/ ( n-2)] = MSR/MSE có phân phối F và thường được dùng để kiểm định mức ý nghĩa của mô hình hồi qui. F càng lớn mô hình càng có ý nghĩa.
Các nguồn biến động của hồi qui tuyến tính đơn được tóm tắt trong bảng phân tích phương sai hồi qui như sau:
Nguồn biến động
Độ tự do
(d.f)
Tổng bình phương
(SS)
Trung bình bình phương
(MS)
Do hồi qui
Dư số
1
(n-2)
SSR=∑ ( i – ytb)2
SSE=∑ ( yi - i )2
SSE/(n-2)
Tổng cộng
(n-1)
SST= ∑ ( yi – ytb)2
SST/(n-1)
1.1.1.5. Dự báo trong phương pháp hồi qui tuyến tính đơn giản
Ước lượng khoảng giá trị thực của với độ tin cậy (1 - )
Se
Ước lượng khoảng giá trị trung bình của với độ tin cậy (1 - )
Se
1.1.2. Hồi qui tuyến tính nhiều chiều
1.1.2.1. Mô hình hồi qui
Giả sử Y phụ thuộc vào k biến độc lập X1…Xk. Nếu giá trị của k biến độc lập X1...Xk mô hình hồi qui tuyến tính nhiều chiều có dạng :
Y = + X1 + X2 + … +Xk + U
Giải thích biến:
- Y (biến phụ thuộc): chỉ tiêu phân tích: Năng suất lúa dình quân cả năm.
- ( biến độc lập): hệ số chặn phản ánh mức độ ảnh hưởng của các nhân tố khác đến chỉ tiêu phân tích.
- : hệ số ước lượng, các hệ số hồi quy này phản ánh mức độ ảnh hưởng của từng nhân tố đến biến giải thích.
Nếu >0 thì ảnh hưởng thuận và ngược lại là ảnh hưởng nghịch. càng lớn thì sự ảnh hưởng đến chỉ tiêu phân tích càng mạnh.
- Xi các yếu tố ảnh hưỏng đến năng suất.Với i chạy từ 1 đến k.
- U là sai số
1.1.2.2. Phương trình hồi qui
Gọi các hệ số a, b1…bk ước lượng cho ,… được xác định bởi phương pháp bình phương bé nhất. Phương trình hồi qui có dạng:
Y = a + b1x1 + b2x2 +…+bkxk.
Các tham số a, b1,b2,…,bn có thể được ước lượng dễ dàng nhờ các phần mềm có sẵn các biến độc lập X1, X2,…, Xk.
1.1.2.3. Phân tích phương sai hồi qui
F Hệ số xác định:
Hệ số xác định R2 là nói lên tính chặt chẽ giữa biến phụ thuộc Y và các biến độc lập Xi, tức là nó thể hiện phần trăm biến thiên của Y có thể được giải thích bởi sự biến thiên của tất cả các biến Xi.
R2 = = 1 - 0 R2 1
Trong đó:
SSE = : là phần biến động còn lại hay còn gọi là số dư
SSR = : là tổng bình phương hồi qui, là đại lượng biến động của y được giải thích bằng đường hồi qui
SST = : là tổng biến động của y.
SSR càng lớn thì mô hình hồi quy càng có độ tin cậy cao trong việc giải thích biến động y
F Hệ số tương quan bội R
R nối lên tính chặt chẽ của mối quan hệ giữa biến phụ thuộc (y) và các biến độc lập (xi).
R = (-1 R 1)
F Phân tích ANOVA hồi quy:
Kiểm định sự phù hợp của mô hình (ANOVA):
Giá trị được dùng để kiểm định là giá trị F. Việc kiểm định này nhằm đảm bảo cho việc phù hợp của mô hình hồi quy tuyến tính mẫu với các hệ số tìm được vẫn có giá trị khi suy diễn ra mô hình thực cho tổng thể.
Để kiểm định sự phù hợp của mô hình hồi quy tổng thể, ta sử dụng Sig.F để làm căn cứ cho việc chấp nhận hay bác bỏ giả thiết
Sig.F < α : mô hình có ý nghĩa.
Sig.F > α : mô hình không có ý nghĩa.
1.1.2.4. Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi quy nhiều chiều
Mô hình hồi qui nhiều chiều cho tổng thể có dạng:
y = + x1 + x2 +… + xk + U
Đặt a, b1, b2, … ,bk là những tham số được ước lượng cho tổng thể ; , , , …, là những độ lệch chuẩn đã ước lượng, và U coi phân phối chuẩn thì biến ngẫu nhiên t được tính như sau:
= ; = có độ tự do ( n –k -1)
Vì vậy, khoảng tin cậy 100(1-)% cho các hệ số hồi qui được tính như sau:
b1 - < < b1 +
là một số sao cho (P.
1.2.Dãy số thời gian
1.2.1. Khái niệm
Các hiện tượng kinh tế - xã hội luôn luôn biến động qua thời gian. Để nghiên cứu sự biến động này người ta dung phương pháp dãy số thời gian. Dãy số thời gian là dãy các giá trị của chỉ tiêu kinh tế - xã hội biến động theo thời gian.
1.2.2. Phân loại
Căn cứ vào đặc điểm về mặt thời gian, người ta thường chia dãy số thời gian thành 2 loại:
Dãy số thời kỳ: là dãy số biểu hiện sự thay đổi của hiện tượng qua từng thời kỳ nhất định.
Dãy số thời điểm: là dãy số biểu hiện mặt lượng của hiện tượng vào một thời điểm nhất định
Một cách chi tiết hơn, dãy số thời điểm còn có thể được chia thành dãy số thời điểm có khoảng cách thời gian bằng nhau và dãy số thời điểm có khoảng cách thời gian không bằng nhau.
1.2.3. Ý nghĩa của việc nghiên cứư dãy số thời gian
Phương pháp phân tích một dãy số thời gian dựa trên một giả định căn bản là: sự biến động trong tương lai của hiện tượng nói chung sẽ giống với sự biến động của hiện tượng trong quá khứ và hiện tại xét về mặt đặc điểm và cường độ biến động. Nói một cách khác các yếu tố đã ảnh hưởng đến biến động của hiện tượng trong quá khứ và hiện tại được giả định trong tương lai sẽ tiếp tục tác động đến hiện tượng theo xu hướng và cường độ giống hoặc gần giống như trước.
Do vậy, mục tiêu chính của phân tích dãy số thời gian là chỉ ra và tách biệt các yếu tố đã ảnh hưởng đến dãy số thời gian. Điều đó có ý nghĩa trong việc dự đoán cũng như nghiên cứu quy luật biến động của hiện tượng. Tất nhiên, giả định nói trên có nhược điểm, nó thường bị phê bình là quá ngây thơ và máy móc vì đã không xem xét đến sự thay đổi về kỹ thuật, thói quen, nhu cầu hoặc sự tích lũy kinh nghiệm trong kinh doanh... Vì vậy phương pháp phân tích dãy số thời gian cung cấp những thông tin hữu ích các nhà quản lý trong việc dự đoán và xem xét chu kỳ biến động của hiện tượng. Đây là công cụ đắc lực cho họ trong việc ra quyết định.
1.2.4. Các yếu tố ảnh hưởng đến dãy số thời gian
Biến động của một dãy số thời gian: X1, X2,…, Xn thường được xem như là kết quả hợp thành của các yếu tố sau đây:
- Tính xu hướng: Quan sát số liệu thực tế của hiện tượng trong một thời gian dài (thường là nhiều năm), ta thấy biến động của hiện tượng theo một chiều hướng ( tăng hoặc ) giảm rõ rệt. Nguyên nhân của 2 loại biến động này là sự thay đổi trong công nghệ sản xuất, gia tăng dân số, biến động về tài sản…
- Tính chu kỳ: biến động của hiện tượng được lặp lại với một chu kỳ nhất định, thường kéo dài 2-10 năm, trải qua 4 giai đoạn: phục hồi, phát triển, thịnh vượng, suy thoái và đình trệ. Biến động theo chu kỳ là do biến động tổng hợp của nhiều yếu tố khác nhau. Chẳng hạn như trong kỳ kinh doanh thì chu kỳ đời sống sản phẩm ảnh hưởng rất lớn đến doanh thu của công ty qua 4 giai đoạn của nó.
- Tính thời vụ: biến động của một số hiện tượng kinh tế - xã hội mang tính thời vụ nghĩa là hàng năm, vào thời điểm nhất định (tháng hoặc quý) biến động của hiện tượng được lặp đi lặp lại. Nguyên nhân của biến động hiện tượng là do các điều kiện thời tiết khí hậu tập quán xã hội, tín ngưỡng của dân cư…
- Tính ngẫu nhiên hay bất thường: là những biến động không có quy luật và hầu như không thể dự đoán được. Loại biến động này thường xảy ra trong một thời gian ngắn và không lặp lại. Nguyên nhân là do ảnh hưởng của các biến cố chính trị, thiên tai, chiến tranh…
Giá trị X trong dãy số thời gian X1, X2,…, Xn, có thể được diễn tả bằng công thức sau:
Xi = Ti . Ci . Si . Ii
Xi : Giá trị thứ i của dãy số thời gian
Ti : Giá trị của yếu tố xu hướng
Ci : Giá trị của yếu tố chu kỳ
Si : Giá trị của yếu tố thời vụ
Ii : Giá trị của yếu tố ngẫu nhiên (bất thường)
1.2.5. Các chỉ tiêu cơ bản dùng để phân tích biến động dãy số thời gian
1.2.5.1. Mức độ trung bình theo thời gian
Là số trung bình của các mức độ trong dãy số. Chỉ tiêu này biểu hiện mức độ chung nhất của hiện tượng trong thời kỳ nghiên cứu.
Ký hiệu: x1, x2, …, xn: Dãy số thời gian
: Mức độ trung bình
Mức độ trung bình của dãy số thời kỳ
= =
Mức độ trung bình của dãy số thời điểm
Khoảng cách thời gian giữa các thời điểm bằng nhau
=
Nếu khoảng cách giữa các điểm thời gian không bằng nhau
=
xi: mức độ thứ i
ti: độ dài thời gian có mức độ thứ i
: Giá trị trung bình thứ i
1.2.5.2.Lượng tăng (giảm) tuyệt đối
Là chỉ tiêu biểu hiện sự thay đổi về giá trị tuyệt đối của hiện tượng giữa hai thời kỳ hoặc thời điểm nghiên cứu.
Tuỳ theo mục đích nghiên cứu, ta có:
Lượng tăng giảm tuyệt đối từng kỳ (liên hoàn): Biểu hiện lượng tăng giảm
tuyệt đối giữa 2 thời kỳ kế tiếp nhau.
= xi - ( I =2, …,n)
Lượng tăng (giảm) tuyệt đối định gốc: Biểu hiện lượng tăng giảm tuyệt đối
giữa kỳ nghiên cứu và kỳ được chọn làm gốc.
= xi – x1
x1: kỳ được chọn làm gốc
Giữa lượng tăng (giảm) tuyệt đối từng kỳ và định gốc có mối liên hệ sau. Tổng đại số các lượng tăng (giảm) tuyệt đối từng kỳ bằng lượng tăng (giảm) tuyệt đối định gốc, nghĩa là:
=
- Lượng tăng (giảm) tuyệt đối trung bình: chỉ tiêu này biểu hiện một cách chung nhất lượng tăng (giảm) tuyệt đối, tính trung bình cho cả thời kỳ nghiên cứu.
=
Chỉ tiêu này có ý nghĩa khi các lượng tăng (giảm) tuyệt đối từng kỳ xấp xỉ nhau.
1.2.5.3. Tốc độ phát triển (lần, %)
Là chỉ tiêu biểu hiện sự biến động của hiện tượng xét về mặt tỷ lệ. Tuỳ theo mục đích nghiên cứu, ta có các loại tốc độ phát triển sau:
- Tốc độ phát triển từng kỳ (liên hoàn) : Biểu hiện sự biến động về mặt tỷ lệ của hiện tựơng giữa hai kỳ liền nhau.
ti = ( i= 2,3,…,n)
- Tốc độ phát triển định gốc: Biểu hiện sự biến động về mặt tỷ lệ của hiện tượng giữa kỳ nghiên cứu với kỳ được chọn làm gốc.
= (I = 2,3,…,n)
* Mối quan hệ giữa tốc độ phát triển từng kỳ và định gốc
- Tích các tốc độ phát triển từng kỳ bằng tốc độ phát triển định gốc.
Công thức:
- Thương của hai tốc độ phát triển định gốc liền nhau bằng tốc độ phát từng kỳ.
Công thức:
1.2.5.4. Tốc độ tăng (giảm)
Thực chất tốc độ tăng (giảm) bằng tốc độ tăng trừ đi 1 ( hoặc trừ 100 nếu tính bằng %). Nó phản ánh mức độ của hiện tượng nghiên cứu giữa hai thời kỳ tăng lên hay giảm đi bao nhiêu lần (hoặc %), nói lên nhịp điệu của sự tăng theo thời gian.
- Tốc độ tăng (giảm) từng kỳ (hay liên hoàn)
(i=2,3,…,n)
Vì:
- Tốc độ tăng (giảm) định gốc
Suy ra: hay
(i=2,3,…,n)
Vì:
Suy ra: hay
- Tốc độ tăng (giảm) trunng bình
1.2.5.5. Giá trị tuyệt đối của 1% tăng (giảm)
Là chỉ tiêu này biểu hiện mối quan hệ giữa chỉ tiêu lượng tăng (giảm) tuyệt đối trong công thức với chỉ tiêu tốc độ tăng (giảm), nghĩa là tính xem 1 % tăng (giảm) của chúng tương ứng với một lượng giá trị tuyệt đối tăng giảm là bao nhiêu.
Từ công thức trên ta có:
Suy ra:
Chỉ tiêu này không tính cho tốc độ tăng (giảm) định gốc vì kết quả luôn luôn bằng
1.2.6. Dự đoán biến động của dãy số thời gian
Dự báo là xác định mức độ có thể xảy ra trong tương lai của hiện tượng. Biết được tương lai của hiện tượng sẽ giúp các nhà quản trị chủ động cũng như có những quyết định đúng trong kinh doanh.
Có nhiều phương thức dự đoán khác nhau . Tuy vậy nội dung cơ bản của dự đoán thống kê là dựa trên các giá trị đã biết (x1, x2, …, xn). Dự đoán dựa vào dãy số thời gian để phân tích các yếu tố ảnh hưởng đến sự biến động của hiện tượng.
1.2.6.1. Dự đoán bằng hàm xu hướng
Tùy theo tính chất của hiện tượng nghiên cứu hoặc kết hợp với kinh nghiêm ta có thể xây dựng hoặc chọn một hàm số phù hợp biểu hiện sự biến động của hiện tượng qua thời gian.
F Hàm xu hướng dạng đa thức (bậc n 4)
Giả sử đường dữ liệu được biểu diễn dưới dạng:
Mô hình hàm xu hướng:
Tính tổng bình phương các sai số:
SS = = =
Xác định các biến bk với (k = 0,1,2,3,4) sao cho hàm SS đạt cực tiểu:
Lấy đạo hàm của hàm SS theo các biến bk với (k = 0,1,2,3,4), ta được ; (k = 0,1,2,3,4)
Hàm xu hướng dạng bậc 4:
Trong đó:
;
;
;
;
Với (k = 0,1,2,3,4)
Hàm xu hướng dạng bậc 3:
Trong đó: ;
;
;
Hàm xu hướng dạng bậc 2:
Trong đó: ;
;
Hàm xu hướng dạng bậc 1:
Trong đó: ;
F Hàm xu hướng dạng hàm mũ
Giả sử đường dữ liệu được biểu diễn dưới dạng:
Mô hình hàm xu hướng:
Lấy log hai vế hàm mữ ta được: lnyt = lnb0 +b1t
Áp dụng hàm xu hướng dạng đường thẳng ta được:
Trong đó: lnb0 = hay
F Hàm xu hướng dạng hàm Logarithmic
Giả xử đường dữ liệu được biểu diễn dưới dạng:
Mô hình hàm xu hướng:
Áp dụng hàm xu hướng dạng đường thẳng ta được:
Trong đó:
F Hàm xu hướng dạng hàm luỹ thừa
Giả xử đường dữ liệu được biểu diênc dưới dạng:
Mô hình hàm xu hướng:
Áp dụng hàm xu hướng dạng đường thẳng ta được:
Trong đó: lnb0 = hay
1.2.6.2. Mô hình dự đoán lượng tăng (giảm) tuyệt đối trung bình
Phương pháp này thường được sử dụng khi hiện tượng biến động với một lượng tuyệt đối hay tương đối đều nghĩa là các lượng tăng (giảm) tuyệt đối từng kì xấp xỉ nhau.
Công thức dự đơán:
= + .L
: Giá trị dự đoán ở thời điểm n + L
: Giá trị thực tế tại thời điểm n
: Lượng tăng (giảm) tuyệt đối trung bình;
L: Tầm xa dự đoán
1.2.6.3. Dự đoán dựa vào tốc độ phát triển trung bình.
Phương pháp này thường được sử dụng khi hiện tượng bất động với một nhịp độ tương đối ổn định, nghĩa là tốc độ phát triển từng kỳ xấp xỉ nhau.
Công thức dự đoán:
: Giá trị dự đoán ở thời điểm n + L
: Giá trị thực tế tại thời điểm n
: Tốc độ phát triển trung bình;
L: Tầm xa dự đoán
CHƯƠNG 2
PHÂN TÍCH TÌNH HÌNH BIẾN ĐỘNG NĂNG SUẤT LÚA VIỆT NAM GIAI ĐOẠN 1991 – 2005
2.1. Một số yếu tố ảnh hưởng đến sự biến động năng suất việt Nam giai đoạn 1991 – 2005.
Bảng 2.1. Sự biến động năng suất lúa bình quân cả năm giai đoạn 1991-2005
Năm
Sản lượng Phân Bón (kg/ha)
Sản lượng lúa (nghìn tấn)
Năng suất lúa bình quân (tạ/ha)
1991
65.3
19621.9
3.113204
1992
70.5
21590.4
3.33427
1993
78.2
22836.5
3.481492
1994
89.9
23528.2
3.565635
1995
97.3
24963.7
3.689798
1996
102.2
26396.7
3.768911
1997
110.6
27523.9
3.876769
1998
118.9
29145.5
3.958534
1999
125.5
31393.8
4.101834
2000
127.8
32529.5
4.243181
2001
135.1
32108.4
4.285291
2002
140.8
34447.2
4.590328
2003
146.2
34568.8
4.638738
2004
153.3
36148.9
4.855264
2005
162.7
35832.9
4.88906
Tổng
1724.3
432636.3
60.392309
(Bảng số liệu được thu thập từ trang wed tổng cục thống kê www.gso.gov.vn)
Theo kết quả từ SPSS, ta có:
Hệ số tương quan giữa Y (năng suất) và chính nó là 1. Như vậy Năng suất lúa với chính nó có mối quan hệ rất chặt chẽ.
Hệ số tương quan giữa X1 (lượng phân bón) và Y là 0.987. Giá trị này cho thấy rằng giữa năng suất và sản lượng phân bón có mối quan hệ chặt chẽ với nhau.
Hệ số tương quan giữa X2 (sản lượng lúa) và Y là 0.986. Giá trị này cũng cho ta thấy rằng sản lượng lúa cả năm có mối quan hệ chặt chẽ với năng suất lúa trung bình cả năm.
Ta thấy hệ số tương quan r = 0.989: tương quan giữa hai biến là trên mức trung bình (r = 98.9%), nghĩa là năng suất lúa bình quân sẽ tăng khi tăng lượng phân bón và sản lượng lúa thu hoạch được.
Hệ số xác định R2: Chỉ riêng tăng lượng phân bón và sản lượng lúa thu hoạch sẽ làm thay đổi 97.9% năng suất lúa (R2 = 0.979).
Kiểm định ở mức ý nghĩa 5% thì mô hình hồi qui rất có ý nghĩa vì Sig.F= 0.00001 rất nhỏ so với 5%, tức là sản lượng lúa thu hoạch và lượng phân bón ảnh hưởng đến năng suất lúa trung bình.
Phương trình hồi qui: y = 4.236X1 +0.1X2 +1.615
Y: Năng suất lúa bình quân cả năm (tấn/ha)
X1: Sản lượng phân bón (kg/ha)
X2: Sản lượng lúa cả năm (nghìn tấn)
Ý nghĩa của phương trình:
- Khi cố định X1 ( sản lượng phân bón) sản lượng lúa thu hoạch tăng 0.1 nghìn tấn. Ta thấy sản lượng ảnh hưởng đến năng suất lúa bình quân cả năm
- Khi cố định X2 (sản lượng lúa) lượng phân bón tăng 4.236 kg/ha. Ta thấy lượng phân bón ảnh hưởng tới năng suất lúa bình quân cả năm.
- Ngoài 2 nhân tố trên các nhân tố khác làm tăng năng suất lúa bình quân cả năm là 1.615 tấn/ha.
- Sai số chuẩn của lượng phân bón là 0.005
- Sai số chuẩn của sản lượng lúa là 0.0001
2.2. Phân tích dãy số thời gian và dự báo
2.2.1. Phân tích dãy số thời gian và bự báo năng suất lúa bình quân cả năm
Để xác định hàm số mô tả một cách gần đúng nhất biến động của hiện tượng được thể hiện bằng đồ thị về hàm số xu hướng. Quan sát đồ thị ở dưới đồ thị có dạng hàm xu hướng bậc 2, ta thấy năng suất lúa có hiện tượng tăng dần.
Hàm xu hướng bậc 2 có dạng:
yt = b2t2 + b1t + b0
yt: Giá trị dự đoán của hiện tượng ở thời điểm t
, : tham số
: thời gian
Năm
Năng suất lúa (tấn/ha)
1991
3.113204
1992
3.33427
1993
3.481492
1994
3.565635
1995
3.689798
1996
3.768911
1997
3.876769
1998
3.958534
1999
4.101834
2000
4.243181
2001
4.285291
2002
4.590328
2003
4.638738
2004
4.855264
2005
4.88906
Năm
y
t
yt
t2
t3
t4
yt2
1991
3.1132
-7
-21.79
49
-343
2401
152.55
1992
3.3343
-6
-20.01
36
-216
1296
120.03
1993
3.4815
-5
-17.41
25
-125
625
87.037
1994
3.5656
-4
-14.26
16
-64
256
57.05
1995
3.6898
-3
-11.07
9
-27
81
33.208
1996
3.7689
-2
-7.538
4
-8
16
15.076
1997
3.8768
-1
-3.877
1
-1
1
3.8768
1998
3.9585
0
0
0
0
0
0
1999
4.1018
1
4.1018
1
1
1
4.1018
2000
4.2432
2
8.4864
4
8
16
16.973
2001
4.2853
3
12.856
9
27
81
38.568
2002
4.5903
4
18.361
16
64
256
73.445
2003
4.6387
5
23.194
25
125
625
115.97
2004
4.8553
6
29.132
36
216
1296
174.79
2005
4.8891
7
34.223
49
343