Trong nghiên cứu này các mô hình hồi quy tuyến tính đa biến với các hệ số được xác định qua
phương pháp bình phương tối thiểu (MLR), phương pháp độ lệch tuyệt đối nhỏ nhất (LAD), phương
pháp minimax (LMV) và mô hình mạng thần kinh nhân tạo (ANN) được ứng dụng để thử nghiệm dự
báo hạn 6 tháng số lượng xoáy thuận nhiệt đới hoạt động trên khu vực Biển Đông. Qua khảo sát 24
chỉ số khí hậu nghiên cứu đã lựa chọn được 10 chỉ số làm nhân tố dự báo. Kết quả đánh giá sai số dự
báo cho thấy trên bộ số liệu phụ thuộc, mô hình ANN cho kết quả tốt nhất, tiếp đến là mô hình MLR,
LAD và kém nhất ở mô hình LMV. Mặc dù vậy, việc kiểm nghiệm dự báo trên bộ số liệu độc lập
(2011-2017) lại chỉ ra mô hình LAD cho kết quả phù hợp nhất, tiếp theo là MLR và LMV. Sai số dự
báo của mô hình ANN quá khác nhau giữa các tập số liệu phụ thuộc và độc lập có thể liên quan đến
sự khác biệt về tính chất biến động theo thời gian của hai chuỗi số liệu và cần được khảo sát sâu hơn
5 trang |
Chia sẻ: thanhuyen291 | Ngày: 10/06/2022 | Lượt xem: 281 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Thử nghiệm dự báo hạn mùa số lượng xoáy thuận nhiệt đới hoạt động trên khu vực biển đông bằng phương pháp thống kê, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỷ yếu Hội nghị: Nghiên cứu cơ bản trong “Khoa học Trái đất và Môi trường”
DOI: 10.15625/vap.2019.000135
284
THỬ NGHIỆM DỰ BÁO HẠN MÙA SỐ LƯỢNG XOÁY THUẬN NHIỆT ĐỚI
HOẠT ĐỘNG TRÊN KHU VỰC BIỂN ĐÔNG
BẰNG PHƯƠNG PHÁP THỐNG KÊ
Đinh Bá Duy1, Ngô Đức Thành2, Phan Văn Tân3*
1Trung tâm Nhiệt đới Việt Nga, Bộ Quốc phòng, Email: duydb.vrtc@gmail.com
2Trường Đại học Khoa học và Công nghệ Hà Nội (USTH), Viện Hàn lâm Khoa học và Công nghệ
Việt Nam (VAST)
3Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
TÓM TẮT
Trong nghiên cứu này các mô hình hồi quy tuyến tính đa biến với các hệ số được xác định qua
phương pháp bình phương tối thiểu (MLR), phương pháp độ lệch tuyệt đối nhỏ nhất (LAD), phương
pháp minimax (LMV) và mô hình mạng thần kinh nhân tạo (ANN) được ứng dụng để thử nghiệm dự
báo hạn 6 tháng số lượng xoáy thuận nhiệt đới hoạt động trên khu vực Biển Đông. Qua khảo sát 24
chỉ số khí hậu nghiên cứu đã lựa chọn được 10 chỉ số làm nhân tố dự báo. Kết quả đánh giá sai số dự
báo cho thấy trên bộ số liệu phụ thuộc, mô hình ANN cho kết quả tốt nhất, tiếp đến là mô hình MLR,
LAD và kém nhất ở mô hình LMV. Mặc dù vậy, việc kiểm nghiệm dự báo trên bộ số liệu độc lập
(2011-2017) lại chỉ ra mô hình LAD cho kết quả phù hợp nhất, tiếp theo là MLR và LMV. Sai số dự
báo của mô hình ANN quá khác nhau giữa các tập số liệu phụ thuộc và độc lập có thể liên quan đến
sự khác biệt về tính chất biến động theo thời gian của hai chuỗi số liệu và cần được khảo sát sâu hơn.
Từ khoá: Dự báo mùa, xoáy thuận nhiệt đới, Biển Đông, dự báo thống kê.
1. GIỚI THIỆU
Hiện nay, với những biểu hiện bất thường của hệ thống thời tiết khí hậu đặc biệt là các hiện
tượng thời tiết cực đoan như bão, tố lốc thì bài toán dự báo hạn mùa bão, áp thấp nhiệt đới
(XTNĐ) đang là vấn đề được nhiều nhà khoa học, nhà quản lý trong và ngoài nước quan tâm bởi
các kết quả của nó có ý nghĩa ứng dụng hết sức thiết thực đối với các hoạt động kinh tế xã hội và an
ninh quốc phòng. Cơ sở vật lý để đưa ra những thông tin ước tính trong tương lai xa xuất phát từ
tính có thể dự báo được các tín hiệu/yếu tố trong đại dương ở qui mô thời gian mùa đến những qui
mô nhỏ hơn trên bề mặt lục địa và trong khí quyển [1]. Điểm mấu chốt trong bài toán dự báo mùa là
các hiện tượng tương tác giữa đại dương - khí quyển như hiện tượng El Niño là một ví dụ xảy ra ở
vùng Thái Bình Dương nhiệt đới và có thể dự báo trước đến 6 tháng hoặc xa hơn nữa [2], [3]. Thời
hạn trong các dự báo hạn mùa thường từ qui mô tháng cho đến một năm tùy thuộc yếu tố dự báo,
trong đó các hạn dự báo phổ biến là 1, 3, 6 và 9 tháng. Nhiều nghiên cứu đã chỉ ra, sự tương tác
giữa khí quyển và đại dương đóng một vai trò cực kỳ quan trọng trong việc điều khiển và chi phối
hoàn lưu khí quyển [4]. Do vậy, yếu tố nhiệt độ mặt nước biển (SST) và các quá trình vật lý khác
trên bề mặt trái đất ảnh hưởng nhiều hơn tới kết quả dự báo hạn mùa so với các điều kiện ban đầu
của khí quyển. Trên qui mô toàn cầu, sự thay đổi của yếu tố SST là nguyên nhân chính dẫn đễn
những thay đổi của khí hậu từ năm này sang năm khác. Đáng chú ý, ở vùng nhiệt đới, dị thường
SST liên quan đến hoạt động của đối lưu sâu điều khiển phần lớn hoàn lưu khí quyển toàn cầu do
đó yếu tố này là thành phần quan trọng trong bài toán dự báo hạn mùa [5]. Như vậy, xuất phát từ
bản chất trên việc giải quyết các bài toán dự báo mùa thường được tiếp cận theo phương pháp thống
kê [6], [7], [8], [9], [10], [11]. Nghiên cứu này tiếp cận phương pháp thống kê để xây dựng các
phương trình dự báo hạn mùa số lượng XTNĐ hoạt động trên khu vực Biển Đông (BĐ).
Kỷ yếu Hội nghị: Nghiên cứu cơ bản trong “Khoa học Trái đất và Môi trường”
285
2. SỐ LIỆU VÀ PHƯƠNG PHÁP
Nghiên cứu khảo sát để lựa chọn nhân tố dự báo từ bộ 24 chỉ số khí hậu giai đoạn 1981-2017,
được cập nhật tại website của NOAA và JMA (Bảng 1). Yếu dự báo là số lượng XTNĐ hoạt động
trong 6 tháng tiếp sau trên khu vực BĐ được tính toán từ số liệu XTNĐ của JMA. Tất cả các bộ số
liệu này được chuẩn bị cho giai đoạn dự báo phụ thuộc 1981-2010 và cho giai đoạn dự báo độc lập
2011-2017.
Bảng 1. Các chỉ số khí hậu được khảo sát lựa chọn nhân tố dự báo
TT Chỉ số Mô tả
1 Niño 3 SST vùng nhiệt đới Đông Thái Bình Dương (5N-5S, 150W-90W)
2 QBO Dao động tựa 2 năm
3 CPC_SOI Chỉ số dao động Nam
4 Niño 4 Chỉ số SST vùng nhiệt đới trung tâm Thái Bình Dương (5N-5S, 160E-150W)
5 REQSOI Dị thường chuẩn hóa dao động Nam vùng xích đạo
6 WPAC850 Gió tín phong mực 850 mb khu vực Tây Thái Bình Dương (5N-5S, 135E-180W)
7 DMI Chỉ số dao động lưỡng cực (Dipole Mode Index)
8 U200_IN Gió vĩ hướng mực 200mb khu vực 5ºN-5ºS; 80-100ºE
9 NP Áp suất mực biển khu vực Bắc Thái Bình Dương (30N-65N, 160E-140W)
10
RINDO_SP
LA
Dị thường chuẩn hóa khí áp mực biển vùng xích đạo gần khu vực Indonesia
11 WP Chỉ số Tây Thái Bình Dương (Western Pacific Index)
12 SOLAR Chỉ số dòng năng lượng mặt trời (Solar Flux - 10.7cm)
13 AMM Chỉ số Mod kinh hướng Đại Tây Dương (Atlantic Meridional Mode)
14 MEI V2 Chỉ số ENSO đa biến phiên bản 2 (Multivariate ENSO Index, V2)
15 AMO Dao động đa thập kỷ Đại Tây Dương (Atlantic multidecadal Oscillation)
16 OLR-MC Chỉ số phát xạ sóng dài khu vực 5N-5S, 110-135ºE
17 NAO Dao động Bắc Đại Tây Dương (North Atlantic Oscillation)
18 ONI Chỉ số Niño Đại Dương
19 OLR-PH Chỉ số phát xạ sóng dài khu vực 5N-5S, 110-140ºE (theo JMA)
20 Niño 1+2 Chỉ số SST Đông Thái Bình Dương (vùng Niño 1+2; 0-10S, 90W-80W)
21 TNI Chỉ số khuynh hướng Niño hay chỉ số Niño-chuyển dịch (Trans-Niño Index)
22 Niño 3.4 Chỉ số SST trung tâm Thái Bình Dương vùng Niño 3.4 (5N-5S, 170E-120W)
23 PNA Chỉ số Bắc Mỹ Thái Bình Dương (Pacific North American Index)
24 TSA Chỉ số Nam Đại Tây Dương nhiệt đới (Tropical Southern Atlantic Index)
Phương pháp thống kê được sử dụng trong nghiên cứu này, theo đó số lượng XTNĐ độ hoạt
động trên khu vực BĐ được xây dựng từ mô hình hồi quy tuyến tính nhiều biến có dạng:
∑
(1)
Hồ Chí Minh, tháng 11 năm 2019
286
Trong đó y là yếu tố dự báo (số lượng XTNĐ 6 tháng tới), là các nhân tố dự
báo, các hệ số hồi quy được xác định theo ba phương pháp khác nhau:
1) Phương pháp bình phương tối thiểu (MLR):
∑ ( ∑
)
(2)
2) Phương pháp độ lệch tuyệt đối nhỏ nhất (LAD):
∑ | ∑
|
(3)
3) Phương pháp minimax (LMV):
( | ∑
| ) (4)
Trong các công thức từ (2) đến (4) ở trên, , tương ứng là giá trị quan trắc thứ i (i=1, 2,...,
n) của yếu tố dự báo y và các nhân tố dự báo (j=1, 2,...,m). Ứng với mỗi phương pháp xác định
bộ hệ số hồi quy ở trên, để giản tiện và thống nhất các nghiên cứu và kết quả dưới đây quy ước tên
gọi tương ứng là mô hình MLR, mô hình LAD và mô hình LMV.
Bên cạnh 3 mô hình truyền thống kể trên, nghiên cứu này còn thử nghiệm với mô hình mạng
thần kinh nhân tạo (mô hình ANN) với cấu trúc gồm một lớp đầu vào, một lớp ẩn và một lớp đầu
ra. Các neuron ở hai lớp kề nhau có liên kết với nhau thông qua các trọng số, các neuron cùng một
lớp hoặc ở hai lớp không kề nhau không có liên kết với nhau.
Kết quả dự báo được đánh giá qua các sai số trung bình (ME), sai số tuyệt đối trung bình
(MAE), sai số bình phương trung bình (RMSE) và hệ số tương quan (Corr) giữa giá trị dự báo và
quan trắc.
3. KẾT QUẢ VÀ THẢO LUẬN
Hình 1 mô tả mức độ tương quan trễ từ 0 cho tới 12 tháng của 24 chỉ số khí hậu với số lượng
XTNĐ hoạt động trên khu vực Biển Đông. Kết quả tại hình 1 cho thấy các chỉ số có mức độ tương
quan tốt là Niño 3, QBO, Niño 4, WPC850, DMI, NP, AMM, AMO, Niño 1+2, Niño 3.4.
Với 10 chỉ số khí hậu có tương quan tốt nhất trong bộ 24 chỉ số khảo sát, nghiên cứu đã tiến
hành xây dựng các phương trình dự báo số lượng XTNĐ của 6 tháng tiếp sau theo 4 phương pháp
thống kê (mục 2). Kết quả đánh gía sai số của các phương trình dự báo trên bộ số liệu phụ thuộc
(1981-2010) và trên bộ số liệu độc lập (2011-2017) lần lượt được trình bày trong các bảng 2 và 3.
Bảng 2 cho thấy các mô hình đã mô phỏng khá tốt số lượng XTNĐ trên khu vực BĐ. Sai số
trung bình (ME) khá nhỏ, phổ biến ở 0.3 cơn, tương quan giữa kết quả dự báo và quan trắc dao
động trong khoảng 0.5 - 0.7, còn sai số tuyệt đối trung bình chỉ trên dưới 1.0 cơn trong đó mô hình
ANN gần như đạt mức lý tưởng (sai số gần bằng 0).
Hình 1. Hệ số tương quan giữa số lượng TCs và các chỉ số khí hậu
Chỉ số đánh giá sai số dự báo trên bộ số liệu độc lập (bảng 3) cho thấy cả 4 mô hình đều có xu
hướng dự báo thấp hơn so với thực tế. Sai số trung bình (ME) của các mô hình MLR, LMV và LAD
Kỷ yếu Hội nghị: Nghiên cứu cơ bản trong “Khoa học Trái đất và Môi trường”
287
nằm trong khoảng từ 1 đến 4 cơn, sai số tuyệt đối trung bình khoảng trên 2.0 cơn. Mô hình ANN
cho sai số lớn nhất.
Bảng 2. Chỉ số đánh giá sai số dự báo của các mô hình trên bộ số liệu phụ thuộc
(giai đoạn 1981-2010)
Tháng
dự
báo
MLR LAD LMV ANN
ME MAE RMSE Corr ME MAE RMSE Corr ME MAE RMSE Corr ME MAE RMSE Corr
1 0,0 1,2 1,5 0,5 0,1 1,1 1,6 0,5 0,1 1,5 1,6 0,4 0,0 0,0 0,0 1,0
2 0,0 1,3 1,6 0,5 0,2 1,2 1,9 0,4 0,0 1,8 2,1 0,3 0,0 0,0 0,0 1,0
3 0,0 1,3 1,5 0,6 0,3 1,1 1,8 0,5 -0,1 1,5 1,7 0,5 0,0 0,0 0,0 1,0
4 0,0 1,2 1,6 0,7 0,0 1,2 1,8 0,7 0,2 1,8 2,0 0,5 0,0 0,0 0,0 1,0
5 0,0 1,1 1,6 0,7 -0,1 1,0 1,7 0,6 -0,1 1,9 2,2 0,4 0,0 0,0 0,0 1,0
6 0,0 1,1 1,4 0,7 -0,1 1,0 1,5 0,6 -0,1 1,5 1,8 0,6 0,0 0,0 0,1 1,0
7 0,0 1,1 1,4 0,6 -0,2 1,0 1,5 0,6 0,3 1,4 1,6 0,5 0,0 0,0 0,0 1,0
8 0,0 1,1 1,4 0,7 0,3 1,0 1,6 0,6 0,2 1,4 1,5 0,6 0,0 0,0 0,0 1,0
9 0,0 1,3 1,5 0,6 0,0 1,1 1,8 0,5 0,3 1,5 1,7 0,5 0,0 0,0 0,0 1,0
10 0,0 1,1 1,4 0,5 0,0 1,0 1,5 0,4 0,8 1,7 1,9 0,2 0,0 0,0 0,0 1,0
11 0,0 0,7 0,9 0,6 0,0 0,6 1,0 0,5 0,5 1,1 1,2 0,4 0,0 0,0 0,0 1,0
12 0,0 0,8 0,9 0,6 -0,1 0,7 1,1 0,4 0,0 0,9 1,0 0,5 0,0 0,0 0,0 1,0
Bảng 3. Chỉ số đánh giá sai số dự báo của các mô hình trên bộ số liệu độc lập
(giai đoạn 2011-2017)
Tháng
dự báo
MLR LAD LMV ANN
ME MAE RMSE ME MAE RMSE ME MAE RMSE ME MAE RMSE
1 -1,9 1,9 2,4 -2,1 2,2 2,6 -1,4 1,8 2,1 -3,1 3,1 3,4
2 -1,9 2,3 3,0 -3,3 3,7 4,4 -3,1 3,1 3,9 -0,3 2,5 3,1
3 -1,6 2,4 3,3 -2,6 3,1 4,1 -1,9 2,9 3,8 -1,3 2,9 3,4
4 -1,3 3,0 3,7 -1,8 4,0 4,6 -1,0 2,9 3,5 -2,7 4,4 5,4
5 -1,1 3,4 4,5 -1,1 3,7 4,8 -1,3 3,1 4,2 0,7 5,4 5,8
6 -0,9 3,9 4,7 -0,8 3,9 4,9 -1,7 4,0 4,9 -1,3 3,3 4,6
7 -0,5 2,5 3,1 -0,6 2,6 3,1 0,2 2,3 2,6 -0,9 2,8 3,7
8 -1,1 1,7 2,3 -0,8 2,1 2,6 -0,6 2,0 2,3 -0,5 2,3 3,3
9 -1,3 2,1 2,4 -1,9 2,5 3,2 -0,9 1,9 2,1 0,0 2,0 2,6
10 -0,6 1,8 1,9 -0,9 1,9 2,1 -0,4 1,3 1,5 -0,1 1,0 1,2
11 -0,3 1,6 1,8 -0,1 1,7 1,8 0,2 1,9 2,0 -0,9 1,6 2,1
12 -0,6 1,3 1,5 -0,8 1,0 1,3 -0,4 1,4 1,8 -1,6 1,6 2,1
Hồ Chí Minh, tháng 11 năm 2019
288
4. KẾT LUẬN
Các kết quả nghiên cứu bước đầu đã chỉ ra khả năng dự báo hạn mùa số lượng XTNĐ hoạt
động trên khu vực BĐ bằng việc sử dụng các mô hình thống kê MLR, LAD, LMV và ANN với
nhân tố dự báo là các chỉ số khí hậu.
Đánh giá các sai số dự báo cho thấy trên bộ số liệu luyện mô hình ANN cho kết quả tốt nhất,
tiếp đến là mô hình MLR, LAD và kém nhất ở mô hình LMV, tuy vậy kiểm nghiệm trên dự báo độc
lập (2011-2017) mô hình ANN cho kết quả kém nhất, các kết quả tốt hơn theo thứ tự được thống kê
tại mô hình LAD, MLR và LMV.
TÀI LIỆU THAM KHẢO
[1]. Palmer T. N., Anderson D. L. T. (1994), The prospects for seasonal forecasting -A review paper,
Quarterly Journal of the Royal Meteorological Society, 120(518), pp. 755–793.
[2]. Jin E. K., Kinter J. L., Wang B., Park C.-K., Kang I.-S., Kirtman B. P., Kug J.-S., Kumar A., Luo J.-J.,
Schemm J., Shukla J., Yamagata T. (2008), Current status of ENSO prediction skill in coupled ocean-
atmosphere models, Clim. Dyn., 31(6), pp. 647–664.
[3]. Weisheimer A., Doblas‐ Reyes F. J., Palmer T. N., Alessandri A., Arribas A., Déqué M., Keenlyside
N., MacVean M., Navarra A., Rogel P. (2009), ENSEMBLES: A new multi-model ensemble for
seasonal-to-annual predictions - Skill and progress beyond DEMETER in forecasting tropical Pacific
SSTs, Geophys. Res. Lett., 36(21), pp. 1–6.
[4]. Wang S. W., Zhu J. H. (2001), A review on seasonal climate prediction, Advances in Atmospheric
Sciences, 18(2), pp. 197–208.
[5]. Stockdale T. N. (2000), An overview of techniques for seasonal forecasting, Stochastic Environmental
Research and Risk Assessment, 14(4), pp. 0305–0318.
[6]. Landsea C. W., Bell G. D., Gray W. M., Goldenberg S. B. (2002), The Extremely Active 1995 Atlantic
Hurricane Season: Environmental Conditions and Verification of Seasonal Forecasts, Mon. Weather
Rev., 126(5), pp. 1174–1193.
[7]. Landsea C. W., Gray W. M., Mielke P. W., Berry K. J. (1994), Seasonal forecasting of Atlantic hurricane
activity, Weather, 49(8), pp. 273–284.
[8]. Gray W. M., Landsea W. C., Mielke Jr. P. W., Berry K. J. (1993), Predicting Atlantic Basin Seasonal
Tropical Cyclone Activity by 1 June, Wea. Forecast., vol. 9, pp. 103–115.
[9]. Nicholls N., Landsea C., Gill J. (1998), Recent trends in Australian region tropical cyclone activity,
Meteorol. Atmos. Phys., 65(3–4), pp. 197–205.
[10]. Elsner J. B., Liu K., Kocher B. (2000), Spatial variations in major U.S. hurricane activity: Statistics and
a physical mechanism, J. Clim., 13(13), pp. 2293–2305.
[11].Chan J. C. L., Shi J., Lam C. (1998), Seasonal Forecasting of Tropical Cyclone Activity over
theWestern North Pacific and the East Sea, Weather Forecast, 13(4), pp. 997–1004.