Phú dưỡng là một hiện tượng nghiêm trọng tại các hồ nông ở Hà Nội. Dữ liệu về các thông số
chất lượng nước và tình trạng phú dưỡng đã được thu thập tại 6 hồ ở Hà Nội trong giai đoạn 2015-
2017. Chỉ số tình trạng dinh dưỡng (TSI) phản ánh mức độ phú dưỡng đã được tính toán để đánh giá
các điều kiện hồ. Nồng độ oxy hòa tan DO đã được quan trắc cho thấy có sự biến thiên rất lớn đạt giá
trị lớn nhất vào thời gian 15h00-17h00 (180 % DO bão hòa) và giá trị thấp nhất vào 4h00-6h00 (20 %
DO bão hòa). Kỹ thuật điều khiển dữ liệu đã được phát triển cho phép lựa chọn các biến điều khiển
trong việc phân loại trạng thái phú dưỡng trong hồ. Việc áp dụng các cây phân loại đã chứng minh
rằng sự phú dưỡng trong các hồ của Hà Nội được thúc đẩy bởi các chất dinh dưỡng và gia tăng các
chất hữu cơ cũng như sự biến thiên nồng độ oxy hòa tan trong ngày. Biến thiên DO hàng ngày tương
quan với mật độ thực vật phù du, TSI, Chlorphyll-a và mật độ tảo cho thấy mối quan hệ chặt chẽ giữa
biến thiên DO và tình trạng phú dưỡng. Đây có thể là một chỉ số quan trọng cho quá trình phú dưỡng
trên thủy vực tĩnh. Kỹ thuật điều khiển dữ liệu đã được chứng minh là một công cụ hiệu quả có thể
cung cấp các mô phỏng đáng tin cậy giúp cho công tác quản lý tổng hợp nguồn nước.
4 trang |
Chia sẻ: thanhuyen291 | Ngày: 10/06/2022 | Lượt xem: 307 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Kỹ thuật điều khiển dữ liệu ứng dụng trong nghiên cứu quá trình phú dưỡng hồ Hà Nội, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỷ yếu Hội nghị: Nghiên cứu cơ bản trong “Khoa học Trái đất và Môi trường”
DOI: 10.15625/vap.2019.000209
577
KỸ THUẬT ĐIỀU KHIỂN DỮ LIỆU ỨNG DỤNG TRONG NGHIÊN CỨU
QUÁ TRÌNH PHÚ DƢỠNG HỒ HÀ NỘI
Hoàng Thị Thu Hương, Văn Diệu Anh, Nguyễn Thị Thu Hiền
Trường Đại học Bách khoa Hà Nội, Email: huong.hoangthithu@hust.edu.vn
TÓM TẮT
Phú dưỡng là một hiện tượng nghiêm trọng tại các hồ nông ở Hà Nội. Dữ liệu về các thông số
chất lượng nước và tình trạng phú dưỡng đã được thu thập tại 6 hồ ở Hà Nội trong giai đoạn 2015-
2017. Chỉ số tình trạng dinh dưỡng (TSI) phản ánh mức độ phú dưỡng đã được tính toán để đánh giá
các điều kiện hồ. Nồng độ oxy hòa tan DO đã được quan trắc cho thấy có sự biến thiên rất lớn đạt giá
trị lớn nhất vào thời gian 15h00-17h00 (180 % DO bão hòa) và giá trị thấp nhất vào 4h00-6h00 (20 %
DO bão hòa). Kỹ thuật điều khiển dữ liệu đã được phát triển cho phép lựa chọn các biến điều khiển
trong việc phân loại trạng thái phú dưỡng trong hồ. Việc áp dụng các cây phân loại đã chứng minh
rằng sự phú dưỡng trong các hồ của Hà Nội được thúc đẩy bởi các chất dinh dưỡng và gia tăng các
chất hữu cơ cũng như sự biến thiên nồng độ oxy hòa tan trong ngày. Biến thiên DO hàng ngày tương
quan với mật độ thực vật phù du, TSI, Chlorphyll-a và mật độ tảo cho thấy mối quan hệ chặt chẽ giữa
biến thiên DO và tình trạng phú dưỡng. Đây có thể là một chỉ số quan trọng cho quá trình phú dưỡng
trên thủy vực tĩnh. Kỹ thuật điều khiển dữ liệu đã được chứng minh là một công cụ hiệu quả có thể
cung cấp các mô phỏng đáng tin cậy giúp cho công tác quản lý tổng hợp nguồn nước.
Từ khóa: Cây phân loại, biến thiên DO, TSI.
1. GIỚI THIỆU
Theo báo cáo Hồ Hà Nội 2015, các hồ trong khu vực đô thị Hà Nội đã phải đối mặt với nhiều
vấn đề môi trường, như: 1) bị thiếu nước; 2) độ đục cao do hợp chất hữu cơ và rác thải; 3) bị ô
nhiễm bởi kim loại nặng và hợp chất hữu cơ nhân tạo; 4) bùng nổ tảo; 5) suy thoái đa dạng sinh
học. Trong đó vấn đề phú dưỡng hóa là đặc biệt nghiêm trọng. Phú dưỡng là hiện tượng dư thừa
chất dinh dưỡng trong thủy vực dẫn đến sự nở rộ của tảo, gây suy giảm chất lượng nước. Trong các
hồ phú dưỡng, do mật độ tảo tăng, quá trình quang hợp và hô hấp mạnh gây ra sự thay đổi rất lớn
nồng độ oxy hòa tan. Hiện tượng này ảnh hưởng lớn đến đời sống của các sinh vật thủy sinh gây ra
nhiều khó khăn trong việc đánh giá chất lượng nước.
Quản lý tổng hợp nguồn nước dựa trên giám sát, mô hình hóa và đánh giá chu trình nước.
Quản lý đạt hiệu quả khi phối hợp tốt cả ba hoạt động trên. Việc lựa chọn các kỹ thuật giám sát và
đánh giá chất lượng phù hợp là yếu tố quan trọng trong quản lý các thủy vực [1]. Hiện nay các kỹ
thuật mô hình hóa đã phát triển mạnh trong đó kỹ thuật khai thác dữ liệu - mô hình hóa sinh thái,
dựa trên các số liệu quan trắc, đã trở thành công cụ hữu ích nhằm khảo sát các hệ thống phức tạp,
làm rõ các thuộc tính của toàn bộ hệ thống, cho phép hoàn thiện hơn các hiểu biết về hệ sinh thái
[2]. Cây phân loại đã được sử dụng rộng rãi để hỗ trợ quản lý nguồn nước [3,4], và được sử dụng
trong nghiên cứu này để xác định các tham số quan trọng ảnh hưởng đến quá trình phú dưỡng.
Nghiên cứu đã thu thập các số liệu về hệ sinh thái hồ Hà Nội, ứng dụng cây phân loại để phân
tích, đánh giá và xác định các yếu tố cơ bản để phân loại thủy vực phú dưỡng làm cơ sở đề xuất các
giải pháp kiểm soát, và hạn chế tác động của hiện tượng phú dưỡng tại hồ Hà Nội cũng như hồ đô thị.
2. PHƢƠNG PHÁP
2.1. Phƣơng pháp thu thập số liệu
2.1.1. Quan trắc, lấy mẫu và phân tich
Sáu hồ bao gồm Hoàn Kiếm, Ba Mẫu, Bảy Mẫu, Hai Bà Trưng, Trúc Bạch và Đầm Trị nằm ở 5
quận khác nhau trong đô thị Hà Nội đã được chọn để nghiên cứu. Quá trình quan trắc được triển khai
theo 7 đợt: tháng 10/2015, 01/2016, 3/016, 7/2016, 9/2016, 9/2016, 11/2016, 01/2017. Quy trình lấy
mẫu và bảo quản mẫu được thực hiện theo tiêu chuẩn TCVN 6663-4:2011 (ISO 5667-4:2006).
Kỷ yếu Hội nghị: Nghiên cứu cơ bản trong “Khoa học Trái đất và Môi trường”
578
Các phép đo tại hiện trường bao gồm độ sâu (m, thiết bị siêu âm), nhiệt độ nước (°C), pH (pH
DREL/2010), oxy hòa tan (mg/l, tỷ lệ oxy bão hòa %) (WTW Oxy 330), độ dẫn (WTW Điện cực
249), độ sâu Secchi (SD) (cm). Phân tích tại phòng thí nghiệm bao gồm COD (SMWW 5220C/D),
BOD5 (SMWW 5210B), Nitơ Kjeldahl (SMWW 4500-Norg C), tổng P (SMWW 4500-PE) , PO4
3
-
P, Nitơ vô cơ hòa tan (DIN = NH4
+
-N (SMWW 4500-NH3 F) + NO2
-
-N (SMWW 4500-NO2- B) +
NO3
-
- N (SMWW 4500-NO3- E)), Chl-a (SMWW 10200 H) và mật độ thực vật phù du.
Dữ liệu DO theo giờ (mg/l và tỷ lệ oxy bão hòa (%)) được đo trong vòng 24 giờ ở khoảng
0,3m dưới mặt nước vào ngày lấy mẫu nước để đánh giá sự chệnh lệch DO trong ngày và nghiên
cứu tác động của chất lượng nước đến diễn biến DO trong khoảng thời gian 24 giờ.
2.1.2. Tính toán chỉ số phú dưỡng
Tính toán TSI (Chỉ số tình trạng dinh dưỡng) sử dụng 4 thông số là PO4
3-
, chlorophyll-a (Chl-
a), độ trong dựa trên đo bằng Sechi disk (SD), và DIN (NH4
+
+NO3
-
+NO2
-
).
TSIPO4 = 14,42ln(PO4
3-
) + 4.15, (TP: µg / l); TSIChl = 9,81 ln (Chl-a) + 30.6, (Chl: µg /l)
TSISD = 60 - 14.41 ln(SD), (SD: m); TSIDIN =54,45+14,43ln(DIN), (DIN: mg/l)
TSI =
Mức độ phú dưỡng của thủy vực được phân thành các nhóm: TSI <30 đại diện cho tình trạng
thiểu dưỡng (O), 30-50 là trung dưỡng (M), 50-70 là phú dưỡng (E), 70-80 siêu phú dưỡng a (Ha),
80-90 là siêu phú dưỡng b (Hb) và > 90 là siêu phú dưỡng c (Hc) [5].
2.2. Kỹ thuật điều khiển dữ liệu dựa trên Classification trees (Decision trees)
Cây phân loại (CT) là một thuật toán sử dụng trong mô hình, được biểu diễn tương đương
dưới dạng các luật If-then. CT là quá trình phân tích cơ sở dữ liệu, phân lớp và đưa ra dự đoán. CT
được ứng dụng để phân loại các biến phụ thuộc rời rạc thành lớp từ các giá trị của một tập các thuộc
tính (gồm các biến liên tục hoặc rời rạc) độc lập. Thuật toán C4.5 là phương pháp xây dựng cây
phân loại được sử dụng rộng rãi. Nghiên cứu này áp dụng thuật toán J48 với các phân chia nhị phân
phát triển từ C4.5 để xây dựng các cây phân loại trên phần mềm machine learning WEKA [6]. Cài
đặt tiêu chuẩn đã được sử dụng ngoại trừ các yếu tố độ tin cậy cắt tỉa (PCF). Cắt tỉa cây được áp
dụng để tối ưu hóa hiệu suất mô hình bằng cách thay đổi giá trị hệ số PCF. Việc luyện và xác nhận
mô hình được dựa trên kiểm chứng chéo năm lần.
Phương pháp cây phân loại (CT) đã được áp dụng để xác định các biến số có liên quan nhất
đến hiện tượng phú dưỡng ở các hồ của Hà Nội. Khả năng ứng dụng của cây phân loại (CT) được
đánh giá qua hiệu quả phân loại các điểm nghiên cứu. Mô hình đã sử dụng 8 biến độc lập để dự
đoán tình trạng dinh dưỡng dựa trên TSI, được chứng minh là một chỉ số hiệu quả để nghiên cứu
hiện tượng phú dưỡng ở các hồ của Hà Nội [7].
Nghiên cứu này sử dụng toàn bộ số liệu chất lượng nước thu thập được bao gồm các thông số
đo đạc hiện trường và các thông số phân tích trong phòng thí nghiệm từ 10/2015 - 01/2017.
3. KẾT QUẢ VÀ THẢO LUẬN
3.1. Mức độ phú dƣỡng của các hồ nghiên cứu
Hầu hết hồ đô thị ở Hà Nội ở mức siêu phú dưỡng. Các hồ nghiên cứu đều là hồ nội thành, tỷ
lệ kè bờ 100% làm cản trở sự lưu thông của nước hồ và các sinh vật giữa hồ và bờ. Các hồ cảnh
quan như Hoàn Kiếm, Ba Mẫu, Hai Bà Trưng, đặc biệt là Hồ Bảy Mẫu chỉ số phú dưỡng rất cao,
đạt gần 100, thuộc nhóm siêu phú dưỡng loại Hc. Hồ Trúc Bạch tiếp nhận nước thải sau xử lý và
dùng nuôi cá, chất lượng nước biến đổi liên tục, chỉ số phú dưỡng ở mức cao. Hồ Đầm Trị dùng
trồng sen làm cản trở quá trình quang hợp, phát triển của các loài tảo nên chỉ số TSI thấp nhất trong
các hồ vào mùa hè, TSI = 71 (10/2015), tuy nhiên vào mùa đông, sen tàn, cùng với quá trình tát
nước ra khỏi hồ vào khoảng tháng 3 hàng năm đã làm cho mức độ phú dưỡng tăng cao, TSI = 84
(03/2016).
Hồ Chí Minh, tháng 11 năm 2019
579
Các hồ phú dưỡng có hiện tượng biến thiên và chênh
lệch giá trị DO ngày - đêm rất lớn, giá trị cực đại đạt
180 % DO bão hòa, độ biến thiên ∆DO tại Hồ Trúc Bạch:
60 %, Hồ Ba Mẫu: 160 %, Hồ Bảy Mẫu: 140 %, Hồ Hai
Bà Trưng: 110%, Hồ Hoàn Kiếm: 90 %, Hồ Đầm Trị:
90%. Khi thiên DO lớn, các loài động vật thủy sinh có thể
không thích nghi kịp, dẫn đến sốc oxy có thể gây chết.
Một yếu tố khác rất quan trọng là mức độ DO cực tiểu
trong ngày nhỏ hơn ngưỡng tồn tại 4 mg/l, cũng là nguyên
nhân gây chết các động vật thủy sinh.
Số liệu quan trắc cho thấy diễn biến DO trong hồ
khác biệt rõ rệt theo giờ trong ngày, DO cực tiểu đạt vào
khoảng 4h00-6h00 (20 % DO bão hòa), DO cực đại đạt
vào khoảng 15h00-17h00 (180 % DO bão hòa). Ban ngày,
do cường độ bức xạ lớn, quá trình quang hợp của tảo diễn
ra mạnh mẽ, lượng DO sinh ra rất lớn. Ban đêm, với mật
độ tảo rất cao, quá trình hô hấp sử dụng oxy hòa tan trong
nước làm cho DO giảm mạnh.
Hình 1. Phân loại mức độ phú dưỡng
theo chỉ số TSI.
3.2. Đánh giá, phân loại mức độ phú dƣỡng dựa trên kỹ thuật khai thác dữ liệu
Trong quá trình xây dựng cây phân loại
thực hiện điều chỉnh các giá trị tối ưu để đạt
kết quả phân loại tốt nhất. Cây quyết định thu
được với giá trị tỷ lệ phân loại đúng CCI = 61
%, hệ số Kappa = 0.41 đáp ứng các tiêu chí
đánh giá hiệu quả phân loại [5], được thể hiện
trong hình 2.
Kết quả phân loại cho thấy các yếu tố
dinh dưỡng như NH4-N, TP hay hàm lượng
hữu cơ BOD5 đóng vai trò phân loại bước
đầu. Đặc biệt, kết quả nghiên cứu cho thấy
nồng độ DO và mức độ biến thiên DO trong
ngày đóng vai trò là một nút trong cây phân
loại, có ý nghĩa rất quan trọng trong phân loại
phú dưỡng hồ.
Hình 2. Cây phân loại (cài đặt căn bản, hệ số cắt
tỉa tin cậy (PCF) = 0,05, dự báo mức độ phú
dưỡng dựa trên hệ số dinh dưỡng TSI (CCI = 61%;
Kappa = 0,41).
Kết quả phân loại phù hợp với lý thuyết, cho thấy nếu TP ≤ 0,55 mg/l và NH4-N ≤ 0,07 mg/l,
tức là mức độ dư thừa dinh dưỡng không quá cao, quá trình sinh trưởng và phát triển của tảo yếu,
kéo theo mức độ biến thiên DO trong ngày sẽ thấp. Trong điều kiện siêu phú dưỡng và bùng nổ tảo,
DO có mức biến thiên trong ngày rất lớn.
Toàn bộ quá trình xây dựng cây quyết định đã cho thấy ngoài các yếu tố truyền thống dinh
dưỡng là nguyên nhân của phú dưỡng thì các yếu tố hệ quả trực tiếp như DO hay mức độ biến thiên
DO cũng có ý nghĩa lớn, cần xem xét như một chỉ thị quan trọng cho các thủy vực phú dưỡng.
4. KẾT LUẬN
Kết quả xây dựng mô hình sinh thái dạng cây phân loại cho thấy mức độ biến thiên DO trong
ngày là một thông số phân loại tình trạng phú dưỡng, ∆DO cần được xem xét như một chỉ thị của
quá trình phú dưỡng.
Việc ứng dụng mô hình phân loại ngoài mục tiêu phân lớp dữ liệu đầu vào để dự báo các giá
trị tiếp theo, còn có mục tiêu quan trọng là xác định các biến điều khiển (driving variables). Kỹ
Kỷ yếu Hội nghị: Nghiên cứu cơ bản trong “Khoa học Trái đất và Môi trường”
580
thuật phân lớp là ứng dụng thích hợp nhất cho quá trình phân loại và dự báo các biến đổi trong hệ
sinh thái thủy vực.
Lời cám ơn
Nghiên cứu được Quỹ Phát triển Khoa học và Công nghệ Quốc gia (NAFOSTED) tài trợ qua
đề tài 105.99-2012.17.
TÀI LIỆU THAM KHẢO
[1]. Goethals, P. and De Pauw, N. (2001). Development of a concept for integrated ecological river
assessment in Flanders, Belgium. Journal of Limnology 60(1): 7-16.
[2]. Sven Jogensen, G. Bendoricchio. (2001) Fundamental of Ecological Modelling, Elsevier
[3]. Dakou, E., D’heygere, T., Dedecker, A. P., Goethals, P., Lazaridou-Dimitriadou, M. and De Pauw, N.
(2007). Decision tree models for prediction of macroinvertebrate taxa in the river Axios (Northern
Greece). Aquatic Ecology, 41: 399-411.
[4]. Hoang, T. H., Mouton, A., Lock, K. & Goethals, P. 2013 Integrating data-driven ecological models in an
expert-based decision support system for water management in the Du River basin (Vietnam).
Environmental Monitoring and Assessment 185, 631-642.
[5]. Hoang, T. T. H., Van, D. A. & Nguyen, T. T. H. 2017 Driving variables for eutrophication in lakes of
Hanoi by data-driven technique. Water and Environment Journal 31, 176-183.
[6]. Ian H.Witten and Eibe Frank. (2005) Data Mining: Practical Machine Learning Tools and Techniques.
Morgan Kaufman Publisher
[7]. Hoang, T.H., Nguyen, V., Van, A. & Nguyen, H. (2019) Decision tree techniques to assess the role of
daily DO variation in classifying shallow eutrophicated lakes in Hanoi, Vietnam. Water Quality
Research Journal (in press).
DATA-DRIVEN TECHNIQUE APPLIED IN STUDYING
EUTROPHICATION IN THE LAKE OF HANOI
Hoang Thi Thu Huong, Van Dieu Anh, Nguyen Thi Thu Hien
Hanoi University of Science and Technology, Email: huong.hoangthithu@hust.edu.vn
ABSTRACT
Eutrophication is a serious phenomenon in shallow lakes in Hanoi. Water quality parameters
and eutrophication situation data were collected in six shallow eutrophicated lakes in Hanoi during
2015-2017. Trophic index (TSI) reflecting eutrophication level was calculated to evaluate the lake
conditions. A large variation of DO was observed with the maximum value achieved at 15h00-
17h00 (180 % saturation DO) and the minimum value at 4h00-6h00 (20 % saturation DO). The
data-driven technique had been developed and to select the driving variables in classifying the
eutrophication status in lakes. The application of classification trees demonstrated that
eutrophication in the lakes of Hanoi was driven by nutrients and organic enrichment as well as
oxygen variation. The daily DO fluctuations correlated with phytoplankton density, TSI,
Chlorophyll-a concentration and density showing the close relationship between DO variation and
eutrophication conditions. Daily DO variation could be an important indicator for eutrophication.
Data-driven technique proved to be an effective tool that may provide reliable simulations for
integrated water management.
Keywords: Classification tree, DO variation, TSI.