Prediction of pre-consolidation pressure of soft soil using artificial
intelligence in some areas of northern delta Vietnam
Abstract: Pre-consolidation pressure (Pc) of soft soil in some areas Northern
Delta Vietnam has been predicted by using Artificial Intelligence - Machine
Learning through 3 models: Support Vector Regression (SVR), Artificial
Neural Network Mutilayer Perceptron (ANN MLP), Ridge Regression (RR).
Those models were built by Python programming language and Scikit-learn
software machine learning library. The data for this study is 159 soft soil
samples which were collected from the construction site and full of physicomechanical properties were achieved from experiments in laboratory at
provinces Quang Ninh, Hai Phong, Thai Binh, Nam Dinh, Ninh Binh and Hai
Duong. We use 15 physical properties of soil as inputs to analyze correlation
with Pc. After removing parameters which have a weak correlation with Pc, we
have 6 parameters which is strongly correlated with Pc: upper sampling depth
(m), lower sampling depth (m), clay content (%), liquidity index, specific
gravity (g/cm3), void ratio. For predicting Pc, the models were built with 70%
training set and 30% testing set. Performance of the models were validated by
using various statistical measures: Mean Absolute Error (MAE), Root Mean
Square Error (RMSE) Correlation coefficient (R) and Coefficient of
determination (R2). Results of predicting Pc models show that the performance
of the models using different methods is much different where R2-value varies
from 0.728 to 0.843. The present study suggested that the ANN-MLP model has
the highest predictive capability in 3 models: R2 = 0.843, MAE = 0.143, RMSE
= 0.187 and R=0.923
10 trang |
Chia sẻ: thanhuyen291 | Ngày: 09/06/2022 | Lượt xem: 417 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Nghiên cứu ứng dụng kỹ thuật trí tuệ nhân tạo dự báo áp lực tiền cố kết của đất yếu tại một số khu vực ở đồng bằng Bắc Bộ, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ĐỊA KỸ THUẬT SỐ 3 - 2021 26
NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TRÍ TUỆ NHÂN TẠO
DỰ BÁO ÁP LỰC TIỀN CỐ KẾT CỦA ĐẤT YẾU TẠI MỘT SỐ
KHU VỰC Ở ĐỒNG BẰNG BẮC BỘ
NGUYỄN ĐỨC MẠNH*, HỒ SỸ AN*
NGUYỄN HẢI HÀ*, PHẠM BÁ KHẢI*
NGUYỄN ĐÌNH TRUNG*, NGUYỄN ĐÌNH DŨNG*
Prediction of pre-consolidation pressure of soft soil using artificial
intelligence in some areas of northern delta Vietnam
Abstract: Pre-consolidation pressure (Pc) of soft soil in some areas Northern
Delta Vietnam has been predicted by using Artificial Intelligence - Machine
Learning through 3 models: Support Vector Regression (SVR), Artificial
Neural Network Mutilayer Perceptron (ANN MLP), Ridge Regression (RR).
Those models were built by Python programming language and Scikit-learn
software machine learning library. The data for this study is 159 soft soil
samples which were collected from the construction site and full of physico-
mechanical properties were achieved from experiments in laboratory at
provinces Quang Ninh, Hai Phong, Thai Binh, Nam Dinh, Ninh Binh and Hai
Duong. We use 15 physical properties of soil as inputs to analyze correlation
with Pc. After removing parameters which have a weak correlation with Pc, we
have 6 parameters which is strongly correlated with Pc: upper sampling depth
(m), lower sampling depth (m), clay content (%), liquidity index, specific
gravity (g/cm
3
), void ratio. For predicting Pc, the models were built with 70%
training set and 30% testing set. Performance of the models were validated by
using various statistical measures: Mean Absolute Error (MAE), Root Mean
Square Error (RMSE) Correlation coefficient (R) and Coefficient of
determination (R
2
). Results of predicting Pc models show that the performance
of the models using different methods is much different where R
2
-value varies
from 0.728 to 0.843. The present study suggested that the ANN-MLP model has
the highest predictive capability in 3 models: R
2
= 0.843, MAE = 0.143, RMSE
= 0.187 and R=0.923.
Keywords: artificial neural network mutilayer perceptron (ANN MLP),
Artificial Intelligencemachine learning, ridge regression (RR), Pre-
consolidation pressure, soft soil, support vector regression (SVR).
1. ĐẶT VẤN ĐỀ *
Áp lực tiền cố kết (Pc) là áp lực hữu hiệu lớn
nhất trong quá khứ của lớp đất phủ mà mẫu đất
* Tr ng Đ i học Giao thông vận tải
Số 3 phố Cầu Giấy, P.Láng Thượng, Q.Đống Đa, Hà N i.
Email: nguyenducmanh@utc.edu.vn/
syannamanh1998@gmail.com
ở độ sâu nào đó phải chịu [1,2,21]. Đây là một
trong những thông số không thể thiếu khi dự
báo lún nền đất yếu cũng nhƣ phục vụ tính toán
thiết kế giải pháp xử lý nền đất yếu dƣới tác
dụng tải trọng đắp, đặc biệt trong xây dựng
đƣờng giao thông [1,2,21,24]. Để có chỉ tiêu
này, phổ biến hiện nay là tiến hành bằng thí
ĐỊA KỸ THUẬT SỐ 3 - 2021 27
nghiệm mẫu đất trong phòng đƣợc lấy từ các l
khoan khảo sát địa kỹ thuật. Tuy nhiên, phƣơng
pháp truyền thống này có một hạn chế nhƣ chi
phí cao hay kết quả thƣờng có sai số lớn khi
mẫu đất đƣợc lấy ở độ sâu lớn. Ngoài ra, chất
lƣợng bảo quản mẫu đất nguyên trạng, tay nghề
của những ngƣời thực hiện và độ tin cậy của
thiết bị thí nghiệm cũng ảnh hƣởng không nhỏ
đến kết quả xác định Pc.
Để thay thế cho các thí nghiệm trong phòng
truyền thống này, một vài mô hình thuật toán dựa
trên kinh nghiệm đã đƣợc phát triển nhằm dự
đoán Pc hay các thông số đất nền khác [2].
Những mô hình này cơ bản dựa trên việc cải tiến
phân tích hồi quy. Tuy nhiên, phƣơng pháp hồi
quy này thƣờng bị giới hạn bởi số lƣợng hạn chế
nhất định phƣơng trình tuyến tính hoặc phi tuyến.
Ngày nay, trí tuệ nhân tạo (Artificial
intelligent) hay máy học (Machine learning) đã
đƣợc áp dụng rộng rãi trong nhiều l nh vực bao
gồm cả địa k thuật nhƣ là nhận diện hay dự báo
trƣợt lở đất [3-7], dự đoán lũ lụt [8], đánh giá
tiềm năng nƣớc ngầm [9, 10] và dự đoán tính
chất vật liệu [11-20]. Trong nghiên cứu này, các
mô hình thuật toán SVR, ANN MLP và RR sử
dụng kết quả thí nghiệm gồm các chỉ tiêu vật lý
cơ bản của đất làm các biến đầu vào (X) để dự
báo áp lực tiền cố kết Pc của đất yếu (biến đầu
ra, Y) khu vực đồng bằng Bắc Bộ. Kết quả của
các mô hình dự báo đƣợc kiểm tra, đánh giá
hiệu suất bằng các phƣơng pháp thống kê tiêu
chuẩn nhƣ giá trị trung bình của tổng các trị
tuyệt đối của sai số - Mean Absolute Error
(MAE); độ lệch tiêu chuẩn các sai số - Root
Mean Square Error (RMSE); hệ số tƣơng quan
R - Correlation coefficient (R); và hệ số xác
định - Coefficient of detemination (R2). Kết quả
nghiên cứu cho phép đề xuất một phƣơng pháp
mới có thể dự đoán Pc với độ tin cậy cao từ các
thông số vật lý có đƣợc từ những thí nghiệm của
các công trình thực tế, tiến tới xây dựng bộ dự
liệu lớn trong tƣơng lai về l nh vực này.
2. DỮ LIỆU VÀ THUẬT TOÁN SỬ
DỤNG DỰ BÁO
2.1. Dữ liệu sử dụng
Nghiên cứu này, bộ số liệu với đầy đủ các
chỉ tiêu cơ lý xác định trong phòng thí nghiệm
sử dụng làm dữ liệu xây dựng mô hình dự báo
từ 159 mẫu đất yếu là bùn sét pha hay sét pha
trạng thái chảy đƣợc thu thập từ các công trình
thực tế tin cậy thực hiện bởi các đơn vị uy tín
nhƣ TEDI-HECO, TEDI-GIC, CIENCO1 kết
hợp một số mẫu thí nghiệm kiểm chứng bổ sung
đƣợc lấy tại một số khu vực trung vùng nghiên
cứu. Các thông số này đƣợc coi là các biến đầu
vào độc lập cho máy học, tƣơng ứng X1, X2,
X3, X4, X5, X6, X7, X8, X9, X10, X11, X12,
X13, X14, X15 nhằm xác định biến đầu ra phụ
thuộc Pc (Y) (kPa) (Bảng 1). Các thông số của
đất đƣợc xem xét sử dụng phân tích trong bài
báo này bao gồm: độ sâu lấy mẫu trên và dƣới
(X1, X2, m), hàm lƣợng hạt sét (X3, %), hàm
lƣợng hạt bụi (X4, %), giới hạn chảy (X5, %),
giới hạn dẻo (X6, %), chỉ số dẻo (X7, %), độ sệt
(X8), độ ẩm (X9, %), khối lƣợng thể tích tự
nhiên (X10, g/cm
3), khối lƣợng thể tích khô
(X11, g/cm
3), khối lƣợng riêng hạt (X12,
g/cm
3), độ r ng (X13, %), độ bão hòa (X14, %),
hệ số r ng (X15). Thông số dự báo là áp lực tiền
cố kết (Y, kPa). Bộ dữ liệu này đƣợc chia ngẫu
nhiên thành hai phần là tập dữ liệu học lấy 70%,
dùng để tập luyện cho máy và tập dữ liệu kiểm
tra sử dụng 30% còn lại nhằm đánh giá hiệu suất
mô hình. Các mô hình này đƣợc xây dựng trên
ngôn ngữ lập trình Python và thƣ viện h trợ
Scikit-learn.
Bảng 1: Dữ liệu đầu vào và đầu ra sử dụng trong nghi n cứu nà
STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn
1 X1 35,4 0,5 10,76 7,129003
2 X2 36 1,5 11,31465 7,090925
ĐỊA KỸ THUẬT SỐ 3 - 2021 28
STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn
3 X3 69 4,5 26,96541 11,17561
4 X4 84,9 18 53,05535 13,59445
5 X5 77 21,71 51,09472 12,17120
6 X6 39,96 13,08 26,06862 5,296375
7 X7 47,15 6,11 25,02673 8,561346
8 X8 1,94 0,16 0,857799 0,280667
9 X9 70,65 22,12 46,78126 11,48550
10 X10 2,04 1,52 1,735094 0,113142
11 X11 1,67 0,91 1,194969 0,175484
12 X12 2,76 2,65 2,698176 0,022413
13 X13 66,3 37,23 55,71277 6,479979
14 X14 99,97 84,11 96,79566 2,758104
15 X15 1,967 0,593 1,303403 0,315885
16 Y 282,24 20,58 90,12923 0,549973
Phân tích phân phối 159 mẫu cho 15 thông số
là các biến đầu vào (X1-X15) và biến đầu ra (Y)
cho thấy, các thông số cơ lý của các mẫu đất biến
thiên trong khoảng giá trị rất khác nhau (bảng 1 và
hình tiêu biểu 1, 2, 3, 4). Độ lệch tiêu chuẩn lớn
nhất thuộc về thông số hàm lƣợng hạt bụi (X4, độ
lệch tiêu chuẩn 13,59445), nhỏ nhất là khối lƣợng
riêng hạt (X12, độ lệch tiêu chuẩn 0,022413).
Hình 1: Biểu đồ biến thiên giá trị
của độ sâu lấy mẫu trên
Hình 2: Biểu đồ biến thiên giá trị của
hàm l ng h t sét
Hình 3: Biểu đồ biến thiên giá trị của độ sệt Hình 4: Biểu đồ biến thiên của giá trị Pc
t kết quả thí nghiệm mẫu đất
2.2. Công cụ và thuật toán sử dụng
Ngôn ngữ lập trình Python và th viện mở
Scikit-learn:
Python là một ngôn ngữ lập trình thông dịch
(interpreted), hƣớng đối tƣợng (object-oriented),
và là một ngôn ngữ bậc cao (high-level) ngữ
ĐỊA KỸ THUẬT SỐ 3 - 2021 29
ngh a động (dynamic semantics).. Trình thông
dịch Python và thƣ viện chuẩn mở rộng có sẵn
dƣới dạng mã nguồn hoặc dạng nhị phân miễn
phí cho tất cả các nền tảng chính và có thể đƣợc
phân phối tự do [18, 23, 25, 27, 29]. Cùng với
đó, Scikit-learn là một thƣ viện tài nguyên mở
dùng cho máy học, cung cấp nhiều công cụ
dùng cho làm khớp mô hình (model fitting), tiền
xử lý dữ liệu (data preprocessing), lựa chọn mô
hình và nhiều tiện ích khác [23,25].
Thuật toán hỗ tr hồi qui V c tơ (Support
Vector Regression - SVR):
H trợ hồi qui Véc tơ (Support Vector
Regression - SVR) dựa trên lý thuyết học thống
kê lần đầu tiên đƣợc giới thiệu bởi Vapnik vào
năm 1995 [13, 28, 30]. Nguyên tắc của SVR là
xây dựng một mặt siêu phẳng (hyper plane) để
phân loại tập dữ liệu thành các lớp riêng biệt
[25]. Bằng cách sử dụng “kernal” phi tuyến
SVR ánh xạ không gian đầu vào sang không
gian nhiều chiều hơn [26]. Sau đó, siêu phẳng
tối ƣu đƣợc xác định trong không gian đặc trƣng
(feature space) bằng cách tối đa hóa biên của
ranh giới các lớp (margins of class boundaries)
[28]. Các điểm đƣợc huấn luyện (trained points)
gần nhất với mặt siêu phẳng tối ƣu đƣợc gọi là
các véc tơ h trợ (support vectors). SVR đƣợc
coi là một trong những kỹ thuật lập mô hình
chính xác nhất và cũng đƣợc sử dụng rộng rãi
trong dự báo sụt trƣợt đất đá. Nghiên cứu này sử
dụng SVR nhƣ một kỹ thuật hồi quy bằng cách
đề xuất một hàm mất mát (loss function) ε-
không nhạy cảm (ε-insensitive) đƣợc thể hiện
trong phƣơng trình sau:
Dữ liệu học đƣợc đƣa vào dạng (xi, yi), x ∈
rN, y ∈ r, trong đó x biến đầu vào, y biến đầu
ra; rN = N là chiều không gian véc tơ (N -
dimensional vector space); r - một chiều không
gian véc tơ (r - one dimensional vector space)
và ε = vùng l i nhạy cảm (error insensitive
zone) (hình 5). Thuật toán SVR cho phép xác
định một hàm có thể ƣớc tính các giá trị trong
tƣơng lai một cách chính xác [28,30]. Thuật
toán hồi quy h trợ véc tơ cho phép hồi quy hàm
tuyến tính đƣợc thể hiện trong phƣơng trình sau:
(2)
Hình 5: Sơ đồ nguyên lý thuật toán SVR
giải quyết bài toán hồi quy [26]
Trong đó w ∈ rN và b ∈ r; w = véc tơ trọng
số có thể hiệu chỉnh (adjustable weight vector); và
b = ngƣỡng vô hƣớng (scalar threshold). Để độ
dốc (slope) của hàm gần đến 0, giá trị của w phải
đƣợc tối thiểu hóa. Điều này có thể đạt đƣợc bằng
cách tối thiểu hóa norm ‖w‖2 = 〈w,w〉. Đây là
một bài toán tối ƣu lồi (convex optimization) đƣợc
thể hiện trong phƣơng trình sau:
(3)
Với:
Mạng nơ ron nh n tạo đa lớp (Artificial N ural
Network Mutilayer Perceptron - ANN MLP):
Mạng nơ ron nhân tạo (ANN) là một tập hợp
của các nút đƣợc liên kết với nhau nhằm giải
thích và giải quyết các vấn đề có mối quan hệ
phức tạp giữa các biến độc lập đầu vào và biến
phụ thuộc đầu ra [25]. Mạng perceptron đa lớp
(Mutilayer Perceptron - MLP) là một trong
những mạng nơ ron nhân tạo, hay một trong
những kỹ thuật mạng nơ ron nhân tạo hiệu quả
ĐỊA KỸ THUẬT SỐ 3 - 2021 30
nhất trong mô hình và dự đoán đối tƣợng. Do đó
nó đƣợc sử dụng nhƣ một mô hình chuẩn của
nhiều nhà nghiên cứu [25,27]. ANN MLP có
khả năng mô phỏng các quá trình phi tuyến và
phức tạp của thế giới thực. Về cơ bản, có thể nói
ANN MLP là một mô hình chuyển tiếp bao gồm
một lớp đầu vào, một hay nhiều lớp ẩn và một
lớp đầu ra nhƣ trên hình 6.
Hình 6: Minh họa một mô hình ANN MLP
với 2 lớp ẩn [25]
Số lƣợng của các nút đầu vào phụ thuộc và
các thông số đƣợc lựa chọn trong nguồn dữ liệu
sử dụng để dự báo, và số lƣợng của số nơ ron ẩn
đƣợc xác định dựa trên tập dữ liệu dùng cho
máy học trong từng trƣờng hợp cụ thể. Số lƣợng
lớp ẩn đƣợc sử dụng cho tính toán và lớp đầu ra
đại diện cho mục đích của mô hình. M i nút của
lớp ẩn phải kết nối với tất cả các nút của lớp đầu
vào, và m i nút của lớp đầu ra phải đƣợc kết nối
với toàn bộ nút trong các lớp ẩn. Thông qua các
liên kết này, quá trình hoạt động của ANN MLP
có thể chia ra hai bƣớc: truyền thẳng và truyền
ngƣợc sử dụng thuật toán truyền ngƣợc [25].
Trong nghiên cứu này, để dự báo Pc sử dụng
thuật toán ANN MLP có 2 lớp ẩn với số nút lần
lƣợt trong m i lớp ẩn là 8, 10 và sử dụng hàm
kích hoạt Sigmoid.
Thuật toán hồi quy s n b n Ridge
Regression - RR):
Mô hình Ridge Regression (RR) là phƣơng
pháp áp dụng khi bộ dữ liệu gặp vấn đề về đa
cộng tuyến các biến độc lập x có mối liên hệ với
nhau, và ảnh hƣởng lên kết quả dự báo của y,
hay giải quyết các vấn đề về Overfifting (mô
hình áp dụng tốt cho dữ liệu học (training)
nhƣng không hoạt động tốt trên dữ liệu kiểm tra
(test) mà mô hình hồi quy tuyến tính thông
thƣờng gặp phải [26,28].
Hình 7: Mối qua hệ đánh đổi giữa bias
và variance [27]
RR là mô hình hồi quy phân tích mối quan hệ
giữa các biến độc lập và biến phụ thuộc sử dụng
phƣơng pháp Regularization, điều chỉnh mô
hình sao cho giảm thiểu các vấn đề Overfitting,
tối ƣu hay kiểm soát mức độ phức tạp của mô
hình để cân đối giữa Thiên vị (Biased) và
Phƣơng sai (Variance), qua đó giảm sai số của
mô hình. Do vậy, trong nghiên cứu này nhóm
tác giả sử dụng mô hình hồi quy sƣờn bên
(Ridge Regression) vào việc dự báo áp lực tiền
cố kết Pc của đất yếu khu vực nghiên cứu.
3. LỰA CHỌN THÔNG SỐ ĐẦU VÀO
ĐỂ DỰ BÁO PC
Tổng cộng 15 thông số đầu vào là các chỉ
tiêu vật lý của 159 mẫu đất yếu xác định từ thí
nghiệm trong phòng đƣợc lựa chọn (X1-X15).
Tuy nhiên chỉ có một số biến đầu vào có mối
quan hệ chặt chẽ với thông số cần dự báo Pc (kết
quả đầu ra, hay biến đầu ra Y). Thông qua quá
trình xác định mức độ tƣơng quan giữa 15 chỉ
tiêu vật lý của đất với áp lực tiền cố kết bằng
ĐỊA KỸ THUẬT SỐ 3 - 2021 31
thống kê toán học, cho phép loại bỏ những biến
(chỉ tiêu vật lý) ít hoặc không có quan hệ chặt
với kết quả đầu ra – biến đầu ra (Pc). Các làm
này cho phép rút ngắn thời gian xử lý của mô
hình và đồng thời hiệu suất của mô hình dự báo
cũng sẽ đƣợc cải thiện.
Sử dụng công cụ “cây hồi qui bổ sung”
(Extra Trees Regressor) của thƣ viện Scikit-
learn nhằm tạo ra biểu đồ thể hiện trực quan
mức độ quan trọng của các biến độc lập X đối
với biến phụ thuộc Y (Pc) trong mô hình dự báo
(hình 8).
Hình 8: Mức độ t ơng quan của biến độc lập
(Xi đối với biến ph thuộc (Y - Pc) sử d ng
công c Extra Trees Regressor
Hình 8 cho thấy, kết quả máy học chỉ ra đƣợc
6 biến độc lập có mối quan hệ chặt chẽ nhất với
Pc gồm: X1, X2, X8, X3, X15 và X12, tƣơng
ứng là độ sâu lấy mẫu đất trên (m), độ sâu lấy
mẫu đất dƣới (m), và các chỉ tiêu vật lý của đất
thí nghiệm trong phòng nhƣ độ sệt, hàm lƣợng
hạt sét (%), khối lƣợng riêng hạt (g/cm3) và hệ
số r ng của đất.
4. THIẾT LẬP MÔ HÌNH VÀ ĐÁNH
GIÁ HIỆU SUẤT MÔ HÌNH
4.1. Thiết lập mô hình
Trong nghiên cứu này, nhóm nghiên cứu
thực hiện 3 bƣớc cho mô hình máy học với các
thuật toán trí tuệ nhân tạo lựa chọn để dự báo Pc
của đất yếu khu vực nghiên cứu nhu hình 9,
gồm: (1) Chuẩn bị và tiền xử lý số liệu, loại bỏ
nhiễu (159 mẫu đất có các chỉ tiêu thí nghiệm
trong phòng tạo ra 15 thông số đầu vào từ X1
đến X15 là các chỉ tiêu vật lý của đất và biến
đầu ra phụ thuộc Y (Pc)); (2) Loại bỏ các biến
độc lập có mối quan hệ không chặt với biến phụ
thuộc Y (từ 15 biến X ban đầu, sau xử lý rút
xuống còn 6 biến X) (hình 8); (3) Tiến hành
máy học bằng các thuật toán trí tuệ nhân tạo lựa
chọn nghiên cứ để dự đoán Pc, đánh giá hiệu
suất các mô hình dựa vào các thông số RMSE,
MAE, R và R
2
.
Hình 9: Sơ đồ xây dựng mô hình máy học để
dự báo Pc
4.2. Đánh giá hiệu suất mô hình
Một mô hình đƣợc đánh giá tốt khi sử dụng
các biến đầu vào Xi cho ra các giá trị dự báo
Ypred sát với giá trị của thực tế đã xác định
Ytest [27,28,30]. Để đánh giá hiệu suất của các
mô hình máy học, ở đây sử dụng các thông số
(1) Root Mean Square Error (RMSE), (2)
Mean Absolute Error (MAE), (3) Coefficient
of Determine (R
2
) và (4) Correlation
Coefficient (R).
RMSE thể hiện độ lệch tiêu chuẩn các sai số
của mô hình dự đoán. Nó đƣợc xác định thông
qua công thức [11]:
;
trong đó m là số lƣợng mẫu kiểm tra, ytest là
giá trị đúng đã xác định của y, ypred là giá trị do
mô hình dự đoán.
MAE là giá trị trung bình của tổng các trị
ĐỊA KỸ THUẬT SỐ 3 - 2021 32
tuyệt đối của sai số mà mô hình dự đoán, đƣợc
xác định thông qua công thức [29,30]:
; trong đó m
là số lƣợng mẫu kiểm tra, ytest là giá trị đúng
đã xác định của y, ypred là giá trị do mô hình
dự đoán.
Hệ số xác định R2 là một thông số biến đổi từ
0 đến 1 nhằm thể hiện hiệu suất của mô hình dự
đoán [28]. Nó đƣợc xác định thông qua công
thức: ; trong đó m
là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã
xác định của y, ypred là giá trị do mô hình dự
đoán, là giá trị trung bình của các mẫu
kiểm tra.
Hệ số tƣơng quan R đánh giá tƣơng quan
giữa hai biến số trong quan hệ [30]. R đƣợc thể
hiện thông qua công thức sau:
;
trong đó m là số lƣợng mẫu kiểm tra, ytest là giá
trị đúng của y, ypred là giá trị do mô hình dự
đoán, là giá trị trung bình của các mẫu
kiểm tra, là giá trị trung bình của các mẫu
dự đoán.
5. KẾT QUẢ DỰ BÁO ÁP LỰC TIỀN CỐ
KẾT VÀ PHÂN TÍCH
Sử dụng 3 mô hình thuật toán SVR, ANN
MLP và RR nhƣ đã giới thiệu trên, với bộ số
liệu sau chuẩn hóa gồm 6 biến độc lập (X1,
X2, X3, X8, X12, X15) có tƣơng quan chặt
với Pc và tiến hành dự báo theo sơ đồ mô hình
máy học đã xây dựng nhƣ trình bày trên hình
9, cho phép dự báo đƣợc Pc. Kết quả dự báo
áp lực tiền cố kết Pc của đất yếu khu vực
nghiên cứu đƣợc so sánh với giá trị thực tế thí
nghiệm (hình 10, 11 và 12).
Hình 10: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán SVR
Hình 11: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán ANN MLP
ĐỊA KỸ THUẬT SỐ 3 - 2021 33
Hình 12: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán RR
Biểu đồ biến thiên kết quả dự báo Pc so với
giá trị thực thí nghiệm khá tƣơng đồng về hình
thái, về trị số thậm chí trùng khớp nhau (hình 10,
11, 12). Kết quả đánh giá hiệu suất các mô hình
sử dụng trong nghiên cứu này thu đƣợc giá trị tốt
với tất cả các mô hình thuật toán trí tuệ nhân tạo
dự báo đã sử dụng, cụ thể: Khi dự báo Pc bằng
mô hình SVR thì MAE=0,171, RMSE=0,231,
R=0,873, R
2=0,760; với mô hình ANN MLP thì
MAE=0,143, RMSE=0,186, R=0,923, R
2
=0,843;
còn mô hình RR có MAE=0,193, RMSE=0,246,
R=0,856, R
2
=0,728 (bảng 2).
Bảng 2: So sánh hiệu suất các mô hình thuật toán AI sử dụng dự báo Pc.
STT Mô hình RMSE MAE R R
2
1 SVR 0,171 0, 31 0,873 0,760
2 ANN MLP 0,143 0,186 0,923 0,843
3 RR 0,193 0,246 0,856 0,728
Bảng 2 cho thấy, kết quả đánh giá hiệu suất
dự báo của các mô hình trí tuệ nhân tạo sử
dụng trong nghiên cứu này RMSE, MAE, R
hay R
2
đều có giá trị rất tích cực, chứng tỏ
đƣợc độ tin cậy cao khi dự báo Pc thông qua
một số chỉ tiêu vật lý dễ xác định khác đã có
nhƣ: độ sâu lấy mẫu đất; hàm lƣợng hạt sét
trong đất; độ sệt của đất; khối lƣợng riêng và
hệ số r ng của đất.
Phân tích hệ số xác định R2, kết quả của các
mẫu kiểm tra thay đổi từ 0,728 đến 0,843. Kết
quả này cho thấy rằng, độ chính xác của cả 3
mô hình thuật toán AI đã sử dụng trong dự đoán
Pc của đất yếu một số khu vực đồng bằng Bắc
Bộ ở mức khá tốt, và mô hình RR có độ chính
xác thấp nhất trong nghiên cứu này (R2=0,728),
trong khi đó mô hình ANN-MLP đạt hiệu suất
cao nhất trong dự đoán Pc (R
2
=0,843).
6. KẾT LUẬN
Áp lực tiền cố kết (Pc) của đất yếu là thông
số đất nền không thể thiếu, đƣợc sử dụng để lựa
chọn công thức khi phân tích lún cố kết nền đất
yếu dƣới tác dụng tải trọng đắp. Nó thƣờng
đƣợc xác định bằng đồ giải theo Casagrande từ
thí nghiệm nén cố kết mẫu đất tron