Nghiên cứu ứng dụng kỹ thuật trí tuệ nhân tạo dự báo áp lực tiền cố kết của đất yếu tại một số khu vực ở đồng bằng Bắc Bộ

Prediction of pre-consolidation pressure of soft soil using artificial intelligence in some areas of northern delta Vietnam Abstract: Pre-consolidation pressure (Pc) of soft soil in some areas Northern Delta Vietnam has been predicted by using Artificial Intelligence - Machine Learning through 3 models: Support Vector Regression (SVR), Artificial Neural Network Mutilayer Perceptron (ANN MLP), Ridge Regression (RR). Those models were built by Python programming language and Scikit-learn software machine learning library. The data for this study is 159 soft soil samples which were collected from the construction site and full of physicomechanical properties were achieved from experiments in laboratory at provinces Quang Ninh, Hai Phong, Thai Binh, Nam Dinh, Ninh Binh and Hai Duong. We use 15 physical properties of soil as inputs to analyze correlation with Pc. After removing parameters which have a weak correlation with Pc, we have 6 parameters which is strongly correlated with Pc: upper sampling depth (m), lower sampling depth (m), clay content (%), liquidity index, specific gravity (g/cm3), void ratio. For predicting Pc, the models were built with 70% training set and 30% testing set. Performance of the models were validated by using various statistical measures: Mean Absolute Error (MAE), Root Mean Square Error (RMSE) Correlation coefficient (R) and Coefficient of determination (R2). Results of predicting Pc models show that the performance of the models using different methods is much different where R2-value varies from 0.728 to 0.843. The present study suggested that the ANN-MLP model has the highest predictive capability in 3 models: R2 = 0.843, MAE = 0.143, RMSE = 0.187 and R=0.923

10 trang | Chia sẻ: thanhuyen291 | Lượt xem: 723 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Nghiên cứu ứng dụng kỹ thuật trí tuệ nhân tạo dự báo áp lực tiền cố kết của đất yếu tại một số khu vực ở đồng bằng Bắc Bộ, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

ĐỊA KỸ THUẬT SỐ 3 - 2021 26 NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TRÍ TUỆ NHÂN TẠO DỰ BÁO ÁP LỰC TIỀN CỐ KẾT CỦA ĐẤT YẾU TẠI MỘT SỐ KHU VỰC Ở ĐỒNG BẰNG BẮC BỘ NGUYỄN ĐỨC MẠNH*, HỒ SỸ AN* NGUYỄN HẢI HÀ*, PHẠM BÁ KHẢI* NGUYỄN ĐÌNH TRUNG*, NGUYỄN ĐÌNH DŨNG* Prediction of pre-consolidation pressure of soft soil using artificial intelligence in some areas of northern delta Vietnam Abstract: Pre-consolidation pressure (Pc) of soft soil in some areas Northern Delta Vietnam has been predicted by using Artificial Intelligence - Machine Learning through 3 models: Support Vector Regression (SVR), Artificial Neural Network Mutilayer Perceptron (ANN MLP), Ridge Regression (RR). Those models were built by Python programming language and Scikit-learn software machine learning library. The data for this study is 159 soft soil samples which were collected from the construction site and full of physico- mechanical properties were achieved from experiments in laboratory at provinces Quang Ninh, Hai Phong, Thai Binh, Nam Dinh, Ninh Binh and Hai Duong. We use 15 physical properties of soil as inputs to analyze correlation with Pc. After removing parameters which have a weak correlation with Pc, we have 6 parameters which is strongly correlated with Pc: upper sampling depth (m), lower sampling depth (m), clay content (%), liquidity index, specific gravity (g/cm 3 ), void ratio. For predicting Pc, the models were built with 70% training set and 30% testing set. Performance of the models were validated by using various statistical measures: Mean Absolute Error (MAE), Root Mean Square Error (RMSE) Correlation coefficient (R) and Coefficient of determination (R 2 ). Results of predicting Pc models show that the performance of the models using different methods is much different where R 2 -value varies from 0.728 to 0.843. The present study suggested that the ANN-MLP model has the highest predictive capability in 3 models: R 2 = 0.843, MAE = 0.143, RMSE = 0.187 and R=0.923. Keywords: artificial neural network mutilayer perceptron (ANN MLP), Artificial Intelligencemachine learning, ridge regression (RR), Pre- consolidation pressure, soft soil, support vector regression (SVR). 1. ĐẶT VẤN ĐỀ * Áp lực tiền cố kết (Pc) là áp lực hữu hiệu lớn nhất trong quá khứ của lớp đất phủ mà mẫu đất * Tr ng Đ i học Giao thông vận tải Số 3 phố Cầu Giấy, P.Láng Thượng, Q.Đống Đa, Hà N i. Email: [email protected]/ [email protected] ở độ sâu nào đó phải chịu [1,2,21]. Đây là một trong những thông số không thể thiếu khi dự báo lún nền đất yếu cũng nhƣ phục vụ tính toán thiết kế giải pháp xử lý nền đất yếu dƣới tác dụng tải trọng đắp, đặc biệt trong xây dựng đƣờng giao thông [1,2,21,24]. Để có chỉ tiêu này, phổ biến hiện nay là tiến hành bằng thí ĐỊA KỸ THUẬT SỐ 3 - 2021 27 nghiệm mẫu đất trong phòng đƣợc lấy từ các l khoan khảo sát địa kỹ thuật. Tuy nhiên, phƣơng pháp truyền thống này có một hạn chế nhƣ chi phí cao hay kết quả thƣờng có sai số lớn khi mẫu đất đƣợc lấy ở độ sâu lớn. Ngoài ra, chất lƣợng bảo quản mẫu đất nguyên trạng, tay nghề của những ngƣời thực hiện và độ tin cậy của thiết bị thí nghiệm cũng ảnh hƣởng không nhỏ đến kết quả xác định Pc. Để thay thế cho các thí nghiệm trong phòng truyền thống này, một vài mô hình thuật toán dựa trên kinh nghiệm đã đƣợc phát triển nhằm dự đoán Pc hay các thông số đất nền khác [2]. Những mô hình này cơ bản dựa trên việc cải tiến phân tích hồi quy. Tuy nhiên, phƣơng pháp hồi quy này thƣờng bị giới hạn bởi số lƣợng hạn chế nhất định phƣơng trình tuyến tính hoặc phi tuyến. Ngày nay, trí tuệ nhân tạo (Artificial intelligent) hay máy học (Machine learning) đã đƣợc áp dụng rộng rãi trong nhiều l nh vực bao gồm cả địa k thuật nhƣ là nhận diện hay dự báo trƣợt lở đất [3-7], dự đoán lũ lụt [8], đánh giá tiềm năng nƣớc ngầm [9, 10] và dự đoán tính chất vật liệu [11-20]. Trong nghiên cứu này, các mô hình thuật toán SVR, ANN MLP và RR sử dụng kết quả thí nghiệm gồm các chỉ tiêu vật lý cơ bản của đất làm các biến đầu vào (X) để dự báo áp lực tiền cố kết Pc của đất yếu (biến đầu ra, Y) khu vực đồng bằng Bắc Bộ. Kết quả của các mô hình dự báo đƣợc kiểm tra, đánh giá hiệu suất bằng các phƣơng pháp thống kê tiêu chuẩn nhƣ giá trị trung bình của tổng các trị tuyệt đối của sai số - Mean Absolute Error (MAE); độ lệch tiêu chuẩn các sai số - Root Mean Square Error (RMSE); hệ số tƣơng quan R - Correlation coefficient (R); và hệ số xác định - Coefficient of detemination (R2). Kết quả nghiên cứu cho phép đề xuất một phƣơng pháp mới có thể dự đoán Pc với độ tin cậy cao từ các thông số vật lý có đƣợc từ những thí nghiệm của các công trình thực tế, tiến tới xây dựng bộ dự liệu lớn trong tƣơng lai về l nh vực này. 2. DỮ LIỆU VÀ THUẬT TOÁN SỬ DỤNG DỰ BÁO 2.1. Dữ liệu sử dụng Nghiên cứu này, bộ số liệu với đầy đủ các chỉ tiêu cơ lý xác định trong phòng thí nghiệm sử dụng làm dữ liệu xây dựng mô hình dự báo từ 159 mẫu đất yếu là bùn sét pha hay sét pha trạng thái chảy đƣợc thu thập từ các công trình thực tế tin cậy thực hiện bởi các đơn vị uy tín nhƣ TEDI-HECO, TEDI-GIC, CIENCO1 kết hợp một số mẫu thí nghiệm kiểm chứng bổ sung đƣợc lấy tại một số khu vực trung vùng nghiên cứu. Các thông số này đƣợc coi là các biến đầu vào độc lập cho máy học, tƣơng ứng X1, X2, X3, X4, X5, X6, X7, X8, X9, X10, X11, X12, X13, X14, X15 nhằm xác định biến đầu ra phụ thuộc Pc (Y) (kPa) (Bảng 1). Các thông số của đất đƣợc xem xét sử dụng phân tích trong bài báo này bao gồm: độ sâu lấy mẫu trên và dƣới (X1, X2, m), hàm lƣợng hạt sét (X3, %), hàm lƣợng hạt bụi (X4, %), giới hạn chảy (X5, %), giới hạn dẻo (X6, %), chỉ số dẻo (X7, %), độ sệt (X8), độ ẩm (X9, %), khối lƣợng thể tích tự nhiên (X10, g/cm 3), khối lƣợng thể tích khô (X11, g/cm 3), khối lƣợng riêng hạt (X12, g/cm 3), độ r ng (X13, %), độ bão hòa (X14, %), hệ số r ng (X15). Thông số dự báo là áp lực tiền cố kết (Y, kPa). Bộ dữ liệu này đƣợc chia ngẫu nhiên thành hai phần là tập dữ liệu học lấy 70%, dùng để tập luyện cho máy và tập dữ liệu kiểm tra sử dụng 30% còn lại nhằm đánh giá hiệu suất mô hình. Các mô hình này đƣợc xây dựng trên ngôn ngữ lập trình Python và thƣ viện h trợ Scikit-learn. Bảng 1: Dữ liệu đầu vào và đầu ra sử dụng trong nghi n cứu nà STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn 1 X1 35,4 0,5 10,76 7,129003 2 X2 36 1,5 11,31465 7,090925 ĐỊA KỸ THUẬT SỐ 3 - 2021 28 STT Thông số Giá trị lớn nhất Giá trị nhỏ nhất Trung bình Độ lệch ti u chuẩn 3 X3 69 4,5 26,96541 11,17561 4 X4 84,9 18 53,05535 13,59445 5 X5 77 21,71 51,09472 12,17120 6 X6 39,96 13,08 26,06862 5,296375 7 X7 47,15 6,11 25,02673 8,561346 8 X8 1,94 0,16 0,857799 0,280667 9 X9 70,65 22,12 46,78126 11,48550 10 X10 2,04 1,52 1,735094 0,113142 11 X11 1,67 0,91 1,194969 0,175484 12 X12 2,76 2,65 2,698176 0,022413 13 X13 66,3 37,23 55,71277 6,479979 14 X14 99,97 84,11 96,79566 2,758104 15 X15 1,967 0,593 1,303403 0,315885 16 Y 282,24 20,58 90,12923 0,549973 Phân tích phân phối 159 mẫu cho 15 thông số là các biến đầu vào (X1-X15) và biến đầu ra (Y) cho thấy, các thông số cơ lý của các mẫu đất biến thiên trong khoảng giá trị rất khác nhau (bảng 1 và hình tiêu biểu 1, 2, 3, 4). Độ lệch tiêu chuẩn lớn nhất thuộc về thông số hàm lƣợng hạt bụi (X4, độ lệch tiêu chuẩn 13,59445), nhỏ nhất là khối lƣợng riêng hạt (X12, độ lệch tiêu chuẩn 0,022413). Hình 1: Biểu đồ biến thiên giá trị của độ sâu lấy mẫu trên Hình 2: Biểu đồ biến thiên giá trị của hàm l ng h t sét Hình 3: Biểu đồ biến thiên giá trị của độ sệt Hình 4: Biểu đồ biến thiên của giá trị Pc t kết quả thí nghiệm mẫu đất 2.2. Công cụ và thuật toán sử dụng Ngôn ngữ lập trình Python và th viện mở Scikit-learn: Python là một ngôn ngữ lập trình thông dịch (interpreted), hƣớng đối tƣợng (object-oriented), và là một ngôn ngữ bậc cao (high-level) ngữ ĐỊA KỸ THUẬT SỐ 3 - 2021 29 ngh a động (dynamic semantics).. Trình thông dịch Python và thƣ viện chuẩn mở rộng có sẵn dƣới dạng mã nguồn hoặc dạng nhị phân miễn phí cho tất cả các nền tảng chính và có thể đƣợc phân phối tự do [18, 23, 25, 27, 29]. Cùng với đó, Scikit-learn là một thƣ viện tài nguyên mở dùng cho máy học, cung cấp nhiều công cụ dùng cho làm khớp mô hình (model fitting), tiền xử lý dữ liệu (data preprocessing), lựa chọn mô hình và nhiều tiện ích khác [23,25]. Thuật toán hỗ tr hồi qui V c tơ (Support Vector Regression - SVR): H trợ hồi qui Véc tơ (Support Vector Regression - SVR) dựa trên lý thuyết học thống kê lần đầu tiên đƣợc giới thiệu bởi Vapnik vào năm 1995 [13, 28, 30]. Nguyên tắc của SVR là xây dựng một mặt siêu phẳng (hyper plane) để phân loại tập dữ liệu thành các lớp riêng biệt [25]. Bằng cách sử dụng “kernal” phi tuyến SVR ánh xạ không gian đầu vào sang không gian nhiều chiều hơn [26]. Sau đó, siêu phẳng tối ƣu đƣợc xác định trong không gian đặc trƣng (feature space) bằng cách tối đa hóa biên của ranh giới các lớp (margins of class boundaries) [28]. Các điểm đƣợc huấn luyện (trained points) gần nhất với mặt siêu phẳng tối ƣu đƣợc gọi là các véc tơ h trợ (support vectors). SVR đƣợc coi là một trong những kỹ thuật lập mô hình chính xác nhất và cũng đƣợc sử dụng rộng rãi trong dự báo sụt trƣợt đất đá. Nghiên cứu này sử dụng SVR nhƣ một kỹ thuật hồi quy bằng cách đề xuất một hàm mất mát (loss function) ε- không nhạy cảm (ε-insensitive) đƣợc thể hiện trong phƣơng trình sau: Dữ liệu học đƣợc đƣa vào dạng (xi, yi), x ∈ rN, y ∈ r, trong đó x biến đầu vào, y biến đầu ra; rN = N là chiều không gian véc tơ (N - dimensional vector space); r - một chiều không gian véc tơ (r - one dimensional vector space) và ε = vùng l i nhạy cảm (error insensitive zone) (hình 5). Thuật toán SVR cho phép xác định một hàm có thể ƣớc tính các giá trị trong tƣơng lai một cách chính xác [28,30]. Thuật toán hồi quy h trợ véc tơ cho phép hồi quy hàm tuyến tính đƣợc thể hiện trong phƣơng trình sau: (2) Hình 5: Sơ đồ nguyên lý thuật toán SVR giải quyết bài toán hồi quy [26] Trong đó w ∈ rN và b ∈ r; w = véc tơ trọng số có thể hiệu chỉnh (adjustable weight vector); và b = ngƣỡng vô hƣớng (scalar threshold). Để độ dốc (slope) của hàm gần đến 0, giá trị của w phải đƣợc tối thiểu hóa. Điều này có thể đạt đƣợc bằng cách tối thiểu hóa norm ‖w‖2 = 〈w,w〉. Đây là một bài toán tối ƣu lồi (convex optimization) đƣợc thể hiện trong phƣơng trình sau: (3) Với: Mạng nơ ron nh n tạo đa lớp (Artificial N ural Network Mutilayer Perceptron - ANN MLP): Mạng nơ ron nhân tạo (ANN) là một tập hợp của các nút đƣợc liên kết với nhau nhằm giải thích và giải quyết các vấn đề có mối quan hệ phức tạp giữa các biến độc lập đầu vào và biến phụ thuộc đầu ra [25]. Mạng perceptron đa lớp (Mutilayer Perceptron - MLP) là một trong những mạng nơ ron nhân tạo, hay một trong những kỹ thuật mạng nơ ron nhân tạo hiệu quả ĐỊA KỸ THUẬT SỐ 3 - 2021 30 nhất trong mô hình và dự đoán đối tƣợng. Do đó nó đƣợc sử dụng nhƣ một mô hình chuẩn của nhiều nhà nghiên cứu [25,27]. ANN MLP có khả năng mô phỏng các quá trình phi tuyến và phức tạp của thế giới thực. Về cơ bản, có thể nói ANN MLP là một mô hình chuyển tiếp bao gồm một lớp đầu vào, một hay nhiều lớp ẩn và một lớp đầu ra nhƣ trên hình 6. Hình 6: Minh họa một mô hình ANN MLP với 2 lớp ẩn [25] Số lƣợng của các nút đầu vào phụ thuộc và các thông số đƣợc lựa chọn trong nguồn dữ liệu sử dụng để dự báo, và số lƣợng của số nơ ron ẩn đƣợc xác định dựa trên tập dữ liệu dùng cho máy học trong từng trƣờng hợp cụ thể. Số lƣợng lớp ẩn đƣợc sử dụng cho tính toán và lớp đầu ra đại diện cho mục đích của mô hình. M i nút của lớp ẩn phải kết nối với tất cả các nút của lớp đầu vào, và m i nút của lớp đầu ra phải đƣợc kết nối với toàn bộ nút trong các lớp ẩn. Thông qua các liên kết này, quá trình hoạt động của ANN MLP có thể chia ra hai bƣớc: truyền thẳng và truyền ngƣợc sử dụng thuật toán truyền ngƣợc [25]. Trong nghiên cứu này, để dự báo Pc sử dụng thuật toán ANN MLP có 2 lớp ẩn với số nút lần lƣợt trong m i lớp ẩn là 8, 10 và sử dụng hàm kích hoạt Sigmoid. Thuật toán hồi quy s n b n Ridge Regression - RR): Mô hình Ridge Regression (RR) là phƣơng pháp áp dụng khi bộ dữ liệu gặp vấn đề về đa cộng tuyến các biến độc lập x có mối liên hệ với nhau, và ảnh hƣởng lên kết quả dự báo của y, hay giải quyết các vấn đề về Overfifting (mô hình áp dụng tốt cho dữ liệu học (training) nhƣng không hoạt động tốt trên dữ liệu kiểm tra (test) mà mô hình hồi quy tuyến tính thông thƣờng gặp phải [26,28]. Hình 7: Mối qua hệ đánh đổi giữa bias và variance [27] RR là mô hình hồi quy phân tích mối quan hệ giữa các biến độc lập và biến phụ thuộc sử dụng phƣơng pháp Regularization, điều chỉnh mô hình sao cho giảm thiểu các vấn đề Overfitting, tối ƣu hay kiểm soát mức độ phức tạp của mô hình để cân đối giữa Thiên vị (Biased) và Phƣơng sai (Variance), qua đó giảm sai số của mô hình. Do vậy, trong nghiên cứu này nhóm tác giả sử dụng mô hình hồi quy sƣờn bên (Ridge Regression) vào việc dự báo áp lực tiền cố kết Pc của đất yếu khu vực nghiên cứu. 3. LỰA CHỌN THÔNG SỐ ĐẦU VÀO ĐỂ DỰ BÁO PC Tổng cộng 15 thông số đầu vào là các chỉ tiêu vật lý của 159 mẫu đất yếu xác định từ thí nghiệm trong phòng đƣợc lựa chọn (X1-X15). Tuy nhiên chỉ có một số biến đầu vào có mối quan hệ chặt chẽ với thông số cần dự báo Pc (kết quả đầu ra, hay biến đầu ra Y). Thông qua quá trình xác định mức độ tƣơng quan giữa 15 chỉ tiêu vật lý của đất với áp lực tiền cố kết bằng ĐỊA KỸ THUẬT SỐ 3 - 2021 31 thống kê toán học, cho phép loại bỏ những biến (chỉ tiêu vật lý) ít hoặc không có quan hệ chặt với kết quả đầu ra – biến đầu ra (Pc). Các làm này cho phép rút ngắn thời gian xử lý của mô hình và đồng thời hiệu suất của mô hình dự báo cũng sẽ đƣợc cải thiện. Sử dụng công cụ “cây hồi qui bổ sung” (Extra Trees Regressor) của thƣ viện Scikit- learn nhằm tạo ra biểu đồ thể hiện trực quan mức độ quan trọng của các biến độc lập X đối với biến phụ thuộc Y (Pc) trong mô hình dự báo (hình 8). Hình 8: Mức độ t ơng quan của biến độc lập (Xi đối với biến ph thuộc (Y - Pc) sử d ng công c Extra Trees Regressor Hình 8 cho thấy, kết quả máy học chỉ ra đƣợc 6 biến độc lập có mối quan hệ chặt chẽ nhất với Pc gồm: X1, X2, X8, X3, X15 và X12, tƣơng ứng là độ sâu lấy mẫu đất trên (m), độ sâu lấy mẫu đất dƣới (m), và các chỉ tiêu vật lý của đất thí nghiệm trong phòng nhƣ độ sệt, hàm lƣợng hạt sét (%), khối lƣợng riêng hạt (g/cm3) và hệ số r ng của đất. 4. THIẾT LẬP MÔ HÌNH VÀ ĐÁNH GIÁ HIỆU SUẤT MÔ HÌNH 4.1. Thiết lập mô hình Trong nghiên cứu này, nhóm nghiên cứu thực hiện 3 bƣớc cho mô hình máy học với các thuật toán trí tuệ nhân tạo lựa chọn để dự báo Pc của đất yếu khu vực nghiên cứu nhu hình 9, gồm: (1) Chuẩn bị và tiền xử lý số liệu, loại bỏ nhiễu (159 mẫu đất có các chỉ tiêu thí nghiệm trong phòng tạo ra 15 thông số đầu vào từ X1 đến X15 là các chỉ tiêu vật lý của đất và biến đầu ra phụ thuộc Y (Pc)); (2) Loại bỏ các biến độc lập có mối quan hệ không chặt với biến phụ thuộc Y (từ 15 biến X ban đầu, sau xử lý rút xuống còn 6 biến X) (hình 8); (3) Tiến hành máy học bằng các thuật toán trí tuệ nhân tạo lựa chọn nghiên cứ để dự đoán Pc, đánh giá hiệu suất các mô hình dựa vào các thông số RMSE, MAE, R và R 2 . Hình 9: Sơ đồ xây dựng mô hình máy học để dự báo Pc 4.2. Đánh giá hiệu suất mô hình Một mô hình đƣợc đánh giá tốt khi sử dụng các biến đầu vào Xi cho ra các giá trị dự báo Ypred sát với giá trị của thực tế đã xác định Ytest [27,28,30]. Để đánh giá hiệu suất của các mô hình máy học, ở đây sử dụng các thông số (1) Root Mean Square Error (RMSE), (2) Mean Absolute Error (MAE), (3) Coefficient of Determine (R 2 ) và (4) Correlation Coefficient (R). RMSE thể hiện độ lệch tiêu chuẩn các sai số của mô hình dự đoán. Nó đƣợc xác định thông qua công thức [11]: ; trong đó m là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã xác định của y, ypred là giá trị do mô hình dự đoán. MAE là giá trị trung bình của tổng các trị ĐỊA KỸ THUẬT SỐ 3 - 2021 32 tuyệt đối của sai số mà mô hình dự đoán, đƣợc xác định thông qua công thức [29,30]: ; trong đó m là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã xác định của y, ypred là giá trị do mô hình dự đoán. Hệ số xác định R2 là một thông số biến đổi từ 0 đến 1 nhằm thể hiện hiệu suất của mô hình dự đoán [28]. Nó đƣợc xác định thông qua công thức: ; trong đó m là số lƣợng mẫu kiểm tra, ytest là giá trị đúng đã xác định của y, ypred là giá trị do mô hình dự đoán, là giá trị trung bình của các mẫu kiểm tra. Hệ số tƣơng quan R đánh giá tƣơng quan giữa hai biến số trong quan hệ [30]. R đƣợc thể hiện thông qua công thức sau: ; trong đó m là số lƣợng mẫu kiểm tra, ytest là giá trị đúng của y, ypred là giá trị do mô hình dự đoán, là giá trị trung bình của các mẫu kiểm tra, là giá trị trung bình của các mẫu dự đoán. 5. KẾT QUẢ DỰ BÁO ÁP LỰC TIỀN CỐ KẾT VÀ PHÂN TÍCH Sử dụng 3 mô hình thuật toán SVR, ANN MLP và RR nhƣ đã giới thiệu trên, với bộ số liệu sau chuẩn hóa gồm 6 biến độc lập (X1, X2, X3, X8, X12, X15) có tƣơng quan chặt với Pc và tiến hành dự báo theo sơ đồ mô hình máy học đã xây dựng nhƣ trình bày trên hình 9, cho phép dự báo đƣợc Pc. Kết quả dự báo áp lực tiền cố kết Pc của đất yếu khu vực nghiên cứu đƣợc so sánh với giá trị thực tế thí nghiệm (hình 10, 11 và 12). Hình 10: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán SVR Hình 11: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán ANN MLP ĐỊA KỸ THUẬT SỐ 3 - 2021 33 Hình 12: So sánh giá trị dự đoán với giá trị thật của Pc khi sử d ng mô hình thuật toán RR Biểu đồ biến thiên kết quả dự báo Pc so với giá trị thực thí nghiệm khá tƣơng đồng về hình thái, về trị số thậm chí trùng khớp nhau (hình 10, 11, 12). Kết quả đánh giá hiệu suất các mô hình sử dụng trong nghiên cứu này thu đƣợc giá trị tốt với tất cả các mô hình thuật toán trí tuệ nhân tạo dự báo đã sử dụng, cụ thể: Khi dự báo Pc bằng mô hình SVR thì MAE=0,171, RMSE=0,231, R=0,873, R 2=0,760; với mô hình ANN MLP thì MAE=0,143, RMSE=0,186, R=0,923, R 2 =0,843; còn mô hình RR có MAE=0,193, RMSE=0,246, R=0,856, R 2 =0,728 (bảng 2). Bảng 2: So sánh hiệu suất các mô hình thuật toán AI sử dụng dự báo Pc. STT Mô hình RMSE MAE R R 2 1 SVR 0,171 0, 31 0,873 0,760 2 ANN MLP 0,143 0,186 0,923 0,843 3 RR 0,193 0,246 0,856 0,728 Bảng 2 cho thấy, kết quả đánh giá hiệu suất dự báo của các mô hình trí tuệ nhân tạo sử dụng trong nghiên cứu này RMSE, MAE, R hay R 2 đều có giá trị rất tích cực, chứng tỏ đƣợc độ tin cậy cao khi dự báo Pc thông qua một số chỉ tiêu vật lý dễ xác định khác đã có nhƣ: độ sâu lấy mẫu đất; hàm lƣợng hạt sét trong đất; độ sệt của đất; khối lƣợng riêng và hệ số r ng của đất. Phân tích hệ số xác định R2, kết quả của các mẫu kiểm tra thay đổi từ 0,728 đến 0,843. Kết quả này cho thấy rằng, độ chính xác của cả 3 mô hình thuật toán AI đã sử dụng trong dự đoán Pc của đất yếu một số khu vực đồng bằng Bắc Bộ ở mức khá tốt, và mô hình RR có độ chính xác thấp nhất trong nghiên cứu này (R2=0,728), trong khi đó mô hình ANN-MLP đạt hiệu suất cao nhất trong dự đoán Pc (R 2 =0,843). 6. KẾT LUẬN Áp lực tiền cố kết (Pc) của đất yếu là thông số đất nền không thể thiếu, đƣợc sử dụng để lựa chọn công thức khi phân tích lún cố kết nền đất yếu dƣới tác dụng tải trọng đắp. Nó thƣờng đƣợc xác định bằng đồ giải theo Casagrande từ thí nghiệm nén cố kết mẫu đất tron