Mô hình In Silico dự đoán hoạt tính kháng sốt rét

Giới thiệu: Sốt rét là bệnh dịch nguy hiểm ở các nước đang phát triển và nhu cầu cấp thiết hiện nay là tìm ra những thuốc mới có hiệu quả trên cả dòng Plasmodium falciparum đề kháng, giá cả phải chăng. Mục tiêu: Xây dựng các mô hình QSAR để dự đoán hoạt tính kháng sốt rét của một số dẫn chất mới trên các chủng P. falciparum khác nhau. Phương pháp: Nghiên cứu này tiến hành thu thập dữ liệu gần 1700 chất thuộc các nhóm cấu trúc khác nhau từ nhiều bài báo và ứng dụng thuật toán bình phương tối thiểu từng phần để xây dựng 5 mô hình hồi qui tuyến tính dự đoán hoạt tính kháng sốt rét trên máy tính. Các mô hình này được xây dựng từ các nhóm chất có hoạt tính kháng sốt rét thử nghiệm trên 5 dòng tế bào đề kháng chloroquin (K1, FcB1, NF54, Dd2, W2) với phương pháp thử nghiệm là đo độ hấp thu phóng xạ, đo quang và đếm huỳnh quang. Kết quả: Kết quả 5 mô hình (K1-1, FcB1-1, NF54-1, Dd2-1, W2-1) có giá trị R2 của cả tập xây dựng, đánh giá chéo và tập ngoại đều trong khoảng 0,57 – 0,86, RMSE trong khoảng từ 0,28 – 0,94, cho thấy khả năng dự đoán đúng trên 50% và sai số giữa giá trị dự đoán và giá trị thực nghiệm là chấp nhận được. Các mô hình này được ứng dụng dự đoán hoạt tính kháng sốt rét của 11 dẫn chất nhóm chalcon, từ đó rút ra mối quan hệ cấu trúc – tác dụng của nhóm dẫn chất này. Kết luận: Mô hình QSAR/PLS cho thấy khả năng ứng dụng tốt trong dự đoán hoạt tính kháng sốt rét của một số dẫn chất chalcon. Kết quả này được sử dụng trong định hướng thiết kế và tổng hợp các phân tử mới có hoạt tính kháng sốt rét mạnh hơn.

pdf11 trang | Chia sẻ: thuyduongbt11 | Ngày: 14/06/2022 | Lượt xem: 229 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Mô hình In Silico dự đoán hoạt tính kháng sốt rét, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Nghiên cứu Y học Chuyên Đề Dược Khoa 395 MÔ HÌNH IN SILICO DỰ ĐOÁN HOẠT TÍNH KHÁNG SỐT RÉT Thái Khắc Minh*, Võ Vân Anh*, Nguyễn Đắc Chí* TÓM TẮT Giới thiệu: Sốt rét là bệnh dịch nguy hiểm ở các nước đang phát triển và nhu cầu cấp thiết hiện nay là tìm ra những thuốc mới có hiệu quả trên cả dòng Plasmodium falciparum đề kháng, giá cả phải chăng. Mục tiêu: Xây dựng các mô hình QSAR để dự đoán hoạt tính kháng sốt rét của một số dẫn chất mới trên các chủng P. falciparum khác nhau. Phương pháp: Nghiên cứu này tiến hành thu thập dữ liệu gần 1700 chất thuộc các nhóm cấu trúc khác nhau từ nhiều bài báo và ứng dụng thuật toán bình phương tối thiểu từng phần để xây dựng 5 mô hình hồi qui tuyến tính dự đoán hoạt tính kháng sốt rét trên máy tính. Các mô hình này được xây dựng từ các nhóm chất có hoạt tính kháng sốt rét thử nghiệm trên 5 dòng tế bào đề kháng chloroquin (K1, FcB1, NF54, Dd2, W2) với phương pháp thử nghiệm là đo độ hấp thu phóng xạ, đo quang và đếm huỳnh quang. Kết quả: Kết quả 5 mô hình (K1-1, FcB1-1, NF54-1, Dd2-1, W2-1) có giá trị R2 của cả tập xây dựng, đánh giá chéo và tập ngoại đều trong khoảng 0,57 – 0,86, RMSE trong khoảng từ 0,28 – 0,94, cho thấy khả năng dự đoán đúng trên 50% và sai số giữa giá trị dự đoán và giá trị thực nghiệm là chấp nhận được. Các mô hình này được ứng dụng dự đoán hoạt tính kháng sốt rét của 11 dẫn chất nhóm chalcon, từ đó rút ra mối quan hệ cấu trúc – tác dụng của nhóm dẫn chất này. Kết luận: Mô hình QSAR/PLS cho thấy khả năng ứng dụng tốt trong dự đoán hoạt tính kháng sốt rét của một số dẫn chất chalcon. Kết quả này được sử dụng trong định hướng thiết kế và tổng hợp các phân tử mới có hoạt tính kháng sốt rét mạnh hơn. Từ khóa: Dược tin học, QSAR, PLS, Plasmodium falciparum, bệnh sốt rét. ABSTRACT IN SILICO MODEL FOR PREDICTION OF ANTIMALARIAL ACTIVITY Thai Khac-Minh, Vo Van Anh, Nguyen Dac Chi * Y Hoc TP. Ho Chi Minh * Vol. 15 - Supplement of No 1 - 2011: 395 - 405 Background: Malaria is a dangerous infectious desease in developing countries and that finding the new affordable drug with effection on resistant Plasmodium falciparum is essential. Objective: The aim of this study is the development of a relevant computational model to predict antimalarial activity of chalcone derivatives. This model could be applied to screen and design new antimalarial drugs. Method: In this study, nearly 1700 compounds were collected with variable structures from several papers and applicating partial least squares algorithm to build 5 linear regression models to predict antimalarial in silico. These were performed from structure groups with antimalarial defined on 5 Plasmodium falciparum strains, including chloroquin resistant (K1, FcB1, NF54, Dd2, W2) by 3 bio-assay methods, including (H3- Hypoxanthin)-uptake assay, parasite lactate dehydrogenase activity measuring and flow cytometry. Results: Resulting in 5 models (K1-1, FcB1-1, NF54-1, Dd2-1, W2-1) with R2 of training set, LOO and external set in the range of 0.57 – 0.86, RMSE in the range of 0.28 – 0.94, indicated that the ability of prediction Bộ môn Hóa Dược – Khoa Dược – Đại học Y Dược TP. Hồ Chí Minh Tác giả liên hệ: TS. Thái Khắc Minh ĐT: 0909. 680. 385 Email: thaikhacminh@gmail.com Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Chuyên Đề Dược Khoa 396 over 50% and the bias between predicted antimalarial and experiment antimarial approved. These models were applied to predict antimalarial of 11 chalcon derivatives and finding out their structure-activity relationship. Conclusion: The PLS models could be applied to predict antimalarial activity of new chalcone compounds. These models may be used as an in silico tool to design and develop the new potent antimalarial novels. Keywords: Pharmacoinformatics, QSAR, PLS, Plasmodium falciparum, Malaria. ĐẶT VẤN ĐỀ Sốt rét là một trong số những bệnh dịch nguy hiểm ở các nước đang phát triển, đặc biệt là ở châu Phi và đối tượng nhạy cảm nhất là trẻ em dưới 5 tuổi. Bệnh sốt rét là nguyên nhân và cũng là hậu quả của nghèo đói. Hiện nay, những thuốc trị sốt rét rẻ tiền giảm hiệu quả điều trị do tình trạng đề kháng. Vấn đề đặt ra là cần tìm ra thuốc mới có hiệu quả điều trị trên dòng đề kháng và giá cả phải chăng(1). Dược tin học góp phần giúp việc khám phá thuốc mới rút ngắn thời gian và giảm chi phí. Nghiên cứu này sử dụng thuật toán bình phương tối thiểu từng phần xây dựng 5 mô hình cung cấp thông tin về mối liên hệ cấu trúc – tác dụng của nhiều nhóm cấu trúc thu thập được gần 1700 chất từ các bài báo khoa học trên các dòng tế bào P. falciparum nhạy cảm là NF54, D10, 3D7, và đề kháng là K1, FcB1, Dd2, W2 với 3 phương pháp thử hoạt tính kháng sốt rét chính là đo độ hấp thu phóng xạ, đo quang và đếm huỳnh quang. Những mô hình này có thể ứng dụng trong sàng lọc số lượng lớn các chất sẵn có trong ngân hàng dữ liệu, định hướng thiết kế và tổng hợp nhằm tìm ra những hoạt chất phát triển thành thuốc trị sốt rét như mong đợi. PHƯƠNG PHÁP NGHIÊN CỨU Quy trình thực hiện nghiên cứu QSAR Mô hình hồi qui tuyến tính dự đoán hoạt tính kháng sốt rét được xây dựng theo các bước như Hình 1. Hình 1. Các bước xây dựng mô hình dự đoán hoạt tính kháng sốt rét Đánh giá khả năng dự đoán ngoại Tập ngoại (External set) R2, RMSE Ứng dụng mô hình trong dự đoán Xây dựng mô hình 2D-QSAR hồi quy tuyến tính Tập xây dựng mô hình (Training set) Bình phương tối thiểu từng phần (PLS – MOE 2008.10) Đánh giá chéo nội (Bỏ-một-ra – MOE 2008.10): XR2, XRMSE Loại các chất gây nhiễu (outlier) Tập xây dựng mô hình (Training set) Dựa vào Z-score (Plot – MOE 2008.10) Chia tỉ lệ các thông số mô tả Tập xây dựng mô hình (Training set) Chia tỉ lệ trong khoảng 0-1 (RapidMiner 5) Chọn lọc thông số mô tả Tập xây dựng mô hình (Training set) Phân tích ngẫu nhiên (QSAR-Contingency – MOE 2008.10). Tổ chức tìm kiếm lấy thêm và chiến thuật phản hồi (Weka 3.7.0) Chuẩn bị cơ sở dữ liệu Cấu trúc hóa học 2D (ChemBioDraw Ultra 11.0) Hoạt tính sinh học (pIC50) Phân chia tập hợp Tập xây dựng mô hình (Training set) – Tập đánh giá ngoại (External set) Ngẫu nhiên (random), phân phối đa dạng (diverse) Chọn lọc thô các thông số mô tả Tập xây dựng mô hình (Training set) Loại bỏ các thông số có > 15% giá trị 0 (Excell) Loại bỏ các thông số có tương quan chéo ≥ 90% (RapidMiner 5) Tối thiểu hóa năng lượng Tính toán giá trị thông số mô tả 2D (MOE 2008.10) Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Nghiên cứu Y học Chuyên Đề Dược Khoa 397 Chuẩn bị cơ sở dữ liệu Từ nhiều bài báo khoa học sàng lọc gần 1700 hợp chất có hoạt tính kháng sốt rét thuộc nhiều nhóm cấu trúc khác nhau, lựa chọn và sắp xếp lại theo tiêu chí: (i) cùng cách đánh giá hoạt tính kháng sốt rét (IC50), (ii) cùng đơn vị đo hoạt tính (nM), (iii) cùng phương pháp xác định hoạt tính, (iv) có giá trị chất đối chiếu tương đương. Các chất thuộc nhiều hơn 3 bài báo để tạo sự đa dạng, số lượng chất cho mỗi tập hợp không quá ít (≥ 50). Nghiên cứu này xây dựng 10 mô hình dự đoán hoạt tính kháng sốt rét trên cơ sở 10 tập hợp dữ liệu gồm những cấu trúc có tài liệu tham khảo kèm theo như Bảng 1. Dựa vào chất đối chiếu có thể quy đổi giá trị hoạt tính kháng sốt rét của các chất theo quy tắc tam suất nếu chênh lệch giữa các giá trị hoạt tính của chất đối chiếu (như chloroquin) trong các bài báo khác nhau từ năm lần trở lên. IC50 được đổi thành pIC50 = log10(IC50) được sử dụng trong nghiên cứu. Tính thông số mô tả Thông số mô tả thể hiện cấu trúc hóa học hay tính chất vật lý của một phân tử bằng các giá trị số, có ảnh hưởng tới tác dụng sinh học. Cấu trúc 2D của các hợp chất được xây dựng bằng phần mềm ChemBioDraw Ultra 11.0 2008, tối thiểu hóa năng lượng và tính 184 thông số 2D thuộc 7 nhóm bằng phần mềm MOE 2008.10 (Molecular Operating Environment phiên bản 2008.10). Phân chia tập hợp Để xây dựng mô hình 2D-QSAR và đánh giá mô hình xây dựng, tập dữ liệu ban đầu được phân chia thành: tập xây dựng mô hình (80%) và tập ngoại (20%) theo kiểu phân chia ngẫu nhiên (random) hoặc phân chia đa dạng (diverse) bằng phần mềm MOE 2008.10. Lọc thô thông số mô tả Để loại các thông số không có ý nghĩa hoặc khiến mô hình tốt giả tạo, các thông số mô tả của tập xây dựng mô hình được loại thô: - Loại bỏ thông số có >15% chất chứa giá trị 0 bằng phần mềm Excell 2007. - Loại bỏ thông số có giá trị của tất cả các chất giống nhau bằng phần mềm Rapid Miner 5. - Loại bỏ một trong hai thông số có tương quan chéo với nhau ≥ 90% bằng phần mềm RapidMiner 5. Chia tỉ lệ thông số mô tả Để loại bỏ trọng số chỉ liên quan đến các đơn vị được dùng để biểu thị một biến riêng biệt, các thông số trong nghiên cứu này được chia tỉ lệ trong khoảng 0-1 bằng công thức bình thường hóa (nomalization)(10) Bảng 1. Dữ liệu để xây dựng các mô hình dự đoán hoạt tính kháng sốt rét Stt Mô hình Tài liệu tham khảo Dòng tế bào P. f Phương pháp xác định IC50 Số hợp chất 1 K1-1 (13-24) K1 đề kháng Phóng xạ(5) 261 2 FcB1-1 (14,25-35) FcB1 đề kháng Phóng xạ 170 3 NF54-1 (21,36-41) NF54 đề kháng Phóng xạ 95 4 Dd2-1 (42-45) Dd2 đề kháng Phóng xạ 55 5 W2-1 (46-49) W2 đề kháng Phóng xạ 50 6 W2-2 (13,50-54) W2 đề kháng Đo quang(7) 114 7 W2-3 (55-58) W2 đề kháng Đếm huỳnh quang 52 8 D10-1 (22,59-60) D10 nhạy cảm Phóng xạ 52 9 D10-2 (13,50,52,53,61,62) D10 nhạy cảm Đo quang 119 10 3D7-1 (13,23,63) 3D7 nhạy cảm Đo quang 122 : giá trị mới của thông số j của chất thứ i; : giá trị hiện tại; : giá trị lớn nhất và nhỏ nhất của khoảng giá trị hiện tại. Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Chuyên Đề Dược Khoa 398 Chia tỉ lệ được tiến hành bằng phần mềm Excel 2007. Lựa chọn thông số mô tả phân tử Chọn thông số mô tả bằng công cụ QSAR – Contingency trong phần mềm MOE và công cụ select attributes trong phần mềm WEKA 3.7.0. Xây dựng mô hình dự đoán hoạt tính kháng sốt rét bằng thuật toán bình phương tối thiểu từng phần Sử dụng công cụ QSAR – Model trong phần mềm MOE để xây dựng mô hình trên những thông số mô tả đã chọn. Lựa chọn lại thông số mô tả bằng cách loại dần theo hệ số tương quan với pIC50 và đánh giá bằng đánh giá chéo bỏ-một-ra. Dùng giá trị Z-score để loại chất gây nhiễu. Xây dựng lại mô hình với những tập đã loại nhiễu. Đánh giá mô hình dự đoán Để thẩm định khả năng dự đoán, các mô hình cần được đánh giá nội (đánh giá chéo bỏ- một-ra) và đánh giá trên tập ngoại. Các thông số đánh giá chéo gồm: (i) giá trị trung bình bình phương hệ số tương quan của các mô hình thứ cấp Q2, (ii) RMSE tiến hành đồng thời với xây dựng mô hình bằng MOE; các thông số đánh giá trên tập ngoại gồm: (iii) bình phương hệ số tương quan R2, (iv) RMSE bằng công cụ model evaluate của MOE. KẾT QUẢ VÀ BÀN LUẬN Xây dựng và đánh giá mô hình Với mỗi mô hình, tập dữ liệu bao gồm công thức hóa học hai chiều, pIC50, các thông số mô tả được lưu trữ dưới dạng *.mdb trong chương trình MOE. Mỗi tập dữ liệu được chia thành hai tập hợp: xây dựng mô hình và đánh giá ngoại theo tỉ lệ 4:1. Với mỗi mô hình, tập xây dựng tiến hành như trình bày trong PPNC. Lượng thông số mô tả chọn ra tối đa bằng 1/5 số lượng chất trong tập hợp. Kết quả số lượng chất trong các tập hợp và số lượng thông số mô tả cho mỗi mô hình được tóm tắt trong Bảng 4. Bảng 2. Số chất trong các tập hợp và cách thức phân chia ứng với mỗi mô hình stt Mô hìnhSố hợp chất Kiểu phân phối Tập xây dựng Tập ngoại Số thông số 1 K1-1 261 Ngẫu nhiên 210 51 8 2 FcB1-1 170 Ngẫu nhiên 136 34 7 3 NF54-1 95 Ngẫu nhiên 76 19 5 4 Dd2-1 55 Ngẫu nhiên 44 11 5 5 W2-1 50 Đa dạng 40 10 5 Phương trình hồi qui thể hiện mối liên quan định lượng giữa cấu trúc (thông số mô tả) và tác dụng kháng sốt rét, có dạng: y=a0+aixi. Trong đó a0 là hệ số chặn của phương trình, nếu tất cả các thông số mô tả xi=0 thì hoạt tính y=a0; ai là hệ số hồi qui của từng thông số xi, thể hiện tỉ lệ và chiều hướng thay đổi hoạt tính sinh học khi giá trị thông số thay đổi. Cụ thể, nếu ai dương thì cấu trúc có thông số mô tả xi sẽ cho hoạt tính tăng và ngược lại. Phương trình hồi quy của các mô hình được trình bày dưới dạng bảng (các Bảng 6, 8, 10, 12, 14, 16, 18, 20, 21, 22) bao gồm các thông tin trên và hệ số tương quan chéo của từng cặp thông số mô tả, tất cả đều nhỏ hơn 0.90 (90%). Khả năng dự đoán của các mô hình được thể hiện: (i) căn bậc hai sai số chuẩn (RMSE), (ii) bình phương hệ số hồi qui (R2), (iii) giá trị p của tập xây dựng. Để đánh giá lại khả năng dự đoán dùng các thông số như trình bày trong phần PPNC. Các giá trị trên được thể hiện trong các Bảng 5, 7, 9, 11, 13, 15, 17, 19, 21, 23 tương ứng cho mỗi mô hình. Đường thẳng tương quan pIC50 dự đoán – pIC50 thực nghiệm của tập xây dựng (góc trên trái) và tập ngoại (góc dưới phải) được thể hiện trong các Hình 6, 8, 10, 12, 14, 16, 18, 20, 22, 24. Hai đường thẳng song song ở hai bên đường hồi quy thể hiện 95% dự đoán đúng được R2 (%) tùy từng mô hình. Mô hình K1-1: dự đoán hoạt tính kháng sốt rét trên P.f dòng K1 đề kháng CQ với phương pháp thử hoạt tính đo độ hấp thu phóng xạ. Mô hình K1-1 được xây dựng trên tập xây dựng gồm 210 chất thuộc nhiều nhóm cấu trúc (PPNC). Tập xây dựng có giá trị p <0,0001 chứng Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Nghiên cứu Y học Chuyên Đề Dược Khoa 399 tỏ giá trị dự đoán và thực nghiệm khác nhau không có ý nghĩa với giả thuyết phủ định ban đầu là “khác nhau có ý nghĩa”. RMSE thể hiện sai số trung bình giữa pIC50 thực nghiệm và dự đoán là 0,54, tương đương IC50 là ~3 nM, sai số này nhỏ. Mức độ tương quan giữa giá trị dự đoán và thực nghiệm là 82%, tương đối tốt. Các giá trị cho kết quả tương tự khi đánh giá chéo. Hình 1. Đường thẳng tương quan pIC50 dự đoán và thực nghiệm của tập xây dựng và tập ngoại mô hình K1-1 Mô hình được đánh giá ngoại trên tập ngoại gồm 51 chất được lấy ra theo phân phối ngẫu nhiên, đảm bảo tính khách quan khi ứng dụng mô hình. Giá trị dự đoán của các chất phần lớn nằm trong khoảng 95% dự đoán đúng 82% của mô hình. Sai số dự đoán và mức độ tương quan là chấp nhận được khi mà tập ngoại chỉ bằng 25% tập xây dựng. Như vậy, mô hình K1-1 có khả năng dự đoán tốt các chất có thông số mô tả nằm trong khoảng giá trị của tập xây dựng. Bảng 3. Các thông số đánh giá của mô hình K1-1 Tập xây dựng Đánh giá chéo Tập ngoại RMSE 0,54 0,57 0,73 R2/Q2 0,82 0,80 0,71 Giá trị p <0,0001 Bảng4. Bảng thông số mô tả xây dựng phương trình hồi qui của mô hình K1-1 (I) Stt Tên Ý nghĩa ai 1 BCUT_PE OE_0 Chỉ số liên kết ma trận liền kề với điện tích nhỏ nhất +0.9090 5 2 Rings Số vòng +0.8817 8 3 PEOE_VS A+1 Diện tích bề mặt VDW có điện tích (0.05,0.10) -1.19092 4 LogS Log của độ tan trong nước có giá trị (-1, 1) -1.55543 5 a_acc Số nguyên tử nhận liên kết H, cả liên kết cho nhận OH), trừ acid -1.11685 6 vsa_acc Bề mặt VDW có nguyên tử nhận H, trừ acid và nguyên tử cho nhận (OH) -2.11256 7 SlogP_VSA 4 Diện tích có logP(o/w) nằm trong (0.1,0.15). +2.4813 6 8 logP(o/w) Log của hệ số phân bố octanol/nước -4.97468 H: liên kết hydro. VDW: liên kết Van der Waals. logP(o/w): log của hệ số phân bố octanol/ nước Mô hình FcB1-1: trên P.f dòng FcB1 đề kháng CQ với phương pháp thử hoạt tính đo độ hấp thu phóng xạ. Hình 2. Đường thẳng tương quan pIC50 dự đoán và thực nghiệm của tập xây dựng và tập ngoại mô hình FcB1-1 Bảng 4 cho thấy sai số giữa giá trị dự đoán và thực nghiệm của tập xây dựng, đánh giá Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Chuyên Đề Dược Khoa 400 ngoại và đánh giá nội cho giá trị nhỏ. Bình phương hệ số tương quan đều trên 0,70, có khả năng dự đoán tốt. Bảng 5. Các thông số đánh giá của mô hình FcB1-1 Tập xây dựng Đánh giá chéo Tập ngoại RMSE 0,56 0,59 0,66 R2/Q2 0,75 0,72 0,76 Giá trị p <0,0001 Bảng 6. Bảng thông số mô tả xây dựng phương trình hồi qui của mô hình FcB1-1 (II) Stt Tên Ý nghĩa ai 1 Diameter Khoảng cách giữa hai nguyên tử xa nhất -1.27200 2 BCUT_PEOE_0 Chỉ số liên kết ma trận liền kề với điệ n tích nhỏ nhất +2.13552 3 GCUT_SLOGP_2 Chỉ số liên kết ma trận liền kề khoảng cách với hệ số phân bố o/w ở mức 2/3 -2.17195 4 a_ICM Chứa thông tin nguyên tử -3.06610 5 Rings Số vòng -2.22365 6 Q_VSA_FNEG Tỉ lệ diện tích bề mặt VDW mang điện tích âm +3.96696 7 Q_VSA_POL Tổng diện tích bề mặt VDW có trị tuyệt đối điện tích > 0,2 +4.35695 Hệ số chặn của phương trình (II) 1.77705 VDW: liên kết Van der Waals Mô hình NF54-1: trên P.f đề kháng CQ với phương pháp thử hoạt tính đo độ hấp thu phóng xạ Bảng 7. Các thông số đánh giá của mô hình NF54-1 Tập xây dựng Đánh giá chéo Tập ngoại RMSE 0,50 0,55 0,94 R2/Q2 0,87 0,85 0,62 Giá trị p <0,0001 Bảng 8. Bảng thông số mô tả xây dựng phương trình hồi qui của mô hình NF54-1 (III) Stt Tên Ý nghĩa ai 1 b_1rotR Tỉ lệ liên kết đơn quay được -3.86875 2 Rings Số vòng -3.63093 3 PEOE_VSA_HY D Tổng diện tích bề mặt VDW kỵ nước, có trị tuyệt đối điện tích ≤0,2 +6.29295 Stt Tên Ý nghĩa ai 4 SlogP_VSA9 Tổng diện tích bề mặt VDW có logP(o/w) >0,4 +2.87314 5 SMR_VSA1 Tổng diện tích bề mặt VDW có độ khúc xạ trong vùng (0.11,0.26) -2.83267 Hệ số chặn của phương trình (III) 4.71914 VDW: liên kết Van der Waals. logP(o/w): log của hệ số phân bố octanol/ nước. Hình 3. Đường thẳng tương quan pIC50 dự đoán và thực nghiệm của tập xây dựng và tập ngoại mô hình NF54-1 Mô hình NF54-1 có sai số giữa giá trị dự đoán và thực tế của tập xây dựng và đánh giá chéo nhỏ nhưng của tập ngoại tương đối cao (Bảng 6). Tuy nhiên, giá trị này vẫn chấp nhận được. Tương tự, bình phương hệ số hồi qui của tập xây dựng và đánh giá chéo trên 0,8, chứng tỏ khả năng dự đoán cao. Tập ngoại có R2 thấp hơn 0,62 nhưng vẫn chấp nhận được. Trên đồ thị, cho thấy phần lớn các giá trị của tập ngoại nằm trong vùng 95% dự đoán đúng 62% (R2=0,62) của mô hình. Mô hình Dd2-1: trên P.f dòng Dd2 đề kháng CQ với phương pháp thử hoạt tính đo độ hấp thu phóng xạ Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Nghiên cứu Y học Chuyên Đề Dược Khoa 401 Bảng 9. Các thông số đánh giá của mô hình Dd2-1 Tập xây dựng Đánh giá chéo Tập ngoại RMSE 0.57 0,69 0,53 R2/Q2 0.72 0,60 0,60 Giá trị p <0,0001 Như trình bày ở Bảng 8 và Hình 5, mô hình Dd2-1 cho thấy có khả năng dự đoán tốt với bình phương hệ số hồi qui là 0,75. Các thông số đánh giá chéo và đánh giá ngoại chấp nhận. Hình 4. Đường thẳng tương quan pIC50 dự đoán và thực nghiệm của tập xây dựng và tập ngoại mô hình Dd2-1 Bảng 10. Bảng thông số mô tả xây dựng phương trình hồi qui của mô hình Dd2-1 (IV) Stt Tên Ý nghĩa ai 1 a_nN Số nguyên tử N -3.32901 2 PEOE_ VSA-5 Tổng diện tích bề mặt VDW có điện tích trong vùng (-0.30,-0.25) -3.23264 3 PEOE_ VSA-6 Tổng diện tích bề mặt VDW có điện tích trong nhỏ hơn -0.30 -4.97440 4 SlogP_ VSA2 Tổng diện tích bề mặt VDW có logP(o/w) trong vùng (-0.2,0) -2.48145 5 SMR_V SA6 Tổng diện tích bề mặt VDW có đọ khúc xạ trong vùng (0.485,0.56) +2.63627 Hệ số chặn của phương trình (IV) 8.36605 VDW: liên kết Van der Waals. logP(o/w): log của hệ số phân bố octanol/ nước. Mô hình W2-1: trên P.f dòng W2 đề kháng CQ với phương pháp thử hoạt tính đo độ hấp thu phóng xạ Bảng 11. Các thông số đánh giá của mô hình W2-1 Tập xây dựng Đánh giá chéo Tập ngoại RMSE 0,62 0,70 0,84 R2/Q2 0,79 0,72 0,74 Giá trị
Tài liệu liên quan