Giới thiệu: Sốt rét là bệnh dịch nguy hiểm ở các nước đang phát triển và nhu cầu cấp thiết hiện nay là tìm
ra những thuốc mới có hiệu quả trên cả dòng Plasmodium falciparum đề kháng, giá cả phải chăng.
Mục tiêu: Xây dựng các mô hình QSAR để dự đoán hoạt tính kháng sốt rét của một số dẫn chất mới trên
các chủng P. falciparum khác nhau.
Phương pháp: Nghiên cứu này tiến hành thu thập dữ liệu gần 1700 chất thuộc các nhóm cấu trúc khác
nhau từ nhiều bài báo và ứng dụng thuật toán bình phương tối thiểu từng phần để xây dựng 5 mô hình hồi qui
tuyến tính dự đoán hoạt tính kháng sốt rét trên máy tính. Các mô hình này được xây dựng từ các nhóm chất có
hoạt tính kháng sốt rét thử nghiệm trên 5 dòng tế bào đề kháng chloroquin (K1, FcB1, NF54, Dd2, W2) với
phương pháp thử nghiệm là đo độ hấp thu phóng xạ, đo quang và đếm huỳnh quang.
Kết quả: Kết quả 5 mô hình (K1-1, FcB1-1, NF54-1, Dd2-1, W2-1) có giá trị R2 của cả tập xây dựng, đánh
giá chéo và tập ngoại đều trong khoảng 0,57 – 0,86, RMSE trong khoảng từ 0,28 – 0,94, cho thấy khả năng dự
đoán đúng trên 50% và sai số giữa giá trị dự đoán và giá trị thực nghiệm là chấp nhận được. Các mô hình này
được ứng dụng dự đoán hoạt tính kháng sốt rét của 11 dẫn chất nhóm chalcon, từ đó rút ra mối quan hệ cấu trúc
– tác dụng của nhóm dẫn chất này.
Kết luận: Mô hình QSAR/PLS cho thấy khả năng ứng dụng tốt trong dự đoán hoạt tính kháng sốt rét của
một số dẫn chất chalcon. Kết quả này được sử dụng trong định hướng thiết kế và tổng hợp các phân tử mới có
hoạt tính kháng sốt rét mạnh hơn.
Bạn đang xem nội dung tài liệu Mô hình In Silico dự đoán hoạt tính kháng sốt rét, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Nghiên cứu Y học
Chuyên Đề Dược Khoa
395
MÔ HÌNH IN SILICO DỰ ĐOÁN HOẠT TÍNH KHÁNG SỐT RÉT
Thái Khắc Minh*, Võ Vân Anh*, Nguyễn Đắc Chí*
TÓM TẮT
Giới thiệu: Sốt rét là bệnh dịch nguy hiểm ở các nước đang phát triển và nhu cầu cấp thiết hiện nay là tìm
ra những thuốc mới có hiệu quả trên cả dòng Plasmodium falciparum đề kháng, giá cả phải chăng.
Mục tiêu: Xây dựng các mô hình QSAR để dự đoán hoạt tính kháng sốt rét của một số dẫn chất mới trên
các chủng P. falciparum khác nhau.
Phương pháp: Nghiên cứu này tiến hành thu thập dữ liệu gần 1700 chất thuộc các nhóm cấu trúc khác
nhau từ nhiều bài báo và ứng dụng thuật toán bình phương tối thiểu từng phần để xây dựng 5 mô hình hồi qui
tuyến tính dự đoán hoạt tính kháng sốt rét trên máy tính. Các mô hình này được xây dựng từ các nhóm chất có
hoạt tính kháng sốt rét thử nghiệm trên 5 dòng tế bào đề kháng chloroquin (K1, FcB1, NF54, Dd2, W2) với
phương pháp thử nghiệm là đo độ hấp thu phóng xạ, đo quang và đếm huỳnh quang.
Kết quả: Kết quả 5 mô hình (K1-1, FcB1-1, NF54-1, Dd2-1, W2-1) có giá trị R2 của cả tập xây dựng, đánh
giá chéo và tập ngoại đều trong khoảng 0,57 – 0,86, RMSE trong khoảng từ 0,28 – 0,94, cho thấy khả năng dự
đoán đúng trên 50% và sai số giữa giá trị dự đoán và giá trị thực nghiệm là chấp nhận được. Các mô hình này
được ứng dụng dự đoán hoạt tính kháng sốt rét của 11 dẫn chất nhóm chalcon, từ đó rút ra mối quan hệ cấu trúc
– tác dụng của nhóm dẫn chất này.
Kết luận: Mô hình QSAR/PLS cho thấy khả năng ứng dụng tốt trong dự đoán hoạt tính kháng sốt rét của
một số dẫn chất chalcon. Kết quả này được sử dụng trong định hướng thiết kế và tổng hợp các phân tử mới có
hoạt tính kháng sốt rét mạnh hơn.
Từ khóa: Dược tin học, QSAR, PLS, Plasmodium falciparum, bệnh sốt rét.
ABSTRACT
IN SILICO MODEL FOR PREDICTION OF ANTIMALARIAL ACTIVITY
Thai Khac-Minh, Vo Van Anh, Nguyen Dac Chi
* Y Hoc TP. Ho Chi Minh * Vol. 15 - Supplement of No 1 - 2011: 395 - 405
Background: Malaria is a dangerous infectious desease in developing countries and that finding the new
affordable drug with effection on resistant Plasmodium falciparum is essential.
Objective: The aim of this study is the development of a relevant computational model to predict
antimalarial activity of chalcone derivatives. This model could be applied to screen and design new antimalarial
drugs.
Method: In this study, nearly 1700 compounds were collected with variable structures from several papers
and applicating partial least squares algorithm to build 5 linear regression models to predict antimalarial in silico.
These were performed from structure groups with antimalarial defined on 5 Plasmodium falciparum strains,
including chloroquin resistant (K1, FcB1, NF54, Dd2, W2) by 3 bio-assay methods, including (H3-
Hypoxanthin)-uptake assay, parasite lactate dehydrogenase activity measuring and flow cytometry.
Results: Resulting in 5 models (K1-1, FcB1-1, NF54-1, Dd2-1, W2-1) with R2 of training set, LOO and
external set in the range of 0.57 – 0.86, RMSE in the range of 0.28 – 0.94, indicated that the ability of prediction
Bộ môn Hóa Dược – Khoa Dược – Đại học Y Dược TP. Hồ Chí Minh
Tác giả liên hệ: TS. Thái Khắc Minh ĐT: 0909. 680. 385 Email: thaikhacminh@gmail.com
Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011
Chuyên Đề Dược Khoa 396
over 50% and the bias between predicted antimalarial and experiment antimarial approved. These models were
applied to predict antimalarial of 11 chalcon derivatives and finding out their structure-activity relationship.
Conclusion: The PLS models could be applied to predict antimalarial activity of new chalcone compounds.
These models may be used as an in silico tool to design and develop the new potent antimalarial novels.
Keywords: Pharmacoinformatics, QSAR, PLS, Plasmodium falciparum, Malaria.
ĐẶT VẤN ĐỀ
Sốt rét là một trong số những bệnh dịch
nguy hiểm ở các nước đang phát triển, đặc biệt
là ở châu Phi và đối tượng nhạy cảm nhất là trẻ
em dưới 5 tuổi. Bệnh sốt rét là nguyên nhân và
cũng là hậu quả của nghèo đói. Hiện nay, những
thuốc trị sốt rét rẻ tiền giảm hiệu quả điều trị do
tình trạng đề kháng. Vấn đề đặt ra là cần tìm ra
thuốc mới có hiệu quả điều trị trên dòng đề
kháng và giá cả phải chăng(1). Dược tin học góp
phần giúp việc khám phá thuốc mới rút ngắn
thời gian và giảm chi phí. Nghiên cứu này sử
dụng thuật toán bình phương tối thiểu từng
phần xây dựng 5 mô hình cung cấp thông tin về
mối liên hệ cấu trúc – tác dụng của nhiều nhóm
cấu trúc thu thập được gần 1700 chất từ các bài
báo khoa học trên các dòng tế bào P. falciparum
nhạy cảm là NF54, D10, 3D7, và đề kháng là K1,
FcB1, Dd2, W2 với 3 phương pháp thử hoạt tính
kháng sốt rét chính là đo độ hấp thu phóng xạ,
đo quang và đếm huỳnh quang. Những mô
hình này có thể ứng dụng trong sàng lọc số
lượng lớn các chất sẵn có trong ngân hàng dữ
liệu, định hướng thiết kế và tổng hợp nhằm tìm
ra những hoạt chất phát triển thành thuốc trị sốt
rét như mong đợi.
PHƯƠNG PHÁP NGHIÊN CỨU
Quy trình thực hiện nghiên cứu QSAR
Mô hình hồi qui tuyến tính dự đoán hoạt
tính kháng sốt rét được xây dựng theo các bước
như Hình 1.
Hình 1. Các bước xây dựng mô hình dự đoán hoạt
tính kháng sốt rét
Đánh giá khả năng dự đoán ngoại
Tập ngoại (External set)
R2, RMSE
Ứng dụng mô hình trong dự đoán
Xây dựng mô hình 2D-QSAR hồi quy tuyến tính
Tập xây dựng mô hình (Training set)
Bình phương tối thiểu từng phần (PLS – MOE 2008.10)
Đánh giá chéo nội (Bỏ-một-ra – MOE 2008.10): XR2, XRMSE
Loại các chất gây nhiễu (outlier)
Tập xây dựng mô hình (Training set)
Dựa vào Z-score (Plot – MOE 2008.10)
Chia tỉ lệ các thông số mô tả
Tập xây dựng mô hình (Training set)
Chia tỉ lệ trong khoảng 0-1 (RapidMiner 5)
Chọn lọc thông số mô tả
Tập xây dựng mô hình (Training set)
Phân tích ngẫu nhiên (QSAR-Contingency – MOE 2008.10). Tổ
chức tìm kiếm lấy thêm và chiến thuật phản hồi (Weka 3.7.0)
Chuẩn bị cơ sở dữ liệu
Cấu trúc hóa học 2D (ChemBioDraw Ultra 11.0)
Hoạt tính sinh học (pIC50)
Phân chia tập hợp
Tập xây dựng mô hình (Training set) – Tập đánh giá ngoại (External set)
Ngẫu nhiên (random), phân phối đa dạng (diverse)
Chọn lọc thô các thông số mô tả
Tập xây dựng mô hình (Training set)
Loại bỏ các thông số có > 15% giá trị 0 (Excell)
Loại bỏ các thông số có tương quan chéo ≥ 90% (RapidMiner 5)
Tối thiểu hóa năng lượng
Tính toán giá trị thông số mô tả 2D
(MOE 2008.10)
Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Nghiên cứu Y học
Chuyên Đề Dược Khoa
397
Chuẩn bị cơ sở dữ liệu
Từ nhiều bài báo khoa học sàng lọc gần 1700
hợp chất có hoạt tính kháng sốt rét thuộc nhiều
nhóm cấu trúc khác nhau, lựa chọn và sắp xếp
lại theo tiêu chí: (i) cùng cách đánh giá hoạt tính
kháng sốt rét (IC50), (ii) cùng đơn vị đo hoạt tính
(nM), (iii) cùng phương pháp xác định hoạt tính,
(iv) có giá trị chất đối chiếu tương đương. Các
chất thuộc nhiều hơn 3 bài báo để tạo sự đa
dạng, số lượng chất cho mỗi tập hợp không quá
ít (≥ 50). Nghiên cứu này xây dựng 10 mô hình
dự đoán hoạt tính kháng sốt rét trên cơ sở 10 tập
hợp dữ liệu gồm những cấu trúc có tài liệu tham
khảo kèm theo như Bảng 1.
Dựa vào chất đối chiếu có thể quy đổi giá trị
hoạt tính kháng sốt rét của các chất theo quy tắc
tam suất nếu chênh lệch giữa các giá trị hoạt tính
của chất đối chiếu (như chloroquin) trong các bài
báo khác nhau từ năm lần trở lên. IC50 được đổi
thành pIC50 = log10(IC50) được sử dụng trong
nghiên cứu.
Tính thông số mô tả
Thông số mô tả thể hiện cấu trúc hóa học
hay tính chất vật lý của một phân tử bằng các
giá trị số, có ảnh hưởng tới tác dụng sinh học.
Cấu trúc 2D của các hợp chất được xây dựng
bằng phần mềm ChemBioDraw Ultra 11.0 2008,
tối thiểu hóa năng lượng và tính 184 thông số 2D
thuộc 7 nhóm bằng phần mềm MOE 2008.10
(Molecular Operating Environment phiên bản
2008.10).
Phân chia tập hợp
Để xây dựng mô hình 2D-QSAR và đánh giá
mô hình xây dựng, tập dữ liệu ban đầu được
phân chia thành: tập xây dựng mô hình (80%) và
tập ngoại (20%) theo kiểu phân chia ngẫu nhiên
(random) hoặc phân chia đa dạng (diverse) bằng
phần mềm MOE 2008.10.
Lọc thô thông số mô tả
Để loại các thông số không có ý nghĩa hoặc
khiến mô hình tốt giả tạo, các thông số mô tả của
tập xây dựng mô hình được loại thô:
- Loại bỏ thông số có >15% chất chứa giá trị 0
bằng phần mềm Excell 2007.
- Loại bỏ thông số có giá trị của tất cả các
chất giống nhau bằng phần mềm Rapid Miner 5.
- Loại bỏ một trong hai thông số có tương
quan chéo với nhau ≥ 90% bằng phần mềm
RapidMiner 5.
Chia tỉ lệ thông số mô tả
Để loại bỏ trọng số chỉ liên quan đến các đơn
vị được dùng để biểu thị một biến riêng biệt, các
thông số trong nghiên cứu này được chia tỉ lệ
trong khoảng 0-1 bằng công thức bình thường
hóa (nomalization)(10)
Bảng 1. Dữ liệu để xây dựng các mô hình dự đoán hoạt tính kháng sốt rét
Stt Mô hình Tài liệu tham khảo Dòng tế bào P. f Phương pháp xác định IC50 Số hợp chất
1 K1-1 (13-24) K1 đề kháng Phóng xạ(5) 261
2 FcB1-1 (14,25-35) FcB1 đề kháng Phóng xạ 170
3 NF54-1 (21,36-41) NF54 đề kháng Phóng xạ 95
4 Dd2-1 (42-45) Dd2 đề kháng Phóng xạ 55
5 W2-1 (46-49) W2 đề kháng Phóng xạ 50
6 W2-2 (13,50-54) W2 đề kháng Đo quang(7) 114
7 W2-3 (55-58) W2 đề kháng Đếm huỳnh quang 52
8 D10-1 (22,59-60) D10 nhạy cảm Phóng xạ 52
9 D10-2 (13,50,52,53,61,62) D10 nhạy cảm Đo quang 119
10 3D7-1 (13,23,63) 3D7 nhạy cảm Đo quang 122
: giá trị mới của thông số j của chất thứ i; : giá trị hiện tại; : giá trị lớn nhất và nhỏ nhất của
khoảng giá trị hiện tại.
Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011
Chuyên Đề Dược Khoa 398
Chia tỉ lệ được tiến hành bằng phần mềm
Excel 2007.
Lựa chọn thông số mô tả phân tử
Chọn thông số mô tả bằng công cụ QSAR –
Contingency trong phần mềm MOE và công cụ
select attributes trong phần mềm WEKA 3.7.0.
Xây dựng mô hình dự đoán hoạt tính kháng
sốt rét bằng thuật toán bình phương tối thiểu
từng phần
Sử dụng công cụ QSAR – Model trong phần
mềm MOE để xây dựng mô hình trên những
thông số mô tả đã chọn. Lựa chọn lại thông số
mô tả bằng cách loại dần theo hệ số tương
quan với pIC50 và đánh giá bằng đánh giá chéo
bỏ-một-ra. Dùng giá trị Z-score để loại chất gây
nhiễu. Xây dựng lại mô hình với những tập đã
loại nhiễu.
Đánh giá mô hình dự đoán
Để thẩm định khả năng dự đoán, các mô
hình cần được đánh giá nội (đánh giá chéo bỏ-
một-ra) và đánh giá trên tập ngoại. Các thông số
đánh giá chéo gồm: (i) giá trị trung bình bình
phương hệ số tương quan của các mô hình thứ
cấp Q2, (ii) RMSE tiến hành đồng thời với xây
dựng mô hình bằng MOE; các thông số đánh giá
trên tập ngoại gồm: (iii) bình phương hệ số
tương quan R2, (iv) RMSE bằng công cụ model
evaluate của MOE.
KẾT QUẢ VÀ BÀN LUẬN
Xây dựng và đánh giá mô hình
Với mỗi mô hình, tập dữ liệu bao gồm công
thức hóa học hai chiều, pIC50, các thông số mô tả
được lưu trữ dưới dạng *.mdb trong chương
trình MOE. Mỗi tập dữ liệu được chia thành hai
tập hợp: xây dựng mô hình và đánh giá ngoại
theo tỉ lệ 4:1. Với mỗi mô hình, tập xây dựng tiến
hành như trình bày trong PPNC. Lượng thông
số mô tả chọn ra tối đa bằng 1/5 số lượng chất
trong tập hợp. Kết quả số lượng chất trong các
tập hợp và số lượng thông số mô tả cho mỗi mô
hình được tóm tắt trong Bảng 4.
Bảng 2. Số chất trong các tập hợp và cách thức phân
chia ứng với mỗi mô hình
stt Mô hìnhSố hợp
chất
Kiểu phân
phối
Tập
xây
dựng
Tập
ngoại
Số
thông
số
1 K1-1 261 Ngẫu nhiên 210 51 8
2 FcB1-1 170 Ngẫu nhiên 136 34 7
3 NF54-1 95 Ngẫu nhiên 76 19 5
4 Dd2-1 55 Ngẫu nhiên 44 11 5
5 W2-1 50 Đa dạng 40 10 5
Phương trình hồi qui thể hiện mối liên
quan định lượng giữa cấu trúc (thông số mô
tả) và tác dụng kháng sốt rét, có dạng:
y=a0+aixi. Trong đó a0 là hệ số chặn của phương
trình, nếu tất cả các thông số mô tả xi=0 thì
hoạt tính y=a0; ai là hệ số hồi qui của từng
thông số xi, thể hiện tỉ lệ và chiều hướng thay
đổi hoạt tính sinh học khi giá trị thông số thay
đổi. Cụ thể, nếu ai dương thì cấu trúc có thông
số mô tả xi sẽ cho hoạt tính tăng và ngược lại.
Phương trình hồi quy của các mô hình được
trình bày dưới dạng bảng (các Bảng 6, 8, 10, 12,
14, 16, 18, 20, 21, 22) bao gồm các thông tin
trên và hệ số tương quan chéo của từng cặp
thông số mô tả, tất cả đều nhỏ hơn 0.90 (90%).
Khả năng dự đoán của các mô hình được thể
hiện: (i) căn bậc hai sai số chuẩn (RMSE), (ii)
bình phương hệ số hồi qui (R2), (iii) giá trị p của
tập xây dựng. Để đánh giá lại khả năng dự đoán
dùng các thông số như trình bày trong phần
PPNC. Các giá trị trên được thể hiện trong các
Bảng 5, 7, 9, 11, 13, 15, 17, 19, 21, 23 tương ứng
cho mỗi mô hình. Đường thẳng tương quan
pIC50 dự đoán – pIC50 thực nghiệm của tập xây
dựng (góc trên trái) và tập ngoại (góc dưới phải)
được thể hiện trong các Hình 6, 8, 10, 12, 14, 16,
18, 20, 22, 24. Hai đường thẳng song song ở hai
bên đường hồi quy thể hiện 95% dự đoán đúng
được R2 (%) tùy từng mô hình.
Mô hình K1-1: dự đoán hoạt tính kháng sốt
rét trên P.f dòng K1 đề kháng CQ với phương
pháp thử hoạt tính đo độ hấp thu phóng xạ.
Mô hình K1-1 được xây dựng trên tập xây
dựng gồm 210 chất thuộc nhiều nhóm cấu trúc
(PPNC). Tập xây dựng có giá trị p <0,0001 chứng
Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Nghiên cứu Y học
Chuyên Đề Dược Khoa
399
tỏ giá trị dự đoán và thực nghiệm khác nhau
không có ý nghĩa với giả thuyết phủ định ban
đầu là “khác nhau có ý nghĩa”. RMSE thể hiện
sai số trung bình giữa pIC50 thực nghiệm và dự
đoán là 0,54, tương đương IC50 là ~3 nM, sai số
này nhỏ. Mức độ tương quan giữa giá trị dự
đoán và thực nghiệm là 82%, tương đối tốt. Các
giá trị cho kết quả tương tự khi đánh giá chéo.
Hình 1. Đường thẳng tương quan pIC50 dự đoán và
thực nghiệm của tập xây dựng và tập ngoại mô hình
K1-1
Mô hình được đánh giá ngoại trên tập ngoại
gồm 51 chất được lấy ra theo phân phối ngẫu
nhiên, đảm bảo tính khách quan khi ứng dụng
mô hình. Giá trị dự đoán của các chất phần lớn
nằm trong khoảng 95% dự đoán đúng 82% của
mô hình. Sai số dự đoán và mức độ tương quan
là chấp nhận được khi mà tập ngoại chỉ bằng
25% tập xây dựng.
Như vậy, mô hình K1-1 có khả năng dự
đoán tốt các chất có thông số mô tả nằm trong
khoảng giá trị của tập xây dựng.
Bảng 3. Các thông số đánh giá của mô hình K1-1
Tập xây dựng Đánh giá chéo Tập ngoại
RMSE 0,54 0,57 0,73
R2/Q2 0,82 0,80 0,71
Giá trị p <0,0001
Bảng4. Bảng thông số mô tả xây dựng phương trình
hồi qui của mô hình K1-1 (I)
Stt Tên Ý nghĩa ai
1 BCUT_PE
OE_0
Chỉ số liên kết ma trận liền
kề với điện tích nhỏ nhất
+0.9090
5
2 Rings Số vòng +0.8817
8
3 PEOE_VS
A+1
Diện tích bề mặt VDW có
điện tích (0.05,0.10)
-1.19092
4 LogS Log của độ tan trong nước
có giá trị (-1, 1)
-1.55543
5 a_acc Số nguyên tử nhận liên
kết H, cả liên kết cho nhận
OH), trừ acid
-1.11685
6 vsa_acc Bề mặt VDW có nguyên
tử nhận H, trừ acid và
nguyên tử cho nhận (OH)
-2.11256
7 SlogP_VSA
4
Diện tích có logP(o/w)
nằm trong (0.1,0.15).
+2.4813
6
8 logP(o/w) Log của hệ số phân bố
octanol/nước
-4.97468
H: liên kết hydro. VDW: liên kết Van der Waals.
logP(o/w): log của hệ số phân bố octanol/ nước
Mô hình FcB1-1: trên P.f dòng FcB1 đề
kháng CQ với phương pháp thử hoạt tính đo độ
hấp thu phóng xạ.
Hình 2. Đường thẳng tương quan pIC50 dự đoán và
thực nghiệm của tập xây dựng và tập ngoại mô hình
FcB1-1
Bảng 4 cho thấy sai số giữa giá trị dự đoán
và thực nghiệm của tập xây dựng, đánh giá
Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011
Chuyên Đề Dược Khoa 400
ngoại và đánh giá nội cho giá trị nhỏ. Bình
phương hệ số tương quan đều trên 0,70, có khả
năng dự đoán tốt.
Bảng 5. Các thông số đánh giá của mô hình FcB1-1
Tập xây dựng Đánh giá chéo Tập ngoại
RMSE 0,56 0,59 0,66
R2/Q2 0,75 0,72 0,76
Giá trị p <0,0001
Bảng 6. Bảng thông số mô tả xây dựng phương trình
hồi qui của mô hình FcB1-1 (II)
Stt Tên Ý nghĩa ai
1 Diameter Khoảng cách giữa
hai nguyên tử xa nhất
-1.27200
2 BCUT_PEOE_0 Chỉ số liên kết ma
trận liền kề với điệ n
tích nhỏ nhất
+2.13552
3 GCUT_SLOGP_2 Chỉ số liên kết ma
trận liền kề khoảng
cách với hệ số phân
bố o/w ở mức 2/3
-2.17195
4 a_ICM Chứa thông tin
nguyên tử
-3.06610
5 Rings Số vòng -2.22365
6 Q_VSA_FNEG Tỉ lệ diện tích bề mặt
VDW mang điện tích
âm
+3.96696
7 Q_VSA_POL Tổng diện tích bề mặt
VDW có trị tuyệt đối
điện tích > 0,2
+4.35695
Hệ số chặn của
phương trình (II)
1.77705
VDW: liên kết Van der Waals
Mô hình NF54-1: trên P.f đề kháng CQ với
phương pháp thử hoạt tính đo độ hấp thu
phóng xạ
Bảng 7. Các thông số đánh giá của mô hình NF54-1
Tập
xây dựng
Đánh giá
chéo
Tập ngoại
RMSE 0,50 0,55 0,94
R2/Q2 0,87 0,85 0,62
Giá trị p <0,0001
Bảng 8. Bảng thông số mô tả xây dựng phương trình
hồi qui của mô hình NF54-1 (III)
Stt Tên Ý nghĩa ai
1 b_1rotR Tỉ lệ liên kết đơn quay
được
-3.86875
2 Rings Số vòng -3.63093
3 PEOE_VSA_HY
D
Tổng diện tích bề mặt
VDW kỵ nước, có trị
tuyệt đối điện tích ≤0,2
+6.29295
Stt Tên Ý nghĩa ai
4 SlogP_VSA9 Tổng diện tích bề mặt
VDW có logP(o/w) >0,4
+2.87314
5 SMR_VSA1 Tổng diện tích bề mặt
VDW có độ khúc xạ
trong vùng (0.11,0.26)
-2.83267
Hệ số chặn của phương
trình (III)
4.71914
VDW: liên kết Van der Waals. logP(o/w): log của hệ số
phân bố octanol/ nước.
Hình 3. Đường thẳng tương quan pIC50 dự đoán và
thực nghiệm của tập xây dựng và tập ngoại mô hình
NF54-1
Mô hình NF54-1 có sai số giữa giá trị dự
đoán và thực tế của tập xây dựng và đánh giá
chéo nhỏ nhưng của tập ngoại tương đối cao
(Bảng 6). Tuy nhiên, giá trị này vẫn chấp nhận
được. Tương tự, bình phương hệ số hồi qui của
tập xây dựng và đánh giá chéo trên 0,8, chứng tỏ
khả năng dự đoán cao. Tập ngoại có R2 thấp hơn
0,62 nhưng vẫn chấp nhận được. Trên đồ thị,
cho thấy phần lớn các giá trị của tập ngoại nằm
trong vùng 95% dự đoán đúng 62% (R2=0,62)
của mô hình.
Mô hình Dd2-1: trên P.f dòng Dd2 đề kháng
CQ với phương pháp thử hoạt tính đo độ hấp
thu phóng xạ
Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011 Nghiên cứu Y học
Chuyên Đề Dược Khoa
401
Bảng 9. Các thông số đánh giá của mô hình Dd2-1
Tập
xây dựng
Đánh giá
chéo
Tập ngoại
RMSE 0.57 0,69 0,53
R2/Q2 0.72 0,60 0,60
Giá trị p <0,0001
Như trình bày ở Bảng 8 và Hình 5, mô hình
Dd2-1 cho thấy có khả năng dự đoán tốt với
bình phương hệ số hồi qui là 0,75. Các thông số
đánh giá chéo và đánh giá ngoại chấp nhận.
Hình 4. Đường thẳng tương quan pIC50 dự đoán và
thực nghiệm của tập xây dựng và tập ngoại mô hình
Dd2-1
Bảng 10. Bảng thông số mô tả xây dựng phương
trình hồi qui của mô hình Dd2-1 (IV)
Stt Tên Ý nghĩa ai
1 a_nN Số nguyên tử N -3.32901
2 PEOE_
VSA-5
Tổng diện tích bề mặt VDW có
điện tích trong vùng (-0.30,-0.25)
-3.23264
3 PEOE_
VSA-6
Tổng diện tích bề mặt VDW có
điện tích trong nhỏ hơn -0.30
-4.97440
4 SlogP_
VSA2
Tổng diện tích bề mặt VDW có
logP(o/w) trong vùng (-0.2,0)
-2.48145
5 SMR_V
SA6
Tổng diện tích bề mặt VDW có
đọ khúc xạ trong vùng
(0.485,0.56)
+2.63627
Hệ số chặn của phương trình
(IV)
8.36605
VDW: liên kết Van der Waals. logP(o/w): log của hệ số
phân bố octanol/ nước.
Mô hình W2-1: trên P.f dòng W2 đề kháng
CQ với phương pháp thử hoạt tính đo độ hấp
thu phóng xạ
Bảng 11. Các thông số đánh giá của mô hình W2-1
Tập xây dựng Đánh giá chéo Tập ngoại
RMSE 0,62 0,70 0,84
R2/Q2 0,79 0,72 0,74
Giá trị