Trong xã hội và trong tự nhiên nói chung hoặc trong nghiên cứu khoa học nói riêng,các nghiên cứu thống kêgiúptìm ra các mối quan hệ giữa các hiện tượng và đặc tính để có thể tiên đoán đúng các hiện tượng sẽ xảy ra khi biết được một số dấu hiệu nào đó, người ta thường gặp khó khăn với các mô hình thống kê kinh đi ển. Nhưng hiện nay, nhờ sự phát triển vượt bậc của cả công nghệ máy tính và trí tuệ con người, nên chúng ta cómột công cụ hết sức mạnh mẽ trong tay là trí tuệ nhân tạo.
79 trang |
Chia sẻ: vietpd | Lượt xem: 1832 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất n-Acylpiperidine, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC CẦN THƠ
----------
TRẦN DIỄM ÁI
KHẢO SÁT MỐI QUAN HỆ ĐỊNH LƯỢNG
GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA
CÁC DẪN XUẤT N-ACYLPIPERIDINE
LUẬN VĂN THẠC SĨ HÓA HỌC
Chuyên Ngành: Hóa lý thuyết và Hóa lý
Mã Số: 60 44 31
CẦN THƠ – 2010
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC CẦN THƠ
TRẦN DIỄM ÁI
KHẢO SÁT MỐI QUAN HỆ ĐỊNH LƯỢNG
GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA
CÁC DẪN XUẤT N-ACYLPIPERIDINE
LUẬN VĂN THẠC SĨ HÓA HỌC
Chuyên Ngành: Hóa lý thuyết và Hóa lý
Mã Số: 60 44 31
Người hướng dẫn khoa học:
PGS.TS BÙI THỌ THANH
CẦN THƠ – 2010
Lời cảm ơn
-i-
LỜI CẢM ƠN
----------
Nhờ có sự giúp đỡ và động viên của nhiều người mà tôi đã hoàn thành luận
văn thạc sĩ này trong thời gian qua. Tôi xin gởi lời cảm ơn sâu sắc đến:
PGS – TS Bùi Thọ Thanh đã dành nhiều thời gian và công sức hướng dẫn
cho tôi trong suốt thời gian nghiên cứu.
Các thầy cô và các bạn trong Phòng Thí nghiệm Hóa tin – Khoa Hóa của
Trường Đại học Khoa Học Tự Nhiên – ĐHQG TPHCM đã nhiệt tình
giúp đỡ trong quá trình thực hiện luận văn.
Các thầy cô ở Trường Đại học Cần Thơ và Viện công nghệ hóa học đã
truyền đạt những kiến thức quí báu trong thời gian học tập
Sở GD & ĐT tỉnh An Giang và Ban chủ nhiệm khoa Khoa học Trường
Đại học Cần Thơ đã tạo điều kiện thuận lợi trong suốt thời gian học tập.
Gia đình và bạn bè đã luôn giúp đỡ và động viên tôi trong khoảng thời gian
học tập và làm việc.
Cuối cùng, xin cảm ơn quí thầy cô trong Hội đồng chấm luận văn đã góp
nhiều ý kiến để tôi hoàn thiện luận văn này hơn.
Một lần nữa xin chân thành cảm ơn!
Cần Thơ, tháng 01 năm 2010
Trần Diễm Ái
Mục lục
-ii-
MỤC LỤC
----------
Trang
A – MỞ ĐẦU
LỜI MỞ ĐẦU ....................................................................................................... 1
B – TỔNG QUAN
Chương 1: TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA
CẤU TRÚC VÀ HOẠT TÍNH .......................................................... 3
1.1. HOẠT TÍNH ............................................................................................................................................................ 4
1.1.1. Hoạt tính sinh học.................................................................................................................................... 4
1.1.2. Hoạt tính hóa học ..................................................................................................................................... 4
1.2. CÁC THAM SỐ CẤU TRÚC .................................................................................................................... 5
1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR............................................. 5
Chương 2: CƠ HỌC LƯỢNG TỬ, LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ... 9
2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG
BORN-OPPENHEIMER ............................................................................................................................... 9
2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM ............................................................................... 11
2.2.1. Giới thiệu ........................................................................................................................................................ 11
2.2.2. Phương pháp PM3 ................................................................................................................................... 13
Chương 3: PHƯƠNG PHÁP XỬ LÝ SỐ LIỆU .................................................. 16
3.1. PHƯƠNG PHÁP HỒI QUI ĐA BIẾN TUYẾN TÍNH........................................................... 16
3.1.1. Tương quan và hồi qui ......................................................................................................................... 16
3.1.2. Phân tích hồi qui đa biến tuyến tính .......................................................................................... 20
3.1.2.1. Các thủ tục chọn biến .......................................................................................................... 20
3.1.2.1. Đánh giá mô hình ................................................................................................................... 21
3.2. PHƯƠNG PHÁP MẠNG NƠRON NHÂN TẠO ....................................................................... 22
3.2.1. Nơron sinh học và nơron nhân tạo.............................................................................................. 25
Mục lục
-iii-
3.2.2.1. Nơron sinh học ......................................................................................................................... 23
3.2.2.2. Nơron nhân tạo ........................................................................................................................ 24
3.2.2. Cấu trúc mạng nơron đa lớp ............................................................................................................ 25
3.2.3. Luyện mạng: Kỹ thuật lan truyền ngược ............................................................................... 26
3.2.4. Ngừng tiến trình luyện ......................................................................................................................... 27
3.2.5. Các yếu tố ảnh hưởng đến tính tổng quát hóa của mạng ........................................... 28
Chương 4: CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE ............................. 30
4.1. BỆNH DO MUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔI MUỖI.............................. 30
4.2. N-ACYLPIPERIDINE – CHẤT ĐUỔI MUỖI MỚI ................................................................ 33
C – PHƯƠNG PHÁP
Chương 5: PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN................. 37
5.1. PHẦN MỀM ............................................................................................................................................................ 37
5.1.1. Hyperchem 8.03........................................................................................................................................ 37
5.1.2. Stagraphics Centurion XV ................................................................................................................ 37
5.1.3. NeuroSolution 5.07 ................................................................................................................................ 37
5.1.4. Microsoft Excel ......................................................................................................................................... 37
5.2. CÁC BƯỚC THỰC HIỆN ............................................................................................................................ 37
5.2.1. Tính toán hóa lượng tử ........................................................................................................................ 38
5.2.2. Phân tích hồi qui đa biến tuyến tính .......................................................................................... 38
5.2.3. Tính toán mạng nơron .......................................................................................................................... 39
D – KẾT QUẢ VÀ BÀN LUẬN
Chương 6: KHẢO SÁT MỐI QUAN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH
CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE................................ 42
6.1. DỮ LIỆU ................................................................................................................................................................... 42
6.2. KẾT QUẢ VÀ BÀN LUẬN ........................................................................................................................ 44
6.2.1. Phương pháp hồi qui đa biến tuyến tính................................................................................. 44
6.2.1.1. Tính toán với hoạt tính PT 25 ....................................................................................... 45
Mục lục
-iv-
6.2.1.2. Tính toán với hoạt tính PT 2.5 ...................................................................................... 47
6.2.2. Phương pháp mạng nơron ................................................................................................................. 48
6.3. ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU TRÚC LÊN
HOẠT TÍNH ............................................................................................................................................................ 55
E – KẾT LUẬN
KẾT LUẬN ........................................................................................................... 60
TÀI LIỆU THAM KHẢO
PHỤ LỤC
-v-
DANH MỤC CÁC CHỮ VIẾT TẮT
AM1 Austin Model 1
ANN Artificial Neural Network
HF Hartree-Fock
MLR Multiple Linear Regression
MNDO Modified Neglect of Diatomic Overlap
MO Molecular Orbital
MSE Mean Square Error
PM3 Parametric Method 3
PT Protection Time
QSAR Quantitative Structure-Activity Relationships
USDA United States Department of Agricuture
US EPA United States Environmental Protection Agency
VB Valence Bond
ZDO Zero Differential Overlap
-vi-
DANH MỤC CÁC BẢNG
Trang
Bảng 1 Cấu trúc và hoạt tính của dẫn xuất N-acylpiperidine ........................................................ 42
Bảng 2 Kết quả phân tích hồi qui đa biến tuyến tính với 20 biến độc lập ........................... 44
Bảng 3 Một số mô hình tốt nhất trong 16.278 mô hình khảo sát của PT 25 ........................ 45
Bảng 4 Kết quả phân tích hồi qui cho mô hình 1.6, 1.7, 1.8 .......................................................... 46
Bảng 5 Giá trị dự đoán của tập dữ liệu kiểm tra với PT 25 ............................................................ 46
Bảng 6 Một số mô hình tốt nhất trong 16.278 mô hình khảo sát với PT 2.5..................... 47
Bảng 7 Kết quả phân tích hồi qui cho mô hình 2.3, 2.4, 2.5 .......................................................... 47
Bảng 8 Giá trị dự đoán cho tập dữ liệu kiểm tra với PT 2.5 .......................................................... 48
Bảng 9 Hệ số R2, Q2 và R2test ứng với số nơ ron trên lớp ẩn với mạng có 20 input ... 49
Bảng 10 Hệ số R2, Q2 và R2test ứng với số nơron trên lớp ẩn với mạng có 9 input ....... 50
Bảng 11 Kết quả tính và dự đoán hoạt tính theo mô hình (9 – 8 – 2) ..................................... 52
Bảng 12 Kết quả dự đoán hoạt tính cho tập dữ liệu mới .................................................................. 53
Bảng 13 Kết quả các mô hình tốt nhất của 2 phương pháp................................................................. 54
Bảng 14 Giá trị trọng số và độ nhạy của các biến độc lập............................................................... 56
-vii-
DANH MỤC CÁC HÌNH
Trang
Hình 1 Mô hình chung dùng trong khảo sát QSAR .............................................................................. 8
Hình 2 Biểu đồ các mối liên hệ thường gặp của x và y ..................................................................... 17
Hình 3 Cấu tạo một nơron sinh học .................................................................................................................. 23
Hình 4 Cấu tạo một nơron nhân tạo .................................................................................................................. 24
Hình 5 Sơ đồ cấu tạo mạng nơron nhân tạo có 3 lớp........................................................................... 25
Hình 6 Sơ đồ kỹ thuật lan truyền ngược........................................................................................................ 27
Hình 7 Thuốc xịt muỗi và muỗi thuộc nhóm Plasmodium ............................................................. 31
Hình 8 Thí nghiệm hoạt tính sinh học ............................................................................................................. 35
Hình 9 Các loại mạng trong NeuroBuilder .................................................................................................. 39
Hình 10 Các loại hàm truyền trong NeuroBuilder ................................................................................. 40
Hình 11 Đồ thị giá trị dự đoán cho bộ dữ liệu kiểm tra với PT 25 ........................................... 41
Hình 12 Đồ thị giá trị dự đoán cho bộ dữ liệu kiểm tra với PT 2.5 .......................................... 46
Hình 13 Đồ thị R2, Q2 và R2test ứng với số nơron trên lớp ẩn ở 2 nồng độ đối với mạng
có 20 input ....................................................................................................................................................... 48
Hình 14 Đồ thị R2, Q2 và R2test ứng với số nơron trên lớp ẩn ở 2 nồng độ đối với mạng
có 9 input .......................................................................................................................................................... 50
Hình 15 Đồ thị giá trị tính toán và dự đoán theo hoạt tính thực nghiệm ở 2 nồng độ với
cấu trúc mạng (9 – 8 – 2)...................................................................................................................... 51
Hình 16 Đồ thị giá trị tính toán và dự đoán theo hoạt tính thực nghiệm ở 2 nồng độ với
cấu trúc mạng (9 – 8 – 2)...................................................................................................................... 53
Hình 17 Đồ thị giá trị dự đoán và thực nghiệm tập dữ liệu kiểm tra ở hai nồng độ .... 54
Hình 18 Biểu đồ giá trị trị tuyệt đối trọng số và biểu đồ độ nhạy của hai hoạt tính .... 57
Hình 19 Đồ thị biểu diễn giá trị của 9 tham số cấu trúc và hai hoạt tính ............................. 60
-viii-
DANH MỤC CÁC PHỤ LỤC
Phụ lục 1 Cấu trúc dẫn xuất N-acylpiperidine và hoạt tính.
Phụ lục 2 Bảng số liệu các tham số cấu trúc và hoạt tính của dẫn xuất N-acylpiperidine.
Phụ lục 3 Kết quả phân tích hồi qui cho 20 biến độc lập.
Phụ lục 4 Ma trận hệ số tương quan Pearson các tham số cấu trúc và hoạt tính.
Phụ lục 5 Ma trận hệ số tương quan Speaman các tham số cấu trúc và hoạt tính.
Phụ lục 6 Biểu đồ phân tích độ nhạy của hoạt tính theo từng tham số cấu trúc.
Phụ lục 7 Dữ liệu bộ trọng số.
A. MỞ ĐẦU
Lời mở đầu
1
LỜI MỞ ĐẦU
----------
Trong xã hội và trong tự nhiên nói chung hoặc trong nghiên cứu khoa học nói
riêng, các nghiên cứu thống kê giúp tìm ra các mối quan hệ giữa các hiện tượng và đặc
tính để có thể tiên đoán đúng các hiện tượng sẽ xảy ra khi biết được một số dấu hiệu
nào đó, người ta thường gặp khó khăn với các mô hình thống kê kinh điển. Nhưng
hiện nay, nhờ sự phát triển vượt bậc của cả công nghệ máy tính và trí tuệ con người,
nên chúng ta có một công cụ hết sức mạnh mẽ trong tay là trí tuệ nhân tạo. Công cụ
này giải quyết phần lớn các khó khăn gặp phải trước đây khi thống kê, tiên đoán chính
xác các hiện tượng phức tạp với lượng thông tin ít ỏi, đặc biệt là khi ta kết hợp giữa
các công cụ khác nhau của trí tuệ nhân tạo với nhau và cả các phương pháp cổ điển
nữa. Ứng dụng của trí tuệ nhân tạo rất nhiều trong các lĩnh vực như nhận biết tiếng
nói, nhận biết chữ viết, nhận biết hình ảnh, phân tích địa chấn, phân tích điện tâm đồ,
chẩn đoán bệnh, phân tích thị trường chứng khoán, thương mại...
Còn trong hoá học, người ta cũng cần dự đoán trong rất nhiều trường hợp như
tìm hoá chất có hoạt tính mong muốn, dự đoán hướng phản ứng, xác định hướng phản
ứng của các phản ứng cạnh tranh... và còn nhiều mục đích khác nữa. Các công cụ nói
trên có nhiều ứng dụng vào các nghiên cứu, nhất là nghiên cứu mối quan hệ định
lượng giữa hoạt tính và cấu trúc. Ngoài ra cũng phải kết hợp thêm các công cụ của hoá
học khác nữa để thực hiện các nghiên cứu.
Một sự hiểu biết đúng đắn về độc tính của một hoá chất mang một ý nghĩa đóng
góp rất lớn đối với cuộc sống của nhân loại như làm giảm bệnh tật và tỉ lệ tử vong.…
Tuy nhiên để đạt được điều đó lại là một quá trình rất phức tạp và khó khăn liên quan
đến nhiều kỹ thuật khoa học để có được nhiều loại thông tin cần thiết. Đặc biệt, với sự
phát triển công nghệ máy tính ngày càng cao và càng rẻ việc nghiên cứu thuốc bằng
phương pháp mô phỏng phân tử kết hợp với các phương pháp thống kê ngày càng
được quan tâm và phát triển.
Trong luận văn này đã dùng phương pháp tính toán Hoá lượng tử kết hợp với
phương pháp thống kê kinh điển và mạng nơron nhân tạo để nghiên cứu khảo sát mối
quan hệ định lượng giữa hoạt tính và cấu trúc của các chất dẫn xuất N-acylpiperidine.
Lời mở đầu
2
Tên đề tài:
"KHẢO SÁT MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT
TÍNH CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE".
Mục đích đề tài:
Sử dụng chương trình Hóa lượng tử thích hợp để tính toán tham số cấu trúc
của các chất dẫn xuất N-acylpiperidine. Các số liệu này kết hợp với dữ liệu về thời
gian đuổi muỗi của các hợp chất N-acylpiperidine tạo thành bộ dữ liệu cấu trúc – hoạt
tính sử dụng cho việc nghiên cứu QSAR.
Dùng phương pháp tính toán thống kê kinh điển (phương pháp hồi qui đa
biến tuyến tính) và phương pháp sinh – tin hiện đại (mạng nơron nhân tạo) để tìm mô
hình QSAR có tính tổng quát hóa cao.
Từ các kết quả nhận được trong luận văn và các kết quả nghiên cứu QSAR
tương tự, rút ra nhận xét về phương pháp luận nghiên cứu QSAR.
Đề tài gồm những phần chính sau:
A. Lời mở đầu
B. Tổng quan
C. Phương pháp
D. Kết quả và bàn luận
E. Kết luận
B. TỔNG QUAN
Chương 1
3
Chương 1
TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG
GIỮA CẤU TRÚC VÀ HOẠT TÍNH
----------
Mối quan hệ định lượng giữa cấu trúc và hoạt tính của các hoá chất được viết
tắt là QSAR (Quantitative Structure – Activity Relationships). QSAR thường được
nghiên cứu trên một họ hợp chất, giống nhau ở khung cơ bản nhưng khác nhau ở các
nhóm thế trên khung chính và được căn cứ vào giả định rằng có mối tương quan cơ sở
giữa cấu trúc phân tử và hoạt tính sinh học. Trong giả định này, QSAR cố gắng thiết
lập mối tương quan giữa những tính chất riêng của cấu trúc phân tử với hoạt tính thực
nghiệm của nó 5.
Có hai mục đích chính cho sự phát triển QSAR:
Xây dựng mô hình QSAR để dự đoán hoạt tính của những phân tử chưa từng
được kiểm tra.
Mô hình QSAR có vai trò như một công cụ cung cấp thông tin bằng việc
chọn ra một bộ tham số mô tả liên quan đến hoạt tính được đo để có thể đánh giá được
các yếu tố ảnh hưởng đến hoạt tính đã biết. Điều này có thể giúp thiết kế ra phân tử
mới vừa có hoạt tính theo mong muốn hơn vừa giảm được thời gian, chi phí, tiền của.
Dạng phương trình toán học phổ biến của QSAR là:
A (Activity) = f (tính chất hóa lý hoặc cấu trúc riêng của phân tử)
Đối với một mô hình QSAR có giá trị và đáng tin cậy thì hoạt tính của chúng
phải được vạch ra bởi các cơ chế chung. Chất lượng của mô hình QSAR hoàn toàn phụ
thuộc vào chất lượng của bộ dữ liệu sử dụng để xây dựng mô hình, vì vậy việc chọn ra
bộ dữ liệu các tham số cấu trúc có liên quan đến hoạt tính thực nghiệm là quan trọng.
Một vài loại hoạt tính và các tham số cấu trúc thường được nghiên cứu trong
QSAR được giới thiệu dưới đây.
Chương 1
4
1.1 HOẠT TÍNH 3, 11, 31
Hoạt tính được nghiên cứu trong QSAR có thể là hoạt tính hoá học hay hoạt
tính sinh học được quan sát từ thực nghiệm dưới các hình thức khác nhau.
1.1.1 Hoạt tính sinh học
MIC (Minimum Inhibitory Concentration): nồng độ ức chế tối thiểu, hay
nồng độ kiềm khuẩn tối thiểu (dùng trong vi sinh).
MBC (Minimum Bactericidal Concentration): nồng độ diệt khuẩn tối thiểu.
IC50 (Inhibitory Concentration): nồng độ ức chế 50% đối tượng thử, hay còn
gọi là hằng số Michaelis – Menten.
EC50 (Effective Concentration): nồng độ 50% tác dụng tối đa.
ED50 (Effective Dose): liều tác dụng tối đa trên 50% đối tượng thử.
SD50 (Supression Dose): liều tiêu diệt 50% đối tượng thử.
LD50 (Lethal Dose): liều gây chết 50% thú thử.
TI (Therapeutic Index) = LD50/ED50: chỉ số trị liệu (TI càng lớn độ an toàn
sử dụng càng cao)…
Các hoạt tính s