Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất n-Acylpiperidine

Trong xã hội và trong tự nhiên nói chung hoặc trong nghiên cứu khoa học nói riêng,các nghiên cứu thống kêgiúptìm ra các mối quan hệ giữa các hiện tượng và đặc tính để có thể tiên đoán đúng các hiện tượng sẽ xảy ra khi biết được một số dấu hiệu nào đó, người ta thường gặp khó khăn với các mô hình thống kê kinh đi ển. Nhưng hiện nay, nhờ sự phát triển vượt bậc của cả công nghệ máy tính và trí tuệ con người, nên chúng ta cómột công cụ hết sức mạnh mẽ trong tay là trí tuệ nhân tạo.

pdf79 trang | Chia sẻ: vietpd | Lượt xem: 1750 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu Luận văn Khảo sát mối quan hệ định lượng giữa cấu trúc và hoạt tính của các dẫn xuất n-Acylpiperidine, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ ---------- TRẦN DIỄM ÁI KHẢO SÁT MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE LUẬN VĂN THẠC SĨ HÓA HỌC Chuyên Ngành: Hóa lý thuyết và Hóa lý Mã Số: 60 44 31 CẦN THƠ – 2010 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ TRẦN DIỄM ÁI KHẢO SÁT MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE LUẬN VĂN THẠC SĨ HÓA HỌC Chuyên Ngành: Hóa lý thuyết và Hóa lý Mã Số: 60 44 31 Người hướng dẫn khoa học: PGS.TS BÙI THỌ THANH CẦN THƠ – 2010 Lời cảm ơn -i- LỜI CẢM ƠN ---------- Nhờ có sự giúp đỡ và động viên của nhiều người mà tôi đã hoàn thành luận văn thạc sĩ này trong thời gian qua. Tôi xin gởi lời cảm ơn sâu sắc đến:  PGS – TS Bùi Thọ Thanh đã dành nhiều thời gian và công sức hướng dẫn cho tôi trong suốt thời gian nghiên cứu.  Các thầy cô và các bạn trong Phòng Thí nghiệm Hóa tin – Khoa Hóa của Trường Đại học Khoa Học Tự Nhiên – ĐHQG TPHCM đã nhiệt tình giúp đỡ trong quá trình thực hiện luận văn.  Các thầy cô ở Trường Đại học Cần Thơ và Viện công nghệ hóa học đã truyền đạt những kiến thức quí báu trong thời gian học tập  Sở GD & ĐT tỉnh An Giang và Ban chủ nhiệm khoa Khoa học Trường Đại học Cần Thơ đã tạo điều kiện thuận lợi trong suốt thời gian học tập.  Gia đình và bạn bè đã luôn giúp đỡ và động viên tôi trong khoảng thời gian học tập và làm việc.  Cuối cùng, xin cảm ơn quí thầy cô trong Hội đồng chấm luận văn đã góp nhiều ý kiến để tôi hoàn thiện luận văn này hơn. Một lần nữa xin chân thành cảm ơn! Cần Thơ, tháng 01 năm 2010 Trần Diễm Ái Mục lục -ii- MỤC LỤC ---------- Trang A – MỞ ĐẦU LỜI MỞ ĐẦU ....................................................................................................... 1 B – TỔNG QUAN Chương 1: TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT TÍNH .......................................................... 3 1.1. HOẠT TÍNH ............................................................................................................................................................ 4 1.1.1. Hoạt tính sinh học.................................................................................................................................... 4 1.1.2. Hoạt tính hóa học ..................................................................................................................................... 4 1.2. CÁC THAM SỐ CẤU TRÚC .................................................................................................................... 5 1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR............................................. 5 Chương 2: CƠ HỌC LƯỢNG TỬ, LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ... 9 2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG BORN-OPPENHEIMER ............................................................................................................................... 9 2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM ............................................................................... 11 2.2.1. Giới thiệu ........................................................................................................................................................ 11 2.2.2. Phương pháp PM3 ................................................................................................................................... 13 Chương 3: PHƯƠNG PHÁP XỬ LÝ SỐ LIỆU .................................................. 16 3.1. PHƯƠNG PHÁP HỒI QUI ĐA BIẾN TUYẾN TÍNH........................................................... 16 3.1.1. Tương quan và hồi qui ......................................................................................................................... 16 3.1.2. Phân tích hồi qui đa biến tuyến tính .......................................................................................... 20 3.1.2.1. Các thủ tục chọn biến .......................................................................................................... 20 3.1.2.1. Đánh giá mô hình ................................................................................................................... 21 3.2. PHƯƠNG PHÁP MẠNG NƠRON NHÂN TẠO ....................................................................... 22 3.2.1. Nơron sinh học và nơron nhân tạo.............................................................................................. 25 Mục lục -iii- 3.2.2.1. Nơron sinh học ......................................................................................................................... 23 3.2.2.2. Nơron nhân tạo ........................................................................................................................ 24 3.2.2. Cấu trúc mạng nơron đa lớp ............................................................................................................ 25 3.2.3. Luyện mạng: Kỹ thuật lan truyền ngược ............................................................................... 26 3.2.4. Ngừng tiến trình luyện ......................................................................................................................... 27 3.2.5. Các yếu tố ảnh hưởng đến tính tổng quát hóa của mạng ........................................... 28 Chương 4: CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE ............................. 30 4.1. BỆNH DO MUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỔI MUỖI.............................. 30 4.2. N-ACYLPIPERIDINE – CHẤT ĐUỔI MUỖI MỚI ................................................................ 33 C – PHƯƠNG PHÁP Chương 5: PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN................. 37 5.1. PHẦN MỀM ............................................................................................................................................................ 37 5.1.1. Hyperchem 8.03........................................................................................................................................ 37 5.1.2. Stagraphics Centurion XV ................................................................................................................ 37 5.1.3. NeuroSolution 5.07 ................................................................................................................................ 37 5.1.4. Microsoft Excel ......................................................................................................................................... 37 5.2. CÁC BƯỚC THỰC HIỆN ............................................................................................................................ 37 5.2.1. Tính toán hóa lượng tử ........................................................................................................................ 38 5.2.2. Phân tích hồi qui đa biến tuyến tính .......................................................................................... 38 5.2.3. Tính toán mạng nơron .......................................................................................................................... 39 D – KẾT QUẢ VÀ BÀN LUẬN Chương 6: KHẢO SÁT MỐI QUAN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE................................ 42 6.1. DỮ LIỆU ................................................................................................................................................................... 42 6.2. KẾT QUẢ VÀ BÀN LUẬN ........................................................................................................................ 44 6.2.1. Phương pháp hồi qui đa biến tuyến tính................................................................................. 44 6.2.1.1. Tính toán với hoạt tính PT 25 ....................................................................................... 45 Mục lục -iv- 6.2.1.2. Tính toán với hoạt tính PT 2.5 ...................................................................................... 47 6.2.2. Phương pháp mạng nơron ................................................................................................................. 48 6.3. ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU TRÚC LÊN HOẠT TÍNH ............................................................................................................................................................ 55 E – KẾT LUẬN KẾT LUẬN ........................................................................................................... 60 TÀI LIỆU THAM KHẢO PHỤ LỤC  -v- DANH MỤC CÁC CHỮ VIẾT TẮT AM1 Austin Model 1 ANN Artificial Neural Network HF Hartree-Fock MLR Multiple Linear Regression MNDO Modified Neglect of Diatomic Overlap MO Molecular Orbital MSE Mean Square Error PM3 Parametric Method 3 PT Protection Time QSAR Quantitative Structure-Activity Relationships USDA United States Department of Agricuture US EPA United States Environmental Protection Agency VB Valence Bond ZDO Zero Differential Overlap -vi- DANH MỤC CÁC BẢNG Trang Bảng 1 Cấu trúc và hoạt tính của dẫn xuất N-acylpiperidine ........................................................ 42 Bảng 2 Kết quả phân tích hồi qui đa biến tuyến tính với 20 biến độc lập ........................... 44 Bảng 3 Một số mô hình tốt nhất trong 16.278 mô hình khảo sát của PT 25 ........................ 45 Bảng 4 Kết quả phân tích hồi qui cho mô hình 1.6, 1.7, 1.8 .......................................................... 46 Bảng 5 Giá trị dự đoán của tập dữ liệu kiểm tra với PT 25 ............................................................ 46 Bảng 6 Một số mô hình tốt nhất trong 16.278 mô hình khảo sát với PT 2.5..................... 47 Bảng 7 Kết quả phân tích hồi qui cho mô hình 2.3, 2.4, 2.5 .......................................................... 47 Bảng 8 Giá trị dự đoán cho tập dữ liệu kiểm tra với PT 2.5 .......................................................... 48 Bảng 9 Hệ số R2, Q2 và R2test ứng với số nơ ron trên lớp ẩn với mạng có 20 input ... 49 Bảng 10 Hệ số R2, Q2 và R2test ứng với số nơron trên lớp ẩn với mạng có 9 input ....... 50 Bảng 11 Kết quả tính và dự đoán hoạt tính theo mô hình (9 – 8 – 2) ..................................... 52 Bảng 12 Kết quả dự đoán hoạt tính cho tập dữ liệu mới .................................................................. 53 Bảng 13 Kết quả các mô hình tốt nhất của 2 phương pháp................................................................. 54 Bảng 14 Giá trị trọng số và độ nhạy của các biến độc lập............................................................... 56 -vii- DANH MỤC CÁC HÌNH Trang Hình 1 Mô hình chung dùng trong khảo sát QSAR .............................................................................. 8 Hình 2 Biểu đồ các mối liên hệ thường gặp của x và y ..................................................................... 17 Hình 3 Cấu tạo một nơron sinh học .................................................................................................................. 23 Hình 4 Cấu tạo một nơron nhân tạo .................................................................................................................. 24 Hình 5 Sơ đồ cấu tạo mạng nơron nhân tạo có 3 lớp........................................................................... 25 Hình 6 Sơ đồ kỹ thuật lan truyền ngược........................................................................................................ 27 Hình 7 Thuốc xịt muỗi và muỗi thuộc nhóm Plasmodium ............................................................. 31 Hình 8 Thí nghiệm hoạt tính sinh học ............................................................................................................. 35 Hình 9 Các loại mạng trong NeuroBuilder .................................................................................................. 39 Hình 10 Các loại hàm truyền trong NeuroBuilder ................................................................................. 40 Hình 11 Đồ thị giá trị dự đoán cho bộ dữ liệu kiểm tra với PT 25 ........................................... 41 Hình 12 Đồ thị giá trị dự đoán cho bộ dữ liệu kiểm tra với PT 2.5 .......................................... 46 Hình 13 Đồ thị R2, Q2 và R2test ứng với số nơron trên lớp ẩn ở 2 nồng độ đối với mạng có 20 input ....................................................................................................................................................... 48 Hình 14 Đồ thị R2, Q2 và R2test ứng với số nơron trên lớp ẩn ở 2 nồng độ đối với mạng có 9 input .......................................................................................................................................................... 50 Hình 15 Đồ thị giá trị tính toán và dự đoán theo hoạt tính thực nghiệm ở 2 nồng độ với cấu trúc mạng (9 – 8 – 2)...................................................................................................................... 51 Hình 16 Đồ thị giá trị tính toán và dự đoán theo hoạt tính thực nghiệm ở 2 nồng độ với cấu trúc mạng (9 – 8 – 2)...................................................................................................................... 53 Hình 17 Đồ thị giá trị dự đoán và thực nghiệm tập dữ liệu kiểm tra ở hai nồng độ .... 54 Hình 18 Biểu đồ giá trị trị tuyệt đối trọng số và biểu đồ độ nhạy của hai hoạt tính .... 57 Hình 19 Đồ thị biểu diễn giá trị của 9 tham số cấu trúc và hai hoạt tính ............................. 60 -viii- DANH MỤC CÁC PHỤ LỤC Phụ lục 1 Cấu trúc dẫn xuất N-acylpiperidine và hoạt tính. Phụ lục 2 Bảng số liệu các tham số cấu trúc và hoạt tính của dẫn xuất N-acylpiperidine. Phụ lục 3 Kết quả phân tích hồi qui cho 20 biến độc lập. Phụ lục 4 Ma trận hệ số tương quan Pearson các tham số cấu trúc và hoạt tính. Phụ lục 5 Ma trận hệ số tương quan Speaman các tham số cấu trúc và hoạt tính. Phụ lục 6 Biểu đồ phân tích độ nhạy của hoạt tính theo từng tham số cấu trúc. Phụ lục 7 Dữ liệu bộ trọng số. A. MỞ ĐẦU Lời mở đầu 1 LỜI MỞ ĐẦU ---------- Trong xã hội và trong tự nhiên nói chung hoặc trong nghiên cứu khoa học nói riêng, các nghiên cứu thống kê giúp tìm ra các mối quan hệ giữa các hiện tượng và đặc tính để có thể tiên đoán đúng các hiện tượng sẽ xảy ra khi biết được một số dấu hiệu nào đó, người ta thường gặp khó khăn với các mô hình thống kê kinh điển. Nhưng hiện nay, nhờ sự phát triển vượt bậc của cả công nghệ máy tính và trí tuệ con người, nên chúng ta có một công cụ hết sức mạnh mẽ trong tay là trí tuệ nhân tạo. Công cụ này giải quyết phần lớn các khó khăn gặp phải trước đây khi thống kê, tiên đoán chính xác các hiện tượng phức tạp với lượng thông tin ít ỏi, đặc biệt là khi ta kết hợp giữa các công cụ khác nhau của trí tuệ nhân tạo với nhau và cả các phương pháp cổ điển nữa. Ứng dụng của trí tuệ nhân tạo rất nhiều trong các lĩnh vực như nhận biết tiếng nói, nhận biết chữ viết, nhận biết hình ảnh, phân tích địa chấn, phân tích điện tâm đồ, chẩn đoán bệnh, phân tích thị trường chứng khoán, thương mại... Còn trong hoá học, người ta cũng cần dự đoán trong rất nhiều trường hợp như tìm hoá chất có hoạt tính mong muốn, dự đoán hướng phản ứng, xác định hướng phản ứng của các phản ứng cạnh tranh... và còn nhiều mục đích khác nữa. Các công cụ nói trên có nhiều ứng dụng vào các nghiên cứu, nhất là nghiên cứu mối quan hệ định lượng giữa hoạt tính và cấu trúc. Ngoài ra cũng phải kết hợp thêm các công cụ của hoá học khác nữa để thực hiện các nghiên cứu. Một sự hiểu biết đúng đắn về độc tính của một hoá chất mang một ý nghĩa đóng góp rất lớn đối với cuộc sống của nhân loại như làm giảm bệnh tật và tỉ lệ tử vong.… Tuy nhiên để đạt được điều đó lại là một quá trình rất phức tạp và khó khăn liên quan đến nhiều kỹ thuật khoa học để có được nhiều loại thông tin cần thiết. Đặc biệt, với sự phát triển công nghệ máy tính ngày càng cao và càng rẻ việc nghiên cứu thuốc bằng phương pháp mô phỏng phân tử kết hợp với các phương pháp thống kê ngày càng được quan tâm và phát triển. Trong luận văn này đã dùng phương pháp tính toán Hoá lượng tử kết hợp với phương pháp thống kê kinh điển và mạng nơron nhân tạo để nghiên cứu khảo sát mối quan hệ định lượng giữa hoạt tính và cấu trúc của các chất dẫn xuất N-acylpiperidine. Lời mở đầu 2 Tên đề tài: "KHẢO SÁT MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE". Mục đích đề tài:  Sử dụng chương trình Hóa lượng tử thích hợp để tính toán tham số cấu trúc của các chất dẫn xuất N-acylpiperidine. Các số liệu này kết hợp với dữ liệu về thời gian đuổi muỗi của các hợp chất N-acylpiperidine tạo thành bộ dữ liệu cấu trúc – hoạt tính sử dụng cho việc nghiên cứu QSAR.  Dùng phương pháp tính toán thống kê kinh điển (phương pháp hồi qui đa biến tuyến tính) và phương pháp sinh – tin hiện đại (mạng nơron nhân tạo) để tìm mô hình QSAR có tính tổng quát hóa cao.  Từ các kết quả nhận được trong luận văn và các kết quả nghiên cứu QSAR tương tự, rút ra nhận xét về phương pháp luận nghiên cứu QSAR. Đề tài gồm những phần chính sau: A. Lời mở đầu B. Tổng quan C. Phương pháp D. Kết quả và bàn luận E. Kết luận  B. TỔNG QUAN Chương 1 3 Chương 1 TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT TÍNH ---------- Mối quan hệ định lượng giữa cấu trúc và hoạt tính của các hoá chất được viết tắt là QSAR (Quantitative Structure – Activity Relationships). QSAR thường được nghiên cứu trên một họ hợp chất, giống nhau ở khung cơ bản nhưng khác nhau ở các nhóm thế trên khung chính và được căn cứ vào giả định rằng có mối tương quan cơ sở giữa cấu trúc phân tử và hoạt tính sinh học. Trong giả định này, QSAR cố gắng thiết lập mối tương quan giữa những tính chất riêng của cấu trúc phân tử với hoạt tính thực nghiệm của nó 5. Có hai mục đích chính cho sự phát triển QSAR:  Xây dựng mô hình QSAR để dự đoán hoạt tính của những phân tử chưa từng được kiểm tra.  Mô hình QSAR có vai trò như một công cụ cung cấp thông tin bằng việc chọn ra một bộ tham số mô tả liên quan đến hoạt tính được đo để có thể đánh giá được các yếu tố ảnh hưởng đến hoạt tính đã biết. Điều này có thể giúp thiết kế ra phân tử mới vừa có hoạt tính theo mong muốn hơn vừa giảm được thời gian, chi phí, tiền của. Dạng phương trình toán học phổ biến của QSAR là: A (Activity) = f (tính chất hóa lý hoặc cấu trúc riêng của phân tử) Đối với một mô hình QSAR có giá trị và đáng tin cậy thì hoạt tính của chúng phải được vạch ra bởi các cơ chế chung. Chất lượng của mô hình QSAR hoàn toàn phụ thuộc vào chất lượng của bộ dữ liệu sử dụng để xây dựng mô hình, vì vậy việc chọn ra bộ dữ liệu các tham số cấu trúc có liên quan đến hoạt tính thực nghiệm là quan trọng. Một vài loại hoạt tính và các tham số cấu trúc thường được nghiên cứu trong QSAR được giới thiệu dưới đây. Chương 1 4 1.1 HOẠT TÍNH 3, 11, 31 Hoạt tính được nghiên cứu trong QSAR có thể là hoạt tính hoá học hay hoạt tính sinh học được quan sát từ thực nghiệm dưới các hình thức khác nhau. 1.1.1 Hoạt tính sinh học  MIC (Minimum Inhibitory Concentration): nồng độ ức chế tối thiểu, hay nồng độ kiềm khuẩn tối thiểu (dùng trong vi sinh).  MBC (Minimum Bactericidal Concentration): nồng độ diệt khuẩn tối thiểu.  IC50 (Inhibitory Concentration): nồng độ ức chế 50% đối tượng thử, hay còn gọi là hằng số Michaelis – Menten.  EC50 (Effective Concentration): nồng độ 50% tác dụng tối đa.  ED50 (Effective Dose): liều tác dụng tối đa trên 50% đối tượng thử.  SD50 (Supression Dose): liều tiêu diệt 50% đối tượng thử.  LD50 (Lethal Dose): liều gây chết 50% thú thử.  TI (Therapeutic Index) = LD50/ED50: chỉ số trị liệu (TI càng lớn độ an toàn sử dụng càng cao)… Các hoạt tính s
Tài liệu liên quan