Ở Việt Nam, nghề nuôi ong mật đã hình thành rất lâu và hiện nay các sản phẩm của ong mật hầu hết là được xuất khẩu. Hiệu quả kinh tế mang về từ nghề nuôi là khá cao. Tuy nhiên, việc nuôi ong chỉ tập trung chủ yếu ở một số vùng nhất định như Tây Nguyên (Đak Lak), miền Đông Nam Bộ, chưa tận dụng được hết nguồn tài nguyên có sẵn. Sự hạn chế này là do chưa xác định được loài ong cho mật nào phù hợp với từng vùng địa lý cụ thể tại Việt Nam.
                
              
                                            
                                
            
 
            
                 94 trang
94 trang | 
Chia sẻ: vietpd | Lượt xem: 1631 | Lượt tải: 0 
              
            Bạn đang xem trước 20 trang tài liệu Luận văn Khai thác dữ liệu est (expressed sequence tags) nhằm phát hiện microsatellite phục vụ cho công tác phân tích và so sánh đặc điểm di truyền của ong mật, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1 
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH 
BỘ MÔN CÔNG NGHỆ SINH HỌC 
************ 
KHÓA LUẬN TỐT NGHIỆP 
KHAI THÁC DỮ LIỆU EST (Expressed Sequence Tags) 
NHẰM PHÁT HIỆN MICROSATELLITE PHỤC VỤ CHO 
CÔNG TÁC PHÂN TÍCH VÀ SO SÁNH ĐẶC ĐIỂM 
DI TRUYỀN CỦA ONG MẬT 
Ngành học: CÔNG NGHỆ SINH HỌC 
Niên khóa: 2002-2006 
Sinh viên thực hiện: TRẦN NGỌC VIỆT 
Thành phố Hồ Chí Minh 
Tháng 8/2006 
2 
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
TRƢỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH 
BỘ MÔN CÔNG NGHỆ SINH HỌC 
 ************ 
KHAI THÁC DỮ LIỆU EST (Expressed Sequence Tags) 
NHẰM PHÁT HIỆN MICROSATELLITE PHỤC VỤ CHO 
CÔNG TÁC PHÂN TÍCH VÀ SO SÁNH ĐẶC ĐIỂM 
DI TRUYỀN CỦA ONG MẬT 
Giáo viên hƣớng dẫn: Sinh viên thực hiện: 
 TS. BÙI MINH TRÍ TRẦN NGỌC VIỆT 
Thành phố Hồ Chí Minh 
Tháng 8/2006
 iii 
LỜI CẢM TẠ 
Cảm ơn công lao nuôi dƣỡng, dạy dỗ của cha mẹ 
Xin chân thành cảm tạ 
 Ban Giám hiệu Trƣờng Đại học Nông Lâm Thành Phố Hồ Chí Minh 
 Ban chủ nhiệm Bộ Môn Công nghệ Sinh Học cùng tất cả quý thầy cô đã 
truyền đạt kiến thức cho tôi trong suốt quá trình học tại trƣờng. 
Chân thành cảm ơn 
 TS. Bùi Minh Trí đã tận tình hƣớng dẫn, giúp đỡ tôi trong suốt thời gian thực 
hiện đề tài tốt nghiệp. 
Xin cảm ơn CN. Lƣu Phúc Lợi đã giúp đỡ, hỗ trợ tài liệu chuyên môn. 
Cảm ơn các anh chị tại phòng Sinh Hóa đã tạo điều kiện tốt cho tôi khi tiến hành thực 
hiện công việc tại Trung Tâm. 
Xin cảm ơn bạn bè thân yêu của lớp DH02SH đã chia sẻ cùng tôi những vui buồn 
trong thời gian học cũng nhƣ hết lòng hỗ trợ, giúp đỡ tôi trong thời gian thực hiện đề 
tài. 
Tp. Hồ Chí Minh tháng 08 năm 2006 
Sinh viên thực hiện 
Trần Ngọc Việt
 iv 
TÓM TẮT 
TRẦN NGỌC VIỆT, Đại Học Nông Lâm Thành phố Hồ Chí Minh. Tháng 8/2006. 
“KHAI THÁC DỮ LIỆU EST (Expressed Sequence Tags) NHẰM PHÁT HIỆN 
MICROSATELLITE PHỤC VỤ CHO CÔNG TÁC PHÂN TÍCH VÀ SO SÁNH 
ĐẶC ĐIỂM DI TRUYỀN CỦA ONG MẬT” 
Giảng viên hƣớng dẫn: 
TS. BÙI MINH TRÍ 
Thời gian nghiên cứu: từ tháng 2 đến tháng 7 năm 2006 
Địa điểm nghiên cứu: Trung tâm Phân tích Thí Nghiệm - trƣờng Đại học Nông 
Lâm TP. Hồ Chí Minh 
Ở Việt Nam, nghề nuôi ong mật đã hình thành rất lâu và hiện nay các sản phẩm 
của ong mật hầu hết là đƣợc xuất khẩu. Hiệu quả kinh tế mang về từ nghề nuôi là khá 
cao. Tuy nhiên, việc nuôi ong chỉ tập trung chủ yếu ở một số vùng nhất định nhƣ Tây 
Nguyên (Đak Lak), miền Đông Nam Bộ, chƣa tận dụng đƣợc hết nguồn tài nguyên có 
sẵn. Sự hạn chế này là do chƣa xác định đƣợc loài ong cho mật nào phù hợp với từng 
vùng địa lý cụ thể tại Việt Nam. Chính vì thế chúng tôi tiến hành nghiên cứu về việc 
thiết lập nên primer chạy phản ứng PCR dựa vào chỉ thị microsatellite của các loài ong 
cho mật để làm cơ sở cho những bƣớc nghiên cứu định danh và xác định đặc điểm di 
truyền của ong mật phục vụ cho việc mở rộng nghề nuôi ong mật ở các vùng ở Việt 
Nam. 
 Những kết quả đã đạt đƣợc: 
۰ Chúng tôi đã chọn đƣợc một nguồn dữ liệu (EST) tốt cho nghiên cứu 
۰ Thiết lập đƣợc phƣơng pháp để tìm kiếm microsatellite từ nguồn EST 
۰ Thiết kế đƣợc những cặp primer dựa vào vùng bảo tồn hai bên những 
loại microsatellite tìm đƣợc 
 Kết luận: Sự thành công của việc thiết kế primer đã làm cơ sở cho những bƣớc 
nghiên cứu xa hơn về đặc điểm di truyền của các loài ong cho mật. Thành công này 
mở ra một triển vọng cho việc ứng dụng lĩnh vực Bioinformatic hỗ trợ cho nghiên cứu 
thực nghiệm, làm giảm đáng kể chi phí và đẩy nhanh tốc độ nghiên cứu thực nghiệm 
tại Trung Tâm. 
 v 
MỤC LỤC 
CHƢƠNG TRANG 
Trang tựa 
Lời cảm tạ ……………………………………………………………………………..iii 
Tóm tắt …………………………………...………….………………………………..iv 
Mục lục …………………………………………………………………………..…….v 
Danh sách các chữ viết tắt............................................................................................viii 
Danh sách các bảng .......................................................................................................ix 
Danh sách các hình .........................................................................................................x 
1. MỞ ĐẦU ....................................................................................................................1 
 1.1. Đặt vấn đề...........................................................................................................1 
 1.2. Mục đích và yêu cầu nghiên cứu........................................................................2 
1.2.1. Mục đích nghiên cứu .................................................................................2 
1.2.2. Yêu cầu nghiên cứu ...................................................................................2 
 1.3. Giới hạn .............................................................................................................2 
2. TỔNG QUAN TÀI LIỆU ...........................................................................................3 
 2.1. Giới thiệu chung về ong mật .............................................................................3 
2.1.1. Cấu tạo cơ thể của ong mật........................................................................3 
 2.1.1.1. Hình thái cơ thể ................................................................................3 
 2.1.1.2. Các cơ quan bên trong ......................................................................6 
2.1.2. Tổ chức của đàn ong ..................................................................................6 
2.1.3. Yêu cầu dinh dƣỡng của ong .....................................................................7 
2.1.4. Các sản phẩm của ong ...............................................................................7 
 2.1.4.1. Mật ong .............................................................................................7 
 2.1.4.2. Phấn hoa .................................................................................................7 
 2.1.4.3. Sữa ong chúa ..........................................................................................7 
 2.1.4.4. Sáp ong ..................................................................................................8 
 2.2. Nguồn gốc EST (Expressed Sequence Tags) ....................................................8 
2.2.1. EST là gì? ..................................................................................................8 
2.2.2. Phƣơng pháp tạo EST ................................................................................8 
 vi 
 2.3. Microsatellite là gì? .........................................................................................10 
2.3.1. Các dạng microsatellite ...........................................................................10 
2.3.2. Cơ chế hình thành microsatellite .............................................................11 
2.3.3. Ứng dụng của microsatellite ....................................................................12 
2.3.4. Marker phân tử (molecular markers) .......................................................13 
2.3.5. Vì sao chọn marker microsatellite? .........................................................14 
2.4. Ngôn ngữ lập trình Perl (Practical Extraction and Reporting Language) .............15 
 2.4.1. Nguồn gốc của Perl ......................................................................................15 
 2.4.2. Cấu trúc của Perl ..........................................................................................16 
2.4.2.1. Dữ liệu vô hƣớng (scala data) ..............................................................16 
2.4.2.2. Cấu trúc điều khiển ...............................................................................16 
2.4.2.3. Các List, Array và Hash .......................................................................19 
2.4.2.4. Dòng chƣơng trình và các thƣờng trình con .........................................19 
2.4.2.5. Package và Module ..............................................................................20 
2.5. Giới thiệu về mồi (primer) ....................................................................................21 
 2.5.1. Khái quát về mồi ..........................................................................................21 
 2.5.2. Đặc điểm của mồi .........................................................................................21 
2.5.2.1. Tính chuyên biệt ...................................................................................21 
2.5.2.2. Tính ổn định .........................................................................................22 
2.5.2.3. Tính tƣơng thích ...................................................................................23 
2.6. Tin sinh học ...........................................................................................................24 
 2.6.1. Khái niệm tin sinh học ..................................................................................24 
 2.6.2. Các lĩnh vực nghiên cứu chính của tin sinh học ...........................................24 
2.6.2.1. Genomics - Hệ gen học ........................................................................24 
2.6.2.2. Sinh học tiến hóa ..................................................................................26 
2.6.2.3. Phân tích chức năng gen .......................................................................26 
3. PHƢƠNG TIỆN VÀ PHƢƠNG PHÁP NGHIÊN CỨU .........................................29 
 3.1. Thời gian và địa điểm tiến hành nghiên cứu ...................................................29 
3.1.1. Thời gian nghiên cứu ...............................................................................29 
3.1.2. Địa điểm nghiên cứu ...............................................................................29 
 3.2. Vật liệu và công cụ nghiên cứu .......................................................................29 
3.2.1. Vật liệu nghiên cứu .................................................................................29 
 vii 
3.2.2. Công cụ nghiên cứu .................................................................................29 
 3.3. Phƣơng pháp tiến hành nghiên cứu .................................................................30 
3.3.1. Quy trình nghiên cứu tổng quát ...............................................................30 
3.3.2. Phƣơng pháp nghiên cứu .........................................................................31 
 3.3.2.1. Sơ đồ các bƣớc tiến hành nghiên cứu .............................................31 
 3.3.2.2. Các bƣớc tiến hành nghiên cứu chi tiết ..........................................32 
4. KẾT QUẢ VÀ THẢO LUẬN ..................................................................................42 
 4.1. Kết quả tìm kiếm và tải trình tự EST về máy tính cá nhân .............................42 
4.1.1. Kết quả tìm kiếm EST .............................................................................42 
4.1.2. Kết quả tải trình tự EST về máy tính cá nhân .........................................43 
 4.2. Kết quả tìm và phân loại microsatellite ...........................................................44 
4.2.1. Kết quả tìm microsatellite qua xử lý của EST_TRIMMER ....................44 
4.2.2 Kết quả xử lý qua MISA ..........................................................................45 
 4.3. Kết quả thiết kế primer ....................................................................................49 
4.3.1. Kết quả thiết kế primer qua 6 Script Perl ................................................49 
4.3.2. Kết quả so sánh và chọn lọc primer đƣợc thiết kế ...................................56 
5. KẾT LUẬN VÀ ĐỀ NGHỊ ......................................................................................59 
 5.1. Kết luận ...........................................................................................................59 
5.1.1. Sơ đồ phƣơng pháp thực hiện ..................................................................59 
 5.1.2. Kết quả đạt đƣợc .....................................................................................60 
 5.2. Đề nghị ............................................................................................................60 
6. TÀI LIỆU THAM KHẢO ........................................................................................61 
7. PHỤ LỤC .................................................................................................................64 
 viii 
DANH SÁCH CÁC CHỮ VIẾT TẮT 
 AFLP Amplified Fragment Length Polymorphism 
 ALP Amplified Length Polymorphism 
 AP-PCR Arbitrary Primer –Polymerase Chain Reaction 
 BLAST Basic Local Alignment Search Tools 
 CEB Computional Evolution Biology 
 DAF DNA Amplification Fringerprinting 
 DDBJ DNA Data Bank of Japan 
 EMBL the European Molecular Biology Laborary 
 EST Expressed Sequence Tags 
 NCBI the National Center for Biotechnology Information 
 MPSS Massively Parllel Signatur Sequencing 
 PCR Polymerase Chain Reaction 
 PDA Primer Design Assitant 
 PERL Practical Extraction and Reporting Language 
 RAPD Radom Aplified Polymorphic DNA 
 RFLP Restriction Fragment Length Polymorphism 
 SNP Single Nucleotide Polymorphism 
 SSCP Single Strand Conformation Polymorphism 
 SSR Simple Sequence Repeats 
 STS Sequence Tagged Sites 
 ix 
DANH SÁCH CÁC BẢNG 
BẢNG TRANG 
Bảng 2.1. Tên gọi một số marker DNA ..................................................................13 
Bảng 4.1. Kết quả xử lý qua MISA ........................................................................47 
Bảng 4.2. Thành phần của các dạng microsatellite .................................................47 
Bảng 4.3. Tỷ lệ phần trăm các dạng microsatellite .................................................48 
Bảng 4.4. Phần trăm các loại microsatellite chiếm tỷ lệ cao ..................................48 
Bảng 4.5. Kết quả primer của dạng dinucleotide SSR ............................................54 
Bảng 4.6. Kết quả primer của dạng trinucleotide SSR ...........................................55 
Bảng 4.7. Kết quả primer của dạng tetranucleotide SSR .......................................56 
Bảng 4.8. Kết quả primer sau cùng của dạng dinucleotide SSR ............................57 
Bảng 4.9. Kết Quả primer sau cùng của dạng tri/tetra-nucleotide SSR ..................57 
Bảng 4.10. Trình bày loại SSR và mã số truy cập của EST ...................................58 
 x 
DANH SÁCH CÁC HÌNH 
HÌNH TRANG 
Hình 2.1. Hình thái các loài ong cho mật .......................................................................3 
Hình 2.2. Thể hiện ba phần chính của ong .....................................................................4 
Hình 2.3. Hình thái phần đầu của con ong .....................................................................4 
Hình 2.4. Hình thái phần ngực của con ong ...................................................................5 
Hình 2.5. Hình thái phần bụng của con ong ...................................................................5 
Hình 2.6. Sơ đồ nguồn gốc của EST ..............................................................................9 
Hình 2.7. Cách thức tạo nên EST .................................................................................10 
Hình 2.8. Cơ chế bắt chéo lỗi trong giảm phân ............................................................11 
Hình 2.9. Cơ chế trƣợt lỗi trong quá trình sao mã ........................................................12 
Hình 3.1. Trình bày qui trình nghiên cứu tổng quát .....................................................30 
Hình 3.2. Các bƣớc tiến hành nghiên cứu chính ..........................................................31 
Hình 3.3. Giao diện trên trang NCBI với từ khóa honeybee ........................................32 
Hình 3.4. Cú pháp thực thi của EST_TRIMMER ........................................................35 
Hình 3.5. Cú pháp thực thi của MISA ..........................................................................36 
Hình 3.6. Giao diện của Primer3 ..................................................................................38 
Hình 3.7. Giao diện của PrimerQuest ...........................................................................40 
Hình 3.8. Giao diện của PDA .......................................................................................40 
Hình 3.9. Giao diện của DNAClub ..............................................................................41 
Hình 4.1. Kết quả tìm thấy EST trên NCBI .................................................................42 
Hình 4.2. Kết quả download với tùy chọn có sẵn của NCBI .......................................43 
Hình 4.3. Kết quả thực thi 4 tác vụ của EST_TRIMMER ...........................................45 
Hình 4.4. File chứa kết quả trình tự EST đƣợc chọn ....................................................45 
Hình 4.5. File định dạng FASTA .................................................................................45 
Hình 4.6. Thể hiện kết quả thực thi của MISA ............................................................46 
Hình 4.7. Kết quả của file new_ids170404 ..................................................................49 
Hình 4.8. Kết quả trình diễn của ssrout170404 ............................................................50 
Hình 4.9. Kết quả trình diễn của labdbout170404 ........................................................50 
Hình 4.10. Xuất kết quả các thông số thiết lập từ script ..............................................51 
Hình 4.11. Trình bày primer đƣợc thiết kế ...................................................................51 
 xi 
Hình 4.12. Trình diễn của rescreened170404 ...............................................................52 
Hình 4.13. Kết quả màn hình xử lý qua 4_ssr_blast ....................................................52 
Hình 4.14. Thể hiện EST và primer sau cùng ..............................................................53 
Hình 4.15. Trình bày primer đạt đƣợc sau cùng ...........................................................53 
Hình 5.1. Qui trình nghiên cứu thiết kế primer ............................................................59
1 
Phần 1 
MỞ ĐẦU 
1.1. Đặt vấn đề 
Trong thế giới động vật, ong mật là loài thuộc lớp côn trùng. Chúng xuất hiện 
cách đây 40 triệu năm vào thời kỳ Eocene. Ong mật có ở khắp nơi trên thế giới gồm 
nhiều loài khác nhau. Mỗi loài có điều kiện môi trƣờng phát triển khác nhau và hiệu 
quả sản xuất cũng khác nhau. Sản phẩm đƣợc làm ra bởi ong mật nhƣ phấn hoa, mật 
ong, sáp ong, sữa ong chúa, keo ong, nọc ong là các loại thực phẩm dƣợc liệu độc đáo 
có giá trị kinh tế cao. Ngoài ra, ong mật còn có tác động hữu ích đến nhiều loài động 
vật và đặc biệt là tác động rất cần thiết trên thực vật đó là thụ phấn hoa. 
Sự đa dạng và giá trị di truyền học của ong mật cần phải có phƣơng pháp để 
định danh chính xác từng loài và dƣới loài (thứ). Điều này rất cần thiết, nó có tác động 
quyết định đến hiệu quả kinh tế trong nghề nuôi ong nói riêng và ý nghĩa về bảo vệ đa 
dang sinh học nói chung. Công việc này sẽ phục vụ đắc lực trong việc tuyển chọn 
đƣợc loài ong phù hợp nhất cho nghề nuôi ong ở từng vùng địa lý riêng (nhƣ nguồn 
mật hoa, thời tiết…), đảm bảo bảo vệ “thuần khiết” đặc điểm di truyền ban đầu của 
mỗi loài ong. 
Hiện nay, marker microsatellite là một chọn lựa tốt trong việc phân tích sự đa 
dạng di truyền, lập bản đồ di truyền, nhận biết giữa các loài và các cá thể trong một 
loài. Dựa trên nguồn dữ liệu EST (Expressed Sequence Tags) chúng ta có thể tìm ra 
đƣơc những vị trí microsatellite có ở trên các EST một cách nhanh chóng nhờ vào lĩnh 
vực nghiên cứu gọi là tin sinh học (bioinformatics). 
Việc ứng dụng bioinformatic sẽ làm cho công việc nghiên cứu trở nên dễ dàng 
và