Ung thư là một nhóm các bệnh gồm hơn 100 căn bệnh khác nhau, trong đó các bệnh này đều ảnh hưởng đến đơn vị cơ bản nhất của cơ thể sống, đó là tế bào. Ung thư xuất hiện khi việc phân chia tế bào trở nên bất thường, không thể kiểm soát được từ đó sẽ dẫn đến tử vong nhanh chóng. Tại hội thảo quốc tế “Ung thư phụ nữ và trẻ em” tổ chức tại Hà Nội ngày 6 và 7 tháng 11 năm 2003, qua thống kê, mỗi năm Việt Nam có 100000 đến 150000 người mắc bệnh ung thư được phát hiện, trong đó số người tử vong lên đến 70000 người
86 trang |
Chia sẻ: vietpd | Lượt xem: 1457 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng mô hình nơron - Mờ trong việc phát hiện tế bào cổ tử cung giai đoạn tiền ung thư, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 1
LỜI CẢM ƠN
Đầu tiên, em xin chân thành cám ơn Ban giám hiệu, các thầy cô trường Đại học
Khoa Học Tự Nhiên cùng các thầy cô Khoa Công Nghệ Thông Tin đã tận tình truyền
đạt những kiến thức quí báu cho chúng em trong suốt bốn năm học qua.
Tiếp đến, em xin gởi lời cám ơn chân thành nhất đến Tiến sĩ Lê Hoài Bắc. Thầy
đã cho em một định hướng đúng đắn cho đề tài của mình và luôn tận tình theo dõi quá
trình thực hiện đề tài cũng như giúp đỡ kịp thời khi cần thiết.
Em cũng xin chân thành cám ơn bác sĩ Trần Hòa, trưởng khoa Giải phẫu bệnh
(Bệnh viện C, Đà Nẵng) và Thạc sĩ Bác sĩ Nguyễn Thị Tuyết Mai (Bệnh viện Đa khoa,
Đà Nẵng) đã tận tình chỉ dẫn những kiến thức chuyên ngành cần thiết và tạo điều kiện
cho em tiếp cận thực tế.
Cuối cùng, em xin gởi tất cả tình cảm thân thương nhất đến gia đình, thầy cô và
bạn bè; những người luôn ủng hộ em về mọi mặt.
TP. Hồ Chí Minh, ngày 1 tháng 7 năm 2004
Võ Thị Thuỷ Tú
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 2
LỜI NÓI ĐẦU
Ung thư là một nhóm các bệnh gồm hơn 100 căn bệnh khác nhau, trong đó các
bệnh này đều ảnh hưởng đến đơn vị cơ bản nhất của cơ thể sống, đó là tế bào. Ung thư
xuất hiện khi việc phân chia tế bào trở nên bất thường, không thể kiểm soát được từ đó
sẽ dẫn đến tử vong nhanh chóng. Tại hội thảo quốc tế “Ung thư phụ nữ và trẻ em” tổ
chức tại Hà Nội ngày 6 và 7 tháng 11 năm 2003, qua thống kê, mỗi năm Việt Nam có
100000 đến 150000 người mắc bệnh ung thư được phát hiện, trong đó số người tử
vong lên đến 70000 người. Các nghiên cứu đã chứng minh rằng nhiều loại bệnh ung
thư có thể ngăn chặn nếu được phát hiện và điều trị sớm, chẳng hạn như ung thư vú,
ung thư cổ tử cung, ung thư da, ung thư tuyến tiền liệt,… Khi các bệnh này được phát
hiện sớm và điều trị thích hợp, 95% bệnh nhân có thể sống thêm ít nhất 5 năm.
Ung thư cổ tử cung là loại ung thư phụ khoa nguy hiểm thứ hai sau ung thư vú,
chiếm khoảng 18% các trường hợp ung thư ở hệ cơ quan sinh dục nữ. Bệnh là nguyên
nhân gây tử vong do ung thư cao nhất cho phụ nữ ở các nước đang phát triển. Đó là do
những nước này chưa thực hiện chương trình khám sàng lọc nhằm phát hiện sớm ung
thư. Việc chẩn đoán và điều trị cho từng bệnh nhân bị chi phối bởi tiến triển bệnh tại
thời điểm chẩn đoán. Quá trình điều trị sẽ trở nên đơn giản, hiệu quả, với chi phí thấp
nếu bệnh được phát hiện trong giai đoạn tiền ung thư, ngược lại nếu không điều trị kịp
thời thì bệnh sẽ không chữa được. Vì vậy, phát hiện sớm ung thư cổ tử cung rất quan
trọng, liên quan đến lợi ích người bệnh và hiệu quả điều trị. Để làm được điều này, các
bác sĩ giải phẫu bệnh sẽ khám sàng lọc cho tất cả các bệnh nhân ở độ tuổi có thể mắc
bệnh.
Năm 1943, bác sĩ George Papanicolaou đã giới thiệu một phương pháp đơn
giản, hiệu quả, thích hợp cho việc chẩn đoán tế bào cổ tử cung trong giai đoạn tiền ung
thư; đó chính là xét nghiệm Pap. Xét nghiệm này thỉnh thoảng vẫn cho kết quả không
chính xác do nhiều nguyên nhân khách quan và chủ quan. Nhiều phụ nữ sau khi được
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 3
khám sàng lọc vẫn chết do bệnh này. Một trong những nguyên nhân chính là do các tế
bào ung thư phát triển rất phức tạp, nên tỷ lệ chẩn đoán âm tính giả và dương tính giả
rất cao. Tỷ lệ chẩn đoán sai có thể giảm xuống bằng cách kiểm tra lại toàn bộ các mẫu
đã khám sàng lọc. Giải pháp này không khả thi vì tốn nhiều thời gian và công sức mà
hiệu quả lại không cao. Do đó, một hệ thống nhận dạng tự động tế bào tiền ung thư là
rất cần thiết và rất hữu ích.
Bên cạnh đó, việc xác định các hệ thống tự động đang là một công cụ ứng dụng
rất quan trọng trong nhiều lĩnh vực của xã hội. Trong đó, mô hình nơron – mờ dần dần
được thiết lập không chỉ trong lĩnh vực nghiên cứu mà còn trong lĩnh vực ứng dụng. Cả
mạng nơron và hệ thống mờ đều được phát triển dựa trên qui trình lập luận của con
người. Ở hệ thống mờ, các mối liên hệ được mô tả rõ ràng bằng các luật nếu – thì
nhưng lại thiếu khả năng tự điều chỉnh (khả năng “học”). Còn ở mạng nơron, các mối
liên hệ thể hiện không rõ ràng mà chỉ có thể thiết lập được những mô hình liên quan
nhân quả, tuy nhiên dữ liệu lại được mã hóa vào mạng thành các tham số có khả năng
“học”. Như vậy, các hệ thống tích hợp mạng nơron và logic mờ sẽ kết hợp được khả
năng ngữ nghĩa của hệ thống mờ và khả năng “học” của mạng nơron để tạo ra được
một mô hình suy luận hiệu quả nhất.
Với tính chất phức tạp của hệ thống phân lớp tế bào cổ tử cung, một hệ thống
nơron - mờ có thể khắc phục được một số lỗi thường gặp trong chẩn đoán, mà bác sĩ
hay mắc phải. Mô hình nơron – mờ kiểu ANFIS (hệ suy luận mờ loại Sugeno dựa trên
mạng thích nghi) được dùng để thực hiện phân lớp tế bào là bình thường hay bất
thường.
Báo cáo sẽ gồm 5 phần chính và 3 phần phụ:
• Chương 1: Tổng quan
Giới thiệu sơ lược về đề tài và các kiến thức cơ bản liên quan đến đề tài.
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 4
• Chương 2: Hệ thống suy luận mờ dựa trên mạng thích nghi
Trình bày về lý thuyết mô hình ANFIS: cấu trúc ANFIS và thuật toán học.
• Chương 3: Trích chọn đặc trưng
Nêu phương pháp tạo dữ liệu cho hệ thống phân loại tế bào và cách tính các đặc
trưng được trích ra từ ảnh tế bào.
• Chương 4: Phân lớp tế bào cổ tử cung sử dụng mô hình ANFIS
Mô tả cách thức mà mô hình ANFIS thực hiện phân lớp tế bào cổ tử cung trên
một số hệ thống luật mờ: luật chuyên gia, luật chuyên gia biến đổi và luật trích
dẫn từ hệ thống.
• Chương 5: Tổng kết
Giới thiệu chương trình và đánh giá mức độ thực hiện của hệ thống, cũng như
một số ưu, khuyết điểm và định hướng.
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 5
MỤC LỤC
LỜI CẢM ƠN.................................................................................................................1
LỜI NÓI ĐẦU ................................................................................................................2
MỤC LỤC.......................................................................................................................5
DANH MỤC HÌNH ẢNH..............................................................................................6
DANH MỤC BẢNG BIỂU ............................................................................................7
BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT ....................................................................8
Chương 1: TỔNG QUAN..............................................................................................9
1.1. Giới thiệu sơ lược đề tài ........................................................................................9
1.2. Mục đích của đề tài .............................................................................................10
1.3. Mẫu xét nghiệm Pap............................................................................................11
1.4. Một số nguyên nhân dẫn đến chẩn đoán sai........................................................16
1.5. Một số hệ thống phân lớp tế bào tự động và bán tự động...................................17
1.6. Phát biểu vấn đề ..................................................................................................19
1.7. Các tiêu chuẩn đánh giá mức độ thực hiện hệ thống ..........................................20
Chương 2: HỆ SUY LUẬN MỜ DỰA TRÊN MẠNG THÍCH NGHI ...................22
2.1. Giới thiệu sơ lược về mô hình nơron - mờ..........................................................22
2.2. Hệ thống suy luận mờ .........................................................................................23
2.3. Mạng thích nghi ..................................................................................................27
2.4. Hệ thống suy luận mờ dựa trên mạng thích nghi ................................................33
Chương 3: TRÍCH CHỌN ĐẶC TRƯNG.................................................................37
3.1. Giới thiệu sơ lược về trích đặc trưng ..................................................................37
3.2. Dữ liệu nhập của hệ thống ..................................................................................37
3.3. Dữ liệu xuất của hệ thống ...................................................................................39
3.4. Trích chọn đặc trưng ...........................................................................................40
3.5. Các đặc trưng rút trích.........................................................................................46
Chương 4: PHÂN LOẠI TẾ BÀO CỔ TỬ CUNG SỬ DỤNG MÔ HÌNH ANFIS48
4.1. Cấu trúc ANFIS trong phân loại tế bào cổ tử cung.............................................48
4.2. Các hệ thống luật mờ trong phân loại tế bào ......................................................54
Chương 5: TỔNG KẾT ...............................................................................................59
5.1. Chương trình .......................................................................................................59
5.2. Mức độ thực hiện chương trình...........................................................................66
5.3. Đánh giá đề tài ....................................................................................................75
5.4. Hướng phát triển cho đề tài.................................................................................75
PHỤ LỤC......................................................................................................................76
PHỤ LỤC A: MỘT SỐ KIẾN THỨC Y KHOA CƠ BẢN ......................................76
PHỤ LỤC B: PHÂN ĐOẠN ẢNH............................................................................80
PHỤ LỤC C: PHƯƠNG PHÁP LỌC KALMAN .....................................................82
TÀI LIỆU THAM KHẢO ...........................................................................................84
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 6
DANH MỤC HÌNH ẢNH
Hình 1-1: Cấu trúc mô tế bào ở cổ tử cung....................................................................12
Hình 1-2: Phân lớp trong mô tế bào gai .........................................................................13
Hình 1-3: (a) tế bào gai cận đáy, (b) tế bào gai trung gian, (c) tế bào gai bề mặt, ........14
Hình 1-4: Phân lớp trong mô tế bào trụ .........................................................................14
Hình 1-5: Sơ đồ các bước thực hiện chẩn đoán .............................................................19
Hình 2-1: Hệ thống suy luận mờ ....................................................................................25
Hình 2-2: Các luật mờ và các hệ thống suy luận ...........................................................27
Hình 2-3: Mạng thích nghi.............................................................................................27
Hình 2-4: (a) Suy luận mờ loại 3, (b) cấu trúc ANFIS tương ứng.................................34
Hình 3-1: Ảnh đã phân đoạn ..........................................................................................40
Hình 3-2: Ảnh đã gán nhãn ............................................................................................40
Hình 3-3: Các phép tính diện tích ..................................................................................41
Hình 3-4: Vị trí đường kính nhỏ nhất và lớn nhất .........................................................42
Hình 3-5: Tâm của trọng lực đối với nhân và bào tương...............................................44
Hình 3-6: Đường tròn cực tiểu cho nhân .......................................................................46
Hình 4-1: Ý nghĩa các tham số trong hàm dạng chuông................................................49
Hình 4-2: Cấu trúc ANFIS với 2 dữ liệu vào và 4 luật ..................................................50
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 7
DANH MỤC BẢNG BIỂU
Bảng 1-1: Thống kê kích thước tế bào...........................................................................16
Bảng 2-1: Hai quá trình trong thuật toán học lai............................................................36
Bảng 3-1 : Danh sách các đặc trưng trích chọn vào cơ sở dữ liệu.................................47
Bảng 4-1: Ví dụ luật mờ phân loại tế bào ......................................................................48
Bảng 4-2: Luật chuyên gia .............................................................................................54
Bảng 4-3: Luật chuyên gia biến đổi ...............................................................................55
Bảng 5-1: Luật chuyên gia số hóa..................................................................................66
Bảng 5-2: Mức độ thực hiện luật chuyên gia.................................................................67
Bảng 5-3: Mức độ kiểm nghiệm của luật chuyên gia ....................................................67
Bảng 5-4: Luật chuyên gia biến đổi số hóa....................................................................68
Bảng 5-5: Mức độ thực hiện luật chuyển gia biến đổi...................................................68
Bảng 5-6: Mức độ kiểm nghiệm của luật chuyên gia biến đổi ......................................69
Bảng 5-7: Luật trích từ hệ thống với 2 dữ liệu xuất.......................................................70
Bảng 5-8: Luật trích từ hệ thống với 7 dữ liệu xuất.......................................................72
Bảng 5-9: Mức độ thực hiện mạng của luật trích từ hệ thống .......................................72
Bảng 5-10: Mức độ kiểm nghiệm của luật trích từ hệ thống .........................................73
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 8
BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT
ANFIS Adaptive – Network – Based Fuzzy Inference System
RMSE Root Mean Square Error
FN False Negative
FP False Positive
PP Positive Predictive
NP Negative Predictive
LSE Least squares estimate
FDA the Food and Drug Administration
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 9
Chương 1: TỔNG QUAN
Để có thể hiểu rõ về đề tài này, chương đầu tiên xin được trình bày về một số
kiến thức cơ bản liên quan đến ung thư cổ tử cung và một số công việc đã thực hiện
được trong lĩnh vực khám sàng lọc tự động. Tất cả những thông tin này phần nào nói
lên được những khó khăn, những tồn tại của các hệ thống chẩn đoán tự động, bán tự
động hoặc thủ công (do bác sĩ thực hiện), để từ đó nêu bật được sự cần thiết phải xuất
hiện một hệ thống mới.
1.1.Giới thiệu sơ lược đề tài
Ung thư cổ tử cung là loại bệnh nguy hiểm, chiếm tỉ lệ cao thứ hai sau ung thư
vú. Ở Úc, hơn một nghìn trường hợp ung thư cổ tử cung được chẩn đoán hằng năm, và
khoảng 350 phụ nữ chết vì bệnh này (Viện Sức khoẻ Úc, 1991). Độ tuổi trung bình
người bệnh là 52,2 và thường tập trung vào hai độ tuổi 35-39 và 60-64. Thống kê tại
Mĩ cho thấy, ở phụ nữ da trắng, 54% bệnh nhân ung thư cổ tử cung khi được chẩn đoán
bệnh còn ở giai đoạn khu trú (tiền ung thư), 31% có tổn thương trong vùng (ung thư)
và 8% có di căn xa (ung thư giai đoạn cuối); ở phụ nữ Mỹ gốc Phi, tỉ lệ này tương ứng
là 40%, 40% và 12%; Tỉ lệ mắc ung thư cổ tử cung theo độ tuổi cao nhất là ở những
phụ nữ gốc Việt sống ở Mỹ (43/100.000). Trong vòng 45 năm qua, tần xuất mắc ung
thư cổ tử cung giảm từ 45/100.000 xuống còn 8/100.000. Khi tần xuất mắc bệnh xâm
lấn (ung thư) giảm xuống thì tần xuất mắc bệnh tiền xâm lấn (tiền ung thư) lại tăng
đáng kể. Tỉ lệ sống 5 năm của bệnh nhân ung thư cổ tử cung mọi giai đoạn là 71% cho
phụ nữ da trắng và 57% cho phụ nữ Mỹ gốc Phi. Tỉ lệ sống phụ thuộc vào giai đoạn
của bệnh; khi bệnh còn khu trú tỷ lệ sống 5 năm là 92%, con số này giảm xuống 10%
khi bệnh đã di căn. Vì vậy, phát hiện ung thư cổ tử cung giai đoạn tiền ung thư là một
biện pháp hữu hiệu chăm sóc sức khỏe phụ nữ.
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 10
Năm 1943, Georges Papanicolaou đã đưa ra phương pháp chẩn đoán các tế bào
cổ tử cung giai đoạn tiền ung thư. Phương pháp này dựa vào mẫu xét nghiệm Pap để có
thể xác định các tế bào cổ tử cung tiền ung thư, nhằm đem lại hiệu quả điều trị cao cho
người bệnh. Chương trình tầm soát tế bào học British Columbia ở Canada
(www.chrcrm.org) đã chỉ ra rằng tỷ lệ tử vong và tình trạng bệnh tật giảm đi đáng kể
khi đưa việc khám sàng lọc Pap vào khu dân cư tại British Columbia. Do đó mà hiện
nay, phương pháp này được sử dụng phổ biến trên toàn thế giới không chỉ vì hiệu quả
của nó, mà còn vì giá thành của nó rẻ.
Tại Đan Mạch, mặc dù có chương trình khám sàng lọc trên diện rộng, nhưng
mỗi năm lại có hơn 500 ca mới được phát hiện, trong đó có khoảng 5% chẩn đoán âm
tính giả (không tìm ra bệnh). Cách hiệu quả nhất để khắc phục vấn đề này là thực hiện
tầm soát lại toàn bộ mẫu xét nghiệm bằng phương pháp thủ công. Tuy nhiên, điều này
khó có thể thực hiện được vì vấn đề chi phí và số lượng bác sĩ giải phẫu bệnh. Vì vậy,
việc khảo sát tự động bằng máy tính là một biến đổi lớn. Một số hệ thống chẩn đoán
ung thư cổ tử cung tự động và bán tự động cũng đã hoàn thành, nhưng chi phí cho
chúng lại đắt hơn chi phí đào tạo bác sĩ chuyên khoa. Do đó mà khoa Giải phẫu bệnh
của trường đại học Herlev kết hợp với công ty thương mại DIMAC đã thực hiện cơ sở
dữ liệu gồm các ảnh tế bào cổ tử cung cùng kết quả phân lớp loại tế bào chính xác để
có thể phát triển các ứng dụng công nghệ thông tin trong lĩnh vực này. Đề tài này sử
dụng toàn bộ dữ liệu lấy từ đây. Hệ thống suy luận mờ sẽ sử dụng bộ dữ liệu này để
thực hiện phân lớp tế bào cổ tử cung.
1.2.Mục đích của đề tài
Đề tài được thực hiện với một số mục đích sau:
¾ Phát hiện những tế bào cổ tử cung có thay đổi bất thường, và xác định mức
độ thay đổi của chúng (nhẹ, vừa, nặng), những thay đổi này còn gọi là loạn
sản và chúng cũng chính là nguyên nhân gây ra ung thư cổ tử cung sau này.
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 11
¾ Giảm tỷ lệ chẩn đoán âm tính giả và dương tính giả
¾ Giúp các sinh viên y khoa dễ dàng tiếp cận với việc chẩn đoán tế bào học,
giảm thiểu được chi phí đào tạo, huấn luyện bác sĩ
¾ Giúp các bác sĩ giải phẫu bệnh kiểm tra lại các mẫu xét nghiệm đã chẩn
đoán; và nếu được thử nghiệm nhiều thì chương trình có thể thực hiện sàng
lọc bước đầu, loại bỏ những mẫu xét nghiệm không nghi vấn và các bác sĩ
chỉ cần kiểm tra lại các mẫu có những thay đổi bất thường.
1.3.Mẫu xét nghiệm Pap
Xét nghiệm Pap là một phương pháp y khoa dùng để xác định ung thư cổ tử
cung trong giai đoạn tiến triển sớm. Nó có ý nghĩa rất lớn trong vấn đề y tế cộng đồng
vì thực hiện đơn giản và chi phí rẻ.
1.3.1.Mục đích thực hiện xét nghiệm Pap
Mục đích của việc khám sàng lọc bằng mẫu xét nghiệm Pap là nhằm chẩn đoán
các thay đổi “ác tính” trong tế bào ở giai đoạn tiền ung thư trước khi chúng tiến triển
thành ung thư.
1.3.2.Cách thực hiện mẫu xét nghiệm Pap
Dùng chổi y khoa hoặc que gỗ lấy mẫu xét nghiệm từ cổ tử cung, quét lên một
miếng thủy tinh mỏng, hình chữ nhật để thu được một mẫu Pap. Mẫu này sau đó sẽ
được nhuộm theo phương pháp Papanicolaou. Bằng cách này, đặc điểm của những tế
bào khác nhau sẽ có màu khác nhau, dễ phân biệt dưới kính hiển vi. Sau đó, các bác sĩ
giải phẫu bệnh sẽ khảo sát trực tiếp trên kính hiển vi. Việc này làm tốn nhiều thời gian
mà tỷ lệ lỗi lại rất cao khi mà mỗi mẫu như vậy có thể chứa đến 300000 tế bào.
KH
OA
C
NT
T –
Đ
H
KH
TN
Trang 12
1.3.3.Các tế bào trong mẫu xét nghiệm Pap
1.3.3.1.Cấu trúc cổ tử cung
Cổ tử cung được trải bởi các mô tế bào gai và mô tế bào trụ, trong đó mỗi mô
gồm nhiều loại tế bào khác nhau. Mô tế bào gai được tìm thấy ở phần dưới của cổ tử
cung, trái lại mô tế bào trụ được tìm thấy ở phần trên. Vùng chuyển tiếp (mô trung
gian) giữa hai phần trên và dưới là nơi có cả hai loại mô tế