Luận văn Xây dựng mô hình mô phỏng một đối tượng – tạm gọi là Robot – có khả năng nhận thức môi trường chung quanh để tìm kiếm mục tiêu

Trong thời đại kỹ thuật công nghệ phát triển mạnh mẽ như hiện nay, vấn đề tự động hoá luôn được đặt lên vị trí hàng đầu. Những công việc trước đây con người phải tự tay làm thì ngày nay đã được thay thế dần bằng những bộ máy hiện đại được lập trình theo những chức năng chuyên dụng. Theo đà phát triển, con người đã chế tạo ra Robot – một loại máy móc thông minh kết hợp từ các ngành cơ khí, điện tử và tin học – và nó giúp con người rất nhiều việc: từ việc thám hiểm những nơi con người không đến được cho đến những công việc nội trợ trong gia đình.

doc56 trang | Chia sẻ: vietpd | Lượt xem: 1372 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng mô hình mô phỏng một đối tượng – tạm gọi là Robot – có khả năng nhận thức môi trường chung quanh để tìm kiếm mục tiêu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
PHẦN I : LÝ THUYẾT CHƯƠNG I : Ý TƯỞNG VÀ ĐẶC TRƯNG CỦA BÀI TOÁN & 1. Ýù Tưởng Trong thời đại kỹ thuật công nghệ phát triển mạnh mẽ như hiện nay, vấn đề tự động hoá luôn được đặt lên vị trí hàng đầu. Những công việc trước đây con người phải tự tay làm thì ngày nay đã được thay thế dần bằng những bộ máy hiện đại được lập trình theo những chức năng chuyên dụng. Theo đà phát triển, con người đã chế tạo ra Robot – một loại máy móc thông minh kết hợp từ các ngành cơ khí, điện tử và tin học – và nó giúp con người rất nhiều việc: từ việc thám hiểm những nơi con người không đến được cho đến những công việc nội trợ trong gia đình. Từ khi xuất hiện đến nay, Robot luôn được các nhà khoa học đặc biệt quan tâm và làm cho nó ngày càng thông minh hơn, chuyên nghiệp hơn để thích ứng với những yêu cầu mới, những công việc mới trong những lĩnh vực mới. Một trong những việc rất cần đến sự trợ giúp của Robot là lĩnh vực tìm kiếm, chẳng hạn như việc tìm và gỡ mìn, một việc làm rất nguy hiểm đối với con người nhưng Robot lại làm rất tốt. Bên cạnh đó, việc thám hiểm những hành tinh xa xôi, những đáy biển sâu… thì không có sự lựa chọn nào tốt hơn Robot. Hiện nay, con người còn có những ý tưởng chưa thực hiện được về việc chế tạo Robot như: Robot cảnh sát chuyên trấn áp tội phạm, Robot nội trợ, Robot có cảm xúc, Robot cảm nhận bằng âm thanh, Robot mô phỏng các hoạt động của con người… Tuy Robot được ứng dụng vào rất nhiều lĩnh vực khác nhau nhưng hiện tại, việc chế tạo Robot vẫn còn gặp rất nhiều khó khăn về kỹ thuật cũng như công nghệ. Thực tế đó đã làm nảy sinh ý tưởng: có thể mô phỏng hoạt động của một Robot trong thế giới thực bằng máy tính được không? Câu trả lời là có và đã có nhiều công ty lớn làm theo cách này. Đây là một hướng phát triển rất quan trọng trong việc chế tạo Robot vì nó giúp cho việc thiết kế cũng như thử nghiệm Robot không còn khó khăn và tốn kém như trước. Tuy nhiên, việc thể hiện toàn bộ hoạt động của một Robot từ thế giới thực lên máy tính là một bài toán khá rộng lớn nên ở đây, trong giới hạn của đề tài này, tôi chỉ tập trung tìm hiểu bài toán “Xây dựng mô hình mô phỏng một đối tượng – tạm gọi là Robot – có khả năng nhận thức môi trường chung quanh để tìm kiếm mục tiêu”. Phần quan trọng của bài toán này là mô phỏng sự nhận thức của Robot, một bài toán tuy nhỏ nhưng không thể thiếu đối với hầu hết các Robot. Mục tiêu của bài toán là mô phỏng cách một Robot tự phân tích môi trường chung quanh để đi tìm vật thể. Giống như con người, đầu tiên Robot phải tìm nó bằng cách đi tìm khắp mọi nơi nhưng khi đã gặp thì Robot sẽ nhớ vị trí đó để định vị cho lần tìm kiếm sau. Và trong quá trình tìm kiếm, Robot phải tìm cách tránh né chướng ngại vật, phải đánh dấu đường đi đã qua, phải tự đưa ra những quyết định khi đã có thêm thông tin… Với bài toán này, các nội dung chính cần đạt được là: Khả năng nhận thức môi trường xung quanh của Robot: Robot sau khi “nhìn” sẽ phân biệt được chướng ngại vật, đường đi hay vật cần tìm trong khung nhìn. Khả năng đưa ra hành vi thích hợp của Robot: sau khi nhận thức được môi trường chung quanh, Robot sẽ đi tìm mục tiêu theo hướng tốt nhất trong các hướng có thể đi được, kết hợp chuyển hướng quan sát nếu gặp phải chướng ngại vật. Khả năng học của Robot: Robot có thể học bằng cách nhớ lại vị trí của vật cần tìm để định vị cho lần tìm kiếm sau. 2. Đặc trưng của bài toán: Do đây là một bài toán tìm kiếm nên nó có một số đặc trưng sau: Thông tin về đối tượng cần tìm có thể chưa chính xác hoặc bị thay đổi (Heuristic chưa có hoặc bị thay đổi) Đối tượng cần tìm có thể ở những nơi mà Robot không bao giờ tìm thấy được vì đối tượng bị che khuất phía sau vật cản. Kết quả là không bao giờ tìm thấy trong trường hợp môi trường cần tìm kiếm rộng lớn (có khả năng thất bại) Có thể có những đường không đi tiếp được mà thoạt đầu Robot chưa biết (có khả năng quay lui) Có thể có những ngã đường buộc Robot phải chọn một trong số các hướng có thể đi được. Trong thực tế, hướng “gần” đối tượng cần tìm lại là hướng xa nhất do cuối cùng phải đi đường vòng (khả năng mạo hiểm trong việc rẽ nhánh) Robot có thể được đặt ở những nơi mà tất cả các hướng Robot đều không thể đi tiếp. Kết quả là Robot sẽ quay lui về tới vị trí xuất phát và ngưng quá trình tìm kiếm (khả năng kết thúc sớm) Đối tượng cần tìm có thể nằm ở những nơi Robot chỉ nhìn thấy nhưng không thể đi đến được (khả năng Robot đi vòng quanh đối tượng càng lúc càng xa) Có thể có những lối đi quá hẹp để Robot có thể đi qua được (coi như đường đang đi là đường không đi tiếp được) Robot nên đi những nơi mà nó chưa đi qua. Do đó có thể có khả năng đối tượng cần tìm nằm ở bên kia đường đã đi rồi. Kết quả là Robot sẽ phải quay lui hoặc đi vòng. CHƯƠNG II : KIẾN THỨC LIÊN QUAN & Do đề tài mô phỏng khả năng nhận thức của Robot nên một số kiến thức sau đây được sử dụng: Đồ hoạ máy tính: để thể hiện giao diện và giải quyết một số vấn đề kỹ thuật như: tạo khung nhìn, thu thập thông tin về những đối tượng trong khung nhìn … Trí tuệ nhân tạo: hỗ trợ khả năng nhận thức và đưa ra quyết định nhằm phục vụ cho việc tìm kiếm. Lập trình hướng đối tượng: vì tính chất của đề tài là mô phỏng thế giới thực nên lập trình hướng đối tượng là một cách tiếp cận hiệu quả nhất. UML (Unified Modeling Languge): được sử dụng để lên mô hình cho dự án . I. ĐỒ HỌA MÁY TÍNH: Đồ hoạ máy tính là một trong những lĩnh vực phát triển nhanh nhất và lý thú nhất của ngành tin học. Ngay từ khi xuất hiện, đồ họa máy tính đã cuốn hút rất nhiều người thuộc nhiều lĩnh vực khác nhau. Và nhờ có công nghệ đồ họa mà con người có thể làm quen dễ dàng với máy tính. Do đó, để thể hiện giao diện cũng như giải quyết một số vấn đề kỹ thuật, đề tài này cũng dùng đến một số kỹ thuật sau: Tiếp cận Camera tổng hợp: sử dụng cách tiếp cận này để tạo ra khung nhìn cho Robot. Các giải thuật xén: để lấy các đối tượng trong khung nhìn của Robot nhằm mô phỏng việc Robot chỉ có thể thấy những gì nằm trong khung nhìn của nó mà thôi. 1. Khái niệm : Đồ họa là quá trình đưa ra một bức ảnh dựa vào một số mô tả. Để làm được điều này chúng ta phải thực hiện đồng thời 2 việc: thứ nhất là đưa ra một tiếp cận khả dĩ mô tả được các đối tượng từ đơn giản đến phức tạp, thứ hai là xây dựng một tập đầy đủ các công cụ vẽ ảnh cho phép đưa ra những bức ảnh từ những nét phác thảo thô sơ cho đến những hình ảnh sống động đầy hiện thực. Nói cách khác, đồ họa máy tính là tất cả những gì liên quan đến việc sử dụng máy tính để phát sinh ra hình ảnh. Các vấn đề liên quan đến công việc này bao gồm: tạo, lưu trữ, thao tác trên các mô hình hình học của đối tượng và các ảnh. 2. Các ứng dụng tiêu biểu của kỹ thuật đồ họa: 2.1 Xây dựng giao diện người dùng (User Interface) Giao diện đồ họa đang được đa số người dùng ưa thích nhờ tính thân thiện, dễ sử dụng của nó. Ưu điểm của nó so với ứng dụng console có thể được tóm tắt như sau: Người dùng có thể nắm bắt dễ dàng nếu các icon được thiết kế tốt để gợi nhớ về chức năng của nó. Có khả năng mở rộng giao diện, nhiều cửa sổ. 2.2 Lĩnh vực giải trí, nghệ thuật và mô phỏng : Các phần mềm đồ họa có thể cho phép các họa sĩ tạo ra các hình ảnh ngay trên màn hình máy tính. Người họa sĩ được máy tính cung cấp các công cụ làm việc rất đầy đủ như: khung vẽ, bảng pha màu, các thao tác cắt, dán, tẩy, xóa, phóng to, thu nhỏ và rất nhiều công cụ toán học khác nhau mà họa sĩ trên khung vải không sao có được. Các phần mềm khác để xây dựng các hình ảnh động và các kỹ xảo hoạt hình cũng có đầy đủ chức năng như vậy. Hiện tại công nghệ VRML đang phát triển rất nhanh cho phép tạo ra các thế giới thực tại ảo trên máy tính cũng như cho phép xây dựng những ứng dụng trong giải trí, trò chơi, thương mại. 3. Giải thuật xén- Clipping: Xén là tiến trình xác định các điểm của một đối tượng nằm trong hay ngoài cửa sổ hiển thị. Đặc trưng của bài toán xén hình là loại bỏ các phần hình ảnh nằm ngoài một vùng cho trước. Hiện nay có 2 hướng tiếp cận xén thông dụng là cắt và tô. Phương pháp cắt được dùng trong trường hợp hình nhỏ hơn vùng cần xén. Trong khi đó, phương pháp tô được dùng trong trường hợp hình lớn hơn vùng cần xén. Vì tính chất của đề tài này là hình ảnh rất lớn so với vùng cần xén (chứa luôn vùng cần xén) nên ở đây tôi chọn phương pháp tô mà không chọn phương pháp cắt. Dựa trên phương pháp tô này, thay vì tô màu ở những vị trí cần tô ta lấy thông tin về đối tượng tại đó. Có hai cách tiếp cận chính để tô màu một vùng tô là: tô theo dòng quét (scan-line fill) và tô theo đường biên (boundary fill). Phương pháp tô màu theo dòng quét thường được dùng để tô màu các đa giác và một số đường cong đơn giản. Còn phương pháp tô màu theo đường biên thường được dùng cho các vùng tô có đường biên phức tạp hơn. Vì khung nhìn của Robot chỉ là một đa giác đơn giản nên phương pháp tô màu theo dòng quét được sử dụng thay vì phương pháp tô màu theo đường biên. Giải thuật tô màu đa giác theo dòng quét – Scanline: Giải thuật dựa trên ý tưởng sử dụng một đường quét trên trục y của màn hình đi từ ymax đến ymin của vùng cần được tô màu. Với mỗi giá trị y = yi đường thẳng quét cắt các đường biên của vùng cần tô tạo ra đoạn thẳng y = yi với giới hạn x Ỵ [xmin - xmax]. Trên đoạn thẳng đó chúng ta tô màu các điểm tương ứng đi từ xmin --> xmax . Các điểm cần tô màu sẽ là (xi, yi) thuộc đoạn thẳng y = yi nói trên. Phép tô màu hình chữ nhật với giải thuật Scanline là phép tô màu đơn giản nhất bởi với mọi đường quét y = yi ta đều thu được hai giá trị xmin và xmax như nhau. Phép tô màu cho một đa giác bất kỳ sẽ phức tạp hơn rất nhiều so với hình chữ nhật. Độ phức tạp ở đây sẽ xảy ra từ việc xác định giải thuật cho việc tính giao điểm của đường thẳng quét để tìm ra đường biên xấp xỉ khi tô màu đến việc suy diễn đưa ra các phần đoạn thẳng cần tô màu trên đường thẳng quét khi gặp loại hình đa giác lõm hay điểm cắt trùng với đỉnh của đa giác khi mô tả. Phép tô màu một đa giác điển hình (như hình vẽ) sẽ theo những bước sau: Tìm giao điểm của đường thẳng quét với các cạnh của đa giác. Sắp xếp các giao điểm theo thứ tự tăng dần của giá trị biến x. Tô màu từng đoạn thẳng nằm giữa cặp điểm giao của đường thẳng quét và cạnh của đa giác. Trong bước này, ta phải giải quyết một vấn đề nảy sinh khi đường thẳng quét đi qua đỉnh của đa giác. Giả sử rằng tại đỉnh của đa giác, đường thẳng quét sẽ cắt 2 cạnh của đa giác tại hai điểm chồng khít lên nhau. Bài toán sẽ có lời giải trong một số trường hợp khi số điểm cắt là chẵn. Với số điểm cắt lẻ thì chúng ta không thể tìm được các cặp điểm cần tô màu. Để khắc phục nhược điểm trên ta sắp xếp các đỉnh mà dòng quét đi qua. Giải thuật sau đây sẽ cho phép ta quyết định lấy P là một điểm hay hai điểm trùng khớp nhau vào danh sách các điểm cắt. Nếu P là giao điểm của 2 cạnh đa giác có hướng ngược nhau, một cạnh có giá trị y tăng khi x tăng, một cạnh có giá trị y giảm khi x tăng thì dòng quét tạo ra hai điểm giao trên P. Ngược lại, nếu P là đỉnh chung của 2 cạnh đa giác có hướng y cùng nhau, y tăng khi x tăng thì đỉnh P cung cấp 1 điểm giao duy nhất cho danh sách điểm giao. Điều này được minh họa như sau: 4. Camera tổng hợp: Giống như con người, Robot cũng có khả năng nhìn và nhận biết được sự có mặt của các đối tượng trong phạm vi quan sát. Để mô phỏng khả năng này của Robot trên máy tính, tôi sử dụng cách tiếp cận camera tổng hợp với các đặc điểm sau: Là một công cụ hữu hiệu mà gói đồ họa 3D như CORE (Bergeron 1978), GKS3D và PHIGS (Brown 1985) cung cấp nhằm hỗ trợ cho việc lấy ảnh của thế giới thực. Camera tổng hợp có một mặt phẳng quan sát và một con mắt. Mặt phẳng quan sát xác định hệ tọa độ quan sát. Cửa sổ mô tả trong mặt phẳng quan sát. Con mắt, cửa sổ và các mặt phẳng trước, sau xác định khối quan sát. Các cạnh đều bị xén qua 6 mặt của khối quan sát này, phần còn lại được chiếu lên mặt phẳng quan sát, chuyển đến NDC (thiết bị đồ họa chuẩn) và cuối cùng được vẽ lên thiết bị. Nói cách khác, Camera tổng hợp mô tả một camera định vị và định hướng trong không gian, gồm 3 phần chính: Mặt phẳng quan sát (view plane) trong đó có định nghĩa một cửa sổ (window). Hệ quan sát. Và một con mắt. Hình vẽ minh họa một camera như vậy lơ lửng trong hệ tọa độ thực (World Coordinate System). Con mắt nhìn xuyên qua cửa sổ và thấy một phần thế giới thực. Có thể coi camera tổng hợp như là một hệ tọa độ được để tự do di chuyển trong không gian, mang theo mặt phẳng quan sát và con mắt. Các thành phần của camera tổng hợp: Gốc tọa độ của hệ UVN là điểm VRP (View Reference Point) nằm trong mặt phẳng quan sát, được mô tả bằng r = (rx, ry, rz). Pháp tuyến của mặt phẳng quan sát xác định trục N của hệ UVN, là vector VPN (View Plane Normal). Hệ UVN được chọn là hệ tọa độ nghịch, các vector chỉ hướng tương ứng là u, v, n và ta có u = n x v. Tính mềm dẻo của mô hình Camera tổng hợp: Các thành phần của Camera cho phép điều khiển sự quan sát phù hợp với cách di chuyển đầu của chúng ta. VRP (vector r) xác định vị trí của người quan sát, di chuyển VRP giống như di chuyển đầu mà không thay đổi hướng nhìn. VPN (vector n) xác định hướng nhìn. Thay đổi VPN giống như động tác quay đầu. Thay đổi “hướng lên” (thay đổi vector v) giống như nghiêng đầu mà vẫn giữ mắt cố định trên đối tượng. II. TRÍ TUỆ NHÂN TẠO Trong cuộc sống ngày nay, máy tính là một trợ thủ đắc lực và không thể thiếu của con người trong việc xử lý thông tin. Không những thế, máy tính còn có khả năng giải quyết các nhiệm vụ ở mức độ trí tuệ ngày càng cao. Theo một nghĩa nào đó, máy tính đã được trang bị trí tuệ nhân tạo. Mục tiêu của trí tuệ nhân tạo là nghiên cứu các kỹ thuật làm cho máy tính có thể “suy nghĩ một cách thông minh”. Theo một nghĩa hẹp, trí tuệ nhân tạo nghĩa là mô phỏng quá trình suy nghĩ của con người khi đưa ra những quyết định, những lời giải bằng cách tìm kiếm thông tin trong không gian bài toán. Từ đó thiết kế các chương trình cho máy tính để giải quyết bài toán trong quá trình tìm kiếm. Trên cơ sở đó, ta ứng dụng kỹ thuật tìm kiếm của trí tuệ nhân tạo vào đề tài nhằm giải quyết bài toán tìm kiếm của Robot. 1. Khái niệm: Trong thực tế, nhiều dạng hoạt động của con người từ những tính toán trong các nghiên cứu khoa học kỹ thuật, các bài toán xử lý dữ liệu cỡ lớn trong quản lý kinh tế xã hội đến những hoạt động ít nhiều mang tính giản đơn như giải đáp câu đố, chơi cờ, sửa chữa máy móc … đều đòi hỏi sự tham gia của trí tuệ. Trí tuệ nhân tạo là một ngành khoa học chuyên nghiên cứu và tạo ra các chương trình thực hiện các công việc như con người hoặc mô phỏng hoạt động của não người. Ngoài ra, trí tuệ nhân tạo còn làm cho máy tính có khả năng suy nghĩ cũng như có thể mô phỏng quá trình học của con người. Có thể nhận thấy rằng bộ não của con người có thể tích hợp những tri thức mới mà không cần phải thay đổi cách thức làm việc, không cần phải thay đổi cách suy diễn trong não bộ hoặc loại bỏ đi những sự kiện đã được lưu trước đó. Trên cơ sở đó các chuyên gia trí tuệ nhân tạo cố gắng làm cho các chương trình trí tuệ nhân tạo hoạt động tương tự như thế. 2. Các lĩnh vực nghiên cứu và ứng dụng cơ bản của Trí Tuệ Nhân Tạo: Sự phát triển mạnh mẽ của trí tuệ nhân tạo và tin học trong những thập niên gần đây đã tạo ra ngày càng nhiều sản phẩm thông minh phục vụ trong đời sống hằng ngày, trong công nghiệp cũng như trong các ngành khoa học. Từ đó có thể phân chia các lĩnh vực nghiên cứu và ứng dụng quan trọng của trí tuệ nhân tạo theo 4 hướng cơ bản sau : Mô hình hoá trên máy tính những chức năng khác nhau trong quá trình sáng tạo như : các trò chơi, chứng minh tự động các định lý, tổng hợp tự động các chương trình … Nâng cao khả năng trí tuệ “bên ngoài” của máy tính gắn liền với các giao tiếp, hội thoại bằng cách sử dụng các kỹ thuật suy diễn và tìm kiếm. Nâng cao khả năng trí tuệ “bên trong” của máy tính trên cơ sở chế tạo các máy tính thế hệ mới với kiến trúc vật lý mới dựa trên các nguyên lý của trí tuệ nhân tạo. Chế tạo các Robot thông minh có khả năng thực hiện những thao tác phức tạp, có thể ”suy nghĩ” và “hành động” để đạt đến mục đích đã đặt ra. 3. Các phương pháp và kỹ thuật Trí Tuệ Nhân Tạo Các bài toán trí tuệ nhân tạo trải rộng trong nhiều lĩnh vực khác nhau nên việc giải quyết chúng đòi hỏi phải đáp ứng những yêu cầu về phương diện kỹ thuật tin học và cả về thiết bị tương ứng. Các phương pháp và kỹ thuật trí tuệ nhân tạo cơ bản bao gồm: Các phương pháp biểu diễn tri thức và công nghệ xử lý tri thức. Các phương pháp giải quyết vấn đề. Các phương pháp Heuristic. Các phương pháp học. Các ngôn ngữ trí tuệ nhân tạo. Xử lý danh sách, kỹ thuật đệ quy, kỹ thuật quay lui … là những kỹ thuật cơ bản của tin học truyền thống có liên quan trực tiếp đến trí tuệ nhân tạo. Vì đề tài sử dụng các phương pháp tìm kiếm Heuristic và phương pháp học nên ở đây chỉ đề cập đến hai phương pháp này. Còn những phương pháp khác nếu có nhu cầu tìm hiểu thêm, xin xem thêm ở tài liệu tham khảo. 4. Các Giải Thuật Tìm Kiếm Heuristic Lập trình Heuristic là một hướng tiếp cận quan trọng trong việc xây dựng các hệ thống trí tuệ nhân tạo. Lý thuyết tìm kiếm Heuristic bao gồm các phương pháp và các kỹ thuật tìm kiếm, sử dụng các tri thức đặc biệt nảy sinh từ bản thân bài toán cần giải để rút ngắn quá trình giải, nhanh chóng đi đến kết quả mong muốn. Kỹ thuật cơ bản dựa trên các tri thức Heuristic hay được sử dụng trong thực tiễn là các h