Luận văn này thực hiện việc xây dựng bộ điều khiển và nhận dạng tiếng nói bằng xử lý tín hiệu số DSP56002.
Một vài thập niên trước đây, việc nhận dạng tiếng nói bằng máy chỉ tồn tại trong suy nghĩ của các nhà khoa học viễn tưởng, tuy nhiên trong một vài năm gần đây, vấn đề tìm hiểu và thực hiện một hệ thống nhận dạng tiếng nói một cách tự động đã được đưa vào nghiên cứu trong các viện nghiên cứu trên khắp thế giới. Những ứng dụng thực tiễn mà hệ thống này sẽ mang lại là vô cùng lớn như các máy tính của chúng ta sẽ không cần bàn phím, các hệ thống điều khiển sẽ không cần các bảng điều khiển phức tạp, máy điện thoại sẽ không còn cần đến các bàn quay số. có thể xem là một bước đột phá trên tất cả các lĩnh vực trong cuộc sống của chúng ta. Do đó vấn đề nghiên cứu các phương pháp nhận dạng tiếng nói là một vấn đề đã và đang thu hút rất nhiều sự đầu tư và nghiên cứu của các nhà khoa học trên khắp thế giới. Tuy nhiên cho đến nay kết quả mang lại còn rất hạn chế vì sự phức tạp của tiếng nói con người.
Đối với nước ta, vấn đề nhận dạng tiếng nói đang ở trong giai đoạn đầu và các kết quả đạt được cho đến nay vẫn còn khiêm tốn. Luận văn này nghiên cứu thử nghiệm một hướng nhận dạng tiếng nói dựa trên đặc trưng ngữ âm quan trọng của tiếng nói là formant. Công cụ toán học có thể sử dụng là phép phân tích Fourier thời gian ngắn STFT(Short Time Fourier Transform). Nhận dạng tiếng nói là bộ phận nòng cốt trong bộ điều khiển tiếng nói cần thiết kế.
2 trang |
Chia sẻ: oanhnt | Lượt xem: 1541 | Lượt tải: 2
Bạn đang xem nội dung tài liệu Luận văn Xây dựng bộ điều khiển và nhận dạng tiếng nói bằng xử lý tín hiệu số dsp56002, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
GIỚI THIỆU
I. Tổng quan:
Luận văn này thực hiện việc xây dựng bộ điều khiển và nhận dạng tiếng nói bằng xử lý tín hiệu số DSP56002.
Một vài thập niên trước đây, việc nhận dạng tiếng nói bằng máy chỉ tồn tại trong suy nghĩ của các nhà khoa học viễn tưởng, tuy nhiên trong một vài năm gần đây, vấn đề tìm hiểu và thực hiện một hệ thống nhận dạng tiếng nói một cách tự động đã được đưa vào nghiên cứu trong các viện nghiên cứu trên khắp thế giới. Những ứng dụng thực tiễn mà hệ thống này sẽ mang lại là vô cùng lớn như các máy tính của chúng ta sẽ không cần bàn phím, các hệ thống điều khiển sẽ không cần các bảng điều khiển phức tạp, máy điện thoại sẽ không còn cần đến các bàn quay số... có thể xem là một bước đột phá trên tất cả các lĩnh vực trong cuộc sống của chúng ta. Do đó vấn đề nghiên cứu các phương pháp nhận dạng tiếng nói là một vấn đề đã và đang thu hút rất nhiều sự đầu tư và nghiên cứu của các nhà khoa học trên khắp thế giới. Tuy nhiên cho đến nay kết quả mang lại còn rất hạn chế vì sự phức tạp của tiếng nói con người.
Đối với nước ta, vấn đề nhận dạng tiếng nói đang ở trong giai đoạn đầu và các kết quả đạt được cho đến nay vẫn còn khiêm tốn. Luận văn này nghiên cứu thử nghiệm một hướng nhận dạng tiếng nói dựa trên đặc trưng ngữ âm quan trọng của tiếng nói là formant. Công cụ toán học có thể sử dụng là phép phân tích Fourier thời gian ngắn STFT(Short Time Fourier Transform). Nhận dạng tiếng nói là bộ phận nòng cốt trong bộ điều khiển tiếng nói cần thiết kế.
II . Những nội dung chính của luận văn:
Các chương 2, 3, 4, 5, 6 giới thiệu về xử lý tín hiệu số DSP56002, bộ giao tiếp âm thanh đa năng Codec 4215, bộ nhớ mở rộng, mạch giao tiếp và điều khiển. Chương 2 giới thiệu tổng quát về bộ xử lý tín hiệu số DSP56002. Tiếp đến Chương 3 mô tả cụ thể các chức năng của DSP56002 bao gồm: cấu trúc và các chế độ định địa chỉ củûa DSP56002; các thanh ghi trong và chế độ hoạt động của các PORT của DSP56002. Chương 4 mô tả tập lệnh xử lý tín hiệu số DSP56002. Chương 5 giới thiệu về CODEC giao tiếp âm thanh đa năng CS4215, bộ đồng bộ giao tiếp nối tiếp (SSI) của bộ xử lí DSP56002 được sử dụng để thích nghi với sự truyền dữ liệu nối tiếp từ hai bộ chuyển đổi A/D của CS4215 đến DSP56002 và từ DSP56002 đến hai bộ chuyển đổi D/A của CS4215. Chương 6 mở rộng bộ nhớ cho DSP56002; chương này sẽ trình bày về sơ đồ mạch của DSP56002EVM, bộ nhớ mở rộng, sơ đồ điều khiển động cơ DC và các linh kiện sử dụng trong mạch. Các chương sau sẽ giới thiệu về các công cụ toán học và phương pháp nhận dạng tiếng nói. Chương 7 giới thiệu về phép biến đổi Fourier với tín hiệu liên tục và rời rạc, và giới thiệu phương pháp biến đổi nhanh Fourier FFT thực hiện trên DSP56002 sử dụng giải thuật phân chia theo thời gian DIT (decimation-in-time). Tiếp theo Chương 8 trình bày phép tổng quát về biến đổi Fourier thời gian ngắn STFT. Cuối cùng là Chương 9 sẽ tập trung vào phép biến đổi Fourier thời gian ngắn để trích formant của tín hiệu, Sau khi trích formant của tín hiệu sẽ sử dụng phương pháp kết hợp mẫu để nhận dạng tiếng nói.
III. Kết luận sơ bộ:
Luận văn đã thực hiện được việc :mở rộng bộ nhớ cho DSP56002, nhận dữ liệu âm thanh từ ngoài qua giao tiếp SSI giữa DSP56002 và CS4215, thực hiện trích formant của tín hiệu tiếng nói dùng giải thuật STFT. Cuối cùng là đã thực hiện được việc nhận dạng tiếng nói và ứng dụng để điều khiển.