Luận văn Thực thi thời gian thực mô hình thuật toán melp trên bộ xử lý tín hiệu số tms320c5509

1. Lý do chọn đềtài Hiện nay, nén dữliệu âm thanh nói chung và nén dữliệu tiếng nói nói riêng đã và đang được các nhà khoa học, công nghệtrên thếgiới quan tâm nghiên cứu, các kết quả đạt được đã được ứng dụng nhiều trong lĩnh vực truyền thông và giải trí. Đặc biệt, trong điều kiện công nghệthông tin, truyền thông đang phát triển rất mạnh nhưhiện nay thì vấn đềxửlý âm thanh, tiếng nói càng được nghiên cứu và ứng dụng rộng rãi. Đã có rất nhiều thuật toán và mô hình xửlý tiếng nói được nghiên cứu và sửdụng, trong đó, mô hình dự đoán tuyến tính (LPC) là một phần không thể thiếu của hầu hết tất cảcác giải thuật mã hóa thoại hiện đại ngày nay. Ý tưởng cơbản là một mẫu thoại có thể được xấp xỉbằng một kết hợp tuyến tính của các mẫu trong quá khứ. Trong một khung tín hiệu, các trọng sốdùng đểtính toán kết hợp tuyến tính được tìm bằng cách tối thiểu hóa bình phương trung bình sai số dự đoán; các trọng sốtổng hợp, hoặc các hệsốdự đoán tuyến tính được dùng đại diện cho một khung cụthể. Mô hình MELP (dự đoán tuyến tính kích thích hỗn hợp) được thiết kế đểvượt qua một sốhạn chếcủa mô hình LPC, sửdụng một mô hình tạo tiếng nói phức tạp hơn, với các thông sốbổxung đểcải thiện độchính xác. MELP bắt đầu được phát triển bởi McCree từnăm 1995, tích hợp nhiều nghiên cứu tiến bộvào thời điểm đó, bao gồm cảlượng tửhóa vec-tơ, tổng hợp tiếng nói và cải tiến từmô hình LPC cơbản. Hiệu quảcủa MELP đã được chứng minh thực tếkhi được NATO và Mỹ chấp nhận và sửdụng trong nhiều thiết bịquân sự. Tuy nhiên ởViệt Nam thì MELP chưa được chú ý nghiên cứu, phát triển vì tính ứng dụng hẹp: chủyếu trong lĩnh vực quân sự. Xuất phát từnhững lý do trên mà tôi đã chọn đềtài: “Thực thi thời gian thực mô hình thuật toán MELP trên bộxửlý tín hiệu số TMS320C5509”. 2. Mục tiêu và nhiệm vụnghiên cứu Mục tiêu của luận văn này là triển khai trong thời gian thực thuật toán nén thoại MELP trên bộxửlý tín hiệu sốTMS320C55xx, với các nội dung nhưsau: - Phân tích tổng quan vềnén thoại. - Mô hình nén thoại MELP. - Phân tích, nghiên cứu bộxửlý tín hiệu sốTMS320C55X . 2 - Phân tích, xây dựng, triển khai thực thi thời gian thực mô hình MELP trên bộxửlý tín hiệu sốTMS320C5509, đềxuất cải tiến MELP và đánh giá kết quảthửnghiệm. 3. Đối tượng và phạm vi nghiên cứu + Đối tượng nghiên cứu - Tìm hiểu tổng quan vềnén thoại và thuật toán MELP, - Nghiên cứu bộxửlý tín hiệu sốTMS320C55xx. + Phạm vi nghiên cứu - Các vấn đềvềnén dữliệu tiếng nói. - Ứng dụng thuật toán MELPtrên bộxửlý tín hiệu sốTMS320C5509 4. Phương pháp nghiên cứu + Phương pháp nghiên cứu lý thuyết - Nghiên cứu tài liệu, ngôn ngữvà công nghệliên quan. - Tổng hợp các tài liệu. - Phân tích và thiết kếhệthống. + Phương pháp nghiên cứu thực nghiệm - Thiết kếvà triển khai thuật toán trên chip TMS320C5509 - Đánh giá kết quả đạt được, đềxuất phương án mởrộng kết quảnghiên cứu. 5. Kết quảdựkiến Phân tích, thiết kếhệthống và triển khai hoàn chỉnh thuật toán MELP trên chip TMS320C5509. 6. Ý nghĩa khoa học và thực tiễn của luận văn + Vềmặt lý thuyết - Tìm hiểu tổng quan vềnén thoại và thuật toán MELP. - Đềxuất khảnăng triển khai thuật toán MELP trên bộxửlý tín hiệu số + Vềmặt thực tiễn - Ứng dụng các công cụ, ngôn ngữhỗtrợ đểtriển khai, cài đặt thuật toán MELP trên bộxửlý tín hiệu sốTMS320C5509. - Kết quảcủa luận văn có thểáp dụng cho ứng dụng thực tiễn, đặc biệt trong lĩnh vực quân sự.

pdf85 trang | Chia sẻ: truongthanhsp | Lượt xem: 1073 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Luận văn Thực thi thời gian thực mô hình thuật toán melp trên bộ xử lý tín hiệu số tms320c5509, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM VĂN HẬU THỰC THI THỜI GIAN THỰC MÔ HÌNH THUẬT TOÁN MELP TRÊN BỘ XỬ LÝ TÍN HIỆU SỐ TMS320C5509 LUẬN VĂN THẠC SĨ CÔNG NGHỆ ĐIỂN TỬ - VIỄN THÔNG Hà Nội - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM VĂN HẬU THỰC THI THỜI GIAN THỰC MÔ HÌNH THUẬT TOÁN MELP TRÊN BỘ XỬ LÝ TÍN HIỆU SỐ TMS320C5509 Ngành: Công nghệ Điện tử Viễn thông Chuyên ngành: Kỹ thuật điện tử Mã số: 60 52 02 03 LUẬN VĂN THẠC SĨ CÔNG NGHỆ ĐIỆN TỬ VIỄN THÔNG NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. TRẦN ĐỨC TÂN Hà Nội - 2014 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được công bố trong bất kỳ công trình nào khác. Tác giả Phạm Văn Hậu MỤC LỤC LỜI CAM ĐOAN MỤC LỤC MỤC LỤC BẢNG BIỂU MỤC LỤC HÌNH VẼ DANH MỤC VIẾT TẮT  MỞ ĐẦU ....................................................................................................... 1  Chương 1 -  TỔNG QUAN NÉN THOẠI ...................................................... 4  1.1  Cấu trúc của hệ thống nén thoại .................................................................. 4  1.2  Các thuộc tính lý tưởng của nén thoại ........................................................ 6  1.3  Trễ nén ........................................................................................................ 7  1.4  Ứng dụng của các mô hình nén thoại .......................................................... 9  Chương 2 -  MÔ HÌNH NÉN THOẠI MELP ............................................. 10  2.1  Mô hình tạo tiếng nói MELP .................................................................... 10  2.2  Biên độ Fourier (Fourier Manitudes) ........................................................ 11  2.3  Bộ lọc định hình ........................................................................................ 15  2.4  Pitch period và ước lượng voice strength ................................................. 17  2.5  Hoạt động mã hóa ..................................................................................... 24  2.6  Hoạt động giải mã ..................................................................................... 27  2.7  Kết chương ................................................................................................ 30  Chương 3 -  CHIP XỬ LÝ TÍN HIỆU SỐ TMS320C55xx ........................ 32  3.1  Giới thiệu ................................................................................................... 32  3.2  Kiến trúc họ TMS32C55xx ....................................................................... 32  3.3  Công cụ phát triển ..................................................................................... 37  3.4  Các chế độ địa chỉ TMS320C55x ............................................................. 42  3.5  Đường ống và cơ chế song song ............................................................... 44  3.6  Tập lệnh TMS320C55x ............................................................................. 47  3.7  Lập trình hỗn hợp C và Assembly ............................................................ 48  Chương 4 -  CÀI ĐẶT VÀ THỬ NGHIỆM ................................................. 51  4.1  Cài đặt MELP thời gian thực trên C5509 và C5510. ................................ 51  4.2  Thực hiện cài đặt ....................................................................................... 52  4.3  Đánh giá kết quả........................................................................................ 59  KẾT LUẬN ..................................................................................................... 63  Kết quả đạt được của luận văn ............................................................................ 63  Định hướng nghiên cứu tiếp theo ........................................................................ 63  TÀI LIỆU THAM KHẢO ................................................................................ 64  PHỤ LỤC ........................................................................................................ i  A.  Mô hình mã hóa dự đoán tuyến tính LPC .................................................... i  B.  Thuật toán Levinson-Durbin ...................................................................... iii  C.  Lượng tử hóa véc-tơ nhiều lớp (MSVQ) .................................................. vii  MỤC LỤC BẢNG BIỂU Bảng 2-1: Sơ đồ cấp phát bit của mã hóa MELP ................................................ 27  Bảng 3-1: Ví dụ về mã C và mã hợp ngữ được trình biên dịch C55x sinh ra .... 37  Bảng 3-2: Ví dụ về tệp lệnh liên kết sử dụng cho bộ mô phỏng C55x ............... 39  Bảng 3-3: Gán các loại tham số tới thanh ghi ..................................................... 49  Bảng 3-4: Sử dụng và duy trì thanh ghi .............................................................. 50  Bảng 4-1: Một số tệp chính của dự án ................................................................ 52  Bảng 4-2: Bảng cho điểm MOS .......................................................................... 60  Bảng 4-3: Mẫu âm thanh dùng để đánh giá ........................................................ 61  Bảng 4-4: Đánh giá PESQ của cài đặt C55x MELP ........................................... 61  Bảng A-1: Bảng so sánh MC đối với các độ phân giải thường gặp...................... x  MỤC LỤC HÌNH VẼ Hình 1-1: Mô hình hệ thống nén thoại ................................................................ 4 Hình 1-2: Mô hình nén thoại ............................................................................... 5 Hình 1-3: Mô hình xác định trễ ........................................................................... 7 Hình 1-4: Mô tả các thành phần của trễ nén ....................................................... 8 Hình 1-5: Đồ thị mẫu truyền bit ở hai chế độ liên tục (trên) và gói (dưới) ........ 8 Hình 2-1: Mô hình tạo tiếng nói ........................................................................ 10 Hình 2-2: Mô phỏng xử lý tín hiệu với bộ lọc tạo xung ................................... 12 Hình 2-3: Mô hình tính toán và lượng tử hóa biên độ Fourier .......................... 12 Hình 2-4: Quá trình tạo kích thích xung ........................................................... 14 Hình 2-5: Sơ đồ bộ lọc tạo hình xung ............................................................... 16 Hình 2-6: Vị trí của các cửa sổ khác nhau tương ứng với khung tín hiệu ........ 18 Hình 2-7: Mô phỏng ước lượng Pitch period bước 1 ........................................ 19 Hình 2-8: Mô phỏng ước lượng voice strength băng thông .............................. 20 Hình 2-9: Một số tín hiệu và giá trị đỉnh của nó ............................................... 22 Hình 2-10: Đỉnh của chuỗi xung không gian đồng nhất ..................................... 22 Hình 2-11: Sai số dự đoán có được từ một sóng âm (bên trái) và đo đạc đỉnh áp dụng cho sai số dự đoán (bên phải) .................................................. 23 Hình 2-12: Mô hình mã hóa MELP..................................................................... 24 Hình 2-13: Mô hình giải mã MELP .................................................................... 28 Hình 2-14: Đáp ứng xung (trái) và đáp ứng biên độ (phải) của bộ lọc phân tán xung ................................................................................................... 30 Hình 3-1: Sơ đồ khối của CPU TMS320C55x .................................................. 33 Hình 3-2: Sơ đồ đơn giản hóa của IU ................................................................ 34 Hình 3-3: Mô hình đơn giản hóa của PU .......................................................... 34 Hình 3-4: Bộ điều khiển luồng dữ liệu địa chỉ C55x ........................................ 35 Hình 3-5: Mô hình cấu trúc bộ tính toán dữ liệu ............................................... 36 Hình 3-6: Công cụ và Luồng phát triển phần mềm TMS320C55X .................. 38 Hình 3-7: Phát triển phần mềm TMS320C55X với CCS .................................. 40 Hình 3-8: Ví dụ về lệnh hợp ngữ của TMS320C55X ....................................... 41 Hình 3-9: Sơ đồ hoạt động của đường ống C55x .............................................. 46 Hình 4-1: Mô hình hệ thống cho phát triển mô hình MELP ............................. 51 Hình 4-2: Mô hình triển khai thời gian thực trực tuyến .................................... 52 Hình 4-3: Mô hình tổng quát của một phương pháp đo phổ biến ..................... 60 Hình 4-4: Tệp Vn_M gốc và qua xử lý của C55x MELP ................................. 62 Hình 4-5: Tệp Vn_F gốc (và qua xử lý của C55x MELP ................................. 62 DANH MỤC VIẾT TẮT Từ viết tắt Tiếng Anh đầy đủ Nghĩa tiếng Việt 2-D 2-Demensional Hai chiều AbS Analysis-by-synthesis Phân tích bằng cách tổng hợp ACELP Algebraic code-excited linear prediction Dự đoán tuyến tính mã kích thích đại số ACR Absolute category rating Tỉ lệ phân loại tuyệt đối ADPCM Adaptive differential pulse code modulation Điều chế mã xung sai phân thích nghi APCM Adaptive pulse code modulation Điều chế mã xung thích nghi AR Tự hồi quy Tự hồi quy ARMA Tự hồi quy moving average Trung bình dịch chuyển tự hồi quy CCR Comparison category rating Tỉ lệ phân loại so sánh CDMA Code division multiple access Đa truy cập chia theo mã CELP Code-excited linear prediction Dự đoán tuyến tính mã kích thích CS-ACELP Conjugate structure algebraic code- excited linear prediction Dự đoán tuyến tính mã kích thích đại số cấu trúc liên hợp DC Direct current Dòng một chiều DCR Degradation category rating Tỉ lệ phân loại suy giảm DFT Discrete Fourier transform Biến đổi Fourier rời rạc DPCM Differential pulse code modulation Điều chế mã xung sai phân DSP Digital signal processing/processor Xử lý tín hiệu số DTAD Digital telephone answering device Thiết bị trả lời thoại số DTFT Discrete time Fourier transform Biến đổi Fourier thời gian rời rạc DTMF Dual-tone multifrequency Âm kép đa tần EFR Enhanced full rate Tăng cường đầy đủ tỉ lệ FFT Fast Fourier transform Biến đổi Fourier nhanh FIR Finite impulse response Đáp ứng xung hữu hạn FM Frequency modulation Điều tần FS Federal Standard Chuẩn liên bang GLA Generalized Lloyd algorithm Thuật toán Generalized Lloyd IDFT Inverse discrete Fourier transform Biến đổi Fourier rời rạc nghịch đảo IIR Infinite impulse response Đáp ứng xung vô hạn LD-CELP Low-delay code-excited linear prediction Dự đoán tuyến tính mã kích thích trễ thấp LMS Least mean square Bình phương trung bình tối thiểu LP Linear prediction Dự đoán tuyến tính LPC Linear prediction coding/coefficient Mã hóa dự đoán tuyến tính MA Moving average Trung bình dịch chuyển MNB Measuring normalizing block Khối chuẩn hóa đo đạc MP–MLQ Multipulse–maximum likelihood quantization Chuẩn hóa dạng tối đại đa xung MSE Mean square error Sai số bình phương trung bình MSVQ Multistage vector quantization Lượng tử hóa vector đa lớp PCM Pulse code modulation Điều chế mã xung PESQ Perceptual evaluation of speech quality Đánh giá cảm nhận về chất lượng thoại PSQM Perceptual speech quality measure Đo đạc chất lượng thoại PVQ Predictive vector quantization Lượng tử hóa vec-tơ dự đoán QCELP Qualcomm code-excited linear prediction Dự đoán tuyến tính kích thích mã Qualcomm RC Reflection coefficient Hệ số phản xạ RV Random variable Biến ngẫu nhiên SD Spectral distortion Sự biến dạng phổ SNR Signal to noise ratio Tỉ lệ tín hiệu trên nhiễu SPG Segmental prediction gain SSE Sum of squared error Tổng sai số bình phương SSNR Segmental signal to noise ratio Tỉ lệ tính hiệu phân đoạn trên nhiễu TDMA Time division multiple access Đa truy cập phân chia thời gian TI Texas Instruments VoIP Voice over internet protocol Truyền âm qua giao thức internet VQ Vector quantization Lượng tử hóa véc-tơ VSELP Vector sum excited linear prediction Dự đoán tuyến tính kích thích tổng vec- tơ 1 MỞ ĐẦU 1. Lý do chọn đề tài Hiện nay, nén dữ liệu âm thanh nói chung và nén dữ liệu tiếng nói nói riêng đã và đang được các nhà khoa học, công nghệ trên thế giới quan tâm nghiên cứu, các kết quả đạt được đã được ứng dụng nhiều trong lĩnh vực truyền thông và giải trí. Đặc biệt, trong điều kiện công nghệ thông tin, truyền thông đang phát triển rất mạnh như hiện nay thì vấn đề xử lý âm thanh, tiếng nói càng được nghiên cứu và ứng dụng rộng rãi. Đã có rất nhiều thuật toán và mô hình xử lý tiếng nói được nghiên cứu và sử dụng, trong đó, mô hình dự đoán tuyến tính (LPC) là một phần không thể thiếu của hầu hết tất cả các giải thuật mã hóa thoại hiện đại ngày nay. Ý tưởng cơ bản là một mẫu thoại có thể được xấp xỉ bằng một kết hợp tuyến tính của các mẫu trong quá khứ. Trong một khung tín hiệu, các trọng số dùng để tính toán kết hợp tuyến tính được tìm bằng cách tối thiểu hóa bình phương trung bình sai số dự đoán; các trọng số tổng hợp, hoặc các hệ số dự đoán tuyến tính được dùng đại diện cho một khung cụ thể. Mô hình MELP (dự đoán tuyến tính kích thích hỗn hợp) được thiết kế để vượt qua một số hạn chế của mô hình LPC, sử dụng một mô hình tạo tiếng nói phức tạp hơn, với các thông số bổ xung để cải thiện độ chính xác. MELP bắt đầu được phát triển bởi McCree từ năm 1995, tích hợp nhiều nghiên cứu tiến bộ vào thời điểm đó, bao gồm cả lượng tử hóa vec-tơ, tổng hợp tiếng nói và cải tiến từ mô hình LPC cơ bản. Hiệu quả của MELP đã được chứng minh thực tế khi được NATO và Mỹ chấp nhận và sử dụng trong nhiều thiết bị quân sự. Tuy nhiên ở Việt Nam thì MELP chưa được chú ý nghiên cứu, phát triển vì tính ứng dụng hẹp: chủ yếu trong lĩnh vực quân sự. Xuất phát từ những lý do trên mà tôi đã chọn đề tài: “Thực thi thời gian thực mô hình thuật toán MELP trên bộ xử lý tín hiệu số TMS320C5509”. 2. Mục tiêu và nhiệm vụ nghiên cứu Mục tiêu của luận văn này là triển khai trong thời gian thực thuật toán nén thoại MELP trên bộ xử lý tín hiệu số TMS320C55xx, với các nội dung như sau: - Phân tích tổng quan về nén thoại. - Mô hình nén thoại MELP. - Phân tích, nghiên cứu bộ xử lý tín hiệu số TMS320C55X . 2 - Phân tích, xây dựng, triển khai thực thi thời gian thực mô hình MELP trên bộ xử lý tín hiệu số TMS320C5509, đề xuất cải tiến MELP và đánh giá kết quả thử nghiệm. 3. Đối tượng và phạm vi nghiên cứu + Đối tượng nghiên cứu - Tìm hiểu tổng quan về nén thoại và thuật toán MELP, - Nghiên cứu bộ xử lý tín hiệu số TMS320C55xx. + Phạm vi nghiên cứu - Các vấn đề về nén dữ liệu tiếng nói. - Ứng dụng thuật toán MELP trên bộ xử lý tín hiệu số TMS320C5509 4. Phương pháp nghiên cứu + Phương pháp nghiên cứu lý thuyết - Nghiên cứu tài liệu, ngôn ngữ và công nghệ liên quan. - Tổng hợp các tài liệu. - Phân tích và thiết kế hệ thống. + Phương pháp nghiên cứu thực nghiệm - Thiết kế và triển khai thuật toán trên chip TMS320C5509 - Đánh giá kết quả đạt được, đề xuất phương án mở rộng kết quả nghiên cứu. 5. Kết quả dự kiến Phân tích, thiết kế hệ thống và triển khai hoàn chỉnh thuật toán MELP trên chip TMS320C5509. 6. Ý nghĩa khoa học và thực tiễn của luận văn + Về mặt lý thuyết - Tìm hiểu tổng quan về nén thoại và thuật toán MELP. - Đề xuất khả năng triển khai thuật toán MELP trên bộ xử lý tín hiệu số + Về mặt thực tiễn - Ứng dụng các công cụ, ngôn ngữ hỗ trợ để triển khai, cài đặt thuật toán MELP trên bộ xử lý tín hiệu số TMS320C5509. - Kết quả của luận văn có thể áp dụng cho ứng dụng thực tiễn, đặc biệt trong lĩnh vực quân sự. 7. Đặt tên đề tài “THỰC THI THỜI GIAN THỰC MÔ HÌNH THUẬT TOÁN MELP TRÊN BỘ XỬ LÝ TÍN HIỆU SỐ TMS320C5509” 3 8. Bố cục luận văn Nội dung chính của luận văn được chia thành 4 chương như sau: Chương 1: Tổng quan về nén thoại Chương 2: Mô hình nén thoại MELP Chương 3: Chip xử lý tín hiệu số TMS320C55x Chương 4: Cài đặt và thử nghiệm Phụ Lục: Mô hình LPC và Lượng tử hóa véc-tơ nhiều lớp 4 Chương 1 - TỔNG QUAN NÉN THOẠI [4] Nén thoại hay mã thoại, là một quá trình phân tích và sau đó có thể tái tạo lại tín hiệu tiếng nói yêu cầu: sử dụng càng ít bít càng tốt mà không làm giảm chất lượng tiếng nói. Do sự bùng nổ của viễn thông, nên nén thoại ngày càng được nghiên cứu và ứng dụng rộng rãi. Kỹ thuật vi điện tử và các bộ xử lý khả trình giá rẻ cũng góp phần thúc đẩy và trợ giúp phát triển, chuyển giao công nghệ nhanh chóng từ nghiên cứu đến thực tiễn. Nén thoại được thực hiện bằng nhiều bước và được đặc tả bằng một thuật toán.Thuật toán là một tập các lệnh, cung cấp các bước tính toán cần thiết để thực hiện công việc cụ thể. Máy tính hoặc bộ vi xử lý có thể thực hiện các lệnh này để hoàn thành nhiệm vụ mã hóa, giải mã. Các lệnh cũng có thể chuyển đổi sang cấu trúc mạch số, thực hiện các tính toán trực tiếp trên phần cứng: FPGA, CPLD 1.1 Cấu trúc của hệ thống nén thoại Hình 1-1: Mô hình hệ thống nén thoại [4] Hình 1-1 thể hiện mô hình của một hệ thống nén thoại. Tín hiệu thoại tương tự liên tục theo thời gian từ nguồn phát sẽ được đi qua một bộ lọc tiêu chuẩn (khử nhiễu), lấy mẫu (biến đổi thời gian rời rạc), và chuyển đổi tương tự- số (lượng tử hóa chuẩn). Đầu ra sẽ là tín hiệu thoại thời gian rời rạc với các giá trị mẫu cũng được rời rạc hóa, tín hiệu này được gọi là thoại số. Hầu hết các hệ thống nén thoại đều được thiết kế để hỗ trợ các ứng dụng viễn thông, với tần số giới hạn từ 300 đến 3400 Hz. Theo định lý Nyquist, tần số lấy mẫu phải gấp ít nhất là 2 lần băng thông của tín hiệu. Giá trị tần số khoảng 8kHz thường được chọn làm tần số lấy mẫu chuẩn cho tín hiệu thoại. Để chuyển 5 đổi mẫu tương tự sang tín hiệu số, ta sử dụng lượng tử hóa chuẩn và duy trì chất lượng thoại nhiều hơn 8 bits/mẫu. Việc sử dụng 16 bits/mẫu sẽ cung cấp chất lượng thoại cao hơn. Thông thường, chúng ta sẽ sử dụng các tham số cho tín hiệu thoại số như sau: Tần số lấy mẫu: 8 kHz Số lượng bit trên mẫu: 16 Khi đó, bit-rate = 8 * 16 = 128 kbps. Giá trị bit-rate này được gọi là bit-rate đầu vào, chính là giá trị mà bộ mã hóa nguồn cố gắng giảm xuống. Đầu ra của mã hóa nguồn sẽ biểu diễn tín hiệu thoại số đã mã hóa có bit-rate thấp hơn đầu vào càng nhiều càng tốt. Dữ liệu thoại số mã hóa sẽ được xử lý tiếp qua mã hóa kênh, cung cấp khả năng chống sai cho dòng bit trước khi truyền lên kênh truyền tải (bị ảnh hưởng từ rất nhiều nguồn nhiễu). Trong hình 1-1, bộ mã hóa nguồn và mã hóa kênh được tách biệt với nhau nhưng ta cũng có thể phối hợp 2 quá trình này trong một bước. Quá trình giải mã kênh sẽ xử lý dữ liệu đã được chống sai số để lấy lại dữ liệu đã mã hóa, và truyền sang bộ giải mã nguồn để tạo ra tín hiệu thoại số đầu ra với bit-rate ban đầu. Tín hiệu thoại số đầu ra được chuyển đổi sang dạng tín hiệu tương tự thông qua bộ chuyển đổi số-tương tự. Hình 1-2: Mô hình nén thoại Có thể rút gọn quá trình mã hóa nguồn và giải mã nguồn như hình 1-2. Tín hiệu đầu vào (thời gian rời rạc, bit-rate 128 kbps) được đưa vào bộ mã hóa để tạo ra dòng bit đã mã hóa, hay dữ liệu thoại nén. Bit-rate của dòng bit này thường thấp hơn tín hiệu đầu vào. Bộ giải mã sẽ nhận dòng bit đã mã hóa làm đầu vào và khôi phục thành tín hiệu đầu ra, là tín hiệu thời gian rời rạc có cùng bit-rate của tín hiệu thoại đầu vào ban đầu. Mô hình mã hóa/giải mã trên hình 1-2 được gọi là mô hình nén thoại, với tín hiệu thoại đầu vào được mã hóa tạo ra dòng bit có bit-rate thấp. Dòng bit này lại được truyền đi và làm đầu vào cho bộ giải mã, tạo thành xấp xỉ tín hiệu gốc ban đầu. Mã hóa Giải mã Tín hiệu vào (128kbps) Dòng bit đã mã hóa (<128kbps) Tín hiệu ra (128kbps) 6 1.2 Các thuộc tính lý tưởng của né
Tài liệu liên quan