1. Lý do chọn đềtài
Hiện nay, nén dữliệu âm thanh nói chung và nén dữliệu tiếng nói nói
riêng đã và đang được các nhà khoa học, công nghệtrên thếgiới quan tâm
nghiên cứu, các kết quả đạt được đã được ứng dụng nhiều trong lĩnh vực truyền
thông và giải trí. Đặc biệt, trong điều kiện công nghệthông tin, truyền thông
đang phát triển rất mạnh nhưhiện nay thì vấn đềxửlý âm thanh, tiếng nói càng
được nghiên cứu và ứng dụng rộng rãi.
Đã có rất nhiều thuật toán và mô hình xửlý tiếng nói được nghiên cứu và
sửdụng, trong đó, mô hình dự đoán tuyến tính (LPC) là một phần không thể
thiếu của hầu hết tất cảcác giải thuật mã hóa thoại hiện đại ngày nay. Ý tưởng
cơbản là một mẫu thoại có thể được xấp xỉbằng một kết hợp tuyến tính của các
mẫu trong quá khứ. Trong một khung tín hiệu, các trọng sốdùng đểtính toán kết
hợp tuyến tính được tìm bằng cách tối thiểu hóa bình phương trung bình sai số
dự đoán; các trọng sốtổng hợp, hoặc các hệsốdự đoán tuyến tính được dùng
đại diện cho một khung cụthể. Mô hình MELP (dự đoán tuyến tính kích thích
hỗn hợp) được thiết kế đểvượt qua một sốhạn chếcủa mô hình LPC, sửdụng
một mô hình tạo tiếng nói phức tạp hơn, với các thông sốbổxung đểcải thiện
độchính xác. MELP bắt đầu được phát triển bởi McCree từnăm 1995, tích hợp
nhiều nghiên cứu tiến bộvào thời điểm đó, bao gồm cảlượng tửhóa vec-tơ,
tổng hợp tiếng nói và cải tiến từmô hình LPC cơbản.
Hiệu quảcủa MELP đã được chứng minh thực tếkhi được NATO và Mỹ
chấp nhận và sửdụng trong nhiều thiết bịquân sự. Tuy nhiên ởViệt Nam thì
MELP chưa được chú ý nghiên cứu, phát triển vì tính ứng dụng hẹp: chủyếu
trong lĩnh vực quân sự. Xuất phát từnhững lý do trên mà tôi đã chọn đềtài:
“Thực thi thời gian thực mô hình thuật toán MELP trên bộxửlý tín hiệu số
TMS320C5509”.
2. Mục tiêu và nhiệm vụnghiên cứu
Mục tiêu của luận văn này là triển khai trong thời gian thực thuật toán nén
thoại MELP trên bộxửlý tín hiệu sốTMS320C55xx, với các nội dung nhưsau:
- Phân tích tổng quan vềnén thoại.
- Mô hình nén thoại MELP.
- Phân tích, nghiên cứu bộxửlý tín hiệu sốTMS320C55X .
2
- Phân tích, xây dựng, triển khai thực thi thời gian thực mô hình MELP
trên bộxửlý tín hiệu sốTMS320C5509, đềxuất cải tiến MELP và
đánh giá kết quảthửnghiệm.
3. Đối tượng và phạm vi nghiên cứu
+ Đối tượng nghiên cứu
- Tìm hiểu tổng quan vềnén thoại và thuật toán MELP,
- Nghiên cứu bộxửlý tín hiệu sốTMS320C55xx.
+ Phạm vi nghiên cứu
- Các vấn đềvềnén dữliệu tiếng nói.
- Ứng dụng thuật toán MELPtrên bộxửlý tín hiệu sốTMS320C5509
4. Phương pháp nghiên cứu
+ Phương pháp nghiên cứu lý thuyết
- Nghiên cứu tài liệu, ngôn ngữvà công nghệliên quan.
- Tổng hợp các tài liệu.
- Phân tích và thiết kếhệthống.
+ Phương pháp nghiên cứu thực nghiệm
- Thiết kếvà triển khai thuật toán trên chip TMS320C5509
- Đánh giá kết quả đạt được, đềxuất phương án mởrộng kết quảnghiên
cứu.
5. Kết quảdựkiến
Phân tích, thiết kếhệthống và triển khai hoàn chỉnh thuật toán MELP trên
chip TMS320C5509.
6. Ý nghĩa khoa học và thực tiễn của luận văn
+ Vềmặt lý thuyết
- Tìm hiểu tổng quan vềnén thoại và thuật toán MELP.
- Đềxuất khảnăng triển khai thuật toán MELP trên bộxửlý tín hiệu số
+ Vềmặt thực tiễn
- Ứng dụng các công cụ, ngôn ngữhỗtrợ đểtriển khai, cài đặt thuật toán
MELP trên bộxửlý tín hiệu sốTMS320C5509.
- Kết quảcủa luận văn có thểáp dụng cho ứng dụng thực tiễn, đặc biệt
trong lĩnh vực quân sự.
Bạn đang xem trước 20 trang tài liệu Luận văn Thực thi thời gian thực mô hình thuật toán melp trên bộ xử lý tín hiệu số tms320c5509, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
PHẠM VĂN HẬU
THỰC THI THỜI GIAN THỰC MÔ HÌNH THUẬT
TOÁN MELP TRÊN BỘ XỬ LÝ TÍN HIỆU SỐ
TMS320C5509
LUẬN VĂN THẠC SĨ CÔNG NGHỆ ĐIỂN TỬ - VIỄN THÔNG
Hà Nội - 2014
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
PHẠM VĂN HẬU
THỰC THI THỜI GIAN THỰC MÔ HÌNH THUẬT
TOÁN MELP TRÊN BỘ XỬ LÝ TÍN HIỆU SỐ
TMS320C5509
Ngành: Công nghệ Điện tử Viễn thông
Chuyên ngành: Kỹ thuật điện tử
Mã số: 60 52 02 03
LUẬN VĂN THẠC SĨ CÔNG NGHỆ ĐIỆN TỬ VIỄN THÔNG
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. TRẦN ĐỨC TÂN
Hà Nội - 2014
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình
nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là
trung thực và chưa từng được công bố
trong bất kỳ công trình nào khác.
Tác giả
Phạm Văn Hậu
MỤC LỤC
LỜI CAM ĐOAN
MỤC LỤC
MỤC LỤC BẢNG BIỂU
MỤC LỤC HÌNH VẼ
DANH MỤC VIẾT TẮT
MỞ ĐẦU ....................................................................................................... 1
Chương 1 - TỔNG QUAN NÉN THOẠI ...................................................... 4
1.1 Cấu trúc của hệ thống nén thoại .................................................................. 4
1.2 Các thuộc tính lý tưởng của nén thoại ........................................................ 6
1.3 Trễ nén ........................................................................................................ 7
1.4 Ứng dụng của các mô hình nén thoại .......................................................... 9
Chương 2 - MÔ HÌNH NÉN THOẠI MELP ............................................. 10
2.1 Mô hình tạo tiếng nói MELP .................................................................... 10
2.2 Biên độ Fourier (Fourier Manitudes) ........................................................ 11
2.3 Bộ lọc định hình ........................................................................................ 15
2.4 Pitch period và ước lượng voice strength ................................................. 17
2.5 Hoạt động mã hóa ..................................................................................... 24
2.6 Hoạt động giải mã ..................................................................................... 27
2.7 Kết chương ................................................................................................ 30
Chương 3 - CHIP XỬ LÝ TÍN HIỆU SỐ TMS320C55xx ........................ 32
3.1 Giới thiệu ................................................................................................... 32
3.2 Kiến trúc họ TMS32C55xx ....................................................................... 32
3.3 Công cụ phát triển ..................................................................................... 37
3.4 Các chế độ địa chỉ TMS320C55x ............................................................. 42
3.5 Đường ống và cơ chế song song ............................................................... 44
3.6 Tập lệnh TMS320C55x ............................................................................. 47
3.7 Lập trình hỗn hợp C và Assembly ............................................................ 48
Chương 4 - CÀI ĐẶT VÀ THỬ NGHIỆM ................................................. 51
4.1 Cài đặt MELP thời gian thực trên C5509 và C5510. ................................ 51
4.2 Thực hiện cài đặt ....................................................................................... 52
4.3 Đánh giá kết quả........................................................................................ 59
KẾT LUẬN ..................................................................................................... 63
Kết quả đạt được của luận văn ............................................................................ 63
Định hướng nghiên cứu tiếp theo ........................................................................ 63
TÀI LIỆU THAM KHẢO ................................................................................ 64
PHỤ LỤC ........................................................................................................ i
A. Mô hình mã hóa dự đoán tuyến tính LPC .................................................... i
B. Thuật toán Levinson-Durbin ...................................................................... iii
C. Lượng tử hóa véc-tơ nhiều lớp (MSVQ) .................................................. vii
MỤC LỤC BẢNG BIỂU
Bảng 2-1: Sơ đồ cấp phát bit của mã hóa MELP ................................................ 27
Bảng 3-1: Ví dụ về mã C và mã hợp ngữ được trình biên dịch C55x sinh ra .... 37
Bảng 3-2: Ví dụ về tệp lệnh liên kết sử dụng cho bộ mô phỏng C55x ............... 39
Bảng 3-3: Gán các loại tham số tới thanh ghi ..................................................... 49
Bảng 3-4: Sử dụng và duy trì thanh ghi .............................................................. 50
Bảng 4-1: Một số tệp chính của dự án ................................................................ 52
Bảng 4-2: Bảng cho điểm MOS .......................................................................... 60
Bảng 4-3: Mẫu âm thanh dùng để đánh giá ........................................................ 61
Bảng 4-4: Đánh giá PESQ của cài đặt C55x MELP ........................................... 61
Bảng A-1: Bảng so sánh MC đối với các độ phân giải thường gặp...................... x
MỤC LỤC HÌNH VẼ
Hình 1-1: Mô hình hệ thống nén thoại ................................................................ 4
Hình 1-2: Mô hình nén thoại ............................................................................... 5
Hình 1-3: Mô hình xác định trễ ........................................................................... 7
Hình 1-4: Mô tả các thành phần của trễ nén ....................................................... 8
Hình 1-5: Đồ thị mẫu truyền bit ở hai chế độ liên tục (trên) và gói (dưới) ........ 8
Hình 2-1: Mô hình tạo tiếng nói ........................................................................ 10
Hình 2-2: Mô phỏng xử lý tín hiệu với bộ lọc tạo xung ................................... 12
Hình 2-3: Mô hình tính toán và lượng tử hóa biên độ Fourier .......................... 12
Hình 2-4: Quá trình tạo kích thích xung ........................................................... 14
Hình 2-5: Sơ đồ bộ lọc tạo hình xung ............................................................... 16
Hình 2-6: Vị trí của các cửa sổ khác nhau tương ứng với khung tín hiệu ........ 18
Hình 2-7: Mô phỏng ước lượng Pitch period bước 1 ........................................ 19
Hình 2-8: Mô phỏng ước lượng voice strength băng thông .............................. 20
Hình 2-9: Một số tín hiệu và giá trị đỉnh của nó ............................................... 22
Hình 2-10: Đỉnh của chuỗi xung không gian đồng nhất ..................................... 22
Hình 2-11: Sai số dự đoán có được từ một sóng âm (bên trái) và đo đạc đỉnh áp
dụng cho sai số dự đoán (bên phải) .................................................. 23
Hình 2-12: Mô hình mã hóa MELP..................................................................... 24
Hình 2-13: Mô hình giải mã MELP .................................................................... 28
Hình 2-14: Đáp ứng xung (trái) và đáp ứng biên độ (phải) của bộ lọc phân tán
xung ................................................................................................... 30
Hình 3-1: Sơ đồ khối của CPU TMS320C55x .................................................. 33
Hình 3-2: Sơ đồ đơn giản hóa của IU ................................................................ 34
Hình 3-3: Mô hình đơn giản hóa của PU .......................................................... 34
Hình 3-4: Bộ điều khiển luồng dữ liệu địa chỉ C55x ........................................ 35
Hình 3-5: Mô hình cấu trúc bộ tính toán dữ liệu ............................................... 36
Hình 3-6: Công cụ và Luồng phát triển phần mềm TMS320C55X .................. 38
Hình 3-7: Phát triển phần mềm TMS320C55X với CCS .................................. 40
Hình 3-8: Ví dụ về lệnh hợp ngữ của TMS320C55X ....................................... 41
Hình 3-9: Sơ đồ hoạt động của đường ống C55x .............................................. 46
Hình 4-1: Mô hình hệ thống cho phát triển mô hình MELP ............................. 51
Hình 4-2: Mô hình triển khai thời gian thực trực tuyến .................................... 52
Hình 4-3: Mô hình tổng quát của một phương pháp đo phổ biến ..................... 60
Hình 4-4: Tệp Vn_M gốc và qua xử lý của C55x MELP ................................. 62
Hình 4-5: Tệp Vn_F gốc (và qua xử lý của C55x MELP ................................. 62
DANH MỤC VIẾT TẮT
Từ viết tắt Tiếng Anh đầy đủ Nghĩa tiếng Việt
2-D 2-Demensional Hai chiều
AbS Analysis-by-synthesis Phân tích bằng cách tổng hợp
ACELP
Algebraic code-excited linear
prediction
Dự đoán tuyến tính mã kích thích đại số
ACR Absolute category rating Tỉ lệ phân loại tuyệt đối
ADPCM
Adaptive differential pulse code
modulation
Điều chế mã xung sai phân thích nghi
APCM Adaptive pulse code modulation Điều chế mã xung thích nghi
AR Tự hồi quy Tự hồi quy
ARMA Tự hồi quy moving average Trung bình dịch chuyển tự hồi quy
CCR Comparison category rating Tỉ lệ phân loại so sánh
CDMA Code division multiple access Đa truy cập chia theo mã
CELP Code-excited linear prediction Dự đoán tuyến tính mã kích thích
CS-ACELP
Conjugate structure algebraic code-
excited linear prediction
Dự đoán tuyến tính mã kích thích đại số
cấu trúc liên hợp
DC Direct current Dòng một chiều
DCR Degradation category rating Tỉ lệ phân loại suy giảm
DFT Discrete Fourier transform Biến đổi Fourier rời rạc
DPCM Differential pulse code modulation Điều chế mã xung sai phân
DSP Digital signal processing/processor Xử lý tín hiệu số
DTAD Digital telephone answering device Thiết bị trả lời thoại số
DTFT Discrete time Fourier transform Biến đổi Fourier thời gian rời rạc
DTMF Dual-tone multifrequency Âm kép đa tần
EFR Enhanced full rate Tăng cường đầy đủ tỉ lệ
FFT Fast Fourier transform Biến đổi Fourier nhanh
FIR Finite impulse response Đáp ứng xung hữu hạn
FM Frequency modulation Điều tần
FS Federal Standard Chuẩn liên bang
GLA Generalized Lloyd algorithm Thuật toán Generalized Lloyd
IDFT Inverse discrete Fourier transform Biến đổi Fourier rời rạc nghịch đảo
IIR Infinite impulse response Đáp ứng xung vô hạn
LD-CELP
Low-delay code-excited linear
prediction
Dự đoán tuyến tính mã kích thích trễ
thấp
LMS Least mean square Bình phương trung bình tối thiểu
LP Linear prediction Dự đoán tuyến tính
LPC Linear prediction coding/coefficient Mã hóa dự đoán tuyến tính
MA Moving average Trung bình dịch chuyển
MNB Measuring normalizing block Khối chuẩn hóa đo đạc
MP–MLQ
Multipulse–maximum likelihood
quantization
Chuẩn hóa dạng tối đại đa xung
MSE Mean square error Sai số bình phương trung bình
MSVQ Multistage vector quantization Lượng tử hóa vector đa lớp
PCM Pulse code modulation Điều chế mã xung
PESQ
Perceptual evaluation of speech
quality
Đánh giá cảm nhận về chất lượng thoại
PSQM Perceptual speech quality measure Đo đạc chất lượng thoại
PVQ Predictive vector quantization Lượng tử hóa vec-tơ dự đoán
QCELP
Qualcomm code-excited linear
prediction
Dự đoán tuyến tính kích thích mã
Qualcomm
RC Reflection coefficient Hệ số phản xạ
RV Random variable Biến ngẫu nhiên
SD Spectral distortion Sự biến dạng phổ
SNR Signal to noise ratio Tỉ lệ tín hiệu trên nhiễu
SPG Segmental prediction gain
SSE Sum of squared error Tổng sai số bình phương
SSNR Segmental signal to noise ratio Tỉ lệ tính hiệu phân đoạn trên nhiễu
TDMA Time division multiple access Đa truy cập phân chia thời gian
TI Texas Instruments
VoIP Voice over internet protocol Truyền âm qua giao thức internet
VQ Vector quantization Lượng tử hóa véc-tơ
VSELP
Vector sum excited linear
prediction
Dự đoán tuyến tính kích thích tổng vec-
tơ
1
MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay, nén dữ liệu âm thanh nói chung và nén dữ liệu tiếng nói nói
riêng đã và đang được các nhà khoa học, công nghệ trên thế giới quan tâm
nghiên cứu, các kết quả đạt được đã được ứng dụng nhiều trong lĩnh vực truyền
thông và giải trí. Đặc biệt, trong điều kiện công nghệ thông tin, truyền thông
đang phát triển rất mạnh như hiện nay thì vấn đề xử lý âm thanh, tiếng nói càng
được nghiên cứu và ứng dụng rộng rãi.
Đã có rất nhiều thuật toán và mô hình xử lý tiếng nói được nghiên cứu và
sử dụng, trong đó, mô hình dự đoán tuyến tính (LPC) là một phần không thể
thiếu của hầu hết tất cả các giải thuật mã hóa thoại hiện đại ngày nay. Ý tưởng
cơ bản là một mẫu thoại có thể được xấp xỉ bằng một kết hợp tuyến tính của các
mẫu trong quá khứ. Trong một khung tín hiệu, các trọng số dùng để tính toán kết
hợp tuyến tính được tìm bằng cách tối thiểu hóa bình phương trung bình sai số
dự đoán; các trọng số tổng hợp, hoặc các hệ số dự đoán tuyến tính được dùng
đại diện cho một khung cụ thể. Mô hình MELP (dự đoán tuyến tính kích thích
hỗn hợp) được thiết kế để vượt qua một số hạn chế của mô hình LPC, sử dụng
một mô hình tạo tiếng nói phức tạp hơn, với các thông số bổ xung để cải thiện
độ chính xác. MELP bắt đầu được phát triển bởi McCree từ năm 1995, tích hợp
nhiều nghiên cứu tiến bộ vào thời điểm đó, bao gồm cả lượng tử hóa vec-tơ,
tổng hợp tiếng nói và cải tiến từ mô hình LPC cơ bản.
Hiệu quả của MELP đã được chứng minh thực tế khi được NATO và Mỹ
chấp nhận và sử dụng trong nhiều thiết bị quân sự. Tuy nhiên ở Việt Nam thì
MELP chưa được chú ý nghiên cứu, phát triển vì tính ứng dụng hẹp: chủ yếu
trong lĩnh vực quân sự. Xuất phát từ những lý do trên mà tôi đã chọn đề tài:
“Thực thi thời gian thực mô hình thuật toán MELP trên bộ xử lý tín hiệu số
TMS320C5509”.
2. Mục tiêu và nhiệm vụ nghiên cứu
Mục tiêu của luận văn này là triển khai trong thời gian thực thuật toán nén
thoại MELP trên bộ xử lý tín hiệu số TMS320C55xx, với các nội dung như sau:
- Phân tích tổng quan về nén thoại.
- Mô hình nén thoại MELP.
- Phân tích, nghiên cứu bộ xử lý tín hiệu số TMS320C55X .
2
- Phân tích, xây dựng, triển khai thực thi thời gian thực mô hình MELP
trên bộ xử lý tín hiệu số TMS320C5509, đề xuất cải tiến MELP và
đánh giá kết quả thử nghiệm.
3. Đối tượng và phạm vi nghiên cứu
+ Đối tượng nghiên cứu
- Tìm hiểu tổng quan về nén thoại và thuật toán MELP,
- Nghiên cứu bộ xử lý tín hiệu số TMS320C55xx.
+ Phạm vi nghiên cứu
- Các vấn đề về nén dữ liệu tiếng nói.
- Ứng dụng thuật toán MELP trên bộ xử lý tín hiệu số TMS320C5509
4. Phương pháp nghiên cứu
+ Phương pháp nghiên cứu lý thuyết
- Nghiên cứu tài liệu, ngôn ngữ và công nghệ liên quan.
- Tổng hợp các tài liệu.
- Phân tích và thiết kế hệ thống.
+ Phương pháp nghiên cứu thực nghiệm
- Thiết kế và triển khai thuật toán trên chip TMS320C5509
- Đánh giá kết quả đạt được, đề xuất phương án mở rộng kết quả nghiên
cứu.
5. Kết quả dự kiến
Phân tích, thiết kế hệ thống và triển khai hoàn chỉnh thuật toán MELP trên
chip TMS320C5509.
6. Ý nghĩa khoa học và thực tiễn của luận văn
+ Về mặt lý thuyết
- Tìm hiểu tổng quan về nén thoại và thuật toán MELP.
- Đề xuất khả năng triển khai thuật toán MELP trên bộ xử lý tín hiệu số
+ Về mặt thực tiễn
- Ứng dụng các công cụ, ngôn ngữ hỗ trợ để triển khai, cài đặt thuật toán
MELP trên bộ xử lý tín hiệu số TMS320C5509.
- Kết quả của luận văn có thể áp dụng cho ứng dụng thực tiễn, đặc biệt
trong lĩnh vực quân sự.
7. Đặt tên đề tài
“THỰC THI THỜI GIAN THỰC MÔ HÌNH THUẬT TOÁN MELP
TRÊN BỘ XỬ LÝ TÍN HIỆU SỐ TMS320C5509”
3
8. Bố cục luận văn
Nội dung chính của luận văn được chia thành 4 chương như sau:
Chương 1: Tổng quan về nén thoại
Chương 2: Mô hình nén thoại MELP
Chương 3: Chip xử lý tín hiệu số TMS320C55x
Chương 4: Cài đặt và thử nghiệm
Phụ Lục: Mô hình LPC và Lượng tử hóa véc-tơ nhiều lớp
4
Chương 1 - TỔNG QUAN NÉN THOẠI
[4] Nén thoại hay mã thoại, là một quá trình phân tích và sau đó có thể tái
tạo lại tín hiệu tiếng nói yêu cầu: sử dụng càng ít bít càng tốt mà không làm
giảm chất lượng tiếng nói. Do sự bùng nổ của viễn thông, nên nén thoại ngày
càng được nghiên cứu và ứng dụng rộng rãi. Kỹ thuật vi điện tử và các bộ xử lý
khả trình giá rẻ cũng góp phần thúc đẩy và trợ giúp phát triển, chuyển giao công
nghệ nhanh chóng từ nghiên cứu đến thực tiễn. Nén thoại được thực hiện bằng
nhiều bước và được đặc tả bằng một thuật toán.Thuật toán là một tập các lệnh,
cung cấp các bước tính toán cần thiết để thực hiện công việc cụ thể. Máy tính
hoặc bộ vi xử lý có thể thực hiện các lệnh này để hoàn thành nhiệm vụ mã hóa,
giải mã. Các lệnh cũng có thể chuyển đổi sang cấu trúc mạch số, thực hiện các
tính toán trực tiếp trên phần cứng: FPGA, CPLD
1.1 Cấu trúc của hệ thống nén thoại
Hình 1-1: Mô hình hệ thống nén thoại
[4] Hình 1-1 thể hiện mô hình của một hệ thống nén thoại. Tín hiệu thoại
tương tự liên tục theo thời gian từ nguồn phát sẽ được đi qua một bộ lọc tiêu
chuẩn (khử nhiễu), lấy mẫu (biến đổi thời gian rời rạc), và chuyển đổi tương tự-
số (lượng tử hóa chuẩn). Đầu ra sẽ là tín hiệu thoại thời gian rời rạc với các giá
trị mẫu cũng được rời rạc hóa, tín hiệu này được gọi là thoại số.
Hầu hết các hệ thống nén thoại đều được thiết kế để hỗ trợ các ứng dụng
viễn thông, với tần số giới hạn từ 300 đến 3400 Hz. Theo định lý Nyquist, tần số
lấy mẫu phải gấp ít nhất là 2 lần băng thông của tín hiệu. Giá trị tần số khoảng
8kHz thường được chọn làm tần số lấy mẫu chuẩn cho tín hiệu thoại. Để chuyển
5
đổi mẫu tương tự sang tín hiệu số, ta sử dụng lượng tử hóa chuẩn và duy trì chất
lượng thoại nhiều hơn 8 bits/mẫu. Việc sử dụng 16 bits/mẫu sẽ cung cấp chất
lượng thoại cao hơn. Thông thường, chúng ta sẽ sử dụng các tham số cho tín
hiệu thoại số như sau:
Tần số lấy mẫu: 8 kHz
Số lượng bit trên mẫu: 16
Khi đó, bit-rate = 8 * 16 = 128 kbps.
Giá trị bit-rate này được gọi là bit-rate đầu vào, chính là giá trị mà bộ mã
hóa nguồn cố gắng giảm xuống. Đầu ra của mã hóa nguồn sẽ biểu diễn tín hiệu
thoại số đã mã hóa có bit-rate thấp hơn đầu vào càng nhiều càng tốt.
Dữ liệu thoại số mã hóa sẽ được xử lý tiếp qua mã hóa kênh, cung cấp khả
năng chống sai cho dòng bit trước khi truyền lên kênh truyền tải (bị ảnh hưởng
từ rất nhiều nguồn nhiễu). Trong hình 1-1, bộ mã hóa nguồn và mã hóa kênh
được tách biệt với nhau nhưng ta cũng có thể phối hợp 2 quá trình này trong một
bước.
Quá trình giải mã kênh sẽ xử lý dữ liệu đã được chống sai số để lấy lại dữ
liệu đã mã hóa, và truyền sang bộ giải mã nguồn để tạo ra tín hiệu thoại số đầu
ra với bit-rate ban đầu. Tín hiệu thoại số đầu ra được chuyển đổi sang dạng tín
hiệu tương tự thông qua bộ chuyển đổi số-tương tự.
Hình 1-2: Mô hình nén thoại
Có thể rút gọn quá trình mã hóa nguồn và giải mã nguồn như hình 1-2.
Tín hiệu đầu vào (thời gian rời rạc, bit-rate 128 kbps) được đưa vào bộ mã hóa
để tạo ra dòng bit đã mã hóa, hay dữ liệu thoại nén. Bit-rate của dòng bit này
thường thấp hơn tín hiệu đầu vào. Bộ giải mã sẽ nhận dòng bit đã mã hóa làm
đầu vào và khôi phục thành tín hiệu đầu ra, là tín hiệu thời gian rời rạc có cùng
bit-rate của tín hiệu thoại đầu vào ban đầu.
Mô hình mã hóa/giải mã trên hình 1-2 được gọi là mô hình nén thoại, với
tín hiệu thoại đầu vào được mã hóa tạo ra dòng bit có bit-rate thấp. Dòng bit này
lại được truyền đi và làm đầu vào cho bộ giải mã, tạo thành xấp xỉ tín hiệu gốc
ban đầu.
Mã hóa
Giải mã Tín hiệu vào (128kbps)
Dòng bit đã mã hóa
(<128kbps)
Tín hiệu ra
(128kbps)
6
1.2 Các thuộc tính lý tưởng của né