· Tín hiệu Audio được cho vào 1 băng lọc gồm M mạch lọc thông dãi chiếm đầy phổ tần nghe được.
· Mô hình âm tâm lý được sử dụng để tính toán ngưỡng che cho mỗi băng phụ.
· Lối ra của mỗi mạch lọc được lấy mẫu tới hạn, và được lượng tử hoá và mã hoá một cách riêng biệt.
· Việc lượng tử hoá của mỗi băng phụ được dựa trên tỉ số năng lượng đỉnh trên mức che (độ chênh lệch giữa các thành phần các mức SPL cao nhất và ngưỡng che) tính được cho mỗi băng phụ.
14 trang |
Chia sẻ: vietpd | Lượt xem: 1791 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Tìm hiểu kỹ thuật mã hóa thụ cảm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
NỘI DUNG BÁO CÁO
Yêu cầu của đề tài.
Tìm hiểu về kỹ thuật mã hóa thụ cảm.
Phân tích MPEG-1 Layer 3 (MP3).
Giới thiệu chương trình.
Kết luận và hướng phát triển.
PHẦN I: YÊU CẦU CỦA ĐỀ TÀI
Các kỹ thuật mã hoá âm thanh
Phân tích quá trình mã hóa mpeg 1 layer 3.
Phân tích quá trình giải mã mpeg 1 layer 3.
Viết chương trình giải mã tập tin MPEG-1 Layer III, phát lại ra loa.
PHẦN II : TÌM HIỂU KỸ THUẬT MÃ HÓA THỤ CẢM
1. MÃ HÓA BĂNG PHỤ.
Tín hiệu Audio được cho vào 1 băng lọc gồm M mạch lọc thông dãi chiếm đầy phổ tần nghe được.
Mô hình âm tâm lý được sử dụng để tính toán ngưỡng che cho mỗi băng phụ.
Lối ra của mỗi mạch lọc được lấy mẫu tới hạn, và được lượng tử hoá và mã hoá một cách riêng biệt.
Việc lượng tử hoá của mỗi băng phụ được dựa trên tỉ số năng lượng đỉnh trên mức che (độ chênh lệch giữa các thành phần các mức SPL cao nhất và ngưỡng che) tính được cho mỗi băng phụ.
Tỉ số này được sử dụng bởi bộ phân phối bit để phân bố số bit cần thiết cho việc lượng tử hoá mỗi băng phụ, các thành phần thấp hơn ngưỡng che thì không được mã hoá.
Cuối cùng các mẫu lượng tử hoá được đóng thành các khung dữ liệu, trong khung có kèm theo các dữ liệu phụ khác.
MÃ HOÁ BIẾN ĐỔI
Các mẫu Audio trong miền thời gian được chuyển sang miền tần số nhờ các phép biến đổi toán học.
Các bộ mã hoá có thể sử dụng các phép biến đổi như phép biến đổi Fourier rời rạc DFT( Discrete Fourier Transform) hoặc MDCT.
Các hệ số có được từ các phép biến đổi được lượng tử hoá và mã hoá dựa trên mô hình âm tâm lý, các thành phần bị che được loại bỏ.
Làm giảm Entropy của tín hiệu cho phép mã hoá hiệu quả hơn.
PHẦN III :PHÂN TÍCH MPEG -1 LAYER III
MODE:
Chuẩn MPEG có 4 chế độ:
Mono.
Dual channel.
Stereo.
Intensity Stereo (còn gọi là Joint Stereo).
TỐC ĐỘ LẤY MẪU:
Một số tốc độ lấy mẫu:
32 kHz, 44.1 kHz và 48 kHz đối với MPEG 1 (Tiêu chuẩn ISO/IEC 11172-3).
3. LỚP III: Lớp này đưa ra mức độ nén và lọc cao hơn cả lớp II và sử dụng một bộ mã hóa Huffman.
Layer
Complexity
Encoder
Decoder
I
1.5 – 3
1
II
2 – 4
1.25
III
> 7.5
2.5
Lớp III là chuẩn hiệu quả nhất và đã trở thành chuẩn trong thực tế cho việc mã hoá chất lượng âm thanh.
Những cải thiện của lớp 3 so với lớp 1 và lớp 2 :
Giảm sự chồng phổ.
Lượng tử hóa phi tuyến.
Mã hóa entropy các giá trị dữ liệu.
Sử dụng bộ dự trữ bit.
ĐỊNH DẠNG KHUNG DỮ LIỆU:
Frame bao gồm 4 phần : tiêu đề,thông tin ,dữ liệu chính, dữ liệu phụ.
a. Tiêu đề (Header): có chiều dài 4 bytes (32 bits) và chứa thông tin về lớp , tốc độ bit, tần số mẫu và chế độ stereo được mô tả cụ thể như sau:
b. Thông tin (Side information ) :có chiều dài là 256 bit
Main data begin
Private bits
Scale factor
SI granules 0
SI granules 1
c. Dữ liệu chính (Main data) :
Chứa hệ số tỉ lệ và mẫu tần số đã được mã hóa.
Chiều dài phụ thuộc tốc độ bit chứa trong header và dữ liệu phụ.
Ví dụ về việc quản lý dữ liệu chính như sau :
d. Dữ liệu phụ :
Do người dùng định nghĩa, nhưng không cần thiết giải mã.
5. QUÁ TRÌNH MÃ HÓA:
Ví dụ ta có chuỗi cần mã hoá là “HUFFMAN”.
Symbol Xác suất
H 1 / 7
U 1 / 7
F 2 / 7
M 1 / 7
A 1 / 7
N 1 / 7
6. QUÁ TRÌNH GIẢI MÃ:
Giải mã Huffman:
F5-10
0 1
F4-6
F3-4
F2-3
e-3
o - 2
a - 2
F1-2
i - 1
! -1
u-1
Sự lượng tử hóa lại (Requantization):
Dùng hệ số tỉ lệ để chuyển đổi giá trị mã hóa Huffman thành giá trị quang phổ sử dụng công thức sau:
xri = isi4/3 * 2 ( 0.25 * C )
Sự sắp xếp lại (Reordering):
Sau khi lượng tử hóa các mẫu xong phải sắp xếp lại băng tỉ lệ dùng cửa sổ ngắn .
Để tạo cho việc mã hóa Huffman hiệu quả hơn .
Ví dụ
Giải mã âm thanh (Stereo)
Giảm bớt biệt danh
IMDCT:biến đổi vạch phổ (Xk) thành khối lọc đa pha mẫu subband (Si) sử dụng công thức sau :
xi= Xkcos[ π/2n [2i+1+n/2](2k+1)],for i=0 to n-1
Tổng hợp tầng lọc đa pha :
Tần lọc đa pha chuyển 32 subband thành 32 mẫu PCM .
PHẦN IV : GIỚI THIỆU CHƯƠNG TRÌNH
PHẦN V : KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
KẾT LUẬN:
Kết quả đạt được:
Giải mã file mp3 và phát ra loa chỉ được một bài hát.
Thực hiện được các chức năng của chương trình như mở file mp3, giải mã và phát ra loa, tạm dừng hay ngưng hẳn.
Một số hạn chế:
Chưa phát được nhiều file mp3 liên tục.
Chưa điều chỉnh được pass, treble hay độ cân bằng của volume
2. HƯỚNG PHÁT TRIỂN:
Chọn được một danh sách các file mp3 và phát liên tục các file mp3 đó.
Hay điều chỉnh được pass, treble, hay điều chỉnh được độ cân bằng của volume.
Lặp lại một bài hát hay các chức năng khác như trong những chương trình nghe nhạc phổ biến hiện nay như: Winamp, Herosoft …