Ngày nay, khoa học và công nghệ đã phát triển vượt bậc. Con người có thể làm được những điều mà tưởng không bao giờ làm được. Mở đầu là sự ra đời và phát triển ồ ạt của máy tính cũng như các phương tiện xử lí thông tin khác, đặc biệt là các hệ thống xử lí song song với tốc độ ngày càng cao. Cùng với sự phát triển đó xử lí tín hiệu số cũng như các ứng dụng của công cụ xử lý tín hiệu số ngày càng áp dụng hiệu quả trong các lĩnh vực thông tin liên lạc, phát thanh truyền hình, tự động điều khiển và các ngành công nghệ khác.
Từ lâu con người đã ước mơ có thể điều khiển các phương tiện thông qua tiếng nói(âm thanh). Với việc ứng dụng kỹ thuật số vào trong việc phân tích nhận dạng tiếng nói đã giúp chúng ta ngày càng đi đến gần ước mơ của mình.
Trong luận văn này, em sử dụng công cụ vi xử lý DSP56002 của Motorola để thực hiện việc nhận dạng tiếng nói. Do đây là một đề tài lớn và kiến thức của em còn rất hạn chế nên phần trình bày chắc chắn có nhiều sai sót, em rất mong sự góp ý và chỉ dẫn của các thầy cô để luận văn được hoàn chỉnh hơn.
60 trang |
Chia sẻ: oanhnt | Lượt xem: 1240 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Đồ án Xây dựng bộ điều khiển và nhận dạng tiếng nói bằng xử lý tín hiệu số dsp56002, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
XÖÛ LYÙ TÍN HIEÄU TIEÁNG NOÙI
Chöông trình naøy giôùi thieäu cuï theå veà pheùp phaân tích thôøi gian ngaén (Short-time Analysis). Tín hieäu ñöôïc taùch thaønh caùc frame daøi N maãu vaø moïi pheùp toaùn ñeàu thöïc hieän treân frame ñoù maø thoâi. Ñaây laø phöông phaùp phaân tích coå ñieån ñoái vôùi caùc tín hieäu khoâng döøng (non-stationary) nhö tín hieäu tieáng noùi. Khi ñaõ chia thaønh caùc frame thì tín hieäu treân töøng frame coù theå ñöôïc xem nhö laø moät tín hieäu döøng vaø moïi pheùp xöû lyù treân frame ñöôïc aùp duïng nhö laø xöû lyù treân moät tín hieäu döøng. Sau khi thöïc hieän STFT trích ñöôïc ñaëc tröng cuûa tín hieäu tieáng noùi seõ duøng phöông phaùp keát hôïp maãu ñeå nhaän daïng tieáng noùi.
I .TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI DUØNG PHEÙP PHAÂN TÍCH STFT
Sau khi ñaõ soá hoaù tín hieäu, chuùng ta baét ñaàu trích ñaëc tröng tieáng noùi cuûa moät tieát nhö chu kyø cao ñoä, formant nhöng tröôùc heát laø phaûi taùch tín hieäu tieáng noùi khoûi nhieãu neàn (khoaûng im laëng) vì tín hieäu thu trong moâi tröôøng nhieãu neân khoaûng im laëng chính laø nhieãu. Taát caû coâng vieäc treân ñeàu coù theå xöû lyù baèng pheùp phaân tích thôøi gian ngaén (Short-time Analysis).
1 . Caùc khaùi nieäm
a) Frame : moät frame tieáng noùi fs(n,m) laø tích cuûa moät cöûa soå ñöôïc dòch w(m-n) vôùi chuoãi tieáng noùi s(n).
fs(n,m)=s(n).w(m-n) (9.1)
b) Naêng löôïng thôøi gian ngaén : haøm naêng löôïng thôøi gian ngaén (short-time energy function) cuûa tín hieäu tieáng noùi coù theå ñöôïc tính baèng caùch chia tín hieäu tieáng noùi ra thaønh caùc khung, töùc laø caùc ñoaïn N maãu lieân tieáp vaø tính toång bình phöông cuûa caùc maãu tín hieäu naøy trong töøng khung. Vieäc chia tín hieäu ra thaønh caùc khung coù theå ñöôïc thöïc hieän baèng caùch nhaân tín hieäu ñoù vôùi moät haøm cöûa soå w(n) thích hôïp vôùi n=0,1,2…N-1. Haøm naøy seõ coù giaù trò baèng 0 beân ngoaøi khoaûng (0, N-1), thoâng thöôøng caùc cöûa soå naøy laø caùc cöûa soå chöõ nhaät coù beà roäng töø 10 ñeán 20 ms. Vôùi moät cöûa soå keát thuùc taïi maãu thöù m, haøm naêng löôïng thôøi gian ngaén E(m) ñöôïc xaùc ñònh bôûi:
(9.2)
Ñoà thò cuûa haøm naêng löôïng thôøi gian ngaén cuûa moät ñoaïn tín hieäu ñöôïc theå hieän treân hình 9.1. Ta thaáy naêng löôïng cuûa tín hieäu lôùn hôn raát nhieàu so vôùi khoaûng im laëng (coù theå xem laø nhieãu).
Hình 9.1
Tín hieäu b) Naêng löôïng thôøi gian ngaén
c) Tyû leä qua ñieåm zero (Zero-crossing rate):
Tyû leä naøy laø moät thoâng soá cho bieát soá laàn maø bieân ñoä tín hieäu ñi qua ñieåm zero trong moät khoaûng thôøi gian cho tröôùc ñöôïc xaùc ñònh bôûi:
(9.3)
Trong ñoù, N laø chieàu daøi cuûa cöûa soå w(m-n).
d) Haøm töï töông quan thôøi gian ngaén :
Hình 9.2 Haøm töï töông quan cuûa frame töông öùng khoaûng cöïc ñaïi cuûa tín hieäu
Haøm töï töông quan (autocorrelation function) cho ta thoâng soá veà söï töông quan cuûa tín hieäu vôùi moät phieân baûn treã cuûa chính noù. Haøm töï töông quan thôøi gian ngaén cuûa frame keát thuùc taïi m:
(9.4)
Hình 9.2 laø ñoà thò haøm töï töông quan thôøi gian ngaén töông öùng khoaûng cöïc ñaïi cuûa tín hieäu hình 9.1 a) söû duïng cöûa soå hình chöõ nhaät N=250. Neáu tín hieäu tuaàn hoaøn thì haøm naøy cöïc ñaïi khi khoaûng treã laø boäi soá cuûa chu kyø cô baûn.
2 . Phaùt hieän ñieåm ñaàu vaø cuoái cuûa moät aâm tieát duøng naêng löôïng frame
Moät trong nhöõng vaán ñeà cô baûn nhaát trong xöû lyù tieáng noùi laø vieäc xaùc ñònh ñieåm ñaàu vaø ñieåm cuoái cuûa chuoãi tieáng noùi ñöôïc phaùt ra. Ñaây laø moät khaâu quan troïng trong quaù trình nhaän daïng maãu tieáng noùi söû duïng kieåu nhaän daïng töø ñôn (isolated-word) theo höôùng phoái hôïp maãu (Pattern Matching Approach) vaø ñöôïc goïi laø end-point detection. Theo kieåu naøy, caùc aâm tieát trong maãu ghi aâm seõ ñöôïc taùch rieâng vaø trích ñaëc tröng cuûa töøng aâm tieát. Vieäc phaùt hieän end-point raát khoù thöïc hieän trong thöïc teá tröø tröôøng hôïp tyû soá tín hieäu treân nhieãu raát lôùn.
Tín hieäu tieáng noùi thu ñöôïc thoâng qua caùc thieát bò ngoaïi vi luoân naèm giöõa khoaûng im laëng. Vieäc ghi aâm trong moâi tröôøng nhieãu neân khoaûng im laëng coøn goïi laø nhieãu. Naêng löôïng thôøi gian ngaén cuûa caùc cöûa soå chöùa tín hieäu coù ích luoân lôùn hôn nhieàu so vôùi ñoaïn chæ coù nhieãu. Do ñoù, neáu chuùng ta ñaët ra moät möùc ngöôõng ñeå phaân bieät giöõa frame chöùa tín hieäu vaø frame chæ goàm nhieãu thì ñoaïn chöùa aâm tieát seõ ñöôïc taùch ra. Vì theá, giaûi thuaät phaùt hieän end-point duøng naêng löôïng frame nhö hình 9.3
Tröôùc tieân, caùc frame nhieãu neàn seõ ñöôïc thu thaäp lieân tuïc tröôùc khi ghi aâm tín hieäu tieáng noùi nhaèm thieát laäp ngöôõng nhieãu. Ngöôõng naøy coù theå xaùc ñònh baèng boäi soá naøo ñoù cuûa naêng löôïng frame nhieãu lôùn nhaát. Sau ñoù, ghi aâm tín hieäu cuûa moät aâm tieát trong khoaûng thôøi gian ñuû daøi ñeå aâm tieát ñöôïc thu troïn veïn vaø tính naêng löôïng frame cho tín hieäu vöøa ghi aâm. Doø töø ñaàu veà cuoái tín hieäu neáu frame naøo coù naêng löôïng lôùn hôn ngöôõng chính laø frame baét ñaàu cuûa tín hieäu vaø tieáp tuïc doø neáu frame coù naêng löôïng nhoû hôn ngöôõng (frame chöùa nhieãu) thì ñaây laø frame keát thuùc cuûa tín hieäu. Cuoái cuøng xeùt tín hieäu vöøa taùch ñöôïc coù phaûi laø nhieãu hay khoâng baèng caùch so saùnh chieàu daøi naøy vôùi chieàu daøi toái thieåu cuûa moät töø. Neáu thoûa ñieàu kieän naøy thì ñaây thaät söï laø aâm tieát, ngöôïc laïi phaûi ghi aâm laïi.
Y
N
BEGIN
Tính naêng löôïng frame cuûa phaàn nhieãu N[k]
Ngöôõng nhieãu ThrNoise = a*max(N[k])
Ghi moät aâm tieát
Tính naêng löôïng caùc frame tín hieäu tieáng noùi E[k]
k = 1
N
k = k+1
Y
Frame ñaàu töø k
Y
Frame cuoái töø k-1
END
E[k]<ThrNoise?
E[k]>ThrNoise?
N
k = k+1
Chieàu daøi >ngöôõng?
Hình 9.3 Giaûi thuaät phaùt hieän ñieåm ñaàu vaø ñieåm cuoái duøng naêng löôïng frame
Giaù trò a töø 2-5%
Nhaän xeùt :
Giaûi thuaät naøy tuy ñôn giaûn nhöng laïi coù nhieàu nhöôïc ñieåm. Chuùng ta khoâng theå xaùc ñònh ñöôïc ñieåm ñaàu vaø ñieåm cuoái cuûa moät aâm tieát vì neáu frame ñaàu ñöôïc xaùc ñònh chính xaùc thì ñieåm baét ñaàu aâm tieát coù theå naèm ôû vò trí naøo ñoù trong frame naøy, daãn ñeán ñoä sai leäch ñieåm ñaàu coù theå baèng chieàu daøi frame N vaø töông töï cho ñieåm cuoái. Ñoù laø tröôøng hôïp lyù töôûng, coøn neáu frame ñaàu xaùc ñònh sai ( trong moâi tröôøng nhieãu dao ñoäng neân ñònh möùc ngöôõng nhieãu khoâng chính xaùc), thì ñoä sai leäch seõ laø boäi soá cuûa N. vaäy duøng naêng löôïng frame ñeå phaùt hieän ñieåm ñaàu vaø cuoái cuûa töøng aâm tieát trong caâu leänh seõ thieáu chính xaùc.
Löu yù :
Coâng vieäc truy tìm frame ñaàu cuûa tín hieäu tieáng noùi coù theå ñöôïc xuaát phaùt töø vò trí frame coù naêng löôïng cöïc ñaïi treân ngöôõng nhieãu (trong ñoaïn tín hieäu thöïc söï). Thöïc hieän theo caùch naøy seõ taêng thôøi gian xöû lyù nhöng heä thoáng thieáu tính thöïc teá vì tín hieäu ñöôïc thu xong môùi tieán haønh endpoint detection. Vì vaäy, muïc ñích cuûa ngöôøi thieát keá giaûi thuaät laø taïo cho giaûi thuaät coù tính thöïc teá cao bôûi vì boä caûm bieán (cuï theå ôû tröôøng hôïp naøy laø micro) cuûa heä thoáng ñieàu khieån chæ caàn thaêm doø vaø kieåm tra moät frame tín hieäu (khoaûng 10-20ms) treân ngöôõng nhieãu laø bieát coù tín hieäu tieáng noùi thu vaøo hay chöa. Töø ñoù coù theå thöïc hieän caùc coâng vieäc song song khaùc nhö vöøa truy tìm tín hieäu vöøa tính STFT ñeå thu ñöôïc phoå cuïc boä. Nhö vaäy keát thuùc endpoint detection cuõng laø keát thuùc coâng vieäc nhaän daïng.
Moät noå löïc khaùc ñeå khaéc phuïc nhöôïc ñieåm treân khi tín hieäu tieáng noùi ñöôïc thu trong moâi tröôøng nhieãu cao laø keát hôïp naêng löôïng frame vaø tyû leä qua ñieåm zero vôùi nhaän xeùt: baûn chaát cuûa “nhieãu” laø tín hieäu ngaãu nhieân neân tyû leä qua ñieåm zero seõ lôùn trong mieàn nhieãu vaø nhoû trong mieàn tín hieäu. Trong khi naêng löôïng frame laïi lôùn trong mieàn tín hieäu vaø nhoû trong mieàn nhieãu. Neáu keát hôïp caû naêng löôïng frame vaø zero-crossing thì chuùng ta taän duïng ñöôïc caû tính chaát cuûa tín hieäu vaø nhieãu.
Tuy nhieân noå löïc naøy vaãn khoâng caûi thieän hieäu quaû cho laém vì chuùng ta phaûi duøng ñeán hai möùc ngöôõng cho naêng löôïng frame vaø zero-crossing.
Hình 9.4
(a,b) Tín hieäu vaø naêng löôïng cuûa töø ‘LEFT’ tröôùc khi taùch khoûi khoaûng nhieãu .
(c,d) Tín hieäu vaø naêng löôïng cuûa töø ‘LEFT’ sau khi taùch khoûi khoaûng nhieãu .
3 . Trích formant duøng pheùp bieán ñoåi STFT
Tieáng noùi laø tín hieäu khoâng döøng (nonstationary signal) goàm nhieàu thaønh phaàn. Veà maët toaùn hoïc, moät ñoaïn tieáng noùi ñöôïc bieåu dieãn vôùi ñoä chính xaùc cao trong khoâng gian Hilbert laø toång cuûa caùc haøm muõ:
(9.5)
Trong ñoù, {Ai(t)} vaø {i(t)} laàn löôït laø taäp bieân ñoä vaø pha töùc thôøi cuûa N thaønh phaàn taàn soá cuûa tín hieäu. Taàn soá goùc töùc thôøi cuûa i(t) laø
(9.6)
Thöïc hieän STFT ñoái vôùi tín hieäu S(t) trong bieåu thöùc (9.5), ta ñöôïc:
(9.7)
Aùp duïng ñònh lyù Parserval,
(9.8)
vaø tính chaát dòch theo thôøi gian, ñònh lyù ñieàu cheá cuûa bieán ñoåi Fourier vaøo (9.7) ta thu ñöôïc :
(9.9)
Trong ñoù, W() vaø S () laàn löôït laø bieán ñoåi Fourier cuûa cöûa soå w (t) vaø tín hieäu S(t), laø taàn soá ñang phaân tích.
Haøm W () coù taùc duïng nhö moät boä loïc thoâng daõy, laøm giôùi haïn phoå tín hieäu S() xung quanh taàn soá trung taâm (hình 9.5). Do ñoù theo (9.9), caùc thaønh phaàn taàn soá trong tín hieäu tieáng noùi seõ aûnh höôûng leân keát quaû STFT trong laân caän cuûa caùc , taïo thaønh caùc ridge cuûa STFT (hình 9.7). Ñieåm cöïc ñaïi cuûa caùc ridge chính laø taàn soá .
W()
Hình 9.5 Bieåu dieãn phoå cuûa tín hieäu vaø phoå cuûa haøm cöûa soå taïi t=
STFT chuyeån tín hieäu moät chieàu thaønh haøm hai bieán vaø. Do ñoù, keát quaû cuûa STFT laø moät aûnh bieåu dieãn caùc thaønh phaàn taàn soá cuûa tín hieäu theo thôøi gian. Hình aûnh naøy ñöôïc goïi laø spectralgram.
Töø keát quaû phaân tích treân, chuùng ta thu ñöôïc caùc ridges töông öùng vôùi caùc taàn soá töùc thôøi trong tín hieäu maø coù bieân ñoä töông ñoái lôùn. Neáu xem moãi thaønh phaàn taàn soá naøy laø moät formant thì ñænh cuûa caùc ridges chính laø hình aûnh cuûa caùc formant trong tín hieäu tieáng noùi.
Hình 9.7c cho pheùp chuùng ta ruùt ra keát luaän laø ñænh cuûa caùc ridges chính laø cöïc ñaïi ñòa phöông cuûa module tính theo höôùng taàn soá. Nhö vaäy neáu tính ñöôïc cöïc ñaïi ñòa phöông module cuûa pheùp bieån ñoåi STFT theo höôùng taàn soá thì coù theå thu ñöôïc hình aûnh bieåu dieãn caùc formant coù trong tín hieäu tieáng noùi.
Nhö vaäy, ñaëc tröng formant trong tín hieäu tieáng noùi ñöôïc trích ra töø döõ lieäu STFT theo giaûi thuaät toång quaùt hình 9.6. Ñaàu tieân, tín hieäu tieáng noùi cuûa moät aâm tieát sau khi qua endpoint detection ñöôïc phaân tích thôøi gian-taàn soá baèng STFT ñeå thu ñöôïc caùc ridges töông öùng vôùi caùc formant. Sau ñoù, keát quaû STFT ñöôïc laáy cöïc ñaïi ñòa phöông module (local maxima modulus) theo höôùng taàn soá ñeå ñònh vò chính xaùc vò trí cuûa caùc formant. Böôùc cuoái cuøng trong coâng vieäc trích caùc formant laø laàn theo veát cuûa caùc cöïc ñaïi ñòa phöông ñeå thu ñöôïc giaù trò cuûa moãi formant theo thôøi gian. Ñeå phuïc vuï cho muïc ñích nhaän daïng, chæ caàn trích 3-5 formant laø ñuû ñeå phaân bieät caùc aâm tieát vôùi nhau.
Tính
STFT
Trích cöïc ñaïi
ñòa phöông
theo höôùng
taàn soá
Trích
formant
formants
S[n]
Hình 9.6 Giaûi thuaät toång quaùt trích ñaëc tröng formant duøng STFT
Hình 9.7 Spetralgram cuûa tín hieäu
a)Tín hieäu goàm 3 thaønh phaàn taàn soá 200,500,700Hz lieân tieáp nhau theo thôøi gian .
b)Bieåu dieãn STFT trong maët phaúng thôøi gian taàn soá .
c)Bieåu dieãn STFT trong khoâng gian 3 chieàu .
Giaûi thuaät trích cöïc ñaïi hoaù ñòa phöông :
Sau khi tính STFT cuûa tín hieäu tieáng noùi, ta thu ñöôïc moät ma traän MPQ coù P haøng öùng vôùi P giaù trò rôøi raïc taàn soá vaø Q coät töông öùng vôùi Q giaù trò rôøi raïc thôøi gian (Q= soá frame). Moãi phaàn töû M(i,j) cuûa ma traän M laø moät heä soá töông öùng taïi ñieåm (i,j) cuûa pheùp phaân tích.
M=
Ñònh nghóa: cöïc ñaïi ñòa phöông cuûa STFT theo höôùng taàn soá chính laø caùc cöïc ñaïi ñòa phöông treân moãi coät cuûa ma traän MPQ. Moät ñieåm (i,j) goïi laø ñieåm cöïc ñaïi ñòa phöông neáu giaù trò cuûa noù lôùn hôn giaù trò cuûa 2 ñieåm laân caän treân vaø döôùi cuûa cuøng coät ñoù, nghóa laø :
M (i,j ) > M (i-1,j ) vaø M (i,j ) > M (i+1,j ) (9.10)
Tuy nhieân, ñaây chæ laø ñònh nghóa mang tính lyù thuyeát. Khi vaän duïng vaøo baøi toaùn cuï theå, chuùng ta phaûi coù moät soá hieäu chænh cho phuø hôïp. Döïa vaøo hình aûnh spectralgram (hình 9.7c), ngoaøi caùc ridges theå hieän caùc formant thöïc söï, phaàn coøn laïi khoâng baèng phaúng maø coù nhöõng “gôïn” nhaáp nhoâ vôùi bieân ñoä nhoû. Neáu theo ñònh nghóa treân thì keát quaû thu ñöôïc laø toå hôïp cuûa moät soá ñieåm khaùc 0 coù giaù trò khaù lôùn theå hieän ñöôøng neùt formant vaø caùc ñieåm khaùc 0 khaùc töông öùng vôùi ñænh cuûa caùc “gôïn”nhaáp nhoâ ñoù, gaây “nhieãu” cho keát quaû phaân tích. Vì caùc ñieåm “nhieãu” naøy coù giaù trò khaù nhoû so vôùi caùc ñieåm theå hieän ñöôøng neùt formant neân caàn ñaët moät möùc ngöôõng ñeå loaïi boû chuùng. Giaù trò cuûa möùc ngöôõng phaûi vöøa ñuû cho hai muïc ñích: loaïi boû caùc ñieåm “nhieãu” vaø giöõ laïi toát caùc ñieåm theå hieän formant coù giaù trò töông ñoái nhoû.
Vaäy ñieåm (i,j ) laø ñieåm cöïc ñaïi ñòa phöông neáu thoaû:
(9.11)
Töø ñònh nghóa naøy, giaûi thuaät trích cöïc ñaïi ñòa phöông khaù ñôn giaûn nhö hình 9.8. Ñaàu tieân, tính ma traän MPQ baèng caùch laáy module cuûa keát quaû phaân tích tín hieäu tieáng noùi baèng STFT. Khôûi ñoäng ma traän MPQ chöùa döõ lieäu local maxima vôùi caùc giaù trò ñeàu baèng 0. Sau ñoù, töøng ñieåm treân moãi coät cuûa ma traän MPQ seõ ñöôïc kieåm tra xem thoaû maõn ñieàu kieän (9.11) khoâng. Neáu thoaû thì ñaây chính laø ñieåm cöïc ñaïi ñòa phöông. Giaù trò cuûa ñieåm naøy seõ ñöôïc gaùn cho caùc ñieåm töông öùng cuûa ma traän APQ. Nhö vaäy, caùc ñieåm coøn laïi cuûa APQ khoâng phaûi laø ñieåm cöïc ñaïi ñòa phöông ñeàu coù giaù trò baèng 0.
START
M=
Ma traän zero A
j=1
j = Q+1?
Vectô coät M(i,j)
i =2
i = P?
M(i-1,j)M(i+1,j)
M(i,j)>ngöôõng?
A(i,j)=M(i,j)
i = i+1
j = j+1
Y
N
N
Y
END
Hình 9.8 Giaûi thuaät trích cöïc ñaïi ñòa phöông
N
Y
Keát quaû trích local maxima cuûa töø “baùo” ñöôïc veõ treân hình 9.9. Tín hieäu ñöôïc laáy maãu ôû taàn soá Fs=8KHz vaø chieàu daøi cuûa tín hieäu ñöôïc giôùi haïn coøn 1600 maãu ñeå tieän cho vieäc phoái hôïp maãu khi nhaän daïng.
Hình 9.9 Keát quaû trích cöïc ñaïi ñòa phöông cuûa töø ‘LEFT’
Giaûi thuaät trích formant töø ma traän cöïc ñaïi ñòa phöông.
Sau khi thu ñöôïc hình aûnh “töông ñoái” cuûa formant trong trích tín hieäu tieáng noùi töø giaûi thuaät trích local maxima, chuùng ta seõ hoaøn taát coâng vieäc trích formant baèng caùch laàn theo veát ñen cuûa caùc ñöôøng local maxima. Ôû ñaây söû duïng hình aûnh “töông ñoái” bôûi vì aûnh local maxima thu ñöôïc khoâng phaûi ñôn thuaàn laø caùc ñieåm theå hieän formant maø coøn coù caû nhieãu maëc duø ñaõ ñaët moät möùc ngöôõng ñeå loaïi boû caùc ñieåm “nhieãu” naøy. Ñaëc ñieåm cuûa caùc ñieåm “nhieãu” laø coù giaù trò nhoû vaø khoâng taïo thaønh caùc ñöôøng neùt lieân tuïc. Do ñoù, caùc formant khôûi ñaàu coù theå ñöôïc xaùc ñònh baèng caùch tìm caùc ñöôøng lieân tuïc trong moät khoaûng coù ñoä roäng nhaát ñònh ôû giöõa aâm tieát (ôû vò trí naøy, caùc formant theå hieän roõ nhaát so vôùi ôû ñaàu vaø cuoái aâm tieát vì ñaây laø ñænh aâm tieát).
Moãi ñieåm treân moät formant coù 2 thoâng soá quan troïng caàn phaûi laáy ñöôïc: giaù trò (taàn soá)formant coù theå xem nhö haøng xuaát hieän formant treân ma traän döõ lieäu vaø bieân ñoä töùc thôøi cuûa formant taïi ñieåm ñoù, chính laø giaù trò cuûa phaàn töû töông öùng treân ma traän döõ lieäu. Giaûi thuaät trích formant töø local maxima cho pheùp thu ñöôïc caû 2 thoâng soá naøy.
START
Ñònh khoaûng truy tìm caùc formant [t1,t2]ôû giöõa tín hieäu
Tìm caùc formant coù theå coù trong khoaûng [t1,t2]
Xaùc ñònh giaù trò vaø bieân ñoä cuûa töøng formant ôû ñieåm giöõa toát nhaát tc[t1,t2]
Trích töøng formant töø töøng caëp giaù trò vaø bieân ñoä cuûa moãi formant ôû ñieåm giöõa tín hieäu tc
END
Hình 9.10 Giaûi thuaät toång quaùt trích formant
Hình 9.10 trình baøy giaûi thuaät trích formant toång quaùt. Ñaàu tieân caàn xaùc ñònh moät khoaûng truy tìm formant [t1,t2] ôû giöõa tín hieäu (t ñöôïc tính baèng soá frame). Khôûi ñaàu vieäc truy tìm caùc formant ñöôïc thöïc hieän baèng trong moät khoái goàm caùc coät töø t1 ñeán t2 trong ma traän döõ lieäu local maxima APQ. Cô sôû cuûa vieäc tìm formant trong khoái naøy laø caùc ñieåm coù giaù trò khaùc 0 treân caùc coät. Do coù caùc ñieåm “nhieãu” neân soá löôïng ñieåm khaùc 0 treân moät coät coù theå nhieàu hôn soá löôïng formant. Tuy nhieân neáu soá löôïng ñieåm “nhieãu” khoâng nhieàu vaø caùc formant khoâng bò ñöùt ñoaïn thì trong khoái truy tìm seõ coù ít nhaát moät coät coù soá löôïng ñieåm khaùc 0 nhoû nhaát, ñaây chính laø soá löôïng formant coù theå coù. Kí hieäu tc laø vò trí coät tìm ñöôïc, tc ñöôïc xaùc ñònh laø ñieåm toát nhaát ñeå baét ñaàu trích formant. Giaù trò (taàn soá) vaø bieân ñoä cuûa töøng formant ôû ñieåm tc ñöôïc xaùc ñònh. Töø caëp giaù trò vaø bieân ñoä ban ñaàu naøy, vieäc trích moãi formant ñöôïc tieáp tuïc baèng giaûi thuaät hình 9.12.
Ñaàu tieân moät ma traän coù kích thöôùc (2Q) ñöôïc khôûi ñoäng vôùi caùc phaàn töû ñeàu baèng 0 ñeå chuaån bò chöùa döõ lieäu keát quaû cuûa moät formant (haøng ñaàu chöùa giaù trò vaø haøng thöù 2 chöùa bieân ñoä formant). Taïi ñieåm tc, giaù trò vaø bieân ñoä ban ñaàu ñöôïc thieát laäp theo giaù trò ñaõ xaùc ñònh ôû phaàn tröôùc. Töø ñieåm giöõa tc, vieäc truy tìm formant ñöôïc thöïc hieän theo 2 höôùng: laàn theo veát formant cho ñeán cuoái tín hieäu (theo chieàu taêng cuûa t), vaø truy ngöôïc veà ñaàu tín hieäu (theo chieàu giaûm cuûa t). trong caû 2 höôùng truy tìm, giaù trò formant taïi ñieåm tc ñöôïc duøng nhö moät giaù trò khôûi ñaàu.
Hình 9.11 Minh hoïa khoaûng truy tìm caùc formant [t1 t2] ôû giöõa tín hieäu .
Formant taïi ñieåm t ñöôïc xaùc ñònh nhôø giaù trò ƒ cuûa formant taïi thôøi ñieåm vöøa tìm ñöôïc tröôùc ñoù (t-1 khi tìm theo chieàu taêng hoaëc t+1 khi tìm theo chieàu giaûm cuûa t). Do ñaëc tröng cuûa tieáng noùi coù caùc formant thay ñoåi chaäm theo thôøi gian, neân giaù trò formant taïi ñieåm t chæ coù theå thay ñoåi moät khoaûng ƒ khaù nhoû xung quanh giaù trò ƒ ôû caùc ñieåm laân caän cuûa t (tt). Do ñoù ta coù theå giôùi haïn vieäc truy tìm formant (ôû ñieåm t) trong moät khoái xaùc ñònh bôûi caùc laân caän cuûa f (f t) vaø t (tt) treân ma traän döõ lieäu local maxima APQ, goïi laø khoái truy tìm formant. Trong khoái naøy, formant taïi ñieåm ñang tìm coù theå xaùc ñònh baèng ñieåm coù giaù trò lôùn nhaát. Neáu toàn taïi caùc ñieåm cöïc ñaïi coù giaù trò lôùn hôn 0 trong khoái truy tìm thì giaù trò cuûa ñieåm ñoù ñöôïc xem laø bieân ñoä cuûa formant vaø soá thöù töï cuûa haøng xuaát hieän ñieåm cöïc ñaïi trong ma traän APQ coù theå xem laø giaù trò cuûa formant taïi ñieåm truy tìm t. Ngöôïc laïi neáu khoái truy tìm chæ goàm caùc ñieåm coù giaù trò 0, thì formant taïi ñieåm t ñaõ bò maát, taïo thaønh moät khoaûng ñöùt ñoaïn treân ñöôøng neùt formant. Neáu khoaûng ñöùt ñoaïn laø khaù ngaén (nhoû hôn moät giaù trò ngöôõng), thì vieäc formant bò ñöùt coù theå do giôùi haïn ñoä phaân giaûi cuûa pheùp phaân tích vaø ta coù theå khaéc phuïc baèng caùch laáy giaù trò vaø bieân ñoä cuûa formant ôû ñieåm tröôùc ñoù gaùn cho ñieåm ñang xeùt. Ngöôïc laïi, neáu khoaûng bò ñöùt quaù lôùn, thì khoaûng ñoù thöïc söï khoâng coù formant vaø vieäc truy tìm coù theå chaám döùt.
Theo nguyeân taéc treân, formant taïi ñieåm (tc+1) ñöôïc xaùc ñònh nhôø söû duïng giaù trò formant taïi tc laøm taâm cuûa khoái truy tìm. Tieáp tuïc,