MUÏC LUÏC
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC MUÏC LUÏC
Lôøi caûm ôn
......................................................................................................................... i
Toùm taét
........................................................................................................................ ii
Muïc luïc
....................................................................................................................... iii
Chöông 0: MÔÛ ÑAÀU ................................................................................................................. 1 Chöông 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI ..................... 3 I. Nhöõng vaán ñeà cô baûn cuûa tieáng noùi .............................................................................. 3 1. Boä maùy phaùt aâm cuûa con ngöôøi ........................................................................ 3 2. Cô quan thính giaùc cuûa con ngöôøi .................................................................... 7 3. Ngöõ aâm tieáng Vieät ............................................................................................. 9 II. Toång quan veà nhaän daïng tieáng noùi ............................................................................. 10 1. Sô löôïc veà nhaän daïng tieáng noùi....................................................................... 10 2. Phaân loaïi .......................................................................................................... 10 3. Caùc höôùng nghieân cöùu nhaän daïng tieáng noùi ................................................... 11 III. Toùm taét ...................................................................................................................... 13 Chöông 2: CÔ SÔÛ XÖÛ LÍ SOÁ TÍN HIEÄU.............................................................................. 15 I. Chuoãi soá ...................................................................................................................... 15 1. Haøm laáy maãu.................................................................................................... 15 2. Söû duïng haøm laáy maãu ...................................................................................... 16 3. Phoå cuûa tín hieäu laáy maãu ................................................................................. 17 4. Lieân heä giöõa phoå cuûa tín hieäu lieân tuïc vaø tín hieäu rôøi raïc ............................. 17 5. Chuoãi xung ñôn vò ............................................................................................ 18 II. Caùc pheùp toaùn tuyeán tính baát bieán .............................................................................. 19 1. Tính nhaân quaû .................................................................................................. 20 2. Phöông trình sai phaân....................................................................................... 21 3. Bieán ñoåi Z cuûa pheùp toaùn LTI ......................................................................... 21 4. Haøm truyeàn trong mieàn taàn soá cuûa pheùp toaùn LTI ......................................... 23 5. Lieân heä giöõa bieán ñoåi Z vaø bieán ñoåi Fourier .................................................. 23 III. Loïc soá ...................................................................................................................... 24 1. Ñònh nghóa ........................................................................................................ 24 2. Caùc boä loïc lyù töôûng .......................................................................................... 26 3. Boä loïc thöïc teá ................................................................................................... 28 4. Boä loïc FIR vaø IIR............................................................................................. 29 IV. Bieán ñoåi Fourier rôøi raïc ............................................................................................... 30 1. Daïng DFT......................................................................................................... 30 2. Tính chaát cuûa DFT ........................................................................................... 31 3. Phoå coâng suaát ................................................................................................... 31 4. Phoå trung bình .................................................................................................. 32 5. Bieán ñoåi Fourier nhanh .................................................................................... 33 V. Bieán ñoåi Fourier thôøi gian ngaén – STFT ..................................................................... 34 1. Coâng thöùc bieán ñoåi........................................................................................... 35 LUAÄN VAÊN TOÁT NGHIEÄP
- iii -
SVTH: HAØ THUÙC PHUØNG
MUÏC LUÏC
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
2. Moät soá haøm cöûa soå duøng trong STFT.............................................................. 36 VI. Xaùc suaát vaø quaù trình ngaãu nhieân ............................................................................... 38 1. Cô sôû xaùc suaát .................................................................................................. 39 2. Bieán ngaãu nhieân ............................................................................................... 40 3. Kyø voïng, phöông sai ........................................................................................ 40 VII. Toùm taét ...................................................................................................................... 41 Chöông 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI .................................................................. 42 I. II. III. IV.
Haøm naêng löôïng thôøi gian ngaén .................................................................................. 42 Phaùt hieän ñieåm ñaàu, ñieåm cuoái cuûa moät töø ................................................................ 42 Tieàn nhaán (Pre-emphasis) ........................................................................................... 45 Trích ñaëc tröng(Mel-scale Frequency Cepstral Coefficient) .................................... 46 1. Cöûa soå hoùa ....................................................................................................... 48 2. Bieán ñoåi Fourier rôøi raïc ................................................................................... 49 3. Loïc qua boä loïc Mel-scale ................................................................................ 49 4. Tính log naêng löôïng phoå .................................................................................. 51 5. Bieán ñoåi Fourier ngöôïc .................................................................................... 51 V. Toùm taét ...................................................................................................................... 52
Chöông 4: LÖÔÏNG TÖÛ VECTOR ........................................................................................ 53 I. II. III. IV.
Caùc yeáu toá khi toå chöùc VQ .......................................................................................... 53 Taäp huaán luyeän VQ ..................................................................................................... 54 Ño ñoä meùo.................................................................................................................... 54 Phaân nhoùm caùc vector huaán luyeän .............................................................................. 54 1. Giaûi thuaät cuïm thoâng tin (Cluster Algorithm) ................................................. 55 2. Giaûi thuaät Binary Split ..................................................................................... 57 V. Phaân lôùp vector ............................................................................................................ 58 VI. Nhaän daïng baèng VQ .................................................................................................... 59 VII. Toùm taét ...................................................................................................................... 60 Chöông 5: MOÂ HÌNH MARKOV AÅN (HIDDEN MARKOV MODEL)........................... 61 I. Khaùi nieäm..................................................................................................................... 61 1. Chuoãi Markov .................................................................................................. 61 2. Caùc ví duï .......................................................................................................... 62 3. Moâ hình Markov aån ......................................................................................... 64 II. Caùc thaønh phaàn cuûa HMM .......................................................................................... 64 III. Ba baøi toaùn cô baûn cuûa HMM ..................................................................................... 66 1. Baøi toaùn 1 ......................................................................................................... 67 2. Baøi toaùn 2 ......................................................................................................... 71 3. Baøi toaùn 3 ......................................................................................................... 75 IV. Phaân loaïi moâ hình Markov aån ..................................................................................... 77 V. Vaán ñeà tæ leä khi toå chöùc moâ hình Markov aån .............................................................. 78 VI. Ña quan saùt................................................................................................................... 82 VII. Caùc maãu maät ñoä HMM ................................................................................................ 83 1. Maãu maät ñoä rôøi raïc .......................................................................................... 83 LUAÄN VAÊN TOÁT NGHIEÄP
- iv -
SVTH: HAØ THUÙC PHUØNG
MUÏC LUÏC
VIII. IX. X. XI. XII.
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
2. Maãu maät ñoä lieân tuïc ........................................................................................ 83 3. Maãu maät ñoä baùn lieân tuïc ................................................................................. 85 Khôûi taïo caùc tham soá cho HMM ................................................................................. 86 AÛnh höôûng cuûa taäp döõ lieäu khoâng ñaày ñuû .................................................................. 87 Toå chöùc nhaän daïng tieáng noùi baèng HMM ................................................................... 87 Öu ñieåm nhöôïc ñieåm cuûa HMM ................................................................................. 88 Toùm taét ...................................................................................................................... 89
Chöông 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG ........................................................ 90 I. II. III. IV. V. VI.
Trích ñaëc tröng tieáng noùi ............................................................................................. 90 Löôïng töû hoùa vector ..................................................................................................... 93 Giaûi thuaät huaán luyeän HMM ....................................................................................... 94 Giaûi thuaät nhaän daïng ................................................................................................... 96 Giao dieän chöông trình ................................................................................................ 97 Maïch chaáp haønh ......................................................................................................... 101
Chöông 7: KEÁT QUAÛ KEÁT LUAÄN VAØ HÖÔÙNG PHAÙT TRIEÅN ...................................102 I. Keát quaû ....................................................................................................................... 102 II. Keát luaän ...................................................................................................................... 103 III. Höôùng phaùt trieån ........................................................................................................ 104 TAØI LIEÄU THAM KHAÛO ...................................................................................................106
LUAÄN VAÊN TOÁT NGHIEÄP
-v-
SVTH: HAØ THUÙC PHUØNG
Chöông 0: MÔÛ ÑAÀU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Chöông 0:
MÔÛ ÑAÀU Ñaõ töø laâu, con ngöôøi luoân mô öôùc ñeán moât heä thoáng ñieàu khieån töï ñoäng “thoâng minh” coù theå giao tieáp ñöôïc con ngöôøi thaân thieän vaø gaàn guõi. Phöông tieän giao tieáp giöõa ngöôøi vaø maùy ñöôïc nghó ñeán ñaàu tieân laø tieáng noùi. Con ngöôøi muoán duøng tieáng noùi cuûa mình ñeå ñieàu khieån thieát bò maø khoâng caàn duøng nhieàu ñeán 2 baøn tay. Ñieàu naøy baây giôø khoâng coøn quaù xa vôøi nöõa. ÔÛ caùc nöôùc phaùt trieån, caùc heä nhaän daïng tieáng noùi coù maët ôû khaép moïi nôi hay baát cöù luùc naøo nhö: giao dòch ngaân haøng, mua saém qua ñieän thoaïi, truy caäp cô sôû döõ lieäu töø xa, goùp phaàn vaøo phaàn vaøo caùc heä baûo maät cho caùc khu vöïc rieâng, caùc heä ñieàu khieån giao tieáp ngöôøi maùy, vaø raát coù yù nghóa khi laø coâng cuï giuùp ñôõ nhöõng ngöôøi khieám thò, khuyeát taät trong sinh hoaït hoïc taäp haøng ngaøy... Ñeå thöïc hieän ñöôïc ñieàu naøy, con ngöôøi phaûi xaây döïng 1 heä thoáng hieåu ñöôïc tieáng noùi cuûa con ngöôøi, ñoù laø heä thoáng nhaän daïng tieáng noùi. Hieän nay treân theá giôùi ñaõ coù raát nhieàu nghieân cöùu vaø thöû nghieäm veà heä thoáng nhaän daïng tieáng noùi vaø ñaõ ñaït ñöôïc nhöõng thaønh töïu nhö: Via Voice Mellennium (IBM), Via Voice Standard( IBM), CSLU(Center of Spoken Language Understanding),HTK Toolkit…nhöõng heä thoáng naøy ñöôïc xaây döïng ñeå nhaän daïng tieáng Anh, ngoaøi ra coøn coù moät soá heä thoáng nhaän daïng tieáng noùi cuûa caùc ngoân ngöõ khaùc nhö: Trung Quoác, YÙ, Ñöùc… ÔÛ Vieät Nam, coù 2 trung taâm lôùn nghieân cöùu lónh vöïc xöû lyù tieáng noùi vaø tieáng Vieät laø: Vieän Coâng ngheä thoâng tin vaø Trung taâm nghieân cöùu quoác teá Thoâng tin ña phöông tieän, truyeàn thoâng vaø öùng duïng(MICA)-Ñaïi hoïc Baùch khoa Haø Noäi. Ngoaøi ra, coøn coù caùc luaän aùn tieán só, thaïc só lieân quan ñeán vaán ñeà xöû lyù tieáng noùi ôû caùc tröôøng Ñaïi hoïc trong nöôùc. Luaän vaên naøy nghieân cöùu nhöõng yù töôûng cô baûn cuûa heä thoáng nhaän daïng tieáng noùi tieáng Vieät, tìm hieåu giaûi thuaät nhaän daïng tieáng noùi ñaõ vaø ñang ñöôïc thöïc hieän treân theá giôùi; xaây döïng moät boä ñieàu khieån baèng tieáng noùi – tieáng Vieät döïa treân nhöõng boä töø vöïng nhoû(15 töø) vaø thieát laäp heä thoáng ñieàu khieån baèng tieáng noùi vôùi moät taäp leänh coá ñònh. Moâ hình ñieàu khieån ñeøn vaø quaït laø nhöõng öùng duïng thöïc teá mang tính thöû nghieäm cuûa ñeà taøi. Nhieäm vuï chính cuûa luaän vaên bao goàm: Nghieân cöùu phöông phaùp vaø thöïc hieän caùc giaûi thuaät taùch töø, trích ñaëc tröng tieáng noùi, thöïc hieän vieäc huaán luyeän vaø nhaän daïng tieáng noùi Tieáng Vieät duøng phöông phaùp moâ hình Markov aån keát hôïp vôùi phöông phaùp löôïng töû Vector. Xaây döïng moâ hình ñieàu khieån thöïc teá mang tính thöïc nghieäm cho ñeà taøi Trong thôøi gian haïn cheá vôùi möùc ñoä phöùc taïp cuûa vaán ñeà, luaän vaên naøy chæ laø nhöõng nghieân cöùu ban ñaàu cho ñeà taøi nhaän daïng tieáng noùi - tieáng Vieät. Heä thoáng nhaän daïng LUAÄN VAÊN TOÁT NGHIEÄP
-1-
SVTH: HAØ THUÙC PHUØNG
Chöông 0: MÔÛ ÑAÀU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
tieáng noùi – tieáng Vieät khoâng theå döøng laïi ôû moät boä töø vöïng coøn quaù nhoû. Tuy vaäy, ñeà taøi naøy môû ñaàu cho vieäc nghieân cöùu vaø thöïc hieän heä thoáng ñieàu khieån thieát bò baèng tieáng noùi moät caùch hoaøn chænh theo thôøi gian thöïc vôùi boä töø vöïng lôùn hôn. Vaø khoâng nhöõng ñöôïc öùng duïng trong ñieàu khieån, ñeà taøi coøn coù theå tieáp tuïc nghieän cöùu aùp duïng cho caùc moâ hình roäng raõi khaùc giaûi quyeát cho toaøn boä töø ñieån tieáng Vieät trong töông lai.
LUAÄN VAÊN TOÁT NGHIEÄP
-2-
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Chöông 1:
GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI I. NHÖÕNG VAÁN ÑEÀ CÔ BAÛN CUÛA TIEÁNG NOÙI: 1. Boä maùy phaùt aâm cuûa con ngöôøi: a. Cô cheá phaùt aâm: Sô ñoà heä thoáng phaùt aâm cuûa ngöôøi ñöôïc minh hoïa nhö hình veõ:
Hình 1.1: Boä maùy phaùt aâm (1) Khoang muõi, (2) Voøm mieäng cöùng, (3) OÅ raêng, (4) Voøm mieäng meàm, (5)-(6)-(8) Löôõi, (7) Löôõi gaø, (9) Hoïng, (10) Naép thanh quaûn, (11)-(12) Daây thanh aâm, (13) Thanh quaûn, (14) Thöïc quaûn, (15) Khí quaûn. Heä thoáng phaùt aâm ôû ngöôøi bao goàm: phoåi (lung), khí quaûn (trachea), thanh quaûn (thanh quaûn), khoang mieäng (oral cavity) vaø khoang muõi (nasal cavity). Thanh quaûn chöùa hai neáp gaáp goïi laø daây thanh aâm (vocal cords), seõ keùo caêng khi phaùt ra tieáng noùi. Khoang mieäng goàm moät oáng aâm thanh (acoustic tube) daøi khoaûng 17 cm ôû ngöôøi nam, phaàn tröôùc keát thuùc ôû moâi vaø phaàn sau keát thuùc ôû daây thanh aâm hoaëc thanh quaûn. Khoang mieäng ñoùng vai troø laø moät hoäp coäng höôûng ñoäng, theå tích cuûa noù coù theå ñöôïc ñieàu khieån bôûi boä maùy phaùt aâm ( moâi, löôõi, quai haøm, vaø voøm mieäng meàm). Khoang muõi laø moät oáng daøi khoaûng 12 cm ôû ngöôøi nam, keát thuùc ôû loã muõi vaø voøm mieäng meàm. Voøm mieäng meàm (velum) seõ ñieàu khieån hôi phaùt ra theo ñöôøng LUAÄN VAÊN TOÁT NGHIEÄP
-3-
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
mieäng hoaëc ñöôøng muõi. Ñoái vôùi nhöõng aâm khoâng theo gioïng muõi (non-nasalised), voøm mieäng meàm seõ ñoùng khoang muõi vaø hôi chæ phaùt ra theo ñöôøng mieäng. Ñoái vôùi nhöõng aâm coù gioïng muõi, voøm mieäng meàm seõ dòch chuyeån xuoáng phía döôùi, ñoùng ñöôøng mieäng vaø hôi chæ phaùt ra theo ñöôøng muõi. Tröôøng hôïp thöù ba laø hôi ñöôïc phaùt ra theo caû hai ñöôøng. Quaù trình phaùt aâm: khi noùi, phoåi chöùa ñaày khoâng khí. Löôïng khoâng khí naøy seõ ñöôïc ñaåy qua khí quaûn vaø thanh moân (glottis). Luoàng khoâng khí qua thanh moân seõ kích thích daây thanh aâm dao ñoäng taïo ra söï phaùt aâm. AÂm thanh naøy ñöôïc truyeàn ra ngoaøi qua khoang mieäng vaø khoang muõi. Caùc khoang naøy coù taùc duïng nhö boä loïc laøm suy hao moät vaøi taàn soá trong khi cho caùc taàn soá khaùc ñi qua. b. Ñaëc tröng vaät lyù: - Ñoä cao: Laø möùc ñoä cao thaáp cuûa aâm, phuï thuoäc vaøo söï chaán ñoäng nhanh hay chaäm cuûa khoâng khí trong moät khoaûng thôøi gian nhaát ñònh, ñöôïc goïi laø taàn soá dao ñoäng. Taàn soá dao ñoäng caøng lôùn thì aâm thanh caøng cao. - Ñoä maïnh: Thöôøng ñöôïc goïi laø cöôøng ñoä, do bieân ñoä dao ñoäng quyeát ñònh. Trong ngoân ngöõ, phuï aâm thöôøng maïnh hôn nguyeân aâm, ñaây chính laø moät trong nhöõng ñaëc ñieåm goùp phaàn nhaän dieän söï khaùc bieät giöõa phuï aâm vaø nguyeân aâm trong aâm thanh tieáng noùi. - Ñoä daøi: Laø tröôøng ñoä cuûa aâm, phuï thuoäc vaøo söï chaán ñoäng laâu hay mau cuûa caùc phaàn töû khoâng khí. Ñoä daøi ñöôïc söû duïng ñeå phaân bieät caùc nguyeân aâm daøi vaø ngaén, nhö phaân bieät ‚a‛ vôùi ‚aê‛, ‚ô‛ vôùi ‚aâ‛ trong tieáng Vieät. - AÂm saéc: Laø saéc thaùi rieâng cuûa moät aâm do caùc caù theå khaùc nhau taïo ra. AÂm saéc laø nguyeân nhaân gaây ra söï khaùc bieät giöõa gioïng noùi cuûa ngöôøi naøy vôùi ngöôøi khaùc. AÂm saéc coù ñöôïc laø do hieän töôïng coäng höôûng. - Tieáng oàn vaø tieáng thanh: Tieáng oàn laø do söï chuyeån ñoäng khoâng nhòp nhaøng (khoâng coù chu kyø oån ñònh) cuûa caùc phaàn töû khoâng khí gaây ra. Tieáng thanh laø do söï chuyeån ñoäng nhòp nhaøng (coù chu kyø oån ñònh) cuûa caùc phaàn töû khoâng khí gaây ra. LUAÄN VAÊN TOÁT NGHIEÄP
-4-
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Phaân loaïi tieáng noùi: - AÂm höõu thanh: Ñöôïc taïo ra khi daây thanh aâm caêng leân vaø rung khi aùp suaát khoâng khí taêng leân, laøm cho thanh moân môû ra roài ñoùng laïi khi luoàng khoâng khí ñi qua. Boä phaän phaùt aâm hoaït ñoäng gioáng nhö hoäp coäng höôûng, khuyeách ñaïi nhöõng thaønh phaàn haøi naøy vaø laøm suy giaûm nhöõng thaønh phaàn haøi khaùc ñeå taïo ra aâm höõu thanh. Möùc ñoä rung cuûa daây thanh aâm tuøy thuoäc vaøo aùp suaát khoâng khí ôû phoåi vaø söùc caêng cuûa daây thanh aâm. Ngöôøi noùi coù theå ñieàu khieån 2 yeáu toá treân ñeå thaøy ñoåi chu kì cô baûn (ñöôïc goïi laø pitch) cuûa aâm thanh. ÔÛ ngöôøi ñaøn oâng, taàn soá cô baûn khoaûng töø 50÷250 Hz, trong khi ôû phuï nöõ laø thöôøng rôi vaøo khoaûng 120÷500 Hz. Trong ngoân ngöõ, caùc nguyeân aâm veà baûn chaát aâm hoïc laø nhöõng aâm höõu thanh. - AÂm voâ thanh: Ñöôïc taïo ra khi daây thanh aâm khoâng rung. Coù hai loaïi aâm voâ thanh cô baûn: aâm xaùt vaø aâm baät hôi. Ñoái vôùi aâm xaùt, ví duï khi noùi ‚s‛, ‚x‛, moät soá ñieåm treân boä phaän phaùt aâm bò co laïi khi luoàng khoâng khí ñi ngang qua noù, hoãn loaïn xaûy ra taïo neân nhieãu ngaãu nhieân. Bôûi vì nhöõng ñieåm co thöôøng ôû phía tröôùc mieäng, coäng höôûng cuûa boä phaän phaùt aâm coù aûnh höôûng nhoû ñeán ñaëc tính cuûa aâm xaùt. Ñoái vôùi aâm baät hôi, nhö khi ta noùi ‘h’ trong ‚huøng‛, hoãn loaïn xaûy ra ôû gaàn thanh moân khi daây thanh aâm bò giöõ nheï moät phaàn. Tröôøng hôïp naøy, coäng höôûng cuûa boä phaän phaùt aâm seõ bieán ñieäu phoå cuûa nhieãu ngaãu nhieân. Hieäu öùng naøy coù theå nghe roõ khi noùi thì thaàm. Caáu taïo cô baûn cuûa phuï aâm trong moïi ngoân ngöõ laø aâm voâ thanh. Ngoaøi hai loaïi aâm cô baûn ôû treân, coøn coù moät loaïi aâm trung gian vöøa mang tính chaát nguyeân aâm, vöøa mang tính chaát phuï aâm, ñöôïc goïi laø baùn nguyeân aâm hay baùn phuï aâm. Ví duï nhö aâm ‘i’ vaø ‘u’ trong nhöõng töø ‘ai’, ‘aâu’. - AÂm baät hôi: Khi phaùt caùc aâm naøy, boä maùy phaùt aâm seõ ñöôïc ñoùng laïi hoaøn toaøn taïi moät ñieåm naøo ñoù trong boä maùy phaùt aâm. Aùp suaát khoâng khí trong boä maùy phaùt aâm seõ taêng leân töùc thôøi vaø ñöôïc giaûi phoùng moät caùch ñoät ngoät. Söï giaûi thoaùt nhanh choùng cuûa aùp suaát naøy seõ taïo neân moät söï kích thích taïm thôøi cuûa boä maùy phaùt aâm.
LUAÄN VAÊN TOÁT NGHIEÄP
-5-
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
c. Moâ hình loïc nguoàn taïo tieáng noùi: Hình 1.2 minh hoïa moâ hình raát ñôn giaûn cuûa boä phaän phaùt ra nguyeân aâm ‚e‛ laø moät oáng ñeàu coù chieàu daøi L, moät ñaàu nguoàn aâm thanh(daây thanh aâm) vaø ñaàu kia ñöôïc môû ra(moâi). OÁng naøy coäng höôûng ôû caùc taàn soá leû f0, 3f0, 5f0… vôùi f0=c/4L vôùi c laø vaän toác aâm thanh trong khoâng khí. Ví duï, L=17cm, c=300m/s, thì seõ coäng höôûng ôû caùc taàn soá: 500Hz, 1500Hz, 2500Hz,… nhöõng ñænh coäng höôûng naøy ñöôïc goïi laø caùc Formant. Boä phaän phaùt aâm coù theå nhieàu daïng khaùc nhau vaø taïo ra nhöõng ñænh coäng höôûng khaùc nhau hay caùc giaù trò Formant khaùc nhau neân aâm thanh phaùt ra khaùc nhau. Trong tieáng noùi, caùc taàn soá Formant luoân thay ñoåi töø aâm naøy sang aâm khaùc.
Hình 1.2 Moâ hình oáng ñeàu cuûa boä phaän phaùt aâm Quaù trình hình thaønh tieáng noùi ñöôïc bieåu dieãn baèng moâ hình Source-filter:
Hình 1.3 Taïo tieáng noùi theo moâ hình loïc nguoàn Tín hieäu vaøo laø tín hieäu töø nguoàn aâm thanh(cuõng coù theå laø coù chu kì hay nhieãu) ñöôïc loïc baèng boä loïc coù tính chaát coäng höôûng töông töï vôùi boä phaän phaùt aâm. Phoå cuûa tín hieäu tieáng noùi thu ñöôïc baèng caùch nhaân phoå cuûa boä loïc vôùi phoå cuûa tín hieäu. AV, AN laø caùc ñoä lôïi bieåu thò cöôøng ñoä cuûa aâm thanh vaø cöôøng ñoä nhieãu. LUAÄN VAÊN TOÁT NGHIEÄP
-6-
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Moät boä phaän phaùt aâm co moät soá höõu haïn Formant, nhöng chæ caàn quan taâm ñeán 3 hay 4 Formant ñaàu tieân treân baêng taàn töø 100Hz ñeán 3.5kHz do bieân ñoä cuûa caùc Formant cao hôn bò suy giaûm gaàn nhö hoaøn toaøn vôùi ñoä suy giaûm -12dB/octave. Tröôøng hôïp tieáng noùi voâ thanh, phoå töông ñoái baèng phaúng, soá löôïng caùc Formant nhö vaäy vaãn ñuû maëc duø tieáng noùi voâ thanh coù baêng taàn môû roäng leân ñeán 7-8kHz. Ngoaøi ra, do aûnh höôûng böùc xaï cuûa mieäng neân bieân ñoä ñöôïc taêng leân chöøng 6dB/octave trong baêng taàn 0-3kHz. Chình vì vaäy maø ñeán phaàn tieàn xöû lyù tín hieäu ta phaûi duøng boä loïc tieàn nhaán ñeå buø theâm +6dB/octave. 2. Cô quan thính giaùc cuûa con ngöôøi: a. Caáu taïo:
Hình 1.4 Caáu taïo cô quan thính giaùc Tai ngoaøi: Bao goàm coù vaønh tai vaø loã tai, chính loã tai seõ daãn tín hieäu aâm thanh ñeán maøng nhó vaø laøm cho maøng nhó rung leân. Ñoä leäch cuûa maøng nhó khoaûng chöøng vaøi nanomet vaø moät tieáng noùi thaàm coù theå taïo ra moät ñoä leäch chæ baèng moät phaàn möôøi baùn kính nguyeân töû hydro. Tai giöõa: Coù moät xöông nhoû goïi laø xöông buùa aùp saùt vaøo maøng nhó. Trong luùc maøng nhó rung leân, vì xöông buùa lieân keát vôùi caùc xöông khaùc, goïi laø xöông ñe, laøm xöông naøy coù theå quay. Trong luùc quay, xöông ñe laïi lieân keát vôùi moät xöông khaùc, goïi
LUAÄN VAÊN TOÁT NGHIEÄP
-7-
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
laø xöông baøn ñaïp, noù aùp saùt vaøo cöûa soå hình ovan cuûa vuøng trong tai. Ba xöông naøy (buùa, ñe, baøn ñaïp) laø nhöõng xöông nhoû nhaát trong cô theå con ngöôøi vaø ñöôïc goïi chung laø xöông nhoû. Chöùc naêng cuûa noù laø truyeàn taûi söï rung ñoäng cuûa maøng nhó ñeán cöûa soå hình oval ôû trong tai. Tai trong: Cöûa soå hình oval laø moät maøng phuû nhaày, môû roäng trong böùc töôøng xöông coù caáu truùc xoaén oác, ñöôïc goïi laø oác tai. Chaát loûng trong oác tai ñöôïc chia theo chieàu daøi cuûa noù thaønh hai maøng nhaày, goïi laø maøng nhaày Reissner vaø maøng nhaày cô baûn(maøng ñaùy). Söï rung ñoäng cuûa cöûa soå oval gaây neân soùng aùp suaát truyeàn ñeán chaát loûng ôû trong xöông nhoû vaø aùp suaát cuûa soùng gaây treân maøng nhaày cô baûn moät ñoä leäch taïi nhöõng ñieåm khaùc nhau doïc theo chieàu daøi cuûa noù. Aùp chaët vaøo maøng nhaày cô baûn laø cô quan voû naõo. Cô quan naøy chöùa khoaûng 30000 teá baøo hình sôïi. Moãi teá baøo naøy coù nhieàu sôïi nhoû li ti nhoâ ra. Caùc sôïi daây naøy uoán cong nhôø söï vaän ñoäng cuûa maøng nhaày cô baûn vaø nhôø ñoù caùc teá baøo hình sôïi hoaït ñoäng. Caùc teá baøo hình sôïi naøy lieân keát vôùi caùc ñaàu cuoái cuûa nôron cuûa heä thaàn kinh ñeå truyeàn tín hieäu veà naõo. b. Cô cheá nghe: Khi ta nghe moät soùng aâm thuaàn tuyù töùc aâm ñôn (soùng sine), nhöõng ñieåm khaùc nhau treân maøng ñaùy seõ rung ñoäng thao taàn soá cuûa aâm ñôn ñi vaøo tai. Ñieåm leäch lôùn nhaát treân maøng ñaùy phuï thuoäc taàn soá aâm ñôn. Taàn soá caøng cao taïo ra ñieåm leäch lôùn nhaát ôû phía ñaùy vaø taàn soá thaáp taïo ra ñieåm leäch lôùn nhaát phía ñænh. Nhö vaäy maøng ñaùy ñoùng vai troø phaân tích taàn soá tín hieäu vaøo phöùc taïp, baèng caùch taùch nhöõng taàn soá khaùc nhau ôû nhöõng ñieåm khaùc nhau doïc theo chieàu daøi cuûa noù. Moãi ñieåm nhö vaäy coù theå xem laø moät boä loïc thoâng daûi coù taàn soá trung taâm vaø baêng thoâng xaùc ñònh. Nhöõng ñaùp öùng naøy khoâng ñoái xöùng quanh taàn soá trung taâm, vuøng taàn soá cao coù toác ñoä suy giaûm doác hôn nhieàu so vôùi vuøng taàn soá thaáp. Vò trí cuûa ñoä leäch cöïc ñaïi doïc theo maøng nhaøy bieán thieân phi tuyeán theo taàn soá (theo haøm logarit). Nhöõng nghieân cöùu chæ ra raèng ngöôõng nghe cuûa moät aâm ñôn taêng leân khi coù söï hieän dieän cuûa nhöõng aâm ñôn laân caän khaùc (aâm maët naï) vaø chæ coù baêng taàn heïp xung quanh aâm ñôn môùi tham gia vaøo hieäu öùng maë naï, baêng taàn naøy thöôøng goïi laø baêng taàn tôùi haïn. Giaù trò cuûa baêng taàn tôùi haïn phuï thuoäc vaøo tanà soá cuûa aâm ñôn caàn thöû. Vôùi aâm ñôn 100Hz, baêng taàn tôùi haïn xaáp xæ 90Hz, vôùi aâm ñôn 5kHz laø xaáp xæ 1kHz.
LUAÄN VAÊN TOÁT NGHIEÄP
-8-
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Coù theå xem quaù trình nghe cuûa heä thính giaùc laø moät daõy cacù boä loïc baêng thoâng, coù ñaùp öùng phuû laáp leân nhau vaø baêng thoâng hieäu quaû cuûa chuùng xaáp xæ baêng thoâng tôùi haïn. Ñaây laø cô sôû cho vieäc thieát keá daõy baêng loïc sau naøy. 3. Ngöõ aâm tieáng Vieät: a. AÂm vò Veà maët ngoân ngöõ hoïc, coù theå xem tieáng noùi laø moät chuoãi caùc aâm cô baûn ñöôïc goïi laø aâm vò. AÂm vò laø ñôn vò ngoân ngöõ tröøu töôïng vaø khoâng theå quan saùt tröïc tieáp trong tín hieäu tieáng noùi. Nhieàu aâm vò khaùc nhau keát hôïp vôùi nhau moät caùch naøo ñoù ñeå taïo ra nhöõng aâm thanh khaùc nhau. b. Nguyeân aâm Nguyeân aâm ñöôïc xaùc ñònh bôûi hoác coäng höôûng khoang mieäng vaø hoác yeát haàu-nguoàn goác cuûa caùc Formant. Khoang mieäng vaø khoang yeát haàu ñöôïc taùch bieät ra bôûi löôõi. Do ñoù, söï thay ñoåi cuûa khoang naøy ñoàng nghóa vôùi söï thay ñoåi cuûa khoang kia. Vieäc xaùc ñònh theå tích, hình daùng, loái thoaùt khoâng khí cuûa nhöõng hoác coäng höôûng naøy, töùc xaùc ñònh khaû naêng coäng höôûng cuûa chuùng, chính laø moâ taû ñoä môû cuûa mieäng, vò trí cuûa löôõi vaø hình daùng cuûa moâi. c. Phuï aâm Ñaëc ñieåm cô baûn cuûa phuï aâm laø söï caáu taïo baèng luoàng khoâng khí bò caûn trôû, söï caûn trôû naøy dieãn ra vôùi nhöõng möùc ñoä khaùc nhau, caùch thöùc khaùc nhau vaø ôû nhöõng boä phaän khaùc nhau cuûa cô quan phaùt aâm. Phuï aâm ñuôïc chia ra phuï aâm taéc (nhö ‘p’, ‘t’, ‘ñ’, ‘b’) vaø phuï aâm xaùt(nhö ‘v’, ‘s’, ‘x’) Phuï aâm taéc: Ñaëc tröng laø moät tieáng noå, do luoàng khoâng khí bò caûn trôû hoaøn toaøn, phaûi phaù vôõ söï caûn trôû ñeå thoaùt ra ngoaøi. Phuï aâm taéc ñöôïc chia laøm phuï aâm baät hôi (nhö ‘th’)vaø phuï aâm muõi (nhö ‘m’, ‘n’, ‘ng’, ‘nh’). Phuï aâm xaùt: Ñaëc tröng laø tieáng coï xaùt, phaùt sinh do luoàng khoâng khi ñi ra bò caûn trôû khoâng hoaøn toaøn(chæ bò khoù khaên) phaûi laùch qua moät khe hôû nhoû vaø trong khi thoaùt ra ngoaøi coï xaùt vaøo thaønh cuûa boä phaän phaùt aâm d. Thanh ñieäu:
LUAÄN VAÊN TOÁT NGHIEÄP
-9-
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Thanh ñieäu laø söï naâng cao hay haï thaáp ‚gioïng noùi‛ trong moät aâm tieát. AÂm tieát laø ñôn vò phaùt aâm nhoû nhaát, trong tieáng Vieät aâm tieát laø moät töø. Thanh ñieäu laø söï thay ñoåi cao ñoä cuûa gioïng noùi, ñieàu ñoù coù nghóa thay ñoåi bieân ñoä taàn soá cô baûn trong aâm höõu thanh. Thanh ñieäu ñöôïc xaùc ñònh baèng taàn soá cô baûn. Qua phaàn phaân tích ngöõ aâm, ta thaáy raèng, khi phaùt aâm moät töø (toång quaùt goàm phuï aâm, nguyeân aâm, thanh ñieäu), daây thanh aâm rung taïo ra daïng soùng cuûa luoàng khoâng khí, ñeán löôït boä phaän caáu aâm vaø muõi bieán ñoåi chaäm laøm thay ñoåi daïng soùng phaùt ra beân ngoaøi ñeå taïo ra nhöõng töø khaùc nhau. Nhö vaäy tín hieäu tieáng noùi laø do xung böôùc soùng chaäp vôùi tín hieäu bieân thieân chaäm cuûa boä phaän caáu aâm. Ñieàu naøy daãn tôùi vieäc trích tham soá tieáng noùi raát hieäu quaû laø phaân tích cepstral, trong phöông phaùp naøy ngöôøi ta muoán laáy phaàn tín hieäu coù taàn soá thaáp do boä phaän caáu aâm taïo ra. Chi tieát veà cepstral ñöôïc trình baøy chi tieát trong chöông 3. II. TOÅNG QUAN VEÀ NHAÄN DAÏNG TIEÁNG NOÙI: 1. Sô löôïc veà nhaän daïng tieáng noùi: Vaán ñeà nhaän daïng tieáng noùi laø moät vaán ñeà lôùn, nhieàu nghieân cöùu ñaõ thöïc hieän trong vaøi thaäp nieân gaàn ñaây. Caùc heä thoáng vôùi boä töø vöïng nhoû, nhaäp töø rôøi raïc coù theå aùp duïng trong nhöõng öùng duïng töông ñoái ñôn giaûn ñeå caûi thieän hieäu quaû nhaäp thoâng tin vaøo maùy, trong moâi tröôøng saûn xuaát, hoaëc trong nhöõng öùng duïng töø xa vôùi thieát bò. Nhaän daïng tieáng ñaõ ñöôïc nghieân cöùu hôn 40 naêm qua. Nhöõng noã löïc ñaàu tieân ñöôïc thöïc hieän töø nhöõng naêm 1950. Ñaàu nhöõng naêm 1970, heä thoáng nhaän daïng tieáng noùi ñöôïc thieát keá ñeå nhaän daïng phaùt aâm rôøi raïc trong moâi tröôøng khoâng nhieãu (noise free). Caùc heä thoáng duøng boä töø vöïng nhoû(10-100 töø) vaø trong tröôøng hôïp nguôøi noùi cuõng laø ngöôøi huaán luyeän. Töø ñoù ñeán nay, cuøng vôùi söï phaùt trieån cuûa maùy tính, kó thuaät nhaän daïng tieáng noùi ñaõ coù nhöõng söï tieán boä vöôït baäc, ñöôïc thöïc hieän baèng nhöõng phöông phaùp giaûi thuaät môùi hieän ñaïi vaø hieäu quaû ngaøy caøng cao. 2. Phaân loaïi Trong vieäc ñaùnh giaù, phaân loaïi moät heä thoáng nhaän daïng, ngöôøi ta döïa vaøo caùc tieâu chí sau: Theo caùch thöùc ngöôøi noùi: noùi chung chia thaønh 2 loaïi o Nhaän daïng töø rôøi raïc: moãi töø caàn nhaän daïng ñöôïc phaùt aâm moät caùch rôøi raïc, coù caùc khoaûng nghæ tröôùc vaø sau khi phaùt aâm moät töø. Ñeà taøi naøy thöïc hieän theo heä thoáng naøy. LUAÄN VAÊN TOÁT NGHIEÄP
- 10 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
o Nhaän daïng töø lieân tuïc: Tieáng noùi ñöôïc phaùt lieân tuïc trong moät chuoãi tín hieäu nhö moät caâu noùi, ñoïc moät ñoaïn vaên… Döïa treân boä töø vöïng: o Heä thoáng vôùi töø vöïng nhoû ( ~10:100 töø ). o Heä thoáng maø caùc töø ñöôïc ñoïc rôøi raïc (boä töø vöïng coù theå vöôït 1000 töø ). o Heä thoáng chaáp nhaän tieáng noùi lieân tuïc nhöng chæ lieân quan ñeán phaïm vi öùng duïng töông ñoái bò giôùi haïn (boä töø vöïng ~1000:5000 töø). Döïa treân thoâng tin veà caùc maãu tieáng noùi cuûa ngöôøi söû duïng bao goàm: o Heä thoáng phuï thuoäc ngöôøi noùi (speaker-dependent): ñöôïc laøm cho töông thích vôùi töøng ngöôøi rieâng bieät. o Heä thoáng ñoäc laäp ngöôøi noùi (speaker-dependent):coù theå laøm vieäc vôùi moät soá löôïng lôùn ngöôøi söû duïng. o Heä thoáng thích öùng ngöôøi noùi:töï caäp nhaät thoâng tin veà töøng ngöôøi söû duïng rieâng bieät trong thôøi gian heä thoáng söû duïng. 3. Nhöõng yeáu toá aûnh höôûng ñeán hieäu quaû cuûa heä nhaän daïng tieáng noùi:
Xem xeùt caùc yeáu toá aûnh höôûng ñeán vieäc thaønh coâng hay thaát baïi cuûa heä thoáng nhaän daïng tieáng noùi vaø chæ ra möùc ñoä phöùc taïp cuûa vieäc thieát keá nhaän daïng. Nhöõng yeáu toá quyeát ñònh ñeán chaát löôïng vaø hieäu quaû cuûa heä thoáng nhaän daïng tieáng noùi ñöôïc thieát keá döôùi daïng nhöõng caâu hoûi sau: 1. Heä thoáng ñöôïc thieát keá ñeå nhaän daïng moät caù nhaân hay nhieàu ngöôøi. 2. Kích thöôùc boä töø vöïng nhö theá naøo. 3. Tieáng noùi ñöôïc nhaäp vaøo baèng caùc töø rôøi raïc vôùi khoaûng döøng ñuû lôùn hoaëc phaùt aâm lieân tuïc. 4. Söï khoâng roõ raøng vaø nhaàm laãn ngöõ aâm trong moät boä töø vöïng laø gì. 5. Heä thoáng nhaän daïng trong moâi tröôøng yeân tónh hay nhieãu. 6. Kieán thöùc ngöõ aâm hoïc naøo ñöôïc vaän duïng vaøo boä nhaän daïng. 4. Caùc höôùng nghieân cöùu nhaän daïng tieáng noùi: Noùi chung thì ta coù theå xeáp caùc phöông phaùp nhaän daïng tieáng noùi theo moät trong ba nhoùm sau: a. Höôùng ngöõ aâm hoïc: LUAÄN VAÊN TOÁT NGHIEÄP
- 11 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Caùc nghieân cöùu ban ñaàu döïa vaøo vieäc tìm aâm tieáng noùi vaø gaùn nhaõn (label) cho caùc aâm naøy. Ñaây laø cô sôû cuûa aâm hoïc ngöõ aâm vôùi giaû thuyeát toàn taïi moät soá höõu haïn caùc ñôn vò ngöõ aâm khaùc nhau coù theå phaân bieät ñöôïc trong ngoân ngöõ noùi vôùi caùc ñaëc ñieåm ñöôïc moâ taû baèng caùc ñaëc tính aâm hoïc hieän dieän roõ raøng trong tín hieäu tieáng noùi. Maëc duø caùc ñaëc tính aâm hoïc cuûa caùc ñôn vò ngöõ aâm coù theå thay ñoåi theo ngöôøi noùi hoaëc theo caùc aâm laân caän, höôùng nghieân cöùu aâm hoïc ngöõ aâm giaû söû raèng caùc qui luaät chi phoái söï thay ñoåi laø khoâng phöùc taïp (straightforward) vaø coù theå cho maùy hoïc deã daøng. Böôùc ñaàu tieân trong höôùng aâm hoïc ngöõ aâm laø phaân ñoaïn vaø gaùn nhaõn, trong ñoù tín hieäu tieáng noùi ñöôïc phaân ra thaønh caùc vuøng aâm hoïc oån ñònh, moãi vuøng ñöôïc gaùn bôûi moät hoaëc nhieàu kyù hieäu ngöõ aâm taïo thaønh moät chuoãi aâm vò moâ taû tieáng noùi. Böôùc thöù hai laø coá gaéng xaùc ñònh moät töø coù nghóa ( hoaëc moät chuoãi caùc töø ) töø chuoãi kyù hieäu aâm vò ñöôïc taïo ra trong böôùc ñaàu tieân. Trong quaù trình naøy, caùc giôùi haïn ngoân ngöõ hoïc, ( ví duï töø vöïng , ngöõ caûnh vaø caùc qui luaät ngöõ nghóa) ñöôïc aùp duïng ñeå truy xuaát boä töø vöïng vaøo teân chuoãi aâm vò. Höôùng naøy khoâng ñöôïc söû duïng roäng raõi trong caùc öùng duïng thöông. b. Höôùng keát hôïp maãu: Höôùng keát hôïp maãu ( coøn laø ñoái so saùnh maãu ) goàm hai böôùc chính laø huaán luyeän maãu ( pattern training) vaø so saùnh maãu ( pattern comparision) nhö hình 2.1.4. Ñaëc tính chuû yeáu cuûa höôùng naøy laø söû duïng caùc cô caáu toaùn hoïc roõ raøng vaø thieát laäp söï bieãu dieãn thích hôïp caùc maãu tieáng noùi cho vieäc so saùnh chính xaùc caùc maãu huaán luyeän nghieâm chænh. Tieáng noùi coù theå ñöôïc bieãu dieãn ôû daïng maãu tieáng noùi hoaëc moät moâ hình thoáng keâ, coù theå ñöôïc aùp duïng cho moät aâm, moät töø hoaëc moät nhoùm töø. Trong giai ñoaïn so saùnh maãu, coù moät söï so saùnh tröïc tieáp giöõa tieáng noùi chöa bieát (caàn nhaän daïng vôùi moãi maãu ñöôïc hoïc trong giai ñoaïn huaán luyeän ñeå xaùc ñònh ñaëc tính cuûa maãu chöa bieát döïa theo chaát löôïng cuûa vieäc phoái hôïp maãu). Höôùng keát hôïp maãu trôû thaønh phöông phaùp nhaän daïng raát phoå bieán trong nhöõng naêm 90.
LUAÄN VAÊN TOÁT NGHIEÄP
- 12 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 1.5 : Sô ñoà khoái heä nhaän daïng theo höôùng keát hôïp maãu Coù ba lyù do ñeå nhaän daïng tieáng noùi ñöôïc thieát keá theo höôùng naøy, ñoù laø: Raát deã söû duïng , ñôn giaûn vaø deã hieãu. OÅn ñònh vaø hieäu quaû vôùi nhieàu boä töø vöïng, nhieàu ngöôøi söû duïng, nhieàu ñaëc tröng vaø phöông phaùp ñoái saùnh cuõng nhö caùc cô sôû ra quyeát ñònh khaùc nhau. Ñaûm baûo chaát löôïng cao Moâ hình nhaän daïng maãu coù nhöõng ñieåm maïnh vaø yeáu sau : Chaát löôïng cuûa heä thoáng khaù nhaïy vôùi löôïng döõ lieäu huaán luyeän taïo ra maãu tham chieáu ; nghóa laø caøng huaán luyeän nhieàu thì chaát löôïng caøng cao. Caùc maãu tham chieáu thöôøng raát nhaïy vôùi moâi tröôøng phaùt aâm vaø caùc ñaëc tính truyeàn daãn cuûa caùc phöông tieän chuyeån tieáp (micro ) bôûi vì caùc ñaëc tröng phoå chòu söï taùc ñoäng cuûa nhieàu neàn vaø nhieãu lan truyeàn. Phöông phaùp naøy haàu nhö khoâng phuï thuoäc vaøo caùch choïn boä töø vöïng, muïc ñích nhaän daïng cuõng nhö ngöõ caûnh. Khoái löôïng tính toaùn cho huaán luyeän vaø phaân loaïi maãu thöôøng tæ leä tuyeán tính vôùi soá maãu ñöôïc duøng ñeå huaán luyeän vaø nhaän daïng neân khoù maø thích hôïp vôùi öùng duïng coù boä töø vöïng lôùn ñoøi hoûi ñaùp öùng thôøi gian thöïc. Coù theå aùp duïng roäng raõi cho töøng ñôn vò tieáng noùi nhö töø,aâm vò…Coù theå phoái hôïp kieán thöùc ngöõ caûnh ñeå naâng cao chaát löôïng nhaän daïng vaø giaûm khoái löôïng tính toaùn. c. Höôùng thoâng minh nhaân taïo: Höôùng thoâng minh nhaân taïo coá gaéng maùy moùc hoaù hoaït ñoäng nhaän daïng theo caùch con ngöôøi aùp duïng trí khoân trongvieäc hình dung, phaân tích vaø ñaùnh giaù tieáng noùi döaï treân moät taäp hôïp caùc tính chaát aâm hoïc ño ñöôïc. Trong soá caùc kyõ thuaät ñöôïc söû duïng trong höôùng naøy coù vieäc söû duïng moät heä thoáng chuyeân gia trong ñoù tích hôïp aâm vò, töø vöïng, cuù phaùp, ngöõ nghóa vaø ngay caû kieán thöùc thöïc teá cho vieäc phaân ñoaïn, gaùn nhaõn vaø söû duïng caùc coâng cuï nhö maïng trí tueä nhaân taïo cho vieäc hoïc caùc quan heä giöõa caùc söï kieän aâm vò. Troïng taâm höôùng naøy chuû yeáu laø söï hieåu bieát kieán thöùc vaø tích hôïp caùc nguoàn kieán thöùc. Phöông phaùp naøy chöa ñöôïc söû duïng roäng raõi trong caùc heä thoáng thöông maïi. III. TOÙM TAÉT:
LUAÄN VAÊN TOÁT NGHIEÄP
- 13 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 1: GIÔÙI THIEÄU VEÀ TIEÁNG NOÙI VAØ NHAÄN DAÏNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Phaàn naøy trình baøy nhöõng cô sôû sinh lyù hoïc vôùi caáu taïo cuûa boä maùy phaùt aâm vaø cô quan thính giaùc cuûa con ngöôøi. Ngoaøi ra, chöông naøy cuõng ñaõ nghieân cöùu ngöõ aâm tieáng Vieät vôùi vieäc trình baøy nguyeân aâm, phuï aâm, aâm höõu thanh, voâ thanh, vaø ñaëc bieät laø thanh ñieäu-moät ñaëc tröng cuûa tieáng Vieät. Vieäc phaân tích boä phaän phaùt aâm vaø quaù trình nhaän thöùc tieáng noùi cuûa con ngöôøi trong chöông naøy laø cô sôû ñeå phaân tích ñaëc tröng tieáng noùi baèng caùc heä soá cepstral ñöôïc thöïc hieän ôû Chöông 3-Trích ñaëc tröng tieáng noùi, ñaây laø böôùc quan troïng phuïc vuï cho coâng vieäc nhaän daïng sau naøy.
LUAÄN VAÊN TOÁT NGHIEÄP
- 14 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Chöông 2:
CÔ SÔÛ XÖÛ LÍ SOÁ TÍN HIEÄU I. CHUOÃI SOÁ: Muoán cho maùy tính xöû lyù ñöôïc tín hieäu, phaûi laáy maãu tín hieäu taïi nhieàu thôøi ñieåm. Hình 2.1 laø laáy maãu haøm lieân tuïc theo thôøi gian t, moãi maãu caùch nhau T giaây. Keát quaû chuùng ta ñöôïc taäp caùc soá goïi laø chuoãi soá. Neáu haøm lieân tuïc theo thôøi gian laø x(t) thì haøm laáy maãu laø x(nT) theo n. Thoâng thöôøng chuùng ta chuaån hoùa thôøi gian giöõa hai laàn laáy maãu laø 1 neân x(nT) laø x(n).
Hình 2.1: Laáy maãu tín hieäu 1. Haøm laáy maãu Haøm laáy maãu laø caàu noái giöõa haøm thôøi gian lieân tuïc vaø haøm thôøi gian rôøi raïc. Haøm laáy maãu coøn coù teân khaùc laø haøm delta Dirac. Haøm laáy maãu coù nhöõng tính chaát sau ñaây: Tính chaát 1:
f (t ) (t )dt
f ( )
(2.1)
Tính chaát 2:
(t )dt 1
(2.2)
ôû hai phöông trình treân coù theå laø giaù trò thöïc. Ñeå hieåu taïi sao haøm naøy laø haøm laáy maãu lyù töôûng, ñaàu tieân chuùng ta khaûo saùt haøm laáy maãu thöïc teá (t) nhö minh hoïa hình 2.2. Haøm naøy coù ñoä roäng xung laø moät ñôn vò theo thôøi gian vaø bieân ñoä laø moät ñôn vò theo bieân ñoä. Roõ raøng tính chaát 2 thoûa maõn. Tuy nhieân khi nhaân (t) vôùi f(t) thì haøm laáy maãu (t) khoâng laáy taïi moät thôøi ñieåm maø 1 1 laáy trong phaïm vi töø ñeán . Keát quaû laø tính chaát 1 khoâng thoûa maõn. Chuùng ta coù 2 2 LUAÄN VAÊN TOÁT NGHIEÄP
- 15 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
1 2
f (t ) (t )dt f ( )dt
(2.3)
1 2
Ñieàu naøy coù theå hieåu laø quaù trình laáy maãu bò nhoøe trong phaïm vi moät daõy lieân quan ñeán ñoä roäng xung cuûa (t). Muoán xaáp xæ haøm laáy maãu toát hôn thì haøm (t) coù ñoä roäng xung heïp hôn. Tuy nhieân, khi ñoä roäng xung heïp thì bieân ñoä phaûi taêng leân. Veà maët giôùi haïn, chuùng ta thaáy raèng haøm laáy maãu lyù töôûng coù ñoä roäng xung heïp voâ haïn sao cho maãu ñöôïc laáy taïi moät thôøi ñieåm, coøn bieân ñoä lôùn voâ haïn sao cho tín hieäu tín hieäu laáy maãu coù cuøng naêng löôïng höõu haïn nhö nhau. (t )
1
1 2
1 2
Hình 2.2 : Haøm laáy maãu thöïc teá 2. Söû duïng haøm laáy maãu Hình 2.3 minh hoïa quaù trình laáy maãu duøng caùc haøm laáy maãu lyù töôûng taïi caùc thôøi ñieåm caùch nhau T giaây. Keát quaû chuùng ta ñöôïc daïng soùng theo thôøi gian x s (t )
x(t ) (t nT )
(2.4)
n
Do t nT taïo ra heä soá nhaân khaùc zero taïi nhöõng giaù trò t=nT, neân coù theå vieát laïi xs(t) nhö sau: x s (t )
x(nT ) (t nT )
(2.5)
n
Trong phöông trình sau cuøng naøy chuùng ta thaáy xuaát hieän chuoãi soá x(nT).
Hình 2.3 :Haøm laáy maãu lyù töôûng
LUAÄN VAÊN TOÁT NGHIEÄP
- 16 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
3. Phoå cuûa tín hieäu laáy maãu Duøng bieán ñoåi Fourier, phoå taàn soá cuûa daïng soùng lieân tuïc theo thôøi gian x(t) ñöôïc vieát nhö sau :
x(t)e
X(f )
j2 ft
(2.6)
dt
vaø daïng soùng theo thôøi gian bieåu dieãn theo phoå taàn soá laø :
x(t)
X(f )e
j2 ft
(2.7)
df
Ñieàu naøy ñuùng cho moïi haøm lieân tuïc theo thôøi gian x(t), neân cuõng ñuùng cho xs(t)
x (t )e
dt
(2.8)
x(t)(t nT) e j2 ft dt n
(2.9)
Xs( f )
j 2ft
s
Bieåu dieãn xs(t) theo daïng laáy maãu:
Xs (f )
Thöù töï cuûa pheùp toång vaø tích phaân coù theå thay ñoåi, vaø aùp duïng tính chaát 1 cuûa haøm laáy maãu Xs( f )
x(nT )e
(2.10)
j 2fnT
n
Phöông trình naøy bieåu dieãn chính xaùc chuoãi Fourier cuûa Xs(f) laø haøm coù chu kyø T. Caùc heä soá cuûa chuoãi Fourier laø x(nT) ñöôïc tính töø tích phaân sau: 1 2T
x(nT ) T
X
s
(2.11)
( f )e j 2fnT dt
1 2T
Hai phöông trình sau laø caëp chuoãi Fourier cho pheùp tính tín hieäu theo thôøi gian hay phoå taàn soá tuøy theo ñoái soá cuûa caëp chuoãi Fourier. Chuù yù raèng tín hieäu xs(t) ñaõ bò loaïi boû vaø thay vaøo ñoù laø x(nT). 4. Lieân heä giöõa phoå lieân tuïc vaø phoå rôøi raïc Xeùt phöông trình (2.6) taïi thôøi ñieåm t=nT vaø cho keát quaû naøy baèng veá phaûi cuûa phöông trình (2.10) chuùng ta thu ñöôïc moái lieân heä giöõa hai phoå nhö sau:
x(nT )
X ( f )e
LUAÄN VAÊN TOÁT NGHIEÄP
j 2fnT
1 2T
df T X s ( f )e j 2fnT df
(2.12)
1 2T
- 17 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Veá phaûi cuûa phöông trình (2.6) coù theå bieåu dieãn laø toång voâ haïn cuûa moät taäp caùc tích phaân coù giôùi haïn höõu haïn 2 m 1 2T
X ( f )e
x(nT )
j 2fnT
(2.13)
df
m 2 m 1 2T
Ñoåi bieán f
m m (thay f vaø df d ) T T 1 2T
x(nT )
m
X (
1 2T
m
m j 2nT j 2 T nT )e e d T
(2.14)
Di chuyeån pheùp toång vaøo trong tích phaân, chuù yù e j 2mn 1 vôùi moïi m,n nguyeân, vaø thaønh phaàn beân trong tích phaân töông töï vôùi thaønh phaàn beân trong tích phaân cuûa phöông trình (2.11) , neân chuùng ta coù moái lieân heä sau:
Xs( f )
1 m X(f ) T m T
(2.15)
Phöông trình (2.15) noùi leân raèng phoå taàn soá cuûa tín hieäu laáy maãu laø toång voâ haïn phoå taàn soá cuûa tín hieäu lieân tuïc, ôû ñoù khoaûng caùch giöõa hai phoå taàn soá cuûa tín hieäu lieân tuïc laø 1 . T 5. Chuoãi xung ñôn vò: Coù moät chuoãi soá quan troïng laø chuoãi xung ñôn vò vaø kyù hieäu laø u0(n). Chuoãi xung ñôn vò goàm voâ haïn maãu coù giaù trò zero vôùi moïi n 0 vaø baèng 1 taïi n=0. Hình 2.4 minh hoïa chuoãi u0(n) vaø u0(n-m). Tính chaát cuûa chuoãi xung ñôn vò cuõng gioáng nhö tính chaát cuûa haøm laáy maãu
Tính chaát 1:
x(n)u
n
Tính chaát 2:
u
n
LUAÄN VAÊN TOÁT NGHIEÄP
0
0
( n m) x ( m)
( n m) 1
- 18 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 2.4 Dôøi chuoãi xung ñôn vò II. CAÙC PHEÙP TOAÙN TUYEÁN TÍNH BAÁT BIEÁN: Caùc pheùp toaùn ñöôïc söû duïng roäng raõi nhaát trong DSP laø tuyeán tính vaø baát bieán theo thôøi gian-linear time invariant(LTI) Tính chaát tuyeán tính ñöôïc phaùt bieåu nhö sau: Cho x(n) laø chuoãi höõu haïn vaø O{} laø pheùp toaùn trong khoâng gian n-chieàu, ñaët y(n)= O{x(n)} Neáu x(n)=ax1(n)+bx2(n) ôû ñoù a vaø b laø haèng soá töông öùng vôùi n, neáu O{} laø pheùp toaùn tuyeán tính thì: y(n)=aO{x1(n)}+bO{x2(n)} Tính baát bieán theo thôøi gian nghóa laø neáu: y(n)= O{x(n)} thì khi dôøi ñi seõ cho ñaùp öùng gioáng nhau: y(n-m)= O{x(n-m)} Caùch khaùc ñeå phaùt bieåu tính chaát naøy laø neáu x(n) coù chu kyø laø N x(n+N)=x(n) thì pheùp toaùn O{} baát bieán trong khoâng gian n-chieàu laø O{x(n)}= O{x(n+N)}
LUAÄN VAÊN TOÁT NGHIEÄP
- 19 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Ta coù: u 0 (n m) 1, n m vaø u0 ( n m) =0, n coøn laïi neân chuùng ta coù theå vieát x(n) nhö sau: x ( n)
x(m)u
m
Suy ra:
0
( n m)
y (n) O{ x(m)u 0 (n m)} m
O{} laø haøm theo n, laø pheùp toaùn tuyeán tính neân: y ( n)
x(m)O{u
m
0
(n m)}
Chuùng ta goïi h(n) O{u 0 (n)}
laø ñaùp öùng cuûa chuoãi xung ñôn vò. Do tính baát bieán theo thôøi gian neân: h(n m) O{u 0 (n m)}
Do ñoù: y ( n)
x(m)h(n m)
m
Phöông trình treân phaùt bieåu raèng y(n) laø toång chaäp x(n) vôùi ñaùp öùng xung h(n). Thay m n p vaøo phöông trình treân ta ñöôïc: y ( n)
h( p)x(n p)
p
1. Tính nhaân quaû: Cho ñeán baây giôø caùc moâ taû toaùn hoïc cuûa chuoãi soá vaø pheùp toaùn ñeàu giaû thieát laø ñaùp öùng xung cuûa pheùp toaùn vaãn coù giaù trò ngay caû tröôùc thôøi ñieåm taùc ñoäng cuûa chuoãi soá vaøo. Ñaây laø daïng toång quaùt cuûa phöông trình vaø phuø hôïp cho phaùt trieån lyù thuyeát. Tuy nhieân, khoâng coù moät heä vaät lyù naøo coù theå taïo ra chuoãi soá ra khi chöa coù chuoãi soá vaøo taùc ñoäng. Bôûi vì caùc pheùp toaùn vaø chuoãi soá DSP coù tính vaät lyù neân chuùng ta chæ thaûo luaän caùc pheùp toaùn vaø chuoãi soá coù theå toàn taïi trong thöïc teá. Böôùc ñaàu tieân khi bieåu dieãn chuoãi soá thöïc teá laø chuoãi soá phaûi baét ñaàu taïi moät thôøi ñieåm cuï theå naøo ñoù. Nhö vaäy coù theå giaû thieát raèng caùc thaønh phaàn cuûa chuoãi soá seõ coù giaù trò zero taïi nhöõng chæ soá thôøi gian nhoû hôn zero, ñoàng thôøi sau thôøi ñieåm zero giaù trò cuûa
LUAÄN VAÊN TOÁT NGHIEÄP
- 20 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
chuoãi laø zero hay khaùc zero. Thuoäc tính naøy cuûa chuoãi soá ñöôïc goïi laø nhaân quaû haynois caùc khaùc chuoãi soá ra cuûa heä DSP taïi thôøi ñieåm n (töùc laø y(n)) chæ phuï thuoäc vaøo chuoãi soá vaïo taïi thôøi ñieåm hieän taïi vaø quaù khöù (töùc laø x(n), x(n-1), x(n-2),…) chöù khoâng phuï thuoäc vaøo chuoãi soá töông lai( töùc laø x(n+1), x(n+2),…). Baây giôø toång chaäp cuûa pheùp toaùn nhaân quaû coù theå vieát:
y (n) h(m)x(n m) m 0
Nghóa laø ñaùp öùng khoâng coù giaù trò vôùi moïi m nhoû hôn zero. 2. Phöông trình sai phaân: Veà maët lyù thuyeát, caùc pheùp toaùn baát bieán theo ghôøi gian, nhaân quaû, tuyeán tính, rôøi raïc theo thôøi gian coù theå moâ taû baèng phöông trình sai phaân baäc N: N 1
a
m 0
N 1
m y ( n m) b p x ( n p ) p 0
Moät caùch toång quaùt, phöông trình khoâng thay ñoåi neáu taát caû caùc heä soá chuaån hoùa theo a0 : N 1
N 1
m 1
p 0
y ( n) a m y ( n m) b p x ( n p )
Hay N 1
N 1
p 0
m 1
y ( n) b p x ( n p ) a m y ( n m)
3. Bieán ñoåi Z cuûa pheùp toaùn LTI: Coù pheùp bieán ñoåi tuyeán tính raát hieäu quaû ñeå phaântichs tínhieeuj rôøi raïc theo thôøi gian, gioáng nhö pheùp bieán ñoåi Laplace ñeå phaân tích tín hieäu lieân tuïc theo thôøi gian. Pheùp bieán ñoåi naøy laø bieán ñoåi Z vaø ñöôïc ñònh nghóa nhö sau:
Z{x(n)} X ( z ) x(n) z n n 0
ÔÛ ñoù, kyù hieäu L{x(n)} goïi laø “bieán ñoåi Z cuûa x(n)” vaø z trong phöông trình treân laø soá phöùc. . Caùc giaù trò cuûa z treân maët phaúng phöùc sao cho X(z) xaùc ñònh goïi laø vuøng hoäi tuï (ROC) cuûa X(z). Caùc tính chaát cuûa pheùp bieán ñoåi Z:
LUAÄN VAÊN TOÁT NGHIEÄP
- 21 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
1. Tuyeán tính: neáu:
Z{x1(n)} = X1(z)
vaø:
Z{x2(n)} = X2(z)
thì:
Z{ax1(n) + bx2(n)} = a X1(z) + bX2(z)
vôùi a, b laø caùc haèng soá baát kyø. 2. Dôøi thôøi gian: neáu:
Z{x(n)} = X(z)
thì:
Z{x(n - k)} = z k X(z)
3. Co trong mieàn z: neáu:
Z{x(n)} = X(z)
thì:
Z{anx(n)} = X(a-1z)
vôùi a laø haèng soá baát kyø. 4. Ñaûo thôøi gian: neáu:
Z{x(n)} = X(z)
thì:
Z{x(-n)} = X(z-1)
5. Vi phaân trong mieàn z: neáu:
Z{x(n)} = X(z)
thì:
Z{nx(n)} = -z
dX(z) z
6. Thay ñoåi thang tæ leä: neáu: thì:
Z{x(n)} = X(z) Z{anx(n)} = X(
z ) a
vôùi a laø haèng soá baát kyø. 7. Tính toång chaäp: neáu:
Z{x1(n)} = X1(z)
vaø:
Z{x2(n)} = X2(z)
thì:
Z{x1(n) * x2(n)} = X1(z).X2(z)
LUAÄN VAÊN TOÁT NGHIEÄP
- 22 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
4. Haøm truyeàn trong mieàn taàn soá cuûa pheùp toaùn LTI: Vieát laïi phöông trình:
y (n) h(m)x(n m) m 0
Laáy bieán ñoåi Fourier hai veá phöông trình treân:
F{ y (n)} h(m).F{x(n m)} n 0
Y ( f ) h(m).e j 2fm . X ( f ) n 0
Chia hai veá cho X ( f ) , chuùng ta coù: Y( f ) h(m).e j 2fm X ( f ) n 0
Veá phaûi laø bieán ñoåi Fourier cuûa chuoãi h(m) neân:
Y( f ) H ( f ) T {h(m)} X( f )
Hình 2.5 Mieàn thôøi gian vaø mieàn taàn soá cuûa pheùp toaùn LTI 5. Lieân heä giöõa bieán ñoåi Z vaø bieán ñoåi Fourier: Bieán ñoåi Z cuûa chuoãi x(n) ñöôïc ñònh nghóa: X(z) =
x (n )z n
n
ñaët z = r.ej , ta coù:
LUAÄN VAÊN TOÁT NGHIEÄP
- 23 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
X(z) zr.e j =
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
x ( n ) r n e jn
n
Bieán ñoåi Fourier cuûa chuoãi x(n) ñöôïc ñònh nghóa:
X() =
x ( n ) e jn
n
Töø caùc bieåu thöùc treân thaáy bieán ñoåi Fourier coù theå ñöôïc xem nhö bieán ñoåi Z cuûa moät chuoãi tính treân voøng troøn ñôn vò r = 1 hay |z| = 1: X() = X(z) |z|1 =
x ( n ) e jn
n
III. LOÏC SOÁ: 1. Ñònh nghóa: Boä loïc soá laømoät heä thoáng soá duøng ñeå laøm bieán daïng söï phaân boá taàn soá cuûa caùc thaønh phaàn cuûa moät tín hieäu theo caùc chæ tieâu ñaõ cho. Loïc soá laø caùc thao taùc cuûa xöû lyù duøng ñeå laøm bieán daïng söï phaân boá taàn soá cuûa caùc thaønh phaàn cuûa moät tín hieäu theo caùc chæ tieâu ñaõ cho nhôø moät heä thoáng soá. Moät boä loïc soá laø moät heä thoáng tuyeán tính baát bieán trong mieàn taàn soá, coù sô ñoà khoái:
Vôùi:
yn h n * x n
h m x n m x n * h n
m
xmhn m
m
h(n): ñaùp öùng xung cuûa heä thoáng Ngoaøi ra heä thoáng coøn ñöôïc bieåu dieån bôûi phöông trình sai phaân tuyeán tính sau ñaây: N
a k yn k
k 0
M
b k xn k
k 0
Toång hôïp taác caû caùc heä soá ak vaø bk seõ bieåu dieãn moät heä thoáng tuyeán tính baát bieán. Töùc laø caùc heä soá ak vaø bk laø ñaëc tröng hoaøn toaøn cho heä thoáng. Trong mieàn Z heä thoáng ñöôïc ñaëc tröng bôûi haøm truyeàn ñaït H(z)
LUAÄN VAÊN TOÁT NGHIEÄP
- 24 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
M
Hz Zh n
Yz Xz
b k z k
k 0 N
a k z k
k 0
Hay
H(z) = G.zk .
(z z1 )(z z 2 )...( z z M ) (z p1 )(z p 2 )...( z p N )
Ñaùp öùng taàn soá H e j
M
b k e jk Y e k 0 H e j j
X e j
N
a k e jk
k 0
hay
H(ej) = G. ejk .
(e j z1 )(e j z 2 )...(e j z M )
(e j p1 )(e j p 2 )...(e j p N )
Y e j H e j .X e j
Quan heä giöõa ñaàu vaøo, ñaàu ra vaø ñaùp öùng xung cuûa heä thoáng naøy phaûi thoûa maõn ñieàu kieän sau: yn h n * x n
hm xn m
m0
Lhn 0,
hn
<
n 0
Caùc quan heä naøy cho thaáy chieàu daøi cuûa ñaùp öùng xung h(n) laø raát quan troïng, vì caùc heä soá h(n) laø ñaëc tröng cuûa heä thoáng. Vì theá chuùng ta coù theå phaân loaïi caùc heä thoáng thaønh hai loaïi lôùn tuyø theo chieàu daøi cuûa ñaùp öùng xung h(n). Hai loaïi naøy nhö sau: Loaïi thöù nhaát: Heä thoáng ñöôïc ñaëc tröng bôûi ñaùp öùng xung coùa chieàu daøi höõu haïn (Finite Impulse Response- FIR), töùc laø h(n) # 0 trong moät khoaûng coù chieàu daøi höõu haïn N (töø 0 ñeán N-1).
LUAÄN VAÊN TOÁT NGHIEÄP
- 25 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Loaïi thöù hai: Heä thoáng coù ñöôïc ñaëc tröng bôûi ñaùp öùng xung coù chieàu daøi voâ haïn (Infinite Impulse Response-IIR), töùc laø h(n) # 0 trong moät khoaûng voâ haïn töø 0 ñeán ∞. Vieäc thieát keá boä loïc soá thöïc teá ñeàu ñi töø lyù thuyeát caùc boä loïc lyù töôûng. Coù 4 boä loïc tieâu bieåu sau: _ Boä loïc thoâng thaáp. _ Boä loïc thoâng cao. _ Boä loïc thoâng daûi. _ Boä loïc thoâng chaén daûi. Loïc ôû ñaây chuùng ta hieåu taàn soá laø chính, vì vaäy taát caû caùc ñaëc tröng cuûa boä loïc ñeàu khoâng laøm thay ñoåi bieân ñoä. 2. Caùc boä loïc lyù töôûng: i.
Boä loïc thoâng thaáp: Ñaùp öùng bieân ñoä cuûa boä loïc thoâng thaáp: Ñaùp öùng bieân ñoä cuûa boä loïc thoâng thaáp:
Ñaùp öùng xung : h (n )
ii.
c sin( c n ) cn
Boä loïc thoâng cao Ñaùp öùng bieân ñoä cuûa boä loïc thoâng cao:
LUAÄN VAÊN TOÁT NGHIEÄP
- 26 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Ñaùp öùng xung: h (n )
iii.
sin n c sin( c n ) n cn
Boä loïc thoâng daûi Ñaùp öùng bieân ñoä cuûa boä loïc thoâng daûi:
Ñaùp öùng xung: h (n )
iv.
c 2 sin( c 2 n ) c1 sin( c1n ) c2 n c1n
Boä loïc chaén daûi Ñaùp öùng bieân ñoä cuûa boä loïc thoâng daûi chaén:
LUAÄN VAÊN TOÁT NGHIEÄP
- 27 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Ñaùp öùng xung:
h (n )
sin n c2 sin( c 2 n ) c1 sin( c1n ) n c2 n c1n
Nhaän xeùt: Ñaùp öùng xung h(n) laø ñoái xöùng, taâm ñoái xöùng taïi maãu n=0. L[H(n)]= laø khoâng nhaân quaû, khoâng thöïc hieän ñöôïc veà maët vaät lí. 3. Boä loïc thöïc teá: Boä loïc thöïc teá phaûi laø moät boä loïc coù tính nhaân quaû, khaùc vôùi boä loïc lyù töôûng, xeùt boä loïc thoâng thaáp lyù töôûng vôùi ñaëc tính taàn soá:
coù ñaùp öùng xung cuûa boä loïc laø:
roõ raøng boä loïc thoâng thaáp lyù töôûng laø boä loïc khoâng nhaân quaû neân khoâng toàn taïi trong thöïc teá. Boä loïc soá thöïc teá coøn coù caùc ñaëc tröng bôûi caùc thoâng soá sau: S1 :
ñoä gôïn soùng ôû daûi thoâng.
S2 :
ñoä gôïn soùng ôû daûi chaén.
ωp :
taàn soá giôùi haïn(bieân taàn) daûi thoâng.
ωS:
taàn soá giôùi haïn(bieân taàn) daûi chaén.
LUAÄN VAÊN TOÁT NGHIEÄP
- 28 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU ω:
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
ωS – ωp:Beà roäng daûi quaù ñoä
4. Boä loïc FIR vaø IIR i. Loïc FIR: Caùc heä thoáng coù ñaëc tính xung coù chieàu daøi höõu haïn ñöôïc goïi laø FIR:
Giaû söû heä thoáng FIR:
Khi ñoù ñaëc tính xung cuûa heä thoáng: 1 y(n) = a0
M
b k x (n k )
k 0
ii. Loïc IIR: Caùc heä thoáng coù ñaëc tính xung coù chieàu daøi voâ haïn ñöôïc goïi laø IIR: N
M
k 0
k 0
a k y( n k ) = b k x ( n k )
Phöông trình treân laø moät phöông trình ñeä qui: y(n) = –
N
M
k 1
k 0
a k y( n k ) + b k x (n k )
vì vaäy IIR coøn goïi laø loïc ñeä qui vaø FIR laø loïc khoâng ñeä qui. Khi ñoù heä thoáng coù haøm truyeàn trong maët phaúng Z: M
H(z) =
Y (z) = X (z)
bk z
k 0 N
1
M
k
=
b k z k
k 0 N
a k z k a k z k k 1
k 0
iii. So saùnh boä loïc FIR vaø IIR:
LUAÄN VAÊN TOÁT NGHIEÄP
- 29 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Ñeå thieát keá caùc boä loïc coù ñaëc tính löïa choïn taàn soá, ta caàn phaûi ñaûm baûo ñöôïc nhöõng ñaëc tính mong muoán veà bieân ñoä vaø pha, ñoù chính laø tìm caùc heä soá thích hôïp cuûa boä loïc FIR hay IIR phuï thuoäc vaøo caùc yeâu caàu cuï theå. Trong thöïc teá, caùc boä loïc FIR ñöôïc söû duïng trong caùc tröôøng hôïp ñaëc bieät caàn ñaëc tính pha tuyeán tính trong daûi thoâng cuûa boä loïc. Neáu khoâng quan taâm ñeán yeâu caàu naøy thì ta coù theå söû duïng caû boä loïc FIR laãn IIR. Tuy nhieân neáu khoâng quan taâm ñeán söï meùo daïng veà bieân ñoä vaø pha thì boä loïc IIR ñöôïc söû duïng phoå bieán hôn vì vieäc thöïc thi ít toán keùm boä nhôù vaø thôøi gian thöïc thi nhanh hôn so vôùi boä loïc FIR. Hôn nöõa, vieäc thieát keá boä loïc IIR coù theå söû duïng laïi keát quaû thieát keá caùc boä loïc töông töï (analog). Trong khi ñoù, thieát keá loïc FIR ñoøi hoûi kó thuaät tính toaùn khaù lôùn vaø taêng tuyeán tính theo baäc cuûa boä loïc. Xaáp xó loïc FIR coù ñoä choïn loïc cao khaù khoù. Trong boä loïc FIR ñoøi hoûi boä nhôù RAM vaø boä ghi dòch tæ leä vôùi baäc cuûa boä loïc vaø khaù cao so vôùi boä loïc IIR. IV. BIEÁN ÑOÅI FOURIER RÔØI RAÏC: (Discrete Fourier Transform) Cho tôùi baây giôø chuùng ta ñaõ vaøi laàn söû duïng Fourier khi ñeà caäp ñeán ñaëc tính cuûa chuoãi soá vaø pheùp toaùn tuyeán tính. Bieán ñoåi Fourier cuûa chuoãi nhaân quaû nhö sau:
T x(n) X ( f ) x(n)e j 2fn
(2.16)
n 0
ôû ñoù chu kyø laáy maãu ñaõ chuaån hoùa laø moät (T=1). Neáu chuoãi soá coù ñoä daøi giôùi haïn (ñeå coù theå toå chöùc cho maùy tính) thì: N 1
X ( f ) x(n)e j 2fn
(2.17)
n 0
vôùi ñoä daøi cuûa mieàn laáy maãu laø N. Bieán ñoåi ngöôïc Fourier laø
T 1 X ( f ) x(n)
1 2
X ( f )e
j 2 fn
df
(2.18)
1 2
Bôûi vì X(f) laø haøm tuaàn hoaøn vôùi chu kyø T=1, neân tích phaân treân laáy trong chu kyø naøo cuõng ñöôïc 1
x(n) X ( f )e j 2fn df
(2.19)
0
1. Daïng DFT
LUAÄN VAÊN TOÁT NGHIEÄP
- 30 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Bieåu dieãn cuûa bieán ñoåi Fourier treân laø chính xaùc nhöng coù trôû ngaïi chính trong xöû lyù soá vì bieán taàn soá laø lieân tuïc chöù khoâng phaûi rôøi raïc. Ñeå khaéc phuïc ñieàu naøy, chuùng ta laïi bieãu dieãn laïi tín hieäu theo thôøi gian vaø taàn soá. Bieán ñoåi Fourier rôøi raïc thuaän DFT N 1
X ( k ) x ( n )e
j 2 kn N
(2.20)
n 0
vaø bieán ñoåi Fourier rôøi raïc IDFT
1 N 1 x ( n ) X ( k )e N k 0
j 2 kn N
(2.21)
2. Tính chaát cuûa DFT Phaàn naøy seõ giôùi thieäu caùc tính chaát quan troïng cuûa DFT. Söû duïng caùc tính chaát naøy chuùng ta seõ toå chöùc hieäu quaû khi tính toaùn DFT. Tính tuaàn hoaøn: Neáu x(n) vaø X(k) laø caëp DFT N-ñieåm, thì x(n+N)=x(n)
n
X(k+N)=X(k)
n
(2.22)
Tính tuyeán tính: Neáu
(2.23)
x(n) a(n) b(n)
vôùi vaø laø haèng thöïc hay haèng phöùc thì: X(k)= A(k)+ B(k) A(k) vaø B(k) laø DFT cuûa chuoãi a(n)vaø b(n) trong mieàn thôøi gian Tính chaát dôøi theo thôøi gian: Neáu x(n) vaø X(k) laø caëp DFT N-ñieåm thì DFT x(n p) X (k )e
j 2 kn N
(2.24)
3. Phoå coâng suaát DFT thöôøng ñöôïc duøng laøm coâng cuï ñeå phaân tích phoå cuûa chuoãi vaøo. Bieân ñoä cuûa moät thaønh phaàn thaønh soá cuï theå thöôøng ñöôïc quan taâm. Coù theå chia DFT thaønh bieân ñoä vaø pha nhö sau:
vôùi
X(f)=Xreal(f)+jXimag(f)
(2.25)
X ( f ) X ( f ) e j ( f )
(2.26)
2 2 X ( f ) X real X imag
LUAÄN VAÊN TOÁT NGHIEÄP
- 31 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU vaø
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
X imag X real
( f ) tan 1
Neáu chuùng ta quan taâm ñeán phoå coâng suaát cuûa tín hieäu thì chuùng ta phaûi laáy tín hieäu nhaân vôùi lieân hôïp phöùc cuûa noù. (2.27)
2 2 X (k ) X * (k ) X (k ) X real X imag 2
Tuy nhieân, naûy sinh moät vaán ñeà khi duøng DFT laø coâng cuï phaân tích phoå. Vaán ñeà naûy sinh lieân quan ñeán giaû thieát laø chuùng ta ñaõ taïo ra DFT cuûa chuoãi soá trong moät chu kyø cuûa daïng soùng coù chu kyø laëp laïi. Hình 2.4 minh hoïa ñieàu naøy. Treân hình veõ theå hieän, moïi chuoãi soá ñeàu bò giaùn ñoaïn theo thôøi gian taïi caùc taïi caùc bieân cuûa chu kyø giaû. Giaùn ñoaïn naøy seõ sinh ra thaønh phaàn taàn soá raát cao ôû chuoãi soá ra. Nhöõng thaønh phaàn coù theå seõ lôùn hôn raát nhieàu so vôùi taàn soá laáy maãu, vaø bò dôøi vaøo giöõa phoå.
Hình 2.4: Taïo chu kyø töø moät ñoaïn Kyõ thuaät duøng ñeå khaéc phuïc khoù khaên naøy laø cöûa soå hoùa. Vaán ñeà khaéc phuïc laø phaàn giaùn ñoaïn ôû caïnh cuûa moãi chu kyø cuûa daïng soùng. Bôûi vì thuaät toaùn DFT toång quaùt khoâng bieát ñöôïc ñoä giaùn ñoaïn ôû hai bieân, neân kyõ thuaät cöûa soå chæ ñôn thuaàn giaûm bôùt bieân ñoä cuûa chuoãi soá ôû hai bieân. Ñieàu naøy ñöôïc laøm töøng böôùc vaø laøm trôn sao cho khoâng taïo ra thaønh phaàn giaùn ñoaïn môùi vaø keát quaû laø laøm giaûm bôùt thaønh phaàn taàn soá bò dôøi ñi. Khoâng coù caûi tieán naøo maø khoâng bò traû giaù. Bôûi vì aùp duïng cöûa soå vaøo chuoãi soá tröôùc khi DFT, neân ñoä trung thöïc cuûa phoå bò giaûm. Keát quaû laø ñoä phaân giaûi cuûa caùc thaønh phaàn taàn soá baèng nhau hôi bò suy giaûm. Cöûa soå toát nhaát ñoøi hoûi phaûi laøm cho tín hieäu giaû (bò dôøi ñi) suy giaûm nhieàu nhaát ñoàng thôøi suy hao cuûa ñoä phaân giaûi phoå laø nhoû nhaát. Coù nhieàu loaïi cöûa soå khaùc nhau nhöng ñeàu coù ñaëc tröng chung laø: giaûm caùc phaàn töû gaàn bieân (gaàn n=0 vaø n=N-1) vaø buø baèng caùch taêng giaù trò caùc thaønh phaàn ôû xa bieân. 4. Phoå trung bình Bôûi vì tín hieäu luoân luoân coù nhieãu, nhieãu gaây ra do tính chaát cuûa thieát bò taïo tín hieäu hay nhieãu beân ngoaøi taùc ñoäng ñeán nguoàn tín hieäu. Neáu chæ laáy DFT moät laàn thì ñöôøng bieåu dieãn khoâng trung thöïc phoå tín hieäu. Ñeå khaéc phuïc ñieàu naøy, chuùng ta laáy DFT nhieàu laàn töø nhieàu nguoàn tín hieäu gioáng nhau vaø laáy trung bình theo thôøi gian cuûa phoå coâng suaát. Neáu moãi DFT ñöôïc laáy maãu trong moãi nT giaây thì
LUAÄN VAÊN TOÁT NGHIEÄP
- 32 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU Phoå coâng suaát =
X Max i 0
2 i real
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
X
(2.28)
2 i imag
Roõ raøng, phoå tín hieäu khoâng thay ñoåi nhieàu trong khoaûng töø t=0 tôùi t=Max(NT). 5. Bieán ñoåi Fourier nhanh Bieán ñoåi Fourier nhanh - Fast Fourier Transform (FFT) laø thuaät toaùn raát hieäu quaû ñeå tính DFT cuûa moät chuoãi soá. Öu ñieåm laø ôû choã nhieàu tính toaùn ñöôïc laëp laïi do tính tuaàn hoaøn cuûa soá haïng Fourier e N 1
X ( k ) x ( n )e
j 2 kn N
. Daïng cuûa DFT laø:
j 2 kn N
(2.29)
n 0
Ñaët W
nk
e
j 2 kn N
Chuùng ta vieát laïi phöông trình (4.29)
N 1
X(k) x(n)W nk
(2.30)
n 0
Chuù yù raèng W haïng Fourier.
( N qN )( k rN )
W nk Vôùi moïi q, r nguyeân do tính tuaàn hoaøn cuûa soá
Chuùng ta taùch DFT thaønh hai phaàn: N 1 2
N 1 2
n 0
n 0
X (k ) x(2n)WN2 nk x(2n 1)WN( 2 n 1) k
(2.31)
ôû ñoù chæ soá döôùi N cuûa soá haïng Fourier bieãu dieãn kích thöôùc cuûa chuoãi. Neáu chuùng ta bieåu dieãn thaønh phaàn chaün cuûa chuoãi soá x(n) baèng xev vaø thaønh phaàn leû laø xod thì phöông trình coù theå vieát laïi X (k )
N 1 2
x n 0
ev
(n)W Nnk W Nk 2
N 1 2
x
2 n 0
od
(2.32)
(n)W Nnk 2
Baây giôø chuùng ta coù hai bieåu thöùc DFT, do ñoù chuùng ta coù theå vieát : (2.33)
X (k ) X ev (k ) W Nk X od (k ) 2
Chæ soá k chaïy ñeán N-1 nhöng do söû duïng tính chu kyø cuûa haøm chaün vaø haøm leû neân chæ N caàn tính DFT ñieåm ñeå coù ñöôïc giaù trò cuûa X(k). 2 N Xev k X ev k 2
LUAÄN VAÊN TOÁT NGHIEÄP
N k N 1 2
- 33 -
(2.34)
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Tieáp tuïc chia DFT keát quaû thaønh hai nöûa chaún vaø leû cho ñeán khi chæ coøn phaûi tính hai ñieåm DFT j2 k 2 (0) (1)e A(k) (0) (1) (0) (1)
k
(2.35)
k even k odd
Ñoái vôùi 2 ñieåm DFT naøy chæ caàn pheùp coäng vaø tröø maø khoâng caàn pheùp nhaân. Ñeå tính toaøn boä DFT, chuùng ta nhaân 2 ñieåm DFT vôùi caùc thöøa soá W thích hôïp töø W 0 tôùi WN/2 . Hình 2.51aø ñoà thò 8 ñieåm FFT. Chuùng ta coù theå so saùnh tröïc tieáp DFT vaø FFT nhö sau:
Hình 2.5 : FFT 8 ñieåm, cô soá 2, phaân chia theo taàn soá Khi tính tröïc tieáp DFT, moãi giaù trò cuûa k caàn N pheùp nhaân phöùc vaø N-1 pheùp coäng phöùc. Ñoái vôùi FFT, moãi haøm ñeàu coù daïng (0) W p (1) (goïi laø soá böôùm do ñoà thò coù hình caùnh böôùm) yeâu caàu moät pheùp nhaân vaø hai pheùp coäng. Töø ñoà thò treân hình 2.5 chuùng ta coù theå toång quaùt hoùa soá böôùm laø Soá böôùm= Ñieàu naøy laø do coù
N log 2 N 2
N haøng böôùm (bôûi vì moãi böôùm coù hai ngoõ vaøo) vaø log2N coät böôùm 2
V. BIEÁN ÑOÅI FOURIER THÔØI GIAN NGAÉN-STFT: Pheùp bieán ñoåi Fourier khoâng theå aùp duïng ñoái vôùi tín hieäu khoâng döøng, vì caùc thaønh phaàn taàn soá khoâng oån ñònh. Tuy nhieân neáu chuùng ta chia tín hieäu khoâng döøng thaønh nhöõng ñoaïn
LUAÄN VAÊN TOÁT NGHIEÄP
- 34 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
ñuû nhoû theo thôøi gian thì tín hieäu trong moãi ñoaïn coù theå xem laø tín hieäu döøng vaø do ñoù coù theå laáy bieán ñoåi Fourier treân töøng ñoaïn tín hieäu naøy. Nhö vaäy, pheùp bieán ñoåi STFT vöøa coù tính ñònh vò theo taàn soá do tính chaát cuûa bieán ñoåi Fourier, vöøa coù tính ñònh vò theo thôøi gian do ñöôïc tính trong töøng khoaûng thôøi gian ngaén. Ñaây laø nguyeân lyù cuûa STFT hay coøn goïi laø bieán ñoåi Fourier cöûa soå hoùa. 1. Coâng thöùc bieán ñoåi Trong STFT, tín hieäu f(t) ñaàu tieân ñöôïc nhaân vôùi moät haøm cöûa soå w(t-) ñeå laáy ñöôïc tín hieäu trong khoaûng thôøi gian ngaén xung quanh thôøi ñieåm . Sau ñoù pheùp bieán ñoåi Fourier bình thöôøng ñöôïc tính treân ñoaïn tín hieäu naøy. Keát quaû chuùng ta ñöôïc moät haøm hai bieán STFTf(w,t) xaùc ñònh bôûi :
f (t ).w * (t )e
STFT f ( w, t )
jwt
(2.36)
dt
STFT taïi thôøi ñieåm laø bieán ñoåi Fourier cuûa tín hieäu f(t) nhaân vôùi phieân baûn dòch moät khoaûng theo thôøi gian w(t-) cuûa cöûa soå cô baûn taäp trung xung quanh . Nhö vaäy STFT coù tính ñònh vò theo thôøi gian. Cöûa soå caøng heïp thì tính ñònh vò caøng toát. Ñeå thaáy roõ hôn veà tính ñònh vò theo taàn soá, ta aùp duïng ñònh lyù Parserval ñeå vieát laïi (2.36) nhö sau:
w(t )e
STFT f ( w, )
jwt *
1 2
W
*
f (t )dt
1 2
F (w(t )e
) .F f (t )dw
jwt *
(2.37)
( w , w).e j ( w w) .F w , dw, ,
e jw 2
* , , jw , W (w w) F (w )e dw ,
vôùi W*(w,-w) vaø F(w,) laàn löôït laø phoå cuûa cöûa soå w(t-) vaø tín hieäu f(t). W*(w,-w) coù taùc duïng nhö moät boä loïc daûi thoâng taäp trung quanh taàn soá w coù baêng thoâng baèng baêng thoâng w(t) laøm giôùi haïn phoå cuûa tín hieäu F(w,) xung quanh taàn soá ñang phaân tích w. Nhö vaäy STFT coù tính ñònh vò theo taàn soá. Tính ñònh vò naøy caøng toát khi baêng thoâng cuûa cöûa soå phaân tích caøng heïp. Ta thaáy raèng, STFT chính laø soá ño ñoä gioáng nhau giöõa tín hieäu phieân baûn dòch vaø bieán ñieäu cuûa cöûa soå cô baûn vì (8.1) coù theå vieát laïi nhö sau: STFT f ( w, )
w(t )e
jwt *
(2.38)
f (t )dt g w, (t ), f (t )
vôùi g w, (t ) w(t )e jwt laø phieân baûn dòch vaø bieán thieân cuûa w(t)
LUAÄN VAÊN TOÁT NGHIEÄP
- 35 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Do vieäc dòch thôøi gian moät khoaûng laøm cho cöûa soå tònh tieán moät khoaûng theo truïc thôøi gian vaø bieán ñieäu cöûa soå vôùi e jwt laø cöûa soå tònh tieán moät khoaûng w theo truïc taàn soá, neân kích thöôùc cuûa cöûa soå khoâng thay ñoåi maø chæ dôøi ñeán vò trí môùi xung quanh ( ,w). Nhö vaäy, moãi haøm cöûa soå cô sôû söû duïng trong pheùp bieán ñoåi naøy ñeàu coù moät ñoä phaân giaûi thôøi gian-taàn soá, chæ khaùc vò trí treân maët phaúng thôøi gian taàn soá. Do ñoù, coù theå rôøi raïc hoùa deã daøng STFT treân moät löôùi chöõ nhaät (mw0 , n 0 ) . Neáu haøm cöûa soå laø moät boä loïc haï thoâng coù taàn soá caét wb, hoaëc baêng thoâng 2wb thì w0
ñeå vieäc laáy maãu khoâng maát thoâng tin. Caùc w0 haøm cöûa soå taïi taát caû caùc ñieåm laáy maãu seõ phuû kín maët phaúng thôøi gian-taàn soá cuûa pheùp bieán ñoåi. ñöôïc choïn nhoû hôn wb vaø 0 nhoû hôn
Ñoä phaân giaûi thôøi gian-taàn soá cuûa STFT phuï thuoäc vaøo haøm cöûa soå. Ñeå coù ñoä phaân giaûi toát thì cöûa soå phaân tích phaûi heïp (veà maët thôøi gian). Trong khi ñoù, ñeå ñaït ñöôïc ñoä phaân giaûi taàn soá toát thì baêng thoâng cuûa cöûa soå phaûi heïp. Tuy nhieân, theo nguyeân lyù baát ñònh thì khoâng theå toàn taïi moät cöûa soå vôùi khoaûng thôøi gian vaø baêng thoâng heïp tuøy yù maø coù moät söï hoaùn ñoåi giöõa hai thoâng soá naøy (do tích cuûa chuùng bò chaën döôùi). Neáu ta choïn cöûa soå coù baêng thoâng heïp ñeå ñoä phaân giaûi toát thì khoaûng thôøi gian laïi roäng laøm cho ñoä phaân giaûi thôøi gian laïi keùm ñi vaø ngöôïc laïi, ñaây chính laø nhöôïc ñieåm cuûa STFT. 2. Moät soá haøm cöûa soå duøng trong STFT Trong xöû lyù tín hieäu, ñeå giôùi haïn thôøi gian hoaëc taàn soá (loïc) moät tín hieäu, ngöôøi ta thöôøng duøng caùc haøm cöûa soå. Trong STFT, haøm cöûa soå ñöôïc duøng ñeå giôùi haïn tín hieäu ôû caû mieàn thôøi gian vaø mieàn taàn soá. Moät soá cöûa soå thöôøng hay ñöôïc söû duïng ñöôïc ñònh nghóa nhö sau: Cöûa soå Boxcar (Rectangular)
1 w[n] 0
0nM n [0, M ]
Ñoä roäng cuûa cöûa soå laø M+1 maãu Cöûa soå Bartlett (Triangular)
2n M 2n w[n] 2 M 0
0n
M 2
M nM 2 n [0, M ]
Cöûa soå Hanning
LUAÄN VAÊN TOÁT NGHIEÄP
- 36 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
2n 0,5 0,5 cos( ) w[n] M 0
0nM n [0, M ]
Cöûa soå Hamming
2n 0,54 0,46 cos( ) w[n] M 0
0nM n [0, M ]
Cöûa soå Blackman
2n 4n 0,42 0,5 cos( ) 0,8 cos( ) w[n] M M 0
0nM n [0, M ]
Cöûa soå Kaiser (Ñöôïc ñònh nghóa töø haøm Bessel baäc 0)
n 2 ] I 0 [ 1 [ w[n] I 0 ( ) 0 vôùi
0nM n [0, M ]
M laø I 0 ( ) laø haøm caûi bieân cuûa Bessel baäc 0, ñöôïc ñònh nghóa laø 2
I 0 ( )
1 e cos d 2
Khaùc vôùi caùc cöûa soå khaùc coù hình daïng khoâng thay ñoåi, hình daïng cuûa haøm Kaiser coù theå thay ñoåi moät caùch linh hoaït nhôø vaøo thoâng soá hình daïng . Vôùi caùc giaù trò khaùc nhau thì cöûa soå Kaiser seõ coù hình daïng khaùc nhau.
Boxcar window
Triang window
1.2
1 0.9
1
0.8 0.7
0.8
Amp.
Amp.
0.6 0.6
0.5 0.4
0.4
0.3 0.2
0.2
0.1 0
0
50
100
150 Samples
LUAÄN VAÊN TOÁT NGHIEÄP
200
250
0
300
- 37 -
0
16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 Samples
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC Hanning window 1
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
Amp.
Amp.
Hamming window 1
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
0
16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 Samples
0
16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 Samples
Kaiser window, beta=5 1
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
Amp.
Amp.
Blackman window 1
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
0
16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 Samples
0
16 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 Samples
Kaiser windows 1
Amp.
0.8
0.6 beta=0 beta=1.33 beta=3.68 beta=4.86 beta=7.04 beta=10
0.4
0.2
VI.
0
0
50
100
150
200
250
Sample
Hình 2.6 : Caùc haøm cöûa soå thöôøng ñöôïc söû duïng trong xöû lyù tín hieäu, coù theå duøng ñeå tính STFT. VII. XAÙC SUAÁT VAØ QUAÙ TRÌNH NGAÃU NHIEÂN: Tín hieäu tieáng noùi laø moät quaù trình thoáng keâ ôû ñoù söï töông quan cuûa chuoãi soá ñoùng vai troø quan troïng ñeå phaân tích, döï baùo ñaëc tính cuûa tieáng noùi. Ngoaøi ra, trong nhaän daïng tieáng noùi, moâ hình xaùc suaát laø moät trong nhöõng moâ hình ñaït keát quaû toát nhaát. Phaàn naøy trình baøy khaùi nieäm xaùc suaát vaø quaù trình ngaãu nhieân laøm cô sôû cho trích huaán luyeän vaø nhaän daïng tieáng noùi ôû chöông sau.
LUAÄN VAÊN TOÁT NGHIEÄP
- 38 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
1. Cô sôû xaùc suaát Xaùc suaát cuûa söï kieän A ñöôïc kyù hieäu laø P(A). Coù 3 tính chaát cuûa P(A):
P(A)≥ 0
P(taát caû khaû naêng coù theå xaûy ra)=1
Cho {Ai}, vôùi (Ai . Aj=0) thì P(Ai.Aj)=P(Ai)+P(Aj)
Chuùng ta ñònh nghóa theâm xaùc suaát ñoàng thôøi vaø xaùc suaát coù ñieàu kieän Xaùc suaát ñoàng thôøi laø xaùc suaát ñeå hai hay nhieàu söï kieän ñoàng thôøi xaûy ra trong moät pheùp thöû. Kí hieäu xaùc suaát 2 söï kieän A vaø B xaûy ra ñoàng thôøi: P(AB) Xaùc suaát coù ñieàu kieän laø xaùc suaát ñeå xaûy ra söï kieän A trong khi söï kieän B ñaõ xaûy ra. Kí hieäu: P(A/B) Coâng thöùc tính:
P( A | B)
P( AB) P( B)
(2.39)
Coâng thöùc Bayes: 2 bieán coá A, B ñoäc laäp
P( A | B)
P( B | A).P( A) P( B)
(2.40)
Coâng thöùc (2.40) thöôøng ñöôïc söû duïng ñeå tính xaùc suaát coù ñieàu kieän moät khi ñaõ bieát xaùc suaát cuûa töøng söï kieän vaø xaùc suaát ñieàu kieän cuûa söï kieän kia. 2. Bieán ngaãu nhieân Trong xöû lyù tín hieäu, ñieàu mong muoán laø tín hieäu coù giaù trò cuï theå hay naèm trong moät phaïm vi cuï theå. Tín hieäu trong tröôøng hôïp naøy ñöôïc coi laø bieán ngaãu nhieân. Ví duï, vôùi bieán ngaãu nhieân X, chuùng ta coù caùc söï kieän nhö: Söï kieän A:
X coù giaù trò baèng 5 (X = 5)
Söï kieän B:
X=16
… Ñaây laø taäp söï kieän cuûa bieán rôøi raïc coù giaù trò cuï theå, ngoaøi ra coøn coù taäp söï kieän cuûa bieán lieân tuïc coù giaù trò naèêm trong moät phaïm vi naøo ñoù. Chuùng ta coù theå ñònh nghóa haøm phaân phoái xaùc suaát cuûa moät bieán ngaãu nhieân nhö sau: (2.41)
F ( x) P( X x)
Haøm phaân phoái xaùc suaát laø haøm taêng cuûa bieán ñoäc laäp x vaø chæ ñuùng cho bieán ngaãu nhieân cuï theå X. Neáu laáy vi phaân F(x) theo bieán x, ta nhaän ñöôïc haøm maät ñoä xaùc suaát (probablity destiny function-PDF) cuûa X: LUAÄN VAÊN TOÁT NGHIEÄP
- 39 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU
p( x)
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
dF ( x) dx
(2.42)
Laáy tích phaân p(x), ta coù ñöôïc haøm phaân phoái xaùc suaát nhö sau: x
F ( x)
p( )d
(2.43)
Nhö vaäy ta coù theå xaùc ñònh ñöôïc xaùc suaát cuûa bieán ngaãu nhieân X naèm giöõa a vaø b: (2.45)
P( X b) P(a X b) P( X a) Vieát laïi phöông trình treân theo haøm phaân phoái: b
P(a X b) F (b) F (a) p( x)dx
(2.46)
a
Nghóa laø neáu bieát haøm phaân phoái hay haøm maät ñoä, chuùng ta coù theå tính ñöôïc xaùc suaát cuûa bieân ngaãu nhieân X naèm trong phaïm vi cho tröôùc. 3. Kyø voïng, phöông sai Giaù trò kyø voïng cuûa x kyù hieäu E(x) laø giaù trò coù khaû naêng xaûy ra nhieàu nhaát. E(x) coøn ñöôïc goïi laø giaù trò trung bình, vaø ñöôïc tính töø haøm maät ñoä nhö sau:
E ( x)
xp( x)dx
(2.47)
Ví duï1: (rôøi raïc)
E(X) = 2·0.05+3·0.10+ … +9·0.05 = 5.35 Ví duï 2: (lieân tuïc)
3 Cho f ( x) (1 x 2 ) 0 x 1 otherwise 2
LUAÄN VAÊN TOÁT NGHIEÄP
- 40 -
f ( x) 0
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 2: CÔ SÔÛ XÖÛ LYÙ SOÁ TÍN HIEÄU 1
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC x 1
1
3 3 3 x2 x4 3 ( ) Thì E ( X ) x (1 x 2 )dx ( x x 3 )dx 2 20 2 2 4 x 0 8 0
Phöông sai cuûa bieán ngaãu nhieân x ñöôïc ñònh nghóa: (2.48)
2 Var ( x) E[( x E[ x]) 2 ]
laø caên baäc hai giaù trò bình phöông trung bình cuûa ñoä leäch giöõa moät bieán vaø giaù trò trung bình cuûa bieán ñoù VIII. TOÙM TAÉT: Chöông naøy giôùi thieäu cô sôû lyù thuyeát cuûa xöû lyù soá tín hieäu laøm cô sôû ñeå thöïc hieän cho caùc chöông sau, ñaëc bieät laø Chöông 3-trích ñaëc tröng tieáng noùi. Ngoaøi ra, chöông naøy coøn trình baøy khaùi nieäm xaùc suaát, caùc tính chaát cuûa noù ñeå phuïc vuï cho phaàn quan troïng nhaát cuûa ñeà taøi-Chöông 5: Moâ hình Markov aån.
LUAÄN VAÊN TOÁT NGHIEÄP
- 41 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Chöông 3:
TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI Trong caùc lónh vöïc xöû lyù tieáng noùi nhö nhaän daïng, toång hôïp, maõ hoùa ñeàu caàn phaûi phaân tích tham soá tieáng noùi. Chöông naøy trình baøy kyõ thuaät ñeå trích tham soá cuûa tín hieäu tieáng noùi laø phaân tích cepstral theo phöông phaùp Mel-Frequency Coefficient - MFCC. Khaùi nieäm cô baûn khi phaân tích tieáng noùi laø phaân tích theo thôøi gian ngaén. Trong khoaûng thôøi gian daøi, tín hieäu tieáng noùi laø tín hieäu khoâng döøng, nhöng trong khoaûng thôøi gian ñuû ngaén (1030ms) tieáng noùi ñöôïc xem nhö laø tín hieäu döøng. Ñieàu naøy laø do toác ñoä thay ñoåi phoå tieáng noùi chæ lieân quan tröïc tieáp ñeán toác ñoä di chuyeån cuûa boä phaän caáu aâm (moâi, löôõi, haøm, voøm mieäng meàm) vaø giôùi haïn cuûa caùc raøng buoäc sinh lyù. Haàu heát hoaït ñoäng cuûa caùc heä phaân tích tieáng noùi ñeàu döïa vaøo khaùi nieäm thôøi gian bieán thieân. Thoâng thöôøng ngöôøi ta chia tieáng noùi thaønh nhieàu ñoaïn coù thôøi gian baèng nhau hay caùc frame, moãi frame coù ñoä daøi töø 10-30ms. I. HAØM NAÊNG LÖÔÏNG THÔØI GIAN NGAÉN Haøm naêng löôïng thôøi gian ngaén (Short Time Energy Function) cuûa tieáng noùi ñöôïc tính baèng caùch chia tín hieäu tieáng noùi thaønh nhieàu frame, moãi frame daøi N maãu, roài laáy toån g bình phöông cuûa caùc maãu trong töøng frame. Cöûa soå chöõ nhaät daøi 10-30ms laø phuø hôïp cho muïc ñích naøy. Vôùi cöûa soå baét ñaàu ôû maãu thöù m, haøm naêng löôïng thôøi gian ngaén Em ñöôïc ñònh nghóa nhö sau: m N 1
Em
2
(3.1)
[ x(n) * w(n m)] n m
II. PHAÙT HIEÄN ÑIEÅM ÑAÀU ÑIEÅM CUOÁI CUÛA MOÄT TÖØ Moät trong nhöõng vaán ñeà cô baûn cuûa xöû lyù tieáng noùi laø xaùc ñònh ñieåm baét ñaàu vaø keát thuùc cuûa moät töø. Ñieàu naøy khoù thöïc hieän chính xaùc neáu tín hieäu ñöôïc noùi trong moâi tröôøng coù nhieãu. Chuùng ta söû duïng thuaät toaùn phaùt hieän ñieåm ñaàu ñieåm cuoái cuûa moät töø caên cöù vaøo haøm naêng löôïng thôøi gian ngaén nhö sau:
LUAÄN VAÊN TOÁT NGHIEÄP
- 42 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI Vôùi
moãi m N 1
frame,
tính
naêng
löôïng
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
thôøi
gian
ngaén
E[k]
theo
phöông
trình
2
[ x(n) * w(n m)] , neáu E[k] lôùn hôn giaù trò ngöôõng k*Ethreshold thì ñaùnh soá frame ñoù
Em n m
laø baét ñaàu moät töø, kyù hieäu laø frame B, ngöôïc laïi thì xeùt frame keá tieáp cho ñeán khi xaùc ñònh ñöôïc frame B, trong ñoù k laø heä soá nhaân cho phaùt hieän ñieåm ñaàu, Ethreshold laø naêng löôïng trung bình 10 frame ñaàu tieân khi chöa noùi, ñaëc tröng cho nhieãu neàn. Neáu khoâng xaùc ñònh ñöôïc frame B thì tín hieäu ñoù khoâng phaûi laø tieáng noùi. Tính naêng löôïng thôøi gian ngaén E[k] cuûa frame keá tieáp cho ñeán khi nhoû hôn giaù trò ngöôõng g*Ethresold thì ñaùnh daáu ñoù laø frame keát thuùc moät töø kyù hieäu laø frame E, vôùi g laø heä soá nhaân cho phaùt hieän ñieåm cuoái moät töø. Cuoái cuøng keát hôïp vôùi ñieàu kieän chieàu daøi cuûa moät töø tieáng Vieät thöôøng khoaûng 300-450ms ñeå quyeát ñònh xem ñoù coù phaûi laø moät töø ñöôïc phaùt aâm hay khoâng. Sô ñoà khoái phaùt hieän ñieåm ñaàu ñieåm cuoái cuûa moät töø nhö hình 3.1. Giaûi thuaät taùch töø naøy coù nhieàu nhöôïc ñieåm. Phöông phaùp naøy tuy ñôn giaûn nhöng coù nhöôïc ñieåm laø khoâng xaùc ñònh ñöôïc chính xaùc ñöôïc maãu naøo trong FRAME laø maãu thöïc söï baét ñaàu cho tín hieäu tieáng noùi vaø töông töï cho ñieåm cuoái. Phöông phaùp naøy khoâng coøn chính xaùc neâu moâi tröôøng coù nhieãu quaù lôùn. Tuy nhieân trong moâi tröôøng khoâng quaù oàn, giaûi thuaät naøy coù theå chaáp nhaän ñöôïc. Hình 3.2 minh hoïa ñoaïn tín hieäu vaø naêng löôïng thôøi gian ngaén cuûa noù
LUAÄN VAÊN TOÁT NGHIEÄP
- 43 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 3.1 Sô ñoà khoái taùch töø LUAÄN VAÊN TOÁT NGHIEÄP
- 44 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 3.2: Tín hieäu vaø naêng löôïng thôøi gian ngaén cuûa noù III. TIEÀN NHAÁN (Pre-emphasis) Chuùng ta bieát raèng phoå tieáng noùi höõu thanh coù khuynh höôùng suy giaûm toaøn boä -6dB/octave khi taàn soá taêng leân. Ñieàu naøy laø do khuynh höôùng suy giaûm -12dB/octave cuûa nguoàn kích aâm höõu thanh vaø taêng leân +6dB/octave do phaùt aâm mieäng. Do ñoù caàn phaûi buø +6dB/octave treân toaøn boä baêng taàn. Ñieàu naøy ñöôïc goïi laø pre-emphasis tín hieäu. Trong xöû lyù tín hieäu soá, chuùng ta duøng boä loïc thoâng cao coù taàn soá caét 3dB ôû taàn soá trong phaïm vi töø 100Hz ñeán 1kHz. Boä loïc thoâng cao naøy coù phöông trình sai phaân : y(n) = x(n) - a*x(n)
(3.2)
trong ñoù y(n) laø maãu ra hieän taïi cuûa boä loïc pre-emphasis, x(n) laø maãu vaøo hieän taïi, x(n-1) laø maãu vaøo tröôùc ñoù vaø a laø haèng soá thöôøng ñöôïc choïn giöõa 0.9 vaø 1ø. Laáy bieán z cuûa phöông trình (3.2) : Y(z)=X(z)-az-1X(z)=(1-az-1)X(z)
(3.3)
trong ñoù z-1 laø toaùn töû treã maãu ñôn vò. Suy ra haøm truyeàn H(z) cuûa boä loïc laø: LUAÄN VAÊN TOÁT NGHIEÄP
- 45 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
H ( z)
Y z =1-a z X (z
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
(3.4)
1
vaø sô ñoà khoái ñöôïc cho treân hình 3.3. Bieãu dieãn haøm truyeàn treân mieàn taàn soá baèng caùch ñaët z e jwT vôùi T laø chu kyø maãu cuûa tín hieäu tieáng noùi: H (e jwT ) 1 ae jwT
Bieân ñoä cuûa haøm truyeàn laø: 1
H (e jwT ) 1 ae jwT
[1 a 2
2a cos wT ] 2
(3.5)
Hình 3.3: Boä loïc soá pre-emphasis. IV. TRÍCH ÑAËC TRÖNG MFCC (Mel-scale Frequency Cepstral Coefficient) Quaù trình nhaän daïng maãu (caû ôû pha huaán luyeän hay pha nhaän daïng) ñeàu traûi qua giai ñoaïn trích choïn ñaëc tröng (feature extraction). Böôùc naøy thöïc hieän caùc phaâøn tích phoå (spectral analysis) nhaèm xaùc ñònh caùc thoâng tin quan troïng, ñaëc tröng, oån ñònh cuûa tín hieäu tieáng noùi, toái thieåu hoùa aûnh höôûng cuûa nhieãu; xuùc caûm, traïng thaùi, caùch phaùt aâm cuûa ngöôøi noùi; giaûm khoái löôïng döõ lieäu caàn xöû lyù... Maëc duø khoâng mang tính quyeát ñònh nhöng giai ñoaïn trích choïn ñaëc tröng aûnh höôûng raát lôùn ñeán hieäu naêng nhaän daïng. Vì vaäy vieäc löïa choïn ñaëc tröng cho tín hieäu tieáng noùi raát quan troïng. Coù nhieàu phöông phaùp trích choïn ñaëc tröng ñaõ vaø ñang ñöôïc söû duïng (FBA, MFCC, LPC, PLP...). Moãi phöông phaùp coù nhöõng öu ñieåm vaø nhöôïc ñieåm rieâng. Hieän nay MFCC (Mel-scale Frequency Cepstral Coefficient) ñöôïc söû duïng phoå bieán vaø hieäu quaû nhaát. Vì vaäy söû duïng MFCC laøm ñaëc tröng cuûa heä nhaän daïng ñöôïc trình baøy trong ñeà taøi naøy. Caùc heä nhaän daïng tieáng noùi thöôøng trích ñaëc tröng töø tín hieäu baèng caùch: chia tín hieäu thaønh nhöõng ñoaïn ñoä daøi 5-15 ms, moãi ñoaïn goïi laø moät khung (frame). Trong khoaûng thôøi gian ngaén nhö vaäy, phoå cuûa tín hieäu ñuû oån ñònh ñeå tieán haønh trích ñaëc tröng. Moãi frame seõ cho ñaëc tröng laø moät vector vaø ñaëc tröng cuûa toaøn boä tín hieäu seõ laø moät daõy vector. LUAÄN VAÊN TOÁT NGHIEÄP
- 46 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
MFCC laø phöông phaùp trích ñaëc tröng döïa treâøn ñaëc ñieåm caûm thuï taàn soá aâm cuûa tai ngöôøi: tuyeán tính ñoái vôùi taàn soá nhoû hôn 1kHz vaø phi tuyeán ñoái vôùi taàn soá treân 1kHz (theo thang taàn soá mel, khoâng phaûi theo Hz), ñaëc ñieåm naøy ñaõ ñöôïc ñeà caäp trong Chöông 1. Ñoái vôùi phöông phaùp MFCC, vieäc tính ñaëc tröng coù sô ñoà nhö sau:
Hình 3.4: Sô ñoà trích ñaëc tröng MFCC Sô ñoà khoái trích ñaëc tröng treân laø phöông phaùp trích ñaëc tröng baèng cepstral. Nhö ñaõ ñeà caäp trong phaàn moâ hình loïc nguoàn ôû Chöông 1, tín hieäu tieáng noùi laø do tín hieäu xung böôùc soùng chaäp vôùi tín hieäu taàn soá thaáp do boä phaän phaùt aâm taïo ra vaø vaø chuùng ta muoán laáy ñöôïc tín hieäu do boä phaùt aâm naøy taïo ra. Trong mieàn thôøi gian, goïi s(n) laø tín hieäu nguoàn, p(n) laø tín hieäu kích thích vaø θ(n) bieåu dieãn ñaùp öùng xung cuûa boä phaän phaùt aâm. Ta coù: s(n) = e(n) * θ(n).
( * : Tích chaäp)
(3.7)
Goïi S(ejw) laø phoå cuûa tín hieäu tieáng noùi, E(ejw) laø phoå xung kích thích vaø Θ(ejw) laø phoå cuûa boä phaän phaùt aâm. Nhö vaäy moái lieân heä bieân ñoä cuûa ba thaønh phaàn naøy laø: S(ejw) = E(ejw) . Θ(ejw)
(3.8)
Laáy logarithm cuûa phöông trình treân: Log S(ejw) = log E(ejw) + log Θ(ejw)
(3.9)
Nhö vaäy logarithm cuûa S(ejw) laø do E(ejw) vaø H Θ (ejw) coäng laïi. Trong ñoù tham gia cuûa Θ(ejw) theå hieän ôû vuøng taàn soá thaáp do söï bieán ñoåi chaäm cuûa boä phaän phaùt aâm, coøn tham gia cuûa xung böôùc soùng E(ejw) theå hieän chuû yeáu ôû vuøng taàn soá cao, neân coù theå taùch rôøi hai vuøng naøy baèng boä loïc tuyeán tính. Boä loïc tuyeán tính thöôøng söû duïng laø bieán ñoåi Fourier ngöôïc cuûa Log S(ejw) ñeå taïo ra cepstral cuûa tín hieäu (thuaät ngöõ cepstral laø vieát ngöôïc cuûa spectral-phoå): cs(n) = IDFT{Log S(ejw) } = IDFT{ log E(ejw) }+ IDFT{ log Θ(ejw) } = ce(n) + cθ(n)
LUAÄN VAÊN TOÁT NGHIEÄP
(3.10)
- 47 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Trong ñoù cs(n), ce(n), cθ(n) laàn löôït laø cepstrum cuûa s(n), e(n) vaø θ(n). Thöïc teá ngöôøi ta thöôøng laáy töø 10-36 heä soá cepstral ban ñaàu laø cuûa boä phaän phaùt aâm, coøn caùc heä soá cepstral cao hôn laø cuûa xung böôùc soùng. Trong ñeà taøi naøy, ta choïn 12 heä soá cepstral.
Hình 3.5: Minh hoïa phaân tích cepstral Treân Hình 3.5 ta thaáy, baèng caùch chuyeån tín hieäu tieáng noùi sang mieàn taàn soá, pheùp tích chaäp tín hieäu ñöôïc chuyeån thaønh pheùp nhaân, hôn nöõa, baèng vieäc laáy logarithm, pheùp nhaân ñöôïc chuyeån tieáp thaønh pheùp coäng. Bôûi vì pheùp phaân tích Fourier ngöôïc laø tuyeán tính neân ta coù ñaúng thöùc 3.10. 1. Windowing (cöûa soå hoùa) Ñaàu tieân tín hieäu tieáng noùi x(n) seõ ñöôïc chia thaønh töøng frame (coù thöïc hieän choàng phuû moät phaàn leân nhau: overlap) ñeå ñöôïc T frame x’t(n). Coâng vieäc cöûa soå hoaù naøy seõ ñöôïc thöïc hieän baèng caùch nhaân tín hieäu tieáng noùi vôùi moät haøm cöûa soå. Goïi phöông trình cöûa soå LUAÄN VAÊN TOÁT NGHIEÄP
- 48 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
hoùa laø w(n) (0≤ n ≤ N-1; N: soá maãu trong 1 frame tín hieäu), khi ñoù tín hieäu sau khi ñöôïc cöûa soå hoùa laø Xt(n): Xt(n) =x’t(n).w(n)
(3.11)
Haøm cöûa soå thöôøng ñöôïc döïng laø haøm cöûa soå Hamming:
w (n )
0.54 0.46 cos(
2 n ) ;n N
0..N - 1
(3.12)
2. Bieán ñoåi Fourier rôøi raïc-DFT Tín hieäu (cuûa moät frame) sau khi nhaân vôùi haøm cöûa soå, ñöôïc chuyeån sang mieàn taàn soá baèng bieán ñoåi Fourier rôøi raïc: N 1
X t (k )
x(n).e
i 2 kn N
;k
0..N 1
(3.13)
n 0
Xt(k) laø soá phöùc, tuy nhieân thaønh phaàn pha khoâng quan troïng neân ta chæ quan taâm ñeán thaønh phaàn thöïc |Xt(k) | 3. Loïc qua boä loïc Mel-scale Caùc nghieân cöùu veà heä thoáng thính giaùc cuûa con ngöôøi cho thaáy, tai ngöôøi coù caûm nhaän ñoái vôùi ñoä lôùn caùc taàn soá khoâng theo thang tuyeán tính. Caùc ñaëc tröng phoå taàn soá cuûa tieáng noùi ñöôïc tai ngöôøi tieáp nhaän nhö ngoõ ra cuûa moät daõy caùc boä loïc. Taàn soá trung taâm cuûa caùc boä loïc naøy khoâng phaân boá tuyeán tính doïc theo truïc taàn soá. Thaønh phaàn phoå döôùi 1 kHz thöôøng ñöôïc taäp trung nhieàu boä loïc hôn vì noù chöùa nhieàu thoâng tin veà aâm thanh hôn. Ôû taàn soá thaáp caùc boä loïc baêng heïp ñöôïc söû duïng ñeå taêng ñoä phaân giaûi taàn soá ñeå coù ñöôïc taàn soá cô baûn vaø hoaï taàn voán oån ñònh, coøn ôû taàn soá cao caùc boä loïc thoâng baêng roäng ñöôïc söû duïng ñeå thu ñöôïc caùc thaønh phaàn taàn soá cao voán bieán ñoäng raát nhanh. Vôùi noå löïc nhaèm moâ taû chính xaùc söï tieáp nhaän taàn soá cuûa tai ngöôøi, moät thang taàn soá ñöôïc xaây döïng – thang taàn soá Mel döïa treân cô sôû thöïc nghieäm caûm nhaän nghe cuûa ngöôøi. Taàn soá 1kHz ñöôïc choïn laø 1000 Mel. Moái quan heä giöõa thang taàn soá thöïc (vaät lyù) vaø thang taàn soá Mel (sinh lyù) ñöôïc cho bôûi coâng thöùc:
FMel vôùi
2595log10 (1
FHz ) 700
(3.14)
FMel laø taàn soá sinh lyù, ñôn vò Mel. FHz laø taàn soá thöïc, ñôn vò Hz.
LUAÄN VAÊN TOÁT NGHIEÄP
- 49 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
2500
Frequency (Mel)
2000
1500
1000
500
0
0
500
1000
1500
2000
2500
3000
3500
4000
Frequency (Hz)
Hình 3.6 Quan heä giöõa taàn soá thang Mel vaø taàn soá thang Hz Treân hình 3.5 cho ta thaáy, vôùi nhöõng taàn soá nhoû hôn 1 kHz, thì quan heä giöõa thang mel vaø taàn soá thöïc laø gaàn tuyeán tính. Coøn caùc taàn soá treân 1 kHz thì quan heä naøy laø logarithm. Nhö vaäy thay vì xaây döïng caùc boä loïc treân thang taàn soá thöïc ta coù theå xaây döïng caùc boä loïc naøy vôùi taàn soá trung taâm caùch ñeàu tuyeán tính treân thang mel. Daõy caùc boä loïc naøy ñöôïc cho treân hình 3.6. Taàn soá trung taâm cuûa boä loïc thöù m ñöôïc xaùc ñònh bôûi:
fm
fm
1
(3.15)
fm
Trong ñoù : fm laø taàn soá trung taâm cuûa boä loïc thöù m fm-1 laø taàn soá trung taâm cuûa boä loïc thöù m –1. 2 fm laø baêng thoâng cuûa boä loïc thöù m. fm ñöôïc xaùc ñònh: Vôùi khoaûng taàn soá döôùi 1 kHz, thì fm ñöôïc choïn sao cho coù khoaûng 10 boä loïc phaân boá caùch ñeàu trong khoaûng naøy. Vôùi khoaûng taàn soá treân 1 kHz, fm thöôøng ñöôïc tính bôûi : fm = 1.2* fm –1.
LUAÄN VAÊN TOÁT NGHIEÄP
- 50 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
2 1.8
Gain 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 0
1
2 Frequency (kHz)
3
4
Hình 3.7 Daõy boä loïc Mel Keát quaû sau khi cho phoå tín hieäu Xt(k) qua boä loïc ta thu ñöôïc Yt(m). 4. Tính log naêng löôïng phoå Sau khi qua boä loïc mel, phoå tín hieäu Yt(m) seõ ñöôïc tính Log10 theo coâng thöùc: 2
(3.16)
log { Yt (m) } 5. Bieán ñoåi Fourier ngöôïc-IDFT
Böôùc cuoái cuøng ñeå thu ñöôïc caùc heä soá MFCC laø laáy bieán ñoåi Fourier ngöôïc cuûa keát quaû cho bôûi (3.12). Vaø do keát quaû trong (3.8) laø soá thöïc neân bieán ñoåi Fourier ngöôïc ñôn giaûn ñöôïc söû duïng laø DCT (Dicrete Cosine Transform). M
yt( m) (k )
log{| Yt (m) |2 } cos k m m 1
1 2 M
(3.17)
Thoâng thöôøng soá ñieåm rôøi raïc k cuûa bieán ñoåi ngöôïc naøy ñöôïc choïn 1 k 12. Caùc heä soá MFCC chính laø soá ñieåm rôøi raïc naøy, vaäy ta coù theå coù töø 1 – 12 heä soá MFCC. Hình 3.7 laø keát quaû trích heä soá MFCC cho moät segment cuûa tín hieäu chieàu daøi 256 maãu. Caùc heä soá MFCC naøy raát oån ñònh theo caùc segment neân neáu ñöôïc choïn laøm ñaëc tröng ñeå nhaän daïng thì seõ cho keát quaû toát. Ngoaøi ra trong caùc heä nhaän daïng, caùc heä soá MFCC naøy coøn ñöôïc boå sung theâm caùc heä soá ñaïo haøm baäc moät vaø thaønh phaàn naêng löôïng. LUAÄN VAÊN TOÁT NGHIEÄP
- 51 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 3: TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 3.8 Keát quaû trích MFCC
V. TOÙM TAÉT: Chöông naøy trình baøy phaàn taùch töø vaø trích ñaëc tröng tieáng noùi. Ñaây laø 2 böôùc raát quan troïng trong nhaän daïng tieáng noùi, aûnh höôûng nhieàu ñeán keát quaû nhaän daïng sau naøy. Trích ñaëc tröng MFCC, thöïc hieän thoâng qua phöông phaùp daõy boä loïc heä soá cepstral, ñöôïc lyù giaûi ôû Chöông 1. MFCC laø phöông phaùp coù toác ñoä tính toaùn nhanh, tin caäy cao vaø ñaõ ñöôïc söû duïng raát hieäu quaû trong caùc chöông trình nhaän daïng treân theá giôùi.
LUAÄN VAÊN TOÁT NGHIEÄP
- 52 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Chöông 4:
LÖÔÏNG TÖÛ VECTOR Khi phaân tích ñaëc tröng tieáng noùi, chuùng ta nhaän ñöôïc caùc vector ñaëc tröng laø ñaëc tính phoå bieán thieân theo thôøi gian cuûa tín hieäu tieáng noùi. Kyù hieäu caùc vector phoå laø vl, l=1,2,…,L. Moãi vector coù P chieàu ( vôùi 24 heä soá MFCC ta coù P=24). Do moâ hình HMM rôøi raïc ñöôïc söû duïng ñeå nhaän daïng neân caùc vector phoå naøy phaûi ñöôïc öôùc löôïng vector(Vector Quantization-VQ) thaønh caùc chæ soá codebook rôøi raïc(ñaùnh nhaõn cho vector phoå). VQ laøphöông phaùp hieäu quaû ñeå bieåu dieãn thoâng tin phoå. Caùc ñaëc tính cuûa VQ: Giaûm thieåu khoâng gian löu tröõ cuûa vector phoå Giaûm thôøi gian tính toaùn ñoä gioáng nhau giöõa caùc vector phoå. Trong nhaän daïng tieáng noùi, moät löôïng lôùn pheùp tính duøng ñeå tính söï gioáng nhau giöõa hai caëp phoå. Döïa vaøo VQ, vieäc tính toaùn ñoù ñöôïc giaûm xuoáng qua vieäc tìm söï gioáng nhau cuûa 2 caëp vector codebook trong baûng tìm kieám. Bieåu dieãn rôøi raïc veà maët aâm hoïc cuûa tieáng noùi. Nhôø gaùn nhaõn cho töøng frame cuûa töøng töø, quaù trình choïn codebook toát nhaát cho töø ñoù trong caùc heä nhaän daïng tieáng noùi chæ ñôn thuaàn döïa treân caùc nhaõn naøy. Ñieàu naøy seõ thaáy roõ hôn trong Chöông 5: Moâ hình Markov aån. Khuyeát ñieåm cuûa VQ: Vieäc löôïng töû vector chaéc chaén daãn ñeán sai soá löôïng töû hoùa. Ñieàu naøy daãn ñeán thoâng tin phoå bò sai leäch. Vieäc choïn kích thöôùc codebook cho VQ khoâng ñôn giaûn. Taêng kích thöôùc seõ giaûm sai soá löôïng töû nhöng laïi daãn ñeán vaán ñeà khoâng gian löu tröõ caùc vector trong codebook. Vì vaäy khi caøi ñaët VQ, chuùng ta phaûi caân nhaéc 3 yeáu toá: sai soá löôïng töû, thôøi gian tìm kieám vector trong codebook vaø khoâng gian löu tröõ caùc vector trong codebook. I. CAÙC YEÁU TOÁ KHI TOÅ CHÖÙC VQ Ñeå xaây döïng codebook VQ vaø toå chöùc thuaät toaùn phaân tích VQ, chuùng ta caàn caùc yeáu toá sau: Moät taäp lôùn vector phoå v1,v2,v3,…,vL laø taäp huaán luyeän cho VQ. Neáu kích thöôùc codebook VQ laø M=2B (codebook B bit) thì chuùng ta caàn L>>M ñeå tìm ñöôïc M vector toái öu nhaát. Thöôøng choïn L=10M.
LUAÄN VAÊN TOÁT NGHIEÄP
- 53 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Ñoä ño d giöõa caùc caëp phoå ñeå phaân nhoùm vector trong khaâu huaán luyeän, hay phaân lôùp vector trong khaâu ñaùnh nhaõn. Phöông phaùp xaùc ñònh nhaân ñeå phaân hoaïch L vector phoå thaønh M nhoùm. Phöông phaùp phaân lôùp caùc vector ngoõ vaøo. Moät vector sau khi qua khaâu phaân lôùp thì seõ ñöôïc ñaïi dieän baèng moät nhaõn (maõ)
Hình 4.1 Sô ñoà khoái caáu truùc VQ huaán luyeän vaø phaân lôùp II. TAÄP HUAÁN LUYEÄN VQ Trong ñeà taøi naøy, taäp huaán luyeän cho VQ laø taát caû caùc vector phoå sau khi ñaõ qua khaâu trích ñaëc tröng MFCC cuûa taát caû caùc töø caàn nhaän daïng. Moãi vector laø phoå laø 24 heä soá MFCC cuûa 1 frame tieáng noùi. Caùc töø ñöôïc ghi aâm bôûi 1 ngöôøi noùi trong ñieàu kieän phoøng yeân tónh. III. ÑO ÑOÄ MEÙO Thaønh phaàn quan troïng nhaát cuûa caùc thuaät toaùn ñoái saùnh maãu laø ñoä ño giöõa 2 vector ñaëc tính. Trong nhaän daïng tieáng noùi, ngöôøi ta thöôøng söû duïng ñoä ño Euclidean: P
d ( x, y)
| xk
yk |2
(4.1)
k 1
Ñoä ño naøy duøng trong khaâu phaân lôùp, gaén nhaõn vector phoå. IV. PHAÂN NHOÙM CAÙC VECTOR HUAÁN LUYEÄN Coù 2 giaûi thuaät phaân nhoùm:
LUAÄN VAÊN TOÁT NGHIEÄP
- 54 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
1. Giaûi thuaät cuïm thoâng tin (Cluster Algorithm): Giải thuật naøy coøn goïi laø thuaät toaùn Lloyd hay K-means hay Linde-Buzo-Gray (LBG). (1) Khôûi taïo: Choïn ngaãu nhieân M vector trong taäp huaán luyeän L laøm taäp töø maõ(codeword) ban ñaàu cuûa codebook. (2) Tìm laân caän gaàn nhaát: Vôùi moãi vector huaán luyeän v, tìm codeword trong codebook hieän taïi coù khoaûng caùch gaàn nhaát vôùi vector naøy (döïa vaøo ñoä ño meùo) vaø gaùn noù thuoäc veà cell cuûa codeword ñoù. (3) Caäp nhaät nhaân: Vôùi moãi cell, caäp nhaät codeword söû duïng troïng taâm cuûa taát caû caùc vector huaán luyeän trong cell naøy. (4) Ñeä qui: Laëp laïi böôùc 2 vaø 3 cho ñeán khi sai soá löôïng töû nhoû hôn giaù trò ngöôõng cho pheùp. Löu ñoà giaûi thuaät:
Hình 4.2 Löu ñoà giaûi thuaät LBG Ñieàu baát lôïi cuûa thuaät toaùn naøy laø chuùng ta phaûi öôùc löôïng thaät toát ñieåm khôûi ñaàu cuûa caùc vector codeword. Ñaây laø vaán ñeà khoù khaên. Minh hoïa giaûi thuaät treân bôûi ví duï sau: Cho taäp döõ lieäu, taïo moät codebook goàm 4 phaân vuøng, vôùi codeword khôûi ñoäng laø caùc ñieåm: (2,2), (4,6), (6,5), vaø(8,8)
LUAÄN VAÊN TOÁT NGHIEÄP
- 55 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Tìm laân caän gaàn nhaát, tính toaùn troïng taâm cuûa moãi vuøng, roài tính toaùn laïi nhöõng laân caän gaàn nhaát, tính toaùn laïi troïng taâm cuûa moãi vuøng…
LUAÄN VAÊN TOÁT NGHIEÄP
- 56 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
2. Giaûi thuaät Binary Split Moät bieán theå cuûa thuaät toaùn treân laø giaûi thuaät Binary Split (1) Thieát keá codebook 1 vector. Ñaây laø nhaân toaøn boä cuûa taäp vector huaán luyeän
(2) Nhaân ñoâi kích thöôùc codebook baèng caùch chia moãi vector trong codebook hieän taïi yn thaønh 2 vector: y+n = yn(1 + e) y-n = yn(1 - e)
(4.2)
ÔÛ ñaây, n thay ñoåi töø 1 ñeán kích thöôùc hieän taïi cuûa codebook. e laø tham soá phaân chia, thöôøng ñöôïc choïn trong taàm 0.01 <= e <= 0.05
(3) Duøng thuaät toaùn K-means ôû treân ñeå xaùc ñònh taäp nhaân toá nhaát cuûa codebook ñaõ chia ( töùc codebook coù kích thöôùc gaáp ñoâi)
LUAÄN VAÊN TOÁT NGHIEÄP
- 57 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
(4) Laëp laïi böôùc 2 vaø 3 cho ñeán khi codebook ñaït ñöôïc kích thöôùc M cho tröôùc
Löu ñoà giaûi thuaät:
Hình 4.3: Lưu đồ giải thuật Binary Split V. PHAÂN LÔÙP VECTOR Phương phaùp phaân lớp vector phổ về cơ bản laø phải tìm trong toaøn bộ codebook để xaùc định vector tốt nhất. Kí hiệu:
ym laø vector trong codebook cỡ M , 1≤m≤M v laø vector phổ cần phaân lớp m* laø chỉ số của vector tốt nhất (v giống với ym* nhất) trong codebook
thì:
m* arg min d (v, ym ) 1 m M
LUAÄN VAÊN TOÁT NGHIEÄP
- 58 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VI. NHAÄN DAÏNG BAÈNG VQ: Löôïng töû hoùa vector coù theå ñöôïc duøng ñeå nhaän daïng tieáng noùi. Ñaây laø phöông phaùp ñöôïc theá giôùi söû duïng vaøo nhöõng naêm 80, cho keát quaû khaù toát vôùi boä töø vöïng nhoû (nhoû hôn 10 töø). Phöông phaùp naøy ñöôïc thöïc hieän nhö sau: Trong pha huaán luyeän, moãi töø trong boä töø vöïng ñöôïc noùi nhieàu laàn, sau ñoù phaân tích ñaëc tröng. 1 codebook rieâng reõ seõ ñöôïc thöïc hieän cho 1 töø trong boä töø vöïng. Giaû söû ta caàn nhaän daïng v töø thì seõ coù töông öùng v codebook: C1,C2,…,CV. Trong pha nhaän daïng, töø caàn nhaän daïng ñöôïc ghi aâm, roài trích ñaëc tröng, sau ñoù tính ñieåm VQ trung bình nhö sau: Giaû söû töø caàn nhaän daïng sau khi ruùt trích ñaëc tröng coù T vector : x1,x2,x3,…,xT. Vaø codebook cho töø thöù i laø {y1i,y2i,y3i,…,yMi}, vôùi M laø kích thöôùc cuûa codebook. Ñoä meùo trung bình cuûa töø caàn nhaän daïng sau khi löôïng töû öùng vôùi codebook thöù i laø:
Töø caàn nhaän daïng laø töø coù ñoä meùo nhoû nhaát:
Löu ñoà giaûi thuaät:
LUAÄN VAÊN TOÁT NGHIEÄP
- 59 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 4: LÖÔÏNG TÖÛ VECTOR
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VII. TOÙM TẮT Chöông naøy trình baøy veà khaùi nieäm löôïng töû vector, caùc phöông phaùp maõ hoùa vaø phaân lôùp vector laøm neàn taûng cho vieäc nhaän daïng baèng moâ hình Markov aån rôøi raïc. Vieäc nhaän daïng baèng phöông phaùp VQ cuõng ñaõ ñöôïc giôùi thieäu. Trong project naøy, 1 codebook côõ 128 ñöôïc söû duïng. 1 codebook rieâng reõ ñöôïc thöïc hieän cho 1 töø trong boä töø vöïng.
LUAÄN VAÊN TOÁT NGHIEÄP
- 60 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Chöông 5:
MOÂ HÌNH MARKOV AÅN Chöông naøy trình baøy moät phöông phaùp hieäu quaû duøng ñeå moâ hình hoùa caáu truùc ñoäng cuûa tieáng noùi laø moâ hình Markov aån (Hidden Markov Models-HMM). Ñaây laø höôùng tieáp caän ñoái saùnh maãu xaùc suaát, vôùi giaû ñònh raèng ôû ñoù caùc maãu tieáng noùi tuaàn töï theo thôøi gian laø keát quaû cuûa quaù trình thoáng keâ hay ngaãu nhieân coù tham soá, vaø caùc tham soá naøy coù theå öôùc löôïng. Moãi töø sau khi qua khaâu trích ñaëc tröng ta thu ñöôïc moät daõy vector P chieàu (P=soá heä soá MFCC), vaø ñöôïc kí hieäu laø t1, t2, …, ti , …, tl . Qua khaâu löôïng töû vector, daõy vector ñaëc tröng naøy ñöôïc bieán ñoåi thaønh caùc quan saùt (laø caùc symbols sau khi phaân lôùp VQ) vaø ñöôïc kí hieäu laø o1, o2, …, ot, …, oT I. KHAÙI NIEÄM 1. Chuoãi Markov: Xeùt heä thoáng coù tính chaát nhö sau: ôû moät thôøi ñieåm baát kyø, heä thoáng seõ ôû moät trong N traïng thaùi nhö hình veõ. Cöù sau moät khoaûng thôøi gian ñeàu ñaën, heä thoáng seõ chuyeån sang traïng thaùi môùi hoaëc giöõ nguyeân traïng thaùi tröôùc ñoù. Ta kyù hieäu caùc khoaûng thôøi gian chuyeån traïng thaùi laø t=1, 2, … vaø traïng thaùi taïi thôøi ñieåm t cuûa heä thoáng laø qt , qt seõ coù caùc giaù trò 1, 2, …, N. 1 traïng thaùi töông öùng vôùi 1 söï kieän. Quaù trình treân ñöôïc goïi laø quaù trình Markov
Hình 5.1 : Minh hoïa moâ hình Markov Trong hình veõ, aij laø xaùc suaát chuyeån töø traïng thaùi i sang traïng thaùi j, ta coù caùc quan heä: aij
0,
N
aij
1
i,j i
(5.1)
j 1
LUAÄN VAÊN TOÁT NGHIEÄP
- 61 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Ta chæ xeùt chuoãi Markov baäc nhaát laø nhöõng heä thoáng maø traïng thaùi hieän taïi chæ phuï thuoäc vaøo traïng thaùi ngay tröôùc ñoù, nghóa laø:
a ij = P[qt=j | qt-1=i];
1 i, j
N.
(5.2)
Caùc thaønh phaàn trong moâ hình Markov: N traïng thaùi cuûa moâ hình. Kyù hieäu traïng thaùi ôû thôøi ñieåm t laø qt N söï kieän: E = {e1, e2, e3, …, eN}. Moãi söï kieän töông öùng vôùi 1 traïng thaùi. Taïi moãi thôøi ñieåm t, traïng thaùi phaùt sinh ra söï kieän töông öùng vôùi noù. A={aij} - laø ma traän phaân phoái xaùc suaát chuyeån traïng thaùi, trong ñoù aij laø xaùc suaát chuyeån töø traïng thaùi i ôû thôøi ñieåm t sang traïng thaùi j ôû thôøi ñieåm t+1 aij = P[qt = j |qt-1 = i] = {
i}
1
i,j
N
- ma traän phaân phoái traïng thaùi ban ñaàu trong ñoù
i
laø xaùc suaát cuûa moâ
hình ôû traïng thaùi i taïi thôøi ñieåm ban ñaàu t=1. i
= P[q1=i]
1
i
N
(5.3)
2. Caùc ví duï: 1) Ví duï 1: Tung 1 ñoàng xu:
ÔÛ ñaây coù 2 traïng thaùi: S1 töông öùng vôùi söï kieän e1=Xaáp; vaø S2 töông öùng vôùi söï kieäân e2=Ngöõa. Ta coù caùc phaàn töû cuûa ma traän A: a11 = 0.5
a12 = 0.5
a21 = 0.5
a22 = 0.5
Caùc söï kieän: Xaáp Xaáp Ngöõa Ngöõa Xaáp Ngöõa Xaáp töông öùng vôùi caùc traïng thaùi: S1
S1
LUAÄN VAÊN TOÁT NGHIEÄP
S2
S2
S1 S2 - 62 -
S1 SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
2) Ví duï 2: Thôøi tieát cuûa moät vuøng vôùi moâ hình xaùc suaát nhö sau:
-Xaùc suaát cuûa chuoãi quan saùt {rain, rain, rain, clouds, sun, clouds, rain} öùng vôùi moâ hình Markov treân laø: Quan saùt = { r, r, r, c, s, c, r} S = Time =
{S1, S1, S1, S2, S3, S2, S1} {1, 2, 3, 4, 5, 6, 7} (days)
= P[S1] P[S1|S1] P[S1|S1] P[S2|S1] P[S3|S2] P[S2|S3] P[S1|S2] = 0.5 ·
0.7 ·
0.7 · 0.25 ·
0.1 ·
0.7
· 0.4
= 0.001715 -Xaùc suaát cuûa chuoãi {sun, sun, sun, rain, clouds, sun, sun) öùng vôùi moâ hình Markov treân laø: Quan saùt = { s, s, s, r, c, s, s} S
=
Time =
{S3, S3, S3, S1, S2, S3, S3} {1, 2, 3, 4 , 5 , 6 , 7} (days)
= P[S3] P[S3|S3] P[S3|S3] P[S1|S3] P[S2|S1] P[S3|S2] P[S3|S3] = 0.1 ·
0.1 ·
LUAÄN VAÊN TOÁT NGHIEÄP
0.1 ·
0.2 · 0.25 · 0.1 - 63 -
· 0.1 SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
= 5.0x10-7 3. Moâ hình Markov aån: Khaùc vôùi chuoãi Markov nhö trình baøy ôû treân, moâ hình Markov aån coù nhöõng ñaëc ñieåm sau: Töø 1 traïng thaùi coù theå phaùt sinh hôn 1 söï kieän( hay coøn ñöôïc goïi laø 1 quan saùt). Chuoãi quan saùt laø haøm xaùc suaát cuûa traïng thaùi. Chuùng ta coù theå tính toaùn xaùc suaát cuûa caùc chuoãi traïng thaùi khaùc nhau töø moät chuoãi quan saùt. Nhö vaäy HMM vaãn phaùt sinh ra caùc quan saùt. Soá löôïng traïng thaùi thoâng thöôøng khaùc soá löôïng quan saùt. Khi ôû traïng thaùi Si, coù xaùc suaát p(o1) ñeå phaùt sinh söï kieän 1, xaùc suaát p(o2) ñeå phaùt sinh söï kieän 2…
II. CAÙC THAØNH PHAÀN CÔ BAÛN CUÛA MOÂ HÌNH MARKOV AÅN N laø soá löôïng traïng thaùi cuûa moâ hình. {1,2,…,N} laø caùc traïng thaùi. Kyù hieäu traïng thaùi ôû thôøi ñieåm t laø qt M: laø soá löôïng quan saùt phaân bieät. Caùc kyù hieäu quan saùt töông öùng vôùi tín hieäu vaät lyù maø heä thoáng ñang moâ taû. Ta kyù hieäu taäp quan saùt laø V={v1, v2, …, vM}. Ñoái vôùi tín hieäu tieáng noùi, M laø kích thöôùc codebook. vi laø maõ cuûa töøng vector. A={aij} - laø ma traän phaân phoái xaùc suaát chuyeån traïng thaùi, trong ñoù aij laø xaùc suaát chuyeån töø traïng thaùi i ôû thôøi ñieåm t sang traïng thaùi j ôû thôøi ñieåm t+1 aij = P[qt = j |qt-1 = i]
1
i,j
N
B={bj(k)} - ma traän phaân phoái xaùc suaát caùc kyù hieäu quan saùt, trong ñoù bj(k) laø xaùc suaát nhaän ñöôïc kyù hieäu quan saùt vk ôû traïng thaùi j: bj(k) = P[ot = vk|qt = j] = {
i}
1
k
M, j=1,2,…N
(5.4)
- ma traän phaân phoái traïng thaùi ban ñaàu trong ñoù
i
laø xaùc suaát cuûa moâ
hình ôû traïng thaùi i taïi thôøi ñieåm ban ñaàu t=1: i
= P[q1=i]
1
i
N
Nhö vaäy ñeå ñaëc taû ñaày ñuû moät HMM caàn phaûi coù soá traïng thaùi N cuûa moâ hình, taäp V goàm M kyù hieäu quan saùt, ma traän xaùc suaát chuyeån traïng thaùi A, ma traän xaùc suaát caùc kyù hieäu quan saùt ñöôïc B vaø ma traän xaùc suaát traïng thaùi ban ñaàu . LUAÄN VAÊN TOÁT NGHIEÄP
- 64 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN Ñeå thuaän tieän, ta söû duïng kyù hieäu
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC = (A,B, ) ñeå chæ taäp tham soá moâ hình. Taäp tham soá
naøy seõ xaùch ñònh moät giaù trò xaùc suaát cho daõy quan saùt O laø P(O| ). Ta cuõng ñeå yù laø HMM cuõng phaûi tuaân theo nhöõng raøng buoäc veà maëc thoáng keâ: N
aij = 1
i=1,2,...,N
j 1 M
b j (k ) =1
j=1,2,...,N
(5.5)
k 1 N
=1
(5.6)
i 1
Ñeå roõ hôn veà moâ hình Markov aån ta xeùt caùc ví duï sau: Ví duï: Thôøi tieát vaø ñoä aåm khoâng khí Cho moät moâ hình Markov aån nhö hình veõ sau:
Soá traïng thaùi N=3 (goàm High, Medium, Low)
Moâ hình naøy coù:
Soá kyù hieäu quan saùt M=3 (goàm Rain, Cloud, Sun) Caùc giaù trò caùc phaàn töû cuûa ma traän A, B,
nhö treân hình veõ treân.
Ví duï 1: Neáu cho chuoãi quan saùt O={sun, sun, cloud, rain, cloud, sun} vaø moâ hình Markov aån nhö hình veõ treân, thì xaùc suaát ñeå coù chuoãi traïng thaùi {H, M, M, L, L, M} laø bao nhieâu? - Xaùc suaát caàn tìm = bH(sun). bM(sun) .bM(cloud). bL(rain) .bL(cloud). bM(sun) = 0.8 ·0.3 · 0.4 · 0.6 · 0.3 · 0.3 = 5.2x10-3
LUAÄN VAÊN TOÁT NGHIEÄP
- 65 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Ví duï 2a: Cho moâ hình Markov nhö hình veõ treân. Tính xaùc suaát ñeå coù ñöôïc chuoãi quan saùt O={sun, sun, cloud, rain, cloud, sun} vaø chuoãi traïng thaùi laø {H, M, M, L, L, M}. - Xaùc suaát caàn tìm
=
H·bH(s)
·aHM·bM(s) ·aMM·bM(c) ·aML·bL(r) ·aLL·bL(c) ·aLM·bM(s)
= 0.4 · 0.8 · 0.3 · 0.3 · 0.2 · 0.4 · 0.5 · 0.6 · 0.4 · 0.3 · 0.7 · 0.3 = 1.74x10-5 Ví duï 2b: Cho moâ hình Markov nhö hình veõ treân. Tính xaùc suaát ñeå coù ñöôïc chuoãi quan saùt O={sun, sun, cloud, rain, cloud, sun}vaø chuoãi traïng thaùi laø { H, H, M, L, M, H }. - Xaùc suaát caàn tìm
=
H·bH(s)
·aHH·bH(s) ·aHM·bM(c) ·aML·bL(r) ·aLM·bM(c) ·aMH·bH(s)
= 0.4 · 0.8 · 0.6 · 0.8 · 0.3 · 0.4 · 0.5 · 0.6 · 0.7 · 0.4 · 0.4 · 0.6 = 3.71x10-4 III. BA BAØI TOAÙN CÔ BAÛN CUÛA HMM Vôùi HMM ñaõ ñöôïc khaûo saùt ôû phaàn tröôùc, chuùng ta caàn phaûi giaûi quyeát ba baøi toaùn cô baûn ñeå moâ hình coù theå aùp duïng hieäu quaû trong thöïc teá. Nhöõng baøi toaùn naøy laø: Baøi toaùn 1: Cho chuoãi quan saùt O=(o1o2...oT) vaø moâ hình
= (A,B, ), ta seõ tính P(O| ) laø
xaùc suaát cuûa chuoãi quan saùt cho bôûi moâ hình nhö theá naøo? Baøi toaùn 2: Cho chuoãi quan saùt O=(o1o2...oT) vaø moâ hình
= (A,B, ), laøm sao ta choïn
ñöôïc moät chuoãi traïng thaùi q=(q1q2...qT) töông öùng phuø hôïp nhaát (coù theå giaûi thích toát nhaát chuoãi quan saùt). Baøi toaùn 3: Laøm theá naøo ñeå ñieàu chænh tham soá moâ hình
= (A,B, ) ñeå cöïc ñaïi hoùa
P(O| )? Baøi toaùn 1 laø baøi toaùn ñaùnh giaù, töø moät moâ hình cho saún vaø moät chuoãi quan saùt , baèng caùch naøo tính ñöôïc xaùc suaát ñeå chuoãi quan saùt naøy ñöôïc taïo ra töø moâ hình. Ta coù theå hieåu baøi toaùn töông ñöông vôùi vieäc cho ñieåm phuø hôïp giöõa moâ hình vaø chuoãi quan saùt. Neáu trong tröôøng hôïp phaûi löïa choïn moâ hình phuø hôïp nhaát vôùi chuoãi quan saùt thì caùch giaûi baøi toaùn 1 laø raát thích hôïp ñeå traû lôøi caâu hoûi naøy. Baøi toaùn 2 laø baøi toaùn maø chuùng ta phaûi coá gaéng laøm saùng toû phaàn aån cuûa moâ hình, ñoù laø tìm ra chuoãi traïng thaùi ñuùng . Roõ raøng laø trong moïi tröôøng hôïp thì ñaây laø ñieàu khoâng theå neân trong thöïc teá ta seõ söï duïng moät tieâu chuaån toái öu ñeå giaûi baøi toaùn naøy moät caùch toát nhaát. Baøi toaùn 3 ñoøi hoûi chuùng ta phaûi tìm caùch cöïc ñaïi hoaù nhöõng tham soá moâ hình ñeå moâ taû toát nhaát söï xuaát hieän cuûa moät chuoãi quan saùt. Chuoãi duøng hieäu chænh moâ hình ñöôïc goïi laø LUAÄN VAÊN TOÁT NGHIEÄP
- 66 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
chuoãi huaán luyeän. Baøi toaùn huaán luyeän laø voâ cuøng caàn thieát cho haàu heát caùc öùng duïng cuûa HMM vì noù cho pheùp ta ñieàu chænh caùc tham soá cuûa moâ hình toái öu vôùi döõ lieäu huaán luyeän nghóa laø taïo ra nhöõng moâ hình cho nhöõng hieän töôïng thöïc teá. Ñeå laøm saùng toû vieäc aùp duïng ba baøi toaùn cô baûn treân cuûa HMM vaøo vieäc nhaän daïng tieáng noùi, ta xeùt ví duï moät boä nhaän daïng töø goàm w töø. Ta bieåu dieãn tín hieäu tieáng cuûa moät töø döôùi daïng moät chuoãi thôøi gian cuûa caùc vector phoå ñöôïc maõ hoaù. Vieäc maõ hoaù ñöôïc tieán haønh vôùi codebook côõ M; vì vaäy moãi chuoãi quan saùt laø chæ soá caùc vector phoå gaàn tín hieäu tieáng nguyeân goác nhaát. Vôùi moãi töø trong boä töø vöïng w töø ta seõ coù moät chuoãi huaán luyeän bao goàm laø moät chuoãi chæ soá codebook cuûa töø. Vieäc ñaàu tieân laø phaûi xaây döïng moâ hình cho töøng töø rieâng bieät. Vieäc naøy ñöôïc thöïc hieän nhôø giaûi baøi toaùn thöù 3 ñeå öôùc löôïng caùc tham soá cuûa moâ hình moät caùch toái öu cho töøng töø trong boä töø vöïng. Cuoái cuøng, khi moät taäp goàm w HMM ñaõ ñöôïc thieát keá vaø toái öu hoaù thì vieäc nhaän daïng moät töø chöa bieát seõ nhôø caùch giaûi baøi toaùn 1 ñeå tính ñieåm moãi moâ hình töø caên cöù theo chuoãi quan saùt thöû nghieäm vaø choïn ra moâ hình coù soá ñieåm cao nhaát ( nghóa laø söï gioáng nhau nhieàu nhaát ). 1. Baøi toaùn 1 Chuùng ta caàn tính xaùc suaát nhaän ñöôïc chuoãi quan saùt O=(o1, o2, …, oT) vôùi moâ hình cho tröôùc, nghóa laø tính P(O | ). Caùch ñôn giaûn nhaát laø khaûo saùt taát caû caùc chuoãi traïng thaùi coù theå coù vaø tính xaùc suaát nhaän ñöôïc O ñoái vôùi töøng chuoãi. Xeùt moät chuoãi traïng thaùi q baát kyø: q=(q1, q2, …, qT). Xaùc suaát nhaän ñöôïc chuoãi O öùng vôùi q laø: T
P O q, t 1
(5.7)
P o qt ,
Giaû söû caùc kyù hieäu quan saùt xuaát hieän ñoäc laäp vôùi nhau, ta coù: P O q,
bq1 o1 bq2 o2 .....bqT oT
(5.8)
Xaùc suaát nhaän ñöôïc chuoãi q laø: P q
q1
(5.9)
a q1q2 a q2q3 .......a qT 1qT
Xaùc suaát O vaø q xuaát hieän ñoàng thôøi: P(O, q | )=P(O | q, ).P(q | ).
(5.10)
Ta coù keát quaû:
P O
(5.11)
P O q, .P q all q
Theo coâng thöùc treân, ta caàn coù 2T.NT pheùp tính. Neáu N=5, T=100, caàn khoaûng 1072 pheùp tính. Ñaây laø con soá khoâng theå thöïc hieän ñöôïc. LUAÄN VAÊN TOÁT NGHIEÄP
- 67 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Moät caùch khaùc ñeå giaûi baøi toaùn 1 laø duøng thuû tuïc tieán hoaëc thuû tuïc luøi. i. Thuû tuïc tieán ( Forward hay Baum-Welch) Ta ñònh nghóa: t(i)=P(o1,
o2, …, ot, qt=i | )
(5.12)
nghóa laø xaùc suaát nhaän ñöôïc chuoãi quan saùt o1o2…ot ñeán thôøi ñieåm t vaø traïng thaùi ôû t laø i, vôùi moâ hình cho tröôùc. Ta tính P(O | ) nhö sau: - Baét ñaàu: 1(i)= ibi(o1)
1
i
N
(5.13)
- Quy naïp: N t 1
j
t
i a ij b j o t
T
i
1 1
1
t j
T-1 N
(5.14)
i 1
- Keát thuùc: N
P O
(5.15)
i 1
Theo thuû tuïc treân, soá pheùp tính caàn thieát khoaûng N2T, nhoû hôn raát nhieàu so vôùi 2T.NT.
Hình 5.2 Minh hoïa böôùc quy naïp trong thuû tuïc Forward Ví duï thuaät toaùn Forward:
LUAÄN VAÊN TOÁT NGHIEÄP
- 68 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Cho moâ hình HMM nhö hình veõ treân, ôû ñaây coù 3 traïng thaùi: H, M, L. Vaø coù 2 quan saùt: rain vaø sun. Ta tính xaùc suaát cuûa chuoãi quan saùt: s r r s r trò cuûa taïi thôøi ñieåm 5: -Baét ñaàu:
(s=sun,r=rain) baèng caùch tính giaù
1(M)=0.5·0.5=0.25 1(H)=0.2·0.75=0.15 1(L)=0.3·0.25=0.075
-Quy naïp: 2(M)
= [0.25·0.3 + 0.15·0.4 + 0.075·0.4] · 0.5 = 0.0825
2(H)
= [0.25·0.4 + 0.15·0.5 + 0.075·0.1] · 0.25 = 0.0456
2(L)
= [0.25·0.3 + 0.15·0.1 + 0.075·0.5] · 0.75 = 0.0956
3(M)
= [0.0825·0.3 + 0.0456·0.4 + 0.0956·0.4] · 0.5 = 0.0406
3(H)
= [0.0825·0.4 + 0.0456·0.5 + 0.0956·0.1] · 0.25 = 0.0163
3(L)
= [0.0825·0.3 + 0.0456·0.1 + 0.0956·0.5] · 0.75 = 0.0578
4(M)
= [0.0406·0.3 + 0.0163·0.4 + 0.0578·0.4] · 0.5 = 0.0209
4(H)
= [0.0406·0.4 + 0.0163·0.5 + 0.0578·0.1] · 0.75 = 0.0226
4(L)
= [0.0406·0.3 + 0.0163·0.1 + 0.0578·0.5] · 0.25 = 0.0107
LUAÄN VAÊN TOÁT NGHIEÄP
- 69 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
5(M)
= [0.0209·0.3 + 0.0226·0.4 + 0.0107·0.4] · 0.5 = 0.0098
5(H)
= [0.0209·0.4 + 0.0226·0.5 + 0.0107·0.1] · 0.25 = 0.0052
5(L)
= [0.0209·0.3 + 0.0226·0.1 + 0.0107·0.5] · 0.75 = 0.0104
-Keát thuùc: P(O| )= 5(M) +
5(H)
+
5(L)
= 0.0254
ii. Thuû tuïc luøi (Backward) Töông töï ta ñònh nghóa: t
i
P o t 1o t 2 .....oT q t
(5.14)
i,
Thuû tuïc luøi thöïc hieän nhö sau: - Baét ñaàu: t
i
1
1
i
t 1
j
N.
(5.15)
- Quy naïp: N t
i
a ijb j o t
1
(5.16)
t = T-1, T-2, ....., 1 1 i N
j 1
Hình 5.3 Minh hoïa thuû tuïc Backward Ví duï thuû tuïc Backward: Cho moâ hình HMM nhö trong ví duï phaàn Forward, tính xaùc suaát cuûa chuoãi quan saùt srrsr Ta ñi tính giaù trò cuûa LUAÄN VAÊN TOÁT NGHIEÄP
(s=sun,r=rain)? töø thôøi ñieåm 5 ñeán thôøi ñieåm 0: - 70 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN 5(M)=1.0
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
5(H)=1.0
5(L)=1.0
4(M)
= [0.3·0.50·1.0 + 0.4·0.25·1.0 + 0.3·0.75·1.0] = 0.4750
4(H)
= [0.4·0.50·1.0 + 0.5·0.25·1.0 + 0.1·0.75·1.0] = 0.4000
4(L)
= [0.4·0.50·1.0 + 0.1·0.25·1.0 + 0.5·0.75·1.0] = 0.6000
3(M)
= [0.3·0.50·0.475 + 0.4·0.75·0.400 + 0.3·0.25·0.600] = 0.2363
3(H)
= [0.4·0.50·0.475 + 0.5·0.75·0.400 + 0.1·0.25·0.600] = 0.2600
3(L)
= [0.4·0.50·0.475 + 0.1·0.75·0.400 + 0.5·0.25·0.600] = 0.2000
2(M)
= [0.3·0.50·0.236 + 0.4·0.25·0.260 + 0.3·0.75·0.200] = 0.1064
2(H)
= [0.4·0.50·0.236 + 0.5·0.25·0.260 + 0.1·0.75·0.200] = 0.0947
2(L)
= [0.4·0.50·0.236 + 0.1·0.25·0.260 + 0.5·0.75·0.200] = 0.1287
1(M)
= [0.3·0.50·0.106 + 0.4·0.25·0.095 + 0.3·0.75·0.129] = 0.0544
1(H)
= [0.4·0.50·0.106 + 0.5·0.25·0.095 + 0.1·0.75·0.129] = 0.0428
1(L)
= [0.4·0.50·0.106 + 0.1·0.25·0.095 + 0.5·0.75·0.129] = 0.0720
0(·)
= [0.5·0.50·0.054 + 0.2·0.75·0.043 + 0.3·0.25·0.072] = 0.0254
2. Baøi toaùn 2 Ñeå giaûi quyeát baøi toaùn 2, chuùng ta söû duïng thuaät toaùn Viterbi ñeå tìm chuoãi traïng thaùi ñôn toát nhaát q=(q1, q2, …, qT) öùng vôùi chuoãi quan saùt O=(o1o2...oT) ñaõ cho. Chuùng ta ñònh nghóa ñaïi löôïng: t
laø
t
i
max P q1q 2 ....q t 1 , q t
q1 ,q 2 ,...,q t
(5.17)
i, o1o 2 ...o t
1
i coù ñieåm toát nhaát (xaùc suaát lôùn nhaát) treân con ñöôøng ñôn taïi thôøi ñieåm t öùng
vôùi quan saùt ñaõ cho vaø keát thuùc ôû traïng thaùi i. Qui naïp, ta coù: t 1
j
max t
LUAÄN VAÊN TOÁT NGHIEÄP
t
i a ij .b j o t
1
- 71 -
(5.18) SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Muoán xaùc ñònh chuoãi traïng thaùi, chuùng ta söû duïng maûng
t(j)
ñeå löu laïi ñoái soá laøm
cho phöông trình (5.17) cöïc ñaïi ôû töøng thôøi ñieåm t vaø traïng thaùi i. Thuaät toaùn tìm chuoãi traïng thaùi toát nhaát moâ taû nhö sau: (1). Khôûi taïo 1(i)
=
ibi(o1)
1(i)
=0
, 1
i
N
(5.19a) (5.19b)
(2). Ñeä quy t(j)
= max
t-1(i)aijbj(ot)
t(j)
= arg max
1 i N
t-1(i)aij
1 i N
, 2
t
T, 1
j
N
(5.20a)
, 2
t
T, 1
j
N
(5.20b)
(3). Keát thuùc P*= max 1 i N
T(i)
qT* =arg max 1 i N
(5.21a) T
(i)
(5.21b)
(4). Laàn ngöôïc laïi ñöôøng ñi (chuoãi traïng thaùi) qt* =
* t+1(qt+1 )
t=T-1,T-2,…,1
(5.22)
Thuaät toaùn Viterbi cuõng töông töï thuaät toaùn Baul-Welch (ngoaïi tröø böôùc laàn ngöôïc). Pheùp toaùn cöïc ñaïi hoùa ôû phöông trình (5.20a) thay cho pheùp toång ôû (5.14). Ví duï veà thuaät toaùn Viterbi: Cho moâ hình HMM nhö trong ví duï phaàn thuû tuïc Forward Tính xaùc suaát chuoãi quan saùt: s r r s r
(s=sun,r=rain) baèng thuaät toaùn Viterbi?
Ta tính ñöôøng ñi Viterbi ñeán t=5: (1).Khôûi taïo: 1(M)=0.5·0.5=0.25 1(1)=
0
1(H)=0.2·0.75=0.15 1(2)=
1(L)=0.3·0.25=0.075
0
1(3)=
0
(2).Ñeä quy: 2(M)
= max[0.25*0.3; 0.15*0.4; 0.075*0.4] · 0.5 = 0.0375
2(H)
= max[0.25*0.4; 0.15*0.5; 0.075*0.1] · 0.25 = 0.0250
LUAÄN VAÊN TOÁT NGHIEÄP
- 72 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN 2(L)
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
= max[0.25*0.3; 0.15*0.1; 0.075*0.5] · 0.75 = 0.0563
2(1)=
1
2(2)=
1
2(3)=
1
3(M)
= max[0.0375*0.3; 0.0250*0.4; 0.0563*0.4] · 0.5 = 0.0113
3(H)
= max[0.0375*0.4; 0.0250*0.5; 0.0563*0.1] · 0.25 = 0.0038
3(L)
= max[0.0375*0.3; 0.0250*0.1; 0.0563*0.5] · 0.75 = 0.0211
3(1)=
3
3(2)=
1
3(3)=
3
4(M)
= max[0.0113*0.3 ; 0.0038*0.4 ; 0.0211*0.4] · 0.5 = 0.0042
4(H)
= max[0.0113*0.4 ; 0.0038*0.5 ; 0.0211*0.1] · 0.75 = 0.0034
4(L)
= max[0.0113*0.3 ; 0.0038*0.1 ; 0.0211*0.5] · 0.25 = 0.0026
4(1)=
3
4(2)=
1
4(3)=
3
5(M)
= max[0.0042*0.3 ; 0.0034*0.4 ; 0.0026*0.4] · 0.5 = 0.0007
5(H)
= max[0.0042*0.4 ; 0.003*0.5 ; 0.0026*0.1] · 0.25 = 0.0004
5(L)
= max[0.0042*0.3 + 0.0034*0.1 + 0.0026*0.5] · 0.75 = 0.0010
5(1)=
2
5(2)=
2
5(3)=
3
(3).Keát thuùc: P*=0.0010 qT* =arg max 1 i N
T
(i)
q*5= 3
(4).Laàn ngöôïc con ñöôøng: q*t =
* t+1(q t+1)
q5=3, LUAÄN VAÊN TOÁT NGHIEÄP
- 73 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN q4=
5(3)=3
q3=
4(3)=3
q2=
3(3)=3
q1=
2(3)=1
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Caùc traïng thaùi laàn löôït laø: 13333
Thuaät toaùn Viterbi daïng logarit Neáu laáy logarit tham soá caùc moâ hình thì ta coù theå aùp duïng thuaät toaùn Viterbi ñaõ ñeà nghò maø khoâng caàn duøng baát cöù caùc pheùp nhaân naøo, cuï theå nhö sau : (1). Tieàn xöû lyù log( i )
(5.23a)
bi (ot)=log[bi(ot)]
(5.23b)
a ij =log(aij)
(5.23c)
i
vôùi 1
t
T, 1
i,j
N
(2). Khôûi ñoäng 1(i)
= log(
1(i)
=0
Vôùi 1
1(i))
=
i
+ b i (ot)
(5.24a) (5.24b)
i
N
(3). Keát thuùc *
P = max [ 1 i N
T(i)]
q*T=arg max [ 1 i N
LUAÄN VAÊN TOÁT NGHIEÄP
(5.25a)
T(i)]
(5.25b)
- 74 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
(4). Laàn ngöôïc laïi ñöôøng ñi qt * =
* t+1(q t+1)
t=T-1,T-2,…,1
(5.26)
3. Baøi toaùn 3 Baøi toaùn 3 laø baøi toaùn tìm ra phöông phaùp ñieàu chænh tham soá cuûa moâ hình (A,B, ), ñeå thoaû maõn moät tieâu chuaån toái öu naøo ñoù. Ñaây laø baøi toaùn khoù khaên nhaát. Khoâng coù caùch phaân tích naøo coù theå ñieàu chænh ñöôïc tham soá cuûa moâ hình sao cho ñaït ñöôïc xaùc suaát A, B, lôùn nhaát öùng vôùi quan saùt ñaõ cho. Tuy nhieân, chuùng ta coù theå choïn sao cho xaùc suaát P O
laø cöïc ñaïi ñòa phöông theo phöông phaùp cuûa Baum-Welch. Phöông
phaùp naøy coøn goïi laø kyø voïng cöïc ñaïi-Expectation Maximization (EM). Ñeå moâ taû phöông phaùp öôùc löôïng caùc tham soá moâ hình, ta caàn ñònh nghóa caùc ñaïi löôïng sau ñaây: Ñònh nghóa bieán xaùc suaát haäu nghieäm: t(i)=P(qt=i
| O, )
(5.27)
laø xaùc suaát ôû traïng thaùi i thôøi ñieåm t öùng vôùi chuoãi O vaø moâ hình . Ta bieåu dieãn t(i) theo
t(i)
vaø
t(i):
Vì P(O,qt=i | )= t(i) t(i) neân ta coù theå vieát laïi: t
i
P qt
P 0, q t
i 0,
i
P 0, q t
i
(5.28)
N
P 0
P 0, q t
i
i 1
t
i
t
i
i
t
(5.29)
N t
i
t
i
i 1
Ta thaáy raèng t(i) öùng vôùi mieàn quan saùt o1o2…ot vaø traïng thaùi i ôû thôøi ñieåm t. Coøn öùng vôùi mieàn quan saùt ot+1 ,ot+2,…,oT vaø traïng thaùi ñaõ cho qt = i taïi thôøi ñieåm t Ñònh nghóa
t(i,j)
t(i):
laø xaùc suaát ôû traïng thaùi i taïi thôøi ñieåm t vaø traïng thaùi j ôû thôøi ñieåm
t+1 cho bôûi chuoãi O vaø moâ hình , nghóa laø : t(i,j)
= P(qt = i, qt+1 = j | O, )
(5.30)
Töø ñònh nghóa bieán tieán vaø bieán luøi ta coù theå vieát laïi phöông trình treân : t(i,j)
=
P( qt
LUAÄN VAÊN TOÁT NGHIEÄP
i, q t 1 j , O | ) P(O | )
- 75 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN =
t
(i )aij b j (Ot 1 )
t 1
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC ( j)
P(O | )
=
t N
(i)aij b j (Ot 1 )
t 1
( j)
(5.31)
N t
(i)aij b j (Ot 1 )
t 1
( j)
i 1 j 1
Töø ñònh nghóa
t
(i ) vaø
t(i,j)
suy ra
N
t (i ) =
t
(5.32)
(i, j )
i 1
Neáu laáy toång
t
(i ) theo thôøi gian t, ta nhaän ñöôïc ñaïi löôïng mang yù nghóa laø soá laàn ñöôïc
kyø voïng heä ôû traïng thaùi i, hay töông ñöông vôùi soá laàn chuyeån traïng thaùi ñöôïc kyø voïng töø traïng thaùi i (neáu ta boû qua t=T trong pheùp laáy toång). Töông töõ toång t(i,j) theo thôøi gian laø soá laàn chuyeån ñöôïc kyø voïng töø traïng thaùi i sang traïng thaùi j. Töùc laø: T 1 t
(i) : kyø voïng soá laàn chuyeån traïng thaùi töø traïng thaùi i öùng vôùi O
t
(i, j ) : kyø voïng soá laàn chuyeån ñöôïc töø traïng thaùi i tôùi traïng thaùi j öùng vôùi O
t 1
T 1 t 1
Duøng caùc coâng thöùc ôû treân (vaø khaùi nieäm ñeán nhöõng bieán coá xaûy ra ) chuùng ta coù theå ñöa ra moät phöông phaùp ñeå taùi öôùc löôïng laïi nhöõng tham soá HMM. Caùc coâng thöùc coù theå taùi öôùc löôïng laïi caùc tham soá ,A,B ñöôïc cho nhö sau: j
= taàn suaát ñöôïc mong ñôïi ôû traïng thaùi ôû thôiø ñieåm t=1. =
1
(i ) =
P(O, qt i | ) = P(O | )
(i )
1 N
1
T
(i)
(5.33)
(i)
i 1
a ij
= (kyø voïng soá laàn chuyeån töø traïng thaùi i sang traïng thaùi j ) / (kyø voïng soá laàn chuyeån ñöôïc töø traïng thaùi i) T 1
=
t
(i, j )
(5.34)
t 1 T 1 t
(i )
t 1
LUAÄN VAÊN TOÁT NGHIEÄP
- 76 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
b j (k ) = (kyø voïng soá laàn ñöôïc ôû traïng thaùi j vaø quan saùt thaáy vk) / (kyø voïng soá laàn ñöôïc ôû traïng thaùi j) T t
( j)
T
P(O, qt
t 1 vk = oTt
=
i ) (Ot , v k )
t 1 T
P(O, qt
t ( j)
1
i )
t 1
t 1 T
=
t
( j ). t ( j ). (Ot , v k )
t 1 T t
( j)
t
(5.35)
( j)
t 1
ÔÛ ñaây: (Ot , vk )
1 neáu Ot v k 0 nôi khaùc
(5.36)
Neáu ta ñònh nghóa moâ hình hieän taïi laø = (A,B, ) vaø duøng noù ñeå tính toaùn veá phaûi cuûa caùc phöông trình (5.33), (5.34), (5.35), vaø ta ñònh nghóa moâ hình ñöôïc öôùc löôïng laïi laø =( A , B ,
) nhö ñaõ xaùc ñònh cho veá phaûi cuûa 3 phöông trình naøy thì nhöõng tính chaát
sau seõ xuaát hieän (Baum ñaõ chöùng minh) : Hoaëc Hoaëc
ñaït traïng thaùi tôùi haïn nghóa laø = toát hôn
theo nghóa P(O| )> P(O| ) nghóa laø chuùng ta tìm ra moät moâ
hình môùi maø töø ñoù chuoãi quan saùt coù nhieàu khaû naêng ñöôïc taïo ra hôn. Döïa vaøo thuû tuïc neâu treân, neáu muoán caûi thieän xaùc suaát cuûa O coù theå ñöôïc quan saùt töø moâ hình thì ta coù theå laëp laïi vieäc taùi öôùc löôïng nhieàu laàn. Keát quaû thu ñöôïc cuoái cuøng laø moät öôùc löôïng gioáng nhaát ML (Maximum Likelihood) cuûa HMM. Caàn phaûi thaáy raèng giaûi thuaät tieán luøi chæ seõ daãn ñeán cöïc ñaïi ñòa phöông, vaø trong nhieàu tröôøng hôïp thì haøm likelihood seõ voâ cuøng phöùc taïp vaø coù nhieàu cöïc ñaïi ñòa phöông. IV. PHAÂN LOAÏI HMM: Ta phaân loaïi moâ hình Markov döïa vaøo caáu truùc cuûa ma traän xaùc suaát chuyeån traïng thaùi A. Xeùt moâ hình goàm boán traïng thaùi coù ma traän A nhö beân döôùi:
LUAÄN VAÊN TOÁT NGHIEÄP
- 77 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Neáu taát caû caùc heä soá cuûa ma traän ñeàu döông, nghóa laø moâ hình coù theå chuyeån töø moät traïng thaùi sang moät traïng thaùi baát kyø. Tuy nhieân, trong nhaän daïng tieáng noùi thöôøng söû duïng moâ hình traùi-phaûi hay moâ hình Bakis. Moâ hình naøy coù tính chaát: khi thôøi gian taêng leân, traïng thaùi seõ taêng leân hoaëc vaãn giöõ nguyeân traïng thaùi cuõ. Ñieàu naøy phuø hôïp vôùi caáu truùc töï nhieân cuûa tieáng noùi laø bieán thieân theo thôøi gian töø traùi sang phaûi. Caùc heä soá cuûa moâ hình traùi phaûi coù tính chaát: a ij 0 vôùi j
Thoâng thöôøng, moâ hình Bakis coøn raøng buoäc khoâng ñöôïc chuyeån töø moät traïng thaùi ñeán traïng thaùi quaù xa noù, nghóa laø: a ij 0 neáu j>i+ i. Trong ví duï beân döôùi, ta thaáy moâ hình Bakis vôùi i=2 vaø ma traän A laø:
Chuù yù raèng trong moâ hình Bakis, ôû traïng thaùi cuoái cuøng: aNN=1 vaø aNi=0.
Hình 5.2 : Moâ hình Bakis 6 traïng thaùi V. VAÁN ÑEÀ TÆ LEÄ KHI TOÅ CHÖÙC HMM
LUAÄN VAÊN TOÁT NGHIEÄP
- 78 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Ñeå hieåu roõ vì sao caàn phaûi laáy tæ leä khi caøi ñaët thuû tuïc öôùc löôïng tham soá HMM, ta haõy xem laïi ñònh nghóa bieán tieán t (i) . Coù theå thaáy raèng t (i ) laø toång cuûa moät soá löôïng lôùn caùc soá haïng coù daïng : t 1
t
a qsqs
bqs (Os )
1
s 1
s 1
Vì caùc ñaïi löôïng a vaø b nhoû hôn 1 neân khi t lôùn moãi soá haïng haøm muõ. Vôùi t ñuû lôùn, mieàn giaù trò cuûa
t
t
(i ) seõ tieán veà 0 theo toác ñoä
(i ) seõ vöôït qua giôùi haïn döõ lieäu cho pheùp cuûa baát
kyø maùy tính naøo (vöôït caû ñoä chính xaùc keùp ). Chính vì vaäy ta caàn laáy tæ leä trong quaù trình tính toaùn thuû tuïc öôùc löôïng . Ñeå hieåu roõ quùa trình laáy tæ leä, ta xem laïi quaù trình taùi ñaùnh giaù caùc heä soá chuyeån traïng thaùi aij . Bieåu dieãn ñaïi löôïng naøy tröïc tieáp theo caùc bieán tieán vaø luøi ta ñöôïc : T 1
(i )aij b j (ot )
t
t 1
( j)
(5.37)
t 1
aij
T 1 t
(i )
t 1
( j)
t 1
Ta duøng caùc kyù hieäu : t
(i ) ñeå chæ giaù trò chöa ñöôïc laáy tæ leä
t
(i ) ñeå chæ giaù trò ñaõ ñöôïc laáy tæ leä
t
(i) ñeå chæ giaù trò trung gian khi laáy tæ leä
Vôùi t=1 Ta tính t
t
(i ) =
(i ) nhö sau : 1
(i )
(5.38)
N 1
( j)
j 1
Ta ñònh nghóa c(1) laø heä soá chuaån hoaù vôùi : c(1)=
1
(5.39)
N 1
( j)
j 1
Töø ñoù ta coù :
LUAÄN VAÊN TOÁT NGHIEÄP
- 79 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
(i) =c(1)
1
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC (5.40)
(i)
1
Vôùi t=2 ta söû duïng coâng thöùc tính
t
(i ) aùp duïng cho
t
(i) khi ñoù thay
t
(i ) baèng
t
(i )
nghóa laø : N
(i)
2
2
(5.41)
( j ) a ji bi (o2 )
j 1
Töø (5.37), (5.40) vaø (5.41) ta coù : 2
(i ) =c(1)
(i )
2
Caùc giaù trò naøy ñöôïc tính cho taát caû caùc traïng thaùi i, sau ñoù ta laáy tæ leä chuùng treän toång caùc traïng thaùi :
2
2
(i )
(i )
=c(2)c(1)
2
(i )
(5.42)
N 2
( j)
j 1
Vôùi t = 3,4,…T thöïc hieän töông töï ta coù : N t (i )
t 1
(5.43)
( j )aij b j (ot )
j 1
t t
(i) c(t )
t (i )
c(l )
t
(5.44)
(i)
l 1
Vôùi
1
c(l )
(5.45)
N l
(i )
i 1
Töø (5.43) ñeán (5.45) ta coù theå thaáy raèng : N t 1 t
(i )
( j )a ji bi (ot ) (5.46)
j 1 N
N t 1
( j )a jk bk (ot )
k 1 j 1
Cuoái cuøng ta coù :
LUAÄN VAÊN TOÁT NGHIEÄP
- 80 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
t
t
(i )
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
(i )
(5.47)
N
(k )
t k 1
Coâng vieäc ñöôïc aùp duïng töông töï cho
t
(i) vôùi ñieåm khaùc bieät duy nhaát laø ta laáy cuøng moät
heä soá tæ leä nhö ñaõ aùp duïng ñeå tính cho
t
(i ) . Do vaäy ta coù :
t 1
( j)
c(t )
t 1
(5.48)
( j)
T t
1 ( j)
c(l )
t 1
(5.49)
( j)
l t
Vôùi
t
(i ) vaø
_
a ij nhö sau: t (i ) vöøa laáy tæ leä ta coù theå öôùc löôïng ñöôïc T 1 t
(i )aij b j (ot )
t 1
( j)
(5.50)
t 1
a ij
T 1 t
(i )
t 1
( j)
t 1
Do vaäy ta thaáy caùc gía trò laáy tæ leä coù theå ñöôïc söû duïng ñeå taùi öôùc löôïng xaùc suaát chuyeån traïng thaùi maø khoâng caàn phaûi hieäu chænh. Cuoái cuøng ta haõy xaùch ñònh xaùc suaát P (O ) . Ta coù : P (O ) =
N T
(5.51)
(i )
i 1
Roõ raøng laø khoâng thích hôïp giaù trò ñaõ laáy tæ leä trong coâng thöùc naøy. Tuy nhieân, töø (5.47) ta thaáy : N t
(i ) = 1
(5.52)
t
i 1
Do vaäy, chuùng ta coù theå vieát N T i 1
N
T
i 1
l 1
(i)
c(l )
T
(i) 1
(5.53)
Vaø cuoái cuøng ta ruùt ra ñöôïc :
LUAÄN VAÊN TOÁT NGHIEÄP
- 81 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN 1
T
P(O )
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
(5.54)
c(l ) l 1
Chuùng ta cuõng coù theå tính baèng logarithm ( vì bieåu thöùc treân coù theå vöôït quaù daõy ñoäng cho pheùp cuûa maùy tính ) T
-log P (O ) =
(5.55)
log c(l ) l 1
Nhö vaäy log cuûa P ñöôïc tính chöù khoâng phaûi P, bôûi vì P coù khaû naêng vöôït quaù phaïm vi cho pheùp cuûa maùy tính. Neáu söû duïng thuaät toaùn Viterbi logarithm ñeå xaùc ñònh traïng thaùi toái öu nhaát thì phöông phaùp tæ leä ôû treân laø khoâng caàn thieát. VI. ÑA QUAN SAÙT Trong thöïc teá, ñeå taêng ñoä chính xaùc cuûa HMM, ngöôøi ta thöôøng duøng kyõ thuaät ña quan saùt, nghóa laø duøng moät soá löôïng lôùn quan saùt ñeå huaán luyeän moâ hình. Khi ñoù thuû tuïc öôùc löôïng laïi tham soá seõ phaûi ñöôïc boå sung. Ta kyù hieäu K chuoãi quan saùt nhö sau : O = [ O(1), O(2),…,O(K)] vôùi O(k) = (O1(k),O2(k),…,OTk(k)) laø chuoãi quan saùt thöù k. Ta giaû söû caùc chuoãi quan saùt hoaøn toaøn ñoäc laäp nhau vaø muïc tieâu cuûa ta laø hieäu chænh caùc tham soá cuûa moâ hình ñeå cöïc ñaïi hoaù ñaïi löôïng : K
P (O ) =
K
P(O k )
(5.56)
Pk
k 1
k 1
Vì caùc coâng thöùc taùi öôùc löôïng döïa treân taàn suaát xuaát hieän cuûa caùc bieán coá khaùc nhau neân ta seõ coäng caùc taàn suaát xuaát hieän rieâng bieät vôùi töøng chuoãi vaø ñöa vaøo bieåu thöùc. Vì vaäy caùc coâng thöùc öôùc löôïng laïi ñöôïc boå sung cho aij vaø b j (l ) nhö sau: K
aij
k 1
1
P
Tk 1 k t k t 1 K k 1
LUAÄN VAÊN TOÁT NGHIEÄP
1
P
(i )aij b j (Otk 1 )
k t 1
( j) (5.57)
Tk 1 k t
(i )
k t
( j)
k t 1
- 82 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN K k 1
b j (l )
1
Tk
P
k t 1
K
i
ot
P
( j)
k t
(i )
k t
( j)
l
(5.58)
Tk 1
1
k 1
Coøn
k t
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
k t
( j)
k t 1
khoâng caàn öôùc löôïng laïi do
1
=1 vaø
i
= 0 vôùi i khaùc 1.
Duøng yù töôûng laáy tæ leä ôû phaàn treân, trong ñoù moãi daõy quan saùt coù moät heä soá tæ leä rieâng, ta nhaän ñöôïc caùc coäng thöùc öôùc löôïng theo caùc bieán ñaõ ñöôïc laáy tæ leä nhö sau: K Tk 1 k t
aij
(i)aij b j (Ot( k1) )
k t 1
( j) (5.59)
k 1 t 1 K Tk 1 k t
k t
(i)
( j)
k 1 t 1 K
Tk k t
b j (l )
( j)
k t
( j)
(5.60)
k 1 t 1 K Tk k 1
1 Pk
k t
( j)
k t
( j)
t 1
VII. CAÙC MAÃU MAÄT ÑOÄ HMM Nhöõng traïng thaùi cuûa moät HMM caàn coù nhieàu caùch taïo maãu caùc phaân phoái xaùc suaát trong khoâng gian aâm thanh. Coù 3 caùch thoâng thöôøng ñeå thöïc hieän ñieàu naøy : maãu maät ñoä rôøi raïc, maãu maät ñoä lieân tuïc, vaø maãu maät ñoä baùn lieân tuïc. 1. Maãu maät ñoä rôøi raïc Trong phöông phaùp naøy, toaøn boä khoâng gian aâm thanh ñöôïc chia laøm moät soá trung bình caùc vuøng, baèng thuû tuïc phaân vuøng (clustering procedure) nhö ñaõ giôùi thieäu trong phaàn löôïng töû hoùa vectô (VQ). Nhaân (centroid) cuûa moãi cluster ñöôïc tieâu bieåu bôûi moät töø maõ (codeword) voán laø moät chæ muïc ñeán saùch maõ (codebook). Moãi frame ngoõ vaøo ñöôïc ñoåi thaønh moät codeword baèng caùch tìm ra vectô gaàn nhaát trong codebook. Moãi codebook coù M codeword ñöôïc goïi laø codebook côõ M. M cuõng laø soá kí hieäu quan saùt ñöôïc cuûa 1 traïng thaùi trong HMM. Nhö vaäy, trong HMM rôøi raïc, soá quan saùt laø höõu haïn. Haïn cheá cuûa phöông phaùp khoâng tham soá naøy laø noù gaëp phaûi nhöõng sai soá löôïng töû. Ba baøi toaùn maø ta ñaõ xeùt ôû treân duøng ñeå nhaän daïng vaø huaán luyeän cho caùc tham soá cuûa HMM ñöôïc aùp duïng hoaøn toaøn cho maät ñoä maãu rôøi raïc. 2. Maãu maät ñoä lieân tuïc:
LUAÄN VAÊN TOÁT NGHIEÄP
- 83 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Sai soá löôïng töû coù theå ñöôïc loaïi boû nhôø söû duïng maät ñoä maãu lieân tuïc thay vì duøng saùch maõ. Trong phöông phaùp naøy, phaân phoái xaùc suaát treân khoâng gian ñöôïc taïo maãu tröïc tieáp nhôø giaû ñònh laø noù coù daïng tham soá xaùch ñònh vaø sau ñoù coá tìm ra nhöõng tham soá ñoù. Thöôøng thì daïng tham soá naøy ñöôïc choïn laø phoái hôïp cuûa K bieán Gauss, nghóa laø: M
b j (o)
C jk G(o,
(5.61)
,U jk )
jk
k 1
Vôùi
b j (o)do 1 ,
j=1,2,…,N
Vaø C jk laø troïng soá cho töøng phaân phoái Gauss G coù trung bình laø phöông sai U jk sao cho
k
jk
vaø traän hieäp
C jk = 1. Trong suoát quaù trình huaán luyeän vieä öôùc löôïng laïi
B thì bao goàm caû vieäc ñaùnh giaù laïi C jk ,
jk
, U jk duøng moät taäp hôïp caùc coâng thöùc boå
sung sau ñaây: T t
C jk
( j, k )
öôùc löôïng troïng soá haøm phaân boá thöù k ôû traïng thaùi j
t 1 T M t
( j, k )
t 1 k 1 T
( j , k )Ot
t jk
t 1 T t
vector trung bình haøm phaân boá thöù k traïng thaùi j
( j, k )
t 1 T t
U jk
( j , k )(Ot
jk
)(Ot
jk
t 1 T t
)T
covariance haøm phaân boá thöù k traïng thaùi j
( j, k )
t 1
Trong ñoù
t
t
( j, k ) =
( j , k ) laø xaùc suaát ôû traïng thaùi j taïi thôøi ñieåm t cuûa haøm maät ñoä thöù k:
t
( j)
t
C jk G (Ot ,
( j)
N
jk
,U jk )
M t
( j)
j 1
t
( j) m 1
c
jm
G (Ot ,
jm
(5.62)
,U jm )
Nhaän xeùt: Ñoái vôùi maãu maät ñoä lieân tuïc thì soá quan saùt cuûa HMM laø voâ cuøng. Moãi traïng thaùi phaùt xaï quan saùt theo phaân phoái troän Gauss. LUAÄN VAÊN TOÁT NGHIEÄP
- 84 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Khi aùp duïng maät ñoä maãu lieân tuïc thì ñaõ coù moät soá thay ñoåi treân coâng töùc huaán luyeän. t ( j ) laø xaùc suaát ôû traïng thaùi i thôøi ñieåm t seõ ñöôïc thay baèng toång caùc xaùc suaát ôû traïng thaùi i haøm maät ñoä thöù k taïi thôøi ñieåm t : t ( j) =
M t
( j, k )
k 1
coøn caùc coâng thöùc taùi öôùc löôïng aij vaø
i
vaãn gioáng nhö caùc coâng thöùc ñaõ duøng cho
maãu maät ñoä rôøi raïc Haïn cheá cuûa phöông phaùp naøy laø nhöõng tham soá khoâng ñöôïc duøng chung cho caùc traïng thaùi, Vaäy neáu coù nhieàu traïng thaùi trong toaøn heä thoáng thì moät giaù trò K lôùn coù theå daån ñeán coù quaù nhieàu tham soá caàn ñöôïc huaán luyeän töông xöùng coøn neáu giaûm K thì coù theå khoâng giaùm saùt ñöôïc giaû ñònh raèng phaân phoái coù theå ñöôïc taïo maãu toát baèng caùch keát hôïp caùc bieán Gauss. 3. Maãu maät ñoä baùn lieân tuïc: Ñaây laø söï phoái hôïp giöõa hai phöông phaùp treân. Trong moät maãu maät ñoä baùn lieân tuïc thì cuõng nhö maãu rôøi raïc, cuõng coù moät saùch maõ moâ taû nhöõng cluster aâm thanh ñöôïc duøng chung cho taát caû caùc traïng thaùi. Nhöng thay vì bieåu dieãn nhöõng cluster nhö nhöõng centroids rôøi raïc, thì chuùng ñöôïc bieåu dieãn nhö nhöõng haøm maät ñoä lieân tuïc (thöôøng laø Gauss) treân vuøng khoâng gian laân caän, vì vaäy traùnh ñöôïc sai soá löôïng töû : L
b j (o )
C jk G(o,
k
(5.63)
,U k )
k 1
Vôùi L laø soá muïc töø cuûa saùch maõ, vaø C jk laø troïng soá cho töøng phaân phoái Gauss G coù trung bình laø
jk
vaø traän hieäp phöông sai U jk .
Xaùc suaát cuûa o ôû traïng thaùi j coù theå ñöôïc tính nhö sau : L
b j (o)
(5.64)
f (o vk )b j (k ) k 1
Vôùi f (o v k ) laø xaùc suaát ñeå vector o naèm trong codeword k vaø b j (k ) laø troïng soá ño tæ leä caùc vector thuoäc codeword k xuaát hieän ôû traïng thaùi j. Khi aùp duïng maãu maät ñoä baùn lieân tuïc ñaõ coù moät soá thay ñoåi treân caùc coâng thöùc huaán luyeän, ñoù laø : Xaùc suaát moâ hình ôû traïng thaùi i taïi thôiø ñieåm t vaø nhöõng tín hieäu quan saùt ôû codeword k laø : LUAÄN VAÊN TOÁT NGHIEÄP
- 85 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
b f (o v ) (i) ii k 0 P(O )
t (i, k )
N
t
j 1
t 1
(i)a b (k ) f (o v ) ( j) ij j k t 1 P(O )
N t
(k )
t
i 1
(5.65)
t T
(5.66)
(i, k )
Öôùc löôïng xaùc suaát codeword k ôû traïng thaùi j T t
(i, k )
(5.67)
t 1 T
b j (k )
t
( j)
t 1
Öôùc löôïng vector trung bình taïi codeword k T t k
(k )O t
(5.68)
t 1 T t
(k )
t 1
Öôùc löôïng covariance taïi codeword k T t
Uk
(k )(Ot
k
)(Ot
k
)T
t 1 T t
(5.69)
(k )
t 1
Nhaän xeùt: cuõng nhö trong tröôøng hôïp lieân tuïc caùc bieán Gauss ñöôïc öôùc löôïng laïi trong suoát quaù trình huaán luyeän, vì vaây saùch maõ ñöôïc toái öu hoaù vôùi caùc tham soá HMM, ngöôïc laïi vôùi maãu rôøi raïc trong ñoù saùch maõ vaãn giöõ khoâng ñoåi. Söï toái öu hoaù keát hôïp naøy coù theå laøm caûi thieän chaát löôïng cuûa heä thoáng hôn. Caû ba maãu maät ñoä ñeàu ñöôïc duøng roäng raõi duø cho nhuõng maãu maät ñoä lieân tuïc döôøng nhö cho keát quaû toát nhaát treân nhöõng cô sôõ döõ lieäu lôùn (tuy nhieân thôøi gian chaïy seõ chaäm hôn 300 laàn ). VIII. KHÔÛI TAÏO CAÙC THAM SOÁ CHO HMM
LUAÄN VAÊN TOÁT NGHIEÄP
- 86 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Veà phöông dieän lyù thuyeát, caùc phöông trình öôùc löôïng neân mang laïi caùc tham soá töông öùng vôùi moät cöïc ñaïi ñòa phöông. Vì theá, vaán ñeà coát loõi laø laøm sao choïn ñöôïc nhöõng tham soá ban ñaàu ñeå cöïc ñaïi ñòa phöông baèng hay caøng gaàn giaù trò cöïc ñaïi toaøn cuïc thì caøng toát. Vaán ñeà naøy khoâng coù caâu traû lôøi chính xaùc maø döïa treân kinh nghieäm cho thaáy laø A vaø coù theå ñöôïc khôûi ñoäng ngaãu nhieân hay ñoàng nhaát thì ñeàu cho ñöôïc nhöõng keát quûa öôùc löôïng toát. Tuy nhieân, thöïc teá cuõng cho thaáy vôùi B vieäc khôûi ñoäng toát raát coù lôïi trong tröôøng hôïp kyù hieäu rôøi raïc vaø khoâng theå thieáu vôùi tröôøng hôïp phaân phoái lieân tuïc. Chuùng ta coù theå duøng thuaät toaùn sau ñeå khôûi taïo tham soá cuûa B: ÖÙng vôùi moãi quan saùt Ok = (o1k, o2k, …, oTk) trong taäp ña quan saùt O=[O1, O2, …, OK], ta phaân hoaïch tuaàn töï caùc quan saùt naøy thaønh N ñoaïn ( N laø soá traïng thaùi), keát quaû ta seõ coù N taäp quan saùt. Moãi taäp töông öùng vôùi moät traïng thaùi cuûa moâ hình. Vôùi moãi taäp quan saùt, bj(k) ñöôïc xaùc ñònh nhö sau:
IX. AÛNH HÖÔÛNG CUÛA TAÄP DÖÕ LIEÄU KHOÂNG ÑAÀY ÑUÛ Moät khoù khaên chính trong quaù trình huaán luyeän HMM laø taäp döõ lieäu khoâng ñaày ñuû. Khi tính bj(k), neáu taäp huaán luyeän quaù nhoû thì sau khi öôùc löôïng ta seõ coù bj(k)=0, nghóa laø moâ hình seõ taïo ra xaùc suaát zero cho nhöõng quan saùt coù qt=j vaø ot=vk. Ñeå giaûi quyeát vaàn ñeà naøy, coù theå taêng kích thöôùc taäp quan saùt, nhöng ñieàu naøy khoù thöïc hieän. Höôùng thöù hai laø giaûm bôùt kích thöôùc cuûa moâ hình (giaûm soá traïng thaùi hoaëc caùc heä soá ma traän), höôùng naøy seõ cho keát quaû keùm. Höôùng thöù ba laø tìm moät öôùc löôïng thoáng keâ khoâng chuaån döïa treân taäp huaán luyeän giôùi haïn: bj k
bj k b
if b j k
b
elsewhere
(5.61)
X. TOÅ CHÖÙC NHAÄN DAÏNG TIEÁNG NOÙI BAÈNG HMM
LUAÄN VAÊN TOÁT NGHIEÄP
- 87 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 5.3 Sô ñoà khoái heä nhaän daïng töø rôøi raïc baèng HMM Trong sô ñoà nhaän daïng töø rôøi raïc baèng HMM, giaû söû ta caàn nhaän daïng boä töø vöïng coù V töø, moãi töø ñeàu coù moâ hình Markov rieâng vaø ñöôïc noùi K laàn. Ta thöïc hieän nhöõng böôùc sau: 1. Vôùi moãi töø v trong boä töø vöïng, chuùng ta xaây döïng moät moâ hình Markov aån
v.
2. Vôùi moãi töø chöa bieát, chuùng ta xaây döïng moâ hình nhaän daïng nhö treân hình 5.3. Tín hieäu tieáng noùi ñöôïc trích ñaëc tröng MFCC, roài ñöôïc löôïng töû hoùa ñeå coù ñöôïc caùc quan saùt rôøi raïc O={o1, o2, …, ot, …, oT}. Tieáp theo, tính xaùc suaát cho taát caû caùc moâ hình P(O|
v
),1≤ v ≤ V, vaø choïn töø coù xaùc suaát lôùn nhaát, töùc laø
v* arg max[ P(O | 1 v V
v
]
XI. ÖU ÑIEÅM VAØ NHÖÔÏC ÑIEÅM CUÛA HMM: 1. Öu ñieåm: HMMs coù nhieàu öùng duïng phong phuù. Khi moät HMM ñöôïc aùp duïng vaøo nhaän daïng tieáng noùi thì caùc traïng thaùi ñöôïc hieåu laø caùc maãu aâm thanh , cho thaáy nhöõng aâm naøo coù khaû naêng ñöôïc nghe trong suoát nhöõng segments tieáng noùi töông öùng; coøn caùc traïng thaùi seõ taïo ra nhöõng raøng buoäc theo thôøi gian cho thaáy baèng caùch naøo nhöõng traïng thaùi coù theå noái tieáp nhau moät caùch tuaàn töï. Bôûi tieáng noùi luoân phaùt veà phía tröôùc theo thôøi gian neân caùc chuyeån traïng thaùi trong moät öùng duïng tieáng noùi seõ luoân tieán tôùi tröôùc töông öùng (hay laëp taïi choã, cho pheùp moät traïng thaùi coù khoaûng toàn taïi tuyø yù). LUAÄN VAÊN TOÁT NGHIEÄP
- 88 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 5: MOÂ HÌNH MARKOV AÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Coù theå duøng duøng ñeå giaûi quyeát caùc heä thoáng maø ta khoâng theå bieát ñöôïc chuoãi traïng thaùi maø heä thoáng traûi qua( coøn goïi laø aån). 2. Nhöôïc ñieåm: Giaû ñònh baäc moät cho raèng taát caû caùc xaùc suaát chæ phuï thuoäc duy nhaát vaøo traïng thaùi hieän taïi thì khoâng ñuùng cho nhöõng öùng duïng veà tieáng noùi. Moät haäu quaû laø caùc HMMs khoù coù ñöôïc caùc maãu phaùt aâm roõ raøng vì nhöõng phaân phoái aâm thanh trong thöïc teá phuï thuoäc raát nhieàu vaøo nhöõng traïng thaùi quaù khöù. Moät haäu quaû khaùc laø caùc khoaûng toàn taïi ñöôïc taïo maãu khoâng chính xaùc bôûi moät phaân phoái haøm muõ giaûm thay vì baèng moät phaân phoái Poisson chính xaùc hay nhöõng phaân phoái coù daïng chuoâng khaùc. Giaû ñònh ñoäc laäp cho raèng khoâng coù söï töông quan giöõa nhöõng frames naøo keá tieáp nhau laø khoâng ñuùng cho nhöõng öùng duïng veà tieáng noùi. Vaø theo giaû ñònh naøy caùc HMMs chæ kieåm tra moät frame tieáng noùi ôû moät thôøi ñieåm Nhöõng maãu maät ñoä xaùc suaát (rôøi raïc, lieân tuïc hay baùn lieân tuïc) ñeàu coù ñoä chính xaùc taïo maãu chöa toái öu. Ñaëc bieät laø caùc maãu rôøi raïc phaûi chòa sai soá löôïng töû. XII. TOÙM TAÉT Chöông naøy ñaõ trình baøy chi tieát veà moâ hình Markov aån, caùc thuaät toaùn ñeå ñaùnh giaù xaùc suaát moâ hình. Vieäc öôùc löôïng tham soá moâ hình vaø moät soá yeáu toá aûnh höôûng ñeán moâ hình cuõng ñaõ ñöôïc trình baøy laøm cô sôû cho vieäc xaây döïng heä thoáng nhaän daïng duøng HMM.
LUAÄN VAÊN TOÁT NGHIEÄP
- 89 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Chöông 6:
THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG Sô ñoà khoái ñieàu khieån thieát bò baèng tieáng noùi nhö sau:
Caâu leänh ñieàu khieån ñöôïc noùi vaøo maùy tính, chöông trình treân PC seõ xöû lyù tieáng noùi vöøa môùi ñöôïc noùi vaøo vaø nhaän daïng töø, caâu vöøa noùi. Neáu caâu vöøa noùi vaøo phuø hôïp vôùi ngöõ phaùp thì PC seõ ñieàu khieån thieát bò chaáp haønh Chöông trình huaán luyeän, nhaän daïng tieáng noùi treân PC ñöôïc vieát baèng ngoân ngöõ Matlab, sau ñoù build thaønh ñoái töôïng COM cho Visual Basic söû duïng. PC giao tieáp vôùi vi ñieàu khieån treân maïch chaáp haønh thoâng qua coång RS232. Maïch chaáp haønh mang tính thöû nghieäm heä thoáng nhaän daïng goàm 10 ñeøn Led, töôïng tröng cho 10 thieát bò chieáu saùng, vaø 1 motor töôïng tröng cho 1 quaït (quay vôùi 3 toác ñoä khaùc nhau). Ñeå thöïc hieän heä thoáng treân, tröôùc heát phaûi xaây döïng heä thoáng nhaän daïng tieáng noùi duøng HMM nhö sau:
Hình 6.1: Sơ đồ khối hệ thống nhận dạng tiếng nói I. TRÍCH ÑAËC TRÖNG TIEÁNG NOÙI: Trong đề taøi naøy ta chọn phương phaùp MFCC để trích đặc trưng tiếng noùi. Chi tiết veà trích ñaëc tröng MFCC ñaõ ñöôïc trình baøy ở Chương 3 Sơ đồ trích đặc trưng tiếng Noùi duøng MFCC như sau:
LUAÄN VAÊN TOÁT NGHIEÄP
- 90 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 6.2 Löu ñoà trích ñaëc tröng Tín hiệu tiếng noùi:
LUAÄN VAÊN TOÁT NGHIEÄP
- 91 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Sau khi qua tieàn nhaán:
Qua khaâu phaùt hieän ñieåm ñaàu-ñieåm cuoái:
LUAÄN VAÊN TOÁT NGHIEÄP
- 92 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Keát quaû sau khi qua phaàn trích ñaëc tröng: ma traän P x T , trong ñoù P=24, vaø T laø soá frame cuûa tieáng noùi ñöôïc thu vaøo. Moãi coät laø 24 heä soá MFCC cuûa moät frame. Caùc haøm Matlab chính ñöôïc duøng trong phaàn naøy: x=wavrecord(Nsample,Fs);
% record sound
s=filter(1,[1 -0.96],s);
% pre-emphasis
y=detector(s);
% endpoint detection
y=melcepst(s,Fs,’ed’);
% Extract feature vectors
II. LÖÔÏNG TÖÛ HOÙA VECTOR: Sau khi trích ñaëc tröng, moãi töø cho moät daõy vector phoå. Duøng phöông phaùp LBG ñeå löôïng töû hoùa vector. Trong ñeà taøi naøy, ta söû duïng codebook size 128. Giaûi thuaät löôïng töû hoùa vector :
LUAÄN VAÊN TOÁT NGHIEÄP
- 93 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 6.3 Löu ñoà löôïng töû hoùa vector Việc xaùc ñònh taäp nhaân toát nhaát cuûa codebook ñöôïc thöïc hieän nhôø thuaät toaùn LBG Caùc haøm Matlab chính trong phaàn naøy: Yc = vqLBGP(data, codeBookSize); % Vector quantization
III. GIAÛI THUAÄT HUAÁN LUYEÄN HMM: Trong ñeà taøi naøy, moâ hình HMM ñöôïc söû duïng laø moâ hình Bakis, vôùiù 6 traïng thaùi, böôùc nhaûy 2. Moãi töø ñöôïc xaây döïng moät moâ hình Markov aån rieâng. Quaù trình huaán luyeän ñöôïc thöïc hieän nhö sau:
LUAÄN VAÊN TOÁT NGHIEÄP
- 94 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 6.4 Löu ñoà huaán luyeän HMM Giaûi thuaät ñaùnh nhaõn ma traän MFCC( laø ma traän coù chieàu P x T) cuûa 1 töø ñöôïc thöïc hieän nhö sau: o Tính khoaûng caùch Euclide giöõa frame i vôùi töøng codeword trong codebook. o Tìm giaù trò nhoû nhaát trong caùc khoaûng caùch vöøa tính ñöôïc. Nhaõn cuûa frame naøy laø chæ soá cuûa codeword öùng vôùi khoaûng caùch nhoû nhaát ñoù. o Laëp laïi caùc böôùc treân cho ñeán khi taát caû caùc frame ñeàu ñöôïc ñaùnh nhaõn. Khôûi taïo HMM cho töøng töø: khôûi taïo ma traän A, π, B theo caùch khôûi taïo ngaãu nhieân. Huaán luyeän HMM cho töøng töø:
LUAÄN VAÊN TOÁT NGHIEÄP
- 95 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 6.6 Giaûi thuaät huaán luyeän Trong luaän vaên naøy, ngöôõng ε ñöôïc choïn 0.00001 IV. GIAÛI THUAÄT NHAÄN DAÏNG: Sau khi ñaõ huaán luyeän HMM cuûa caùc töø cho heä thoáng, ta coù theå tieán haønh vieäc nhaän daïng töø ñöôïc noùi laø töø naøo trong soá caùc töø ñaõ huaán luyeän. Giaûi thuaät nhaän daïng tieáng noùi baèng HMM nhö sau:
LUAÄN VAÊN TOÁT NGHIEÄP
- 96 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Hình 6.7: Giaûi thuaät nhaän daïng V. Giao diện VB: Form chính:
LUAÄN VAÊN TOÁT NGHIEÄP
- 97 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Chöông trình coù 2 cheá ñoä: o Voice Command: Ñieàu khieån thieát bò baèng tieáng noùi. Caâu leänh ñöôïc ñoïc rôøi raïc trong voøng 5 giaây. Chöông trình ñöôïc thieát laäp vôùi ngöõ phaùp:
LUAÄN VAÊN TOÁT NGHIEÄP
- 98 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Chæ khi heä thoáng nhaän daïng ñöôïc caùc töø vôùi ngöõ phaùp nhö theá thì thieát bò môùi ñöôïc ñieàu khieån.
Giao dieän Voice Command -
Nuùt Record: Ghi aâm caâu noùi ñöôïc noùi vaøo, thôøi gian ghi aâm laø 5s
-
Nuùt Endpoints: Duøng ñeå tieán haønh taùch töø, xaùc ñònh ñieåm ñaàu ñieåm cuoái cuûa tín hieäu tieáng noùi.
-
Nuùt Feature Extraction: nuùt naøy ñöôïc duøng ñeå trích caùc ñaëc tröng cuûa tín hieäu sau khi ñaõ laáy Endpoint ôû giai ñoaïn treân. Sau khi ñaõ tính ñöôïc ñaëc tröng cuûa tín hieäu tieáng noùi, chöông trình seõ töï ñoäng löu caùc ñaëc tröng.
-
Nuùt VQ Symbols: Nuùt naøy ñöôïc duøng ñeå xaùc ñònh daõy quan saùt cuûa caùc chuoãi vector trích ñaëc tröng vöøa môùi coù ñöôïc baèng phöông phaùp löôïng töû vector.
-
Nuùt HMMVQ: Tieán haønh nhaän daïng chuoãi quan saùt ñöôïc taïo ra töø böôùc treân. Sau ñoù tieán haønh nhaän daïng nhöõng töø môùi ñöôïc ghi aâm laø nhöõng töø gì.
o Word Recognition: Nhaän daïng töø rieâng leû. Heä thoáng nhaän daïng töøng töø rieâng leû:
LUAÄN VAÊN TOÁT NGHIEÄP
- 99 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
-
Nuùt Record: Ghi aâm caâu noùi ñöôïc noùi vaøo, thôøi gian ghi aâm laø 2s
-
Nuùt Endpoints: Duøng ñeå tieán haønh taùch töø, xaùc ñònh ñieåm ñaàu ñieåm cuoái cuûa tín hieäu tieáng noùi.
-
Nuùt Feature Extraction: nuùt naøy ñöôïc duøng ñeå trích caùc ñaëc tröng cuûa tín hieäu sau khi ñaõ laáy Endpoint ôû giai ñoaïn treân. Sau khi ñaõ tính ñöôïc ñaëc tröng cuûa tín hieäu tieáng noùi, chöông trình seõ töï ñoäng löu caùc ñaëc tröng.
-
Nuùt VQ Symbols: Nuùt naøy ñöôïc duøng ñeå xaùc ñònh daõy quan saùt cuûa caùc chuoãi vector trích ñaëc tröng vöøa môùi coù ñöôïc baèng phöông phaùp löôïng töû vector.
-
Nuùt HMMVQ: Tieán haønh nhaän daïng chuoãi quan saùt ñöôïc taïo ra töø böôùc treân. Sau ñoù tieán haønh nhaän daïng nhöõng töø môùi ñöôïc ghi aâm laø nhöõng töø gì.
Trong caû 2 mode chöông trình, neáu click vaøo nuùt Word Recognition hoaëc Voice Command thì chöông trình töï ñoäng thöïc hieän töøng böôùc: Record, Endpoints, Feature Extraction, VQ Symbols, vaø cuoái cuøng laø HMMVQ. Ngöôïc laïi, chuùng ta coù theå click tuaàn töï ñeå theo doõi quaù trình tính toaùn cuûa heä thoáng. LUAÄN VAÊN TOÁT NGHIEÄP
- 100 -
SVTH: HAØ THUÙC PHUØNG
CHÖÔNG 6: THIEÁT KEÁ VAØ THI COÂNG HEÄ THOÁNG
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
VI. Mạch chấp haønh Moâ hình ñöôïc xaây döïng mang tính thöïc nghieäm cho ñeà taøi neân khaù ñôn giaûn. Thieát bò thöû nghieäm cho ñeà taøi goàm 10 ñeøn led, moâ phoûng cho 10 thieát bò chieáu saùng, 1 ñoäng cô DC moâ phoûng cho quaït vôùi 3 toác ñoä quay khaùc nhau.
Vi ñieàu khieån ñöôïc söû duïng ôû ñaây laø ATMega16. Khi maùy tính nhaän daïng ñöôïc caâu leänh ñuùng ngöõ phaùp töø ngöôøi noùi thì leänh ñieàu khieån seõ ñöôïc PC truyeàn xuoáng vi ñieàu khieån thoâng qua chuaån RS232. Vi ñieàu khieån seõ xuaát tín hieäu ñieàu khieån thieát bò.
LUAÄN VAÊN TOÁT NGHIEÄP
- 101 -
SVTH: HAØ THUÙC PHUØNG
Chöông 7: KEÁT QUAÛ, KEÁT LUAÄN VAØ HÖÔÙNG PHAÙT TRIEÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
CHÖÔNG 7
KEÁT QUAÛ, KEÁT LUAÄN VAØ HÖÔÙNG PHAÙT TRIEÅN Qua nhöõng quaù trình thöïc hieän ñöôïc trình baøy trong caùc chöông tröôùc, moät heä thoáng nhaän daïng tieáng noùi – tieáng Vieät ñaõ ñöôïc hoaøn thaønh. Chöông naøy seõ tieán haønh nhöõng thöû nghieäm thöïc teá nhö laø nhöõng keát quaû cuoái cuøng veà nhaän daïng treân nhöõng boä töø vöïng nhoû coá ñònh, thoâng qua ñoù keát luaän hieäu naêng cuûa heä thoáng. Luaän vaên ñaõ xaây döïng heä thoáng nhaän daïng boä töø ñôn goàm 15 töø (goàm 10 chöõ soá töø 1 ñeán 10 vaø 5 töø: “taét”, “môû”, “ñeøn”, “quaït”, “soá”). Duøng 15 töø naøy ñeå ñieàu khieån thieát bò vôùi 1 cuù phaùp nhaát ñònh. Chöông trình ñöôïc vieát baèng ngoân ngöõ Matlab. Sau ñoù build thaønh ñoái töôïng COM ñeå söû duïng trong Visual Basic. Muïc ñích ñeå taêng toác ñoä tính toaùn ñoàng thôøi duøng VB vieäc giao tieáp vôùi vi ñieàu khieån thuaän tieän hôn. Vieäc build m-file cuûa Matlab thaønh ñoái töôïng COM ñöôïc thöïc hieän qua Deployment tool cuûa Matlab. I.
KEÁT QUAÛ: Ñoái vôùi nhaän daïng töø ñôn, chöông trình thöû nghieäm thöïc hieän nhaän daïng 15 töø ñôn, moãi töø ñoïc 100 laàn.
LUAÄN VAÊN TOÁT NGHIEÄP
102
SVTH: HAØ THUÙC PHUØNG
Chöông 7: KEÁT QUAÛ, KEÁT LUAÄN VAØ HÖÔÙNG PHAÙT TRIEÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Keát quaû nhaän daïng noùi chung chaáp nhaän ñöôïc. Heä thoáng nhaän daïng chöa coù keát quaû toát vôùi töø “soá”, nhaàm laãn töø naøy vôùi “moät”, “boán”, “saùu” khaù nhieàu. Do töø “soá” phaùt aâm gaàn gioáng vôùi töø “moät” vaø “boán” laø nhöõng töø coù aâm “oâ” troäi hôn caû. Coøn ñoái vôùi töø “saùu”, töø naøy coù cuøng phuï aâm “s” trong töø “soá”. Ngoaøi ra, caùc töø cho keát quaû nhaän daïng döôùi 90% laø : “moät”, “taùm”,”chín”. Do vieäc nhaän daïng töø “soá” khoâng ñöôïc toát neân aûnh höôûng ñeán vieäc nhaän daïng ñuùng caâu leänh, laøm cho ñieàu khieån thieát bò khoâng nhö mong muoán. Tuy nhieân, neáu thay theá cuù phaùp, ví duï:”môû ñeøn soá 1” baèng “môû ñeøn 1”, thì heä thoáng nhaän daïng ñöôïc khaù chính xaùc. Thoáng keâ thaáy heä thoáng nhaän daïng ñuùng vôùi tæ leä trung bình 92% ñoái vôùi caâu leänh baét ñaàu vôùi töø “môû” vaø 87% ñoái vôùi caâu leänh baét ñaàu vôùi töø “taét”, noùi trong ñieàu kieän moâi tröôøng bình thöôøng ( phoøng coù tieáng quaït, maùy tính khaùc phaùt nhaïc, coù tieáng noùi chuyeän…), vôùi moãi caâu leänh ñieàu khieån 1 thieát bò ñöôïc noùi 10 laàn. II.
KEÁT LUAÄN Nhaän daïng tieáng noùi – tieáng Vieät laø ñeà taøi haáp daãn vôùi nhöõng öùng duïng voâ cuøng höõu ích trong nhieàu lónh vöïc; tuy nhieân laïi laø moät baøi toaùn cöïc kì khoù khaên do tính chaát quaù
LUAÄN VAÊN TOÁT NGHIEÄP
103
SVTH: HAØ THUÙC PHUØNG
Chöông 7: KEÁT QUAÛ, KEÁT LUAÄN VAØ HÖÔÙNG PHAÙT TRIEÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
phöùc taïp cuûa tieáng noùi. Ñaõ coù nhöõng coâng trình nghieân cöùu veà vaán ñeà naøy vôùi nhieàu höôùng giaûi quyeát khaùc nhau. Trong thôøi gian daønh cho ñeà taøi raát haïn heïp vaø tính chaát phöùc taïp cuûa tín hieäu tieáng noùi, em ñaõ löïa choïn vieäc xöû lyù nhaän daïng tieáng noùi baèng moâ hình Markov aån vaø ñaõ ñaït ñöôïc nhöõng keát quaû toång quan ban ñaàu trong lónh vöïc nhaän daïng tieáng noùi – tieáng Vieät trong ñieàu khieån. Heä thoáng ñieàu khieån baèng tieáng noùi naøy ñöôïc thöïc hieän treân boä töø vöïng nhoû töông öùng vôùi nhöõng taäp leänh coá ñònh vaø thöïc hieän nhaän daïng phuï thuoäc ngöôøi noùi. Tuy nhieân heä thoáng nhaän daïng tieáng noùi – tieáng Vieät khoâng theå döøng laïi ôû moät boä töø vöïng coøn quaù nhoû, chöa ñuû ñeå coù nhöõng öùng duïng vaøo thöïc teá ñieàu khieån vôùi nhöõng taäp leänh lôùn vaø thay ñoåi tuyø lónh vöïc ñieàu khieån. Ñeà taøi luaän vaên naøy khôûi ñaàu cho vieäc nghieân cöùu giaûi quyeát baøi toaùn nhaän daïng tieáng noùi – tieáng Vieät trong ñieàu khieån döïa treân Moâ hình Markov aån-phöông phaùp ñaõ vaø ñang ñaït keát quaû toát treân theá giôùi. Nhöõng muïc tieâu ñaõ ñaït ñöôïc: Tìm hieåu vaø naém ñöôïc caùc noäi dung sau: Lyù thuyeát tieáng noùi, ñaëc tröng ngöõ aâm tieáng Vieät vaø phöông phaùp nhaän daïng tieáng noùi tieáng Vieät. Caùc kieán thöùc veà xöû lí soá tín hieäu: FT, IFT, DFT, FFT, IDFT vaø STFT… Phöông phaùp phaùt hieän ñieåm ñaàu – ñieåm cuoái cuûa moät töø. Phöông phaùp MFCC trích ñaëc tröng tieáng noùi tieáng Vieät. Löôïng töû vector öùng duïng trong xöû lyù tieáng noùi. Moâ hình Markov aån duøng trong nhaän daïng tieáng noùi. Thöïc hieän ñöôïc heä thoáng hoaøn chænh cho nhaän daïng tieáng noùi: Vieát chöông trình thu aâm tieáng noùi taùch töø Vieát chöông trình trích ñaëc tröng tieáng noùi Vieát chöông trình löôïng töû hoùa vector Vieát chöông trình huaán luyeän moâ hình Markov aån rôøi raïc cho töøng töø Vieát chöông trình nhaän daïng tieáng noùi duøng HMM Thieát keá heä thoáng thöû nghieäm ñieàu khieån thieát bò baèng tieáng noùi. III.
HÖÔÙNG PHAÙT TRIEÅN
LUAÄN VAÊN TOÁT NGHIEÄP
104
SVTH: HAØ THUÙC PHUØNG
Chöông 7: KEÁT QUAÛ, KEÁT LUAÄN VAØ HÖÔÙNG PHAÙT TRIEÅN
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
Luaän Vaên chæ döøng laïi ôû vieäc nhaän daïng tieáng noùi vôùi ngöôøi noùi cuõng laø ngöôøi huaán luyeän. Ñoä chính xaùc chöa thaät söï cao, kích thöôùc boä töø vöïng coøn bò haïn cheá. Keát quaû nhaän daïng chæ döøng laïi ôû choã nhaän daïng teân cuûa töø chöù khoâng nhaän daïng nghóa cuûa noù, cuõng nhö chöa khaûo saùt vaø khoâng theå nhaän daïng caùc aâm toá vaø thanh ñieäu caáu taïo neân aâm tieát ñoù. Vì caùc haïn cheá ñoù, ta coù theå phaùt trieån ñeà taøi cuûa Luaän Vaên theo nhöõng höôùng sau: - Coù theå duøng nhieàu ñaëc tröng ñeå theå hieän ñaày ñuû hôn caùc ñaëc tính cuûa tieáng noùi, coù khaû naêng laøm cô sôû toát hôn ñeå nhaän daïng, ñaëc bieät laø xöû lyù thanh ñieäu trong tieáng Vieät. - Tìm hieåu theâm veà moâ hình Markov aån lieân tuïc, baùn lieân tuïc öùng duïng trong nhaän daïng tieáng noùi ñeå traùnh sai soá khi thöïc hieän löôïng töû vector. Theo moät soá nghieân cöùu gaàn ñaây cho thaáy, söûu duïng HMM trong nhaän daïng tieáng noùi cho pheùp ñaït ñoä chính xaùc cao nhung toác ñoä nhaän daïng chaäm do soá löôïng pheùp tính lôùn. Trong khi ñoù, duøng maïng Neuron thì toác ñoä nhanh hôn nhöng keùm chính xaùc hôn so vôùi HMM. Vì vaäy caàn nghieân cöùu tìm hieåu vieäc keát hôïp HMM vaø maïng Neuron ñeå cho ra moät heä thoáng nhaän daïng tieáng noùi hoaøn chænh hôn. - Boä töø vöïng xaây döïng trong luaän vaên chæ coù 15 töø. Boä töø nhaän daïng vôùi soá löôïng nhö vaäy chöa coù tính öùng duïng thöïc teá cao. Do ñoù, caàn nghieân cöùu ñeå môû roäng theâm voán töø. - Xaây döïng heä thoáng nhaän daïng ñoäc laäp ngöôøi noùi. - Xaây döïng heä thoáng nhaän daïng tieáng Vieät treân caùc chip DSP, FPGA ... - Phaân tích tieáng noùi ñeå nhaän daïng döïa treân caùc aâm toá vaø thanh ñieäu caáu taïo neân aâm tieát, ñaây chính laø neàn taûng ñeå chuyeån sang phaàn toång hôïp tieáng noùi. Vaø cuõng chính laø cô sôû cuûa heä thoáng chuyeån ñoåi töø tieáng noùi thaønh chöõ vieát.
LUAÄN VAÊN TOÁT NGHIEÄP
105
SVTH: HAØ THUÙC PHUØNG
TAØI LIEÄU THAM KHAÛO
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
TAØI LIEÄU THAM KHAÛO [1] Cao Xuaân Haïo, “Tieáng Vieät – Maáy vaán ñeà ngöõ aâm – ngöõ phaùp – ngöõ nghóa”, Nhaø xuaát baûn Giaùo Duïc, 1998. [2] Nguyeãn Ñöùc Thaønh, “Matlab öùng duïng trong ñieàu khieån”, Nhaø xuaát baûn Ñaïi Hoïc Quoác Gia TPHCM, 2004. [3] Leâ Tieán Thöôøng, “Xöû Lyù Soá Tín Hieäu vaø Wavelets – Taäp 1”, Nhaø xuaát baûn Ñaïi Hoïc Quoác Gia TPHCM, 2002. [4] TS Nguyeãn Vaên Giaùp, KS Traàn Vieät Hoàng, “ Kó thuaät nhaän daïng tieáng noùi vaø öùng duïng trong ñieàu khieån” , Boä moân Cô Ñieän töû, khoa Cô khí, Ñaïi Hoïc Baùch khoa TPHCM. [5] Nguyeãn Phuù Bình, “Baøi giaûng Xöû lyù tieáng noùi”, Ñaïi hoïc Baùch khoa Haø Noäi. [6] Nguyeãn Thanh Phöông, “Nhaän daïng tieáng noùi duøng moâ hình Markov aån”, Luaän Vaên Thaïc syõ, Tröôøng Ñaïi Hoïc Baùch Khoa TPHCM, 2003. [7] Traàn Coâng Binh, “Nhaän daïng tieáng noùi-tieáng Vieät trong ñieàu khieån”, Luaän vaên Ñaïi hoïc, 2002. [8] Lyù Höõu Tuaán, Buøi Ñaëng Quoác Thònh, “Toång hôïp vaø nhaän daïng tieáng noùi tieáng Vieät”, Luaän vaên Ñaïi hoïc, 2004. [9] Lawrence
Rabiner,
Biing-Hwuang
Juang,
“Fundamental
of
Speech
Recognition”, Prentice Hall, 1993, ISBN 0-13-015157-2. [10] Minh N. Do, “An Automatic Speaker Recognition System”, Audio Visual communications Laboratory Swiss Federal Institute of Technology, Lausanne, Switzerland, 2000. [11] Andrew Knight, “Basics Matlab and Beyond”, Chapman & Hall/CRC, 2000. [12] Lawrence .R Rabiner, “A tutorial on Hidden Markov Models and Selected Applications in Speech Recognition”, IEEE, VOL.77, NO.2, 1989.
LUAÄN VAÊN TOÁT NGHIEÄP
84
SVTH: HAØ THUÙC PHUØNG
TAØI LIEÄU THAM KHAÛO
GVHD: PHAN NGUYEÃN PHUÏC QUOÁC
[13] Mike Brookes, “VOICEBOX, MATLAB toolbox for speech proceesing”, Department of Electrical & Electronic Engineering, Imperial College [14] Nick Bardici, Björn Skarin, “Speech Recognition using Hidden Markov Model” [15] Moät soá taøi lieäu veà Speech Recognition, Neural Network, Wavelets cuõng nhö moät soá Matlab Toolbox ñöôïc taûi töø caùc website: http://www.cs.ubc.ca/~murphyk/Software/HMM/hmm.html http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html http://en.wikipedia.org/wiki/Category:Speech_recognition http://www.mathworks.com/matlabcentral/
LUAÄN VAÊN TOÁT NGHIEÄP
85
SVTH: HAØ THUÙC PHUØNG