Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Utterance Verification Using State-Level Log-Likelihood Ratio with Frame and State Selection Pengesahan Ujaran Menggunakan Nisbah Kebarangkalian Log Peringkat Negeri dengan Bingkai dan Pemilihan Negeri

Suk-Bong KWON, Hoirin KIM

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Makalah ini mencadangkan sistem pengesahan ujaran menggunakan nisbah kemungkinan log peringkat negeri dengan pemilihan bingkai dan keadaan. Kami menggunakan model Markov tersembunyi untuk pengecaman pertuturan dan pengesahan sebutan sebagai model akustik dan model anti telefon. Model Markov tersembunyi mempunyai tiga keadaan dan setiap negeri mewakili ciri telefon yang berbeza. Oleh itu, kami mencadangkan algoritma untuk mengira nisbah kemungkinan log peringkat negeri dan memberi pemberat pada keadaan untuk mendapatkan ukuran keyakinan yang lebih dipercayai bagi telefon yang diiktiraf. Selain itu, kami mencadangkan algoritma pemilihan bingkai untuk mengira ukuran keyakinan pada bingkai termasuk pertuturan yang betul dalam pertuturan input. Secara amnya, maklumat pembahagian telefon yang diperoleh daripada sistem pengecaman pertuturan bebas pembesar suara adalah tidak tepat kerana model akustik berasaskan trifon sukar untuk dilatih dengan berkesan untuk meliputi pelbagai sebutan dan kesan koartikulasi. Jadi, adalah lebih sukar untuk mencari keadaan dipadankan yang betul apabila mendapatkan maklumat pembahagian keadaan. Algoritma pemilihan keadaan dicadangkan untuk mencari keadaan yang sah. Kaedah yang dicadangkan menggunakan nisbah kemungkinan log peringkat negeri dengan pemilihan bingkai dan keadaan menunjukkan bahawa pengurangan relatif dalam kadar ralat yang sama ialah 18.1% berbanding sistem garis dasar menggunakan nisbah kemungkinan log peringkat telefon mudah.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E93-D No.3 pp.647-650
Tarikh penerbitan
2010/03/01
Diumumkan
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.E93.D.647
Jenis Manuskrip
LETTER
kategori
Pertuturan dan Pendengaran

Pengarang

Kata kunci

Contents [show]