Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

A Rapid Model Adaptation Technique for Emotional Speech Recognition with Style Estimation Based on Multiple-Regression HMM Teknik Adaptasi Model Pantas untuk Pengecaman Pertuturan Emosi dengan Anggaran Gaya Berdasarkan Regresi Berganda HMM

Yusuke IJIMA, Takashi NOSE, Makoto TACHIBANA, Takao KOBAYASHI

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Dalam kertas kerja ini, kami mencadangkan teknik penyesuaian model pantas untuk pengecaman pertuturan emosi yang membolehkan kami mengekstrak maklumat paralinguistik serta maklumat linguistik yang terkandung dalam isyarat pertuturan. Teknik ini adalah berdasarkan anggaran gaya dan penyesuaian gaya menggunakan HMM regresi berganda (MRHMM). Dalam MRHMM, parameter min bagi fungsi ketumpatan kebarangkalian keluaran dikawal oleh vektor parameter berdimensi rendah, dipanggil vektor gaya, yang sepadan dengan satu set pembolehubah penjelasan regresi berbilang. Proses pengecaman terdiri daripada dua peringkat. Pada peringkat pertama, vektor gaya yang mewakili kategori ekspresi emosi dan keamatan ekspresinya untuk ucapan input dianggarkan berdasarkan ayat demi ayat. Seterusnya, model akustik disesuaikan menggunakan vektor gaya anggaran, dan kemudian pengecaman pertuturan berasaskan HMM standard dilakukan pada peringkat kedua. Kami menilai prestasi teknik yang dicadangkan dalam pengiktirafan ucapan emosi simulasi yang diucapkan oleh kedua-dua perawi profesional dan penceramah bukan profesional.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E93-D No.1 pp.107-115
Tarikh penerbitan
2010/01/01
Diumumkan
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.E93.D.107
Jenis Manuskrip
PAPER
kategori
Pertuturan dan Pendengaran

Pengarang

Kata kunci

Contents [show]