Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

HMM-Based Voice Conversion Using Quantized F0 Context Penukaran Suara Berasaskan HMM Menggunakan Konteks F0 Terkuantiti

Takashi NOSE, Yuhei OTA, Takao KOBAYASHI

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Kami mencadangkan teknik penukaran suara berasaskan segmen menggunakan sintesis pertuturan berasaskan model Markov (HMM) tersembunyi dengan data latihan bukan selari. Dalam teknik yang dicadangkan, maklumat fonem dengan tempoh dan kontur F0 terkuantisasi diekstrak daripada ucapan input penutur sumber, dan dihantar ke bahagian sintesis. Dalam bahagian sintesis, simbol F0 terkuantisasi digunakan sebagai konteks prosodik. Urutan label bergantung konteks secara fonetik dan prosodik dihasilkan daripada fonem yang dihantar dan simbol F0. Kemudian, pertuturan yang ditukar dijana daripada jujukan label dengan tempoh menggunakan HMM bergantung konteks yang telah dilatih oleh pembesar suara sasaran. Dalam latihan model, model penceramah sumber dan sasaran boleh dilatih secara berasingan, oleh itu tidak perlu menyediakan data pertuturan selari penceramah sumber dan sasaran. Keputusan percubaan objektif dan subjektif menunjukkan bahawa penukaran suara berasaskan segmen dengan konteks fonetik dan prosodik berfungsi dengan berkesan walaupun data pertuturan selari tidak tersedia.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E93-D No.9 pp.2483-2490
Tarikh penerbitan
2010/09/01
Diumumkan
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.E93.D.2483
Jenis Manuskrip
Special Section PAPER (Special Section on Processing Natural Speech Variability for Improved Verbal Human-Computer Interaction)
kategori
Penukaran Suara

Pengarang

Kata kunci

Contents [show]