Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Adaptation to Pronunciation Variations in Indonesian Spoken Query-Based Information Retrieval Penyesuaian kepada Variasi Sebutan dalam Pencarian Maklumat Berasaskan Pertanyaan Pertuturan Bahasa Indonesia

Dessi Puji LESTARI, Sadaoki FURUI

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Kesilapan pengecaman kata nama khas dan perkataan asing dengan ketara mengurangkan prestasi aplikasi pertuturan berasaskan ASR seperti sistem dailan suara, ringkasan pertuturan, perolehan semula dokumen pertuturan dan perolehan semula maklumat berasaskan pertanyaan (IR). Sebabnya ialah kata nama khas dan perkataan yang berasal daripada bahasa lain biasanya merupakan kata kunci yang paling penting. Kehilangan kata-kata tersebut akibat salah pengecaman seterusnya membawa kepada kehilangan maklumat penting daripada sumber pertuturan. Kertas kerja ini memfokuskan kepada cara meningkatkan prestasi ASR Indonesia dengan mengurangkan masalah variasi sebutan kata nama khas dan perkataan asing (khususnya perkataan Inggeris). Untuk mempertingkatkan ketepatan pengecaman kata nama yang betul, model akustik khusus kata nama khas dicipta melalui penyesuaian diselia menggunakan regresi linear kemungkinan maksimum (MLLR). Untuk meningkatkan pengecaman perkataan Inggeris, sebutan perkataan Inggeris yang terkandung dalam leksikon ditetapkan dengan menggunakan pemetaan fonem Inggeris-ke-Indonesia berasaskan peraturan. Keberkesanan kaedah yang dicadangkan telah disahkan melalui pertanyaan lisan berasaskan IR Indonesia. Kami menggunakan IR berasaskan Rangkaian Inferens (berasaskan IN) dan membandingkan keputusannya dengan IR Model Ruang Vektor (VSM) klasik, kedua-duanya menggunakan skema pemberat tf-idf. Keputusan eksperimen menunjukkan bahawa IR berasaskan IN mengatasi IR VSM.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E93-D No.9 pp.2388-2396
Tarikh penerbitan
2010/09/01
Diumumkan
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.E93.D.2388
Jenis Manuskrip
Special Section PAPER (Special Section on Processing Natural Speech Variability for Improved Verbal Human-Computer Interaction)
kategori
Penyesuaian

Pengarang

Kata kunci

Contents [show]