Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Effective Language Representations for Danmaku Comment Classification in Nicovideo Perwakilan Bahasa Berkesan untuk Klasifikasi Komen Danmaku dalam Nicovideo

Hiroyoshi NAGAO, Koshiro TAMURA, Marie KATSURAI

  • pandangan teks lengkap

    1

  • Petikan Ini

Ringkasan:

Ulasan Danmaku telah menjadi popular untuk tontonan bersama pada platform perkongsian video, seperti Nicovideo. Walau bagaimanapun, banyak komen yang tidak berkaitan biasanya mencemarkan kualiti maklumat yang disediakan oleh video. Masalah pencemar maklumat sedemikian boleh diselesaikan oleh pengelas ulasan yang dilatih dengan pilihan menahan diri, yang mengesan ulasan yang kategori videonya tidak jelas. Untuk meningkatkan prestasi tugas pengelasan ini, kertas kerja ini membentangkan perwakilan bahasa khusus Nicovideo. Khususnya, kami menggunakan ayat daripada Nicopedia, ensiklopedia dalam talian Jepun bagi entiti yang mungkin muncul dalam kandungan Nicovideo, untuk pra-melatih perwakilan pengekod dua arah daripada model Transformers (BERT). Model yang terhasil bernama Nicopedia BERT kemudiannya diperhalusi supaya dapat menentukan sama ada ulasan yang diberikan termasuk dalam mana-mana kategori yang telah ditetapkan. Eksperimen yang dijalankan ke atas data ulasan Nicovideo menunjukkan keberkesanan Nicopedia BERT berbanding model BERT sedia ada yang telah dilatih menggunakan Wikipedia atau tweet. Kami juga menilai prestasi setiap model dalam tugas pengelasan sentimen tambahan, dan keputusan yang diperoleh membayangkan kebolehgunaan Nicopedia BERT sebagai pengekstrak ciri teks media sosial yang lain.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E106-D No.5 pp.838-846
Tarikh penerbitan
2023/05/01
Diumumkan
2023/01/16
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2022DAP0010
Jenis Manuskrip
Special Section PAPER (Special Section on Data Engineering and Information Management)
kategori

Pengarang

Hiroyoshi NAGAO
  Doshisha University
Koshiro TAMURA
  Doshisha University
Marie KATSURAI
  Doshisha University

Kata kunci

Contents [show]