Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

BRsyn-Caps: Chinese Text Classification Using Capsule Network Based on Bert and Dependency Syntax BRsyn-Caps: Pengelasan Teks Bahasa Cina Menggunakan Rangkaian Kapsul Berdasarkan Bert dan Sintaks Ketergantungan

Jie LUO, Chengwan HE, Hongwei LUO

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Pengelasan teks ialah tugas asas dalam pemprosesan bahasa semula jadi, yang menemui aplikasi yang meluas dalam pelbagai domain, seperti pengesanan spam dan analisis sentimen. Maklumat sintaksis boleh digunakan dengan berkesan untuk meningkatkan prestasi model rangkaian saraf dalam memahami semantik teks. Teks Cina mempamerkan tahap kerumitan sintaksis yang tinggi, dengan kata-kata individu selalunya mempunyai beberapa bahagian pertuturan. Dalam makalah ini, kami mencadangkan BRsyn-caps, model klasifikasi teks Cina berasaskan rangkaian kapsul yang memanfaatkan kedua-dua Bert dan sintaks pergantungan. Pendekatan yang dicadangkan kami menyepadukan maklumat semantik melalui model pra-latihan Bert untuk mendapatkan perwakilan perkataan, mengekstrak maklumat kontekstual melalui Rangkaian Neural Memori Jangka Pendek Panjang (LSTM), mengodkan pokok pergantungan sintaksis melalui rangkaian saraf perhatian graf, dan menggunakan rangkaian kapsul untuk menyepadukan ciri dengan berkesan untuk klasifikasi teks. Selain itu, kami mencadangkan algoritma pembinaan matriks bersebelahan pokok pergantungan sintaksis peringkat aksara, yang boleh memperkenalkan maklumat sintaksis ke dalam perwakilan peringkat aksara. Percubaan pada lima set data menunjukkan bahawa BRsyn-caps boleh menyepadukan maklumat semantik, urutan dan sintaksis dalam teks dengan berkesan, membuktikan keberkesanan kaedah cadangan kami untuk klasifikasi teks bahasa Cina.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E107-D No.2 pp.212-219
Tarikh penerbitan
2024/02/01
Diumumkan
2023/11/06
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2023EDP7119
Jenis Manuskrip
PAPER
kategori
Pemprosesan Bahasa Asli

Pengarang

Jie LUO
  Wuhan Institute of Technology
Chengwan HE
  Wuhan Institute of Technology
Hongwei LUO
  Wuhan Institute of Technology

Kata kunci

Contents [show]