Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Tag-Annotated Text Search Using Extended Region Algebra Carian Teks Beranotasi Tag Menggunakan Algebra Wilayah Lanjutan

Katsuya MASUDA, Jun'ichi TSUJII

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Kertas kerja ini membentangkan algoritma untuk mencari kawasan teks dengan menentukan maklumat beranotasi dalam teks beranotasi teg dengan menggunakan Algebra Wilayah. Algebra asal dan algoritma cekapnya dilanjutkan untuk mengendalikan kedua-dua kawasan bersarang dan kawasan bersilang. Sambungan diperlukan untuk carian teks dengan menggunakan anotasi linguistik yang kaya. Kami mula-mula memberikan nombor kedalaman kepada setiap rantau teg bersarang untuk memesan wilayah ini dan menulis algoritma yang cekap menggunakan nombor kedalaman untuk operasi pembendungan yang boleh merawat kawasan tag bersarang. Seterusnya, kami memperkenalkan pembolehubah untuk nilai atribut teg ke dalam algebra untuk merawat anotasi di mana atribut menunjukkan kawasan teg lain dan mencadangkan kaedah yang cekap untuk merawat kemasukan semula dengan menentukan nilai untuk pembolehubah secara berperingkat. Algoritma kami telah dilaksanakan dalam enjin carian teks untuk MEDLINE, yang merupakan asas teks abstrak yang besar dalam sains perubatan. Percubaan dalam abstrak MEDLINE beranotasi teg menunjukkan keberkesanan menentukan anotasi dan kecekapan algoritma kami. Sistem ini boleh diakses secara terbuka di http://www-tsujii.is.su-tokyo.ac.jp/medie/.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E92-D No.12 pp.2369-2377
Tarikh penerbitan
2009/12/01
Diumumkan
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.E92.D.2369
Jenis Manuskrip
Special Section PAPER (Special Section on Natural Language Processing and its Applications)
kategori
Pengambilan Maklumat

Pengarang

Kata kunci

Contents [show]