Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Application of a Word-Based Text Compression Method to Japanese and Chinese Texts Penggunaan Kaedah Pemampatan Teks Berasaskan Perkataan kepada Teks Jepun dan Cina

Shigeru YOSHIDA, Takashi MORIHARA, Hironori YAHAGI, Noriko ITANI

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Kod bahasa Asia 16-bit tidak boleh dimampatkan dengan baik oleh skema pemampatan teks pensampelan 8-bit konvensional. Sebelum ini, kami melaporkan penggunaan kaedah pemampatan teks berasaskan perkataan yang menggunakan pensampelan 16-bit untuk pemampatan teks Jepun. Kertas kerja ini menerangkan usaha kami selanjutnya dalam menggunakan kaedah berasaskan perkataan dengan pengekod Huffman kanonik statik kepada kedua-dua teks Jepun dan Cina. Kaedah ini dicadangkan untuk menyokong persekitaran berbilang bahasa, kerana kami menggantikan kamus perkataan dan jadual kod Huffman kanonik untuk bahasa masing-masing dengan sewajarnya. Simulasi komputer menunjukkan bahawa kaedah ini berkesan untuk kedua-dua bahasa. Nisbah mampatan yang diperoleh adalah kurang sedikit daripada 0.5 tanpa berkenaan dengan konteks Markov, dan sekitar 0.4 apabila mengambil kira konteks Markov tertib pertama.

Jawatankuasa
IEICE TRANSACTIONS on Fundamentals Vol.E85-A No.12 pp.2933-2938
Tarikh penerbitan
2002/12/01
Diumumkan
ISSN dalam talian
DOI
Jenis Manuskrip
PAPER
kategori
Teori Maklumat

Pengarang

Kata kunci

Contents [show]