Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

An Accurate Scene Segmentation Method Based on Graph Analysis Using Object Matching and Audio Feature Kaedah Segmentasi Adegan Tepat Berdasarkan Analisis Graf Menggunakan Padanan Objek dan Ciri Audio

Makoto YAMAMOTO, Miki HASEYAMA

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Kaedah untuk pembahagian pemandangan yang tepat menggunakan dua jenis graf terarah yang diperolehi oleh pemadanan objek dan ciri audio dicadangkan. Secara amnya, dalam bahan audiovisual, seperti program siaran dan filem, terdapat penampilan berulang tangkapan serupa yang merangkumi bingkai latar belakang, objek atau tempat yang sama, dan tangkapan sedemikian disertakan dalam satu adegan. Banyak kaedah pembahagian adegan berdasarkan idea ini telah dicadangkan; walau bagaimanapun, memandangkan mereka menggunakan maklumat warna sebagai ciri visual, mereka tidak dapat memberikan hasil pembahagian pemandangan yang tepat jika ciri warna berubah dalam tangkapan berbeza yang bingkainya termasuk objek yang sama disebabkan oleh operasi kamera seperti zum dan panning. Bagi menyelesaikan masalah ini, pembahagian adegan dengan kaedah yang dicadangkan direalisasikan dengan menggunakan dua pendekatan baru. Dalam pendekatan pertama, pemadanan objek dilakukan antara dua bingkai yang setiap satu disertakan dalam tangkapan yang berbeza. Dengan menggunakan hasil padanan ini, penampilan berulang tangkapan yang bingkainya mengandungi objek yang sama boleh berjaya ditemui dan diwakili sebagai graf terarah. Kaedah yang dicadangkan juga menjana satu lagi graf terarah yang mewakili penampilan berulang tangkapan dengan ciri audio yang serupa dalam pendekatan kedua. Dengan penggunaan gabungan kedua-dua graf terarah ini, kemerosotan ketepatan pembahagian pemandangan, yang terhasil daripada penggunaan hanya satu jenis graf, boleh dielakkan dalam kaedah yang dicadangkan dan dengan itu pembahagian pemandangan yang tepat dapat direalisasikan. Keputusan eksperimen yang dilakukan dengan menggunakan kaedah yang dicadangkan kepada program penyiaran sebenar ditunjukkan untuk mengesahkan keberkesanan kaedah yang dicadangkan.

Jawatankuasa
IEICE TRANSACTIONS on Fundamentals Vol.E92-A No.8 pp.1883-1891
Tarikh penerbitan
2009/08/01
Diumumkan
ISSN dalam talian
1745-1337
DOI
10.1587/transfun.E92.A.1883
Jenis Manuskrip
Special Section PAPER (Special Section on Signal Processing)
kategori
Ucapan/Audio

Pengarang

Kata kunci

Contents [show]