Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Stereophonic Music Separation Based on Non-Negative Tensor Factorization with Cepstral Distance Regularization Pemisahan Muzik Stereofonik Berdasarkan Pemfaktoran Tensor Bukan Negatif dengan Penyelarasan Jarak Cepstral

Shogo SEKI, Tomoki TODA, Kazuya TAKEDA

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Kertas kerja ini mencadangkan kaedah pemisahan sumber separa penyeliaan untuk isyarat muzik stereofonik yang mengandungi berbilang isyarat yang dirakam atau diproses, di mana muzik yang disintesis tertumpu pada muzik stereofonik. Memandangkan isyarat muzik yang disintesis sering dijana sebagai gabungan linear bagi banyak isyarat sumber individu dan keuntungan pencampuran masing-masing, maklumat perbezaan fasa atau fasa antara isyarat antara saluran, yang mewakili ciri spatial persekitaran rakaman, tidak boleh digunakan sebagai petunjuk akustik untuk pemisahan sumber . Pemfaktoran Tensor Bukan Negatif (NTF) ialah teknik berkesan yang boleh digunakan untuk menyelesaikan masalah ini dengan menguraikan spektrogram amplitud isyarat muzik saluran stereo kepada vektor asas dan pengaktifan isyarat sumber muzik individu, bersama-sama dengan keuntungan pencampuran yang sepadan. Walau bagaimanapun, adalah sukar untuk mencapai prestasi pemisahan yang mencukupi menggunakan kaedah ini sahaja, kerana petunjuk akustik yang tersedia untuk pemisahan adalah terhad. Untuk menangani isu ini, kertas kerja ini mencadangkan kaedah Penyelarasan Jarak Cepstral (CDR) untuk pemisahan saluran stereo berasaskan NTF, yang melibatkan membuat sepstrum isyarat sumber yang dipisahkan mengikut Model Campuran Gaussian (GMM) bagi isyarat sumber muzik yang sepadan. GMM ini dilatih terlebih dahulu menggunakan sampel yang tersedia. Penilaian eksperimen yang memisahkan tiga dan empat sumber kukuh dijalankan untuk menyiasat keberkesanan kaedah yang dicadangkan dalam kedua-dua rangka kerja pengasingan diselia dan separa selia, dan prestasi juga dibandingkan dengan kaedah NTF konvensional. Keputusan eksperimen menunjukkan bahawa kaedah yang dicadangkan menghasilkan peningkatan yang ketara dalam kedua-dua rangka kerja pemisahan, dan penyelarasan jarak cepstral memberikan parameter pemisahan yang lebih baik.

Jawatankuasa
IEICE TRANSACTIONS on Fundamentals Vol.E101-A No.7 pp.1057-1064
Tarikh penerbitan
2018/07/01
Diumumkan
ISSN dalam talian
1745-1337
DOI
10.1587/transfun.E101.A.1057
Jenis Manuskrip
PAPER
kategori
Akustik Kejuruteraan

Pengarang

Shogo SEKI
  Nagoya University
Tomoki TODA
  Nagoya University
Kazuya TAKEDA
  Nagoya University

Kata kunci

Contents [show]