Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

FSPose: A Heterogeneous Framework with Fast and Slow Networks for Human Pose Estimation in Videos FSPose: Rangka Kerja Heterogen dengan Rangkaian Pantas dan Lambat untuk Anggaran Pose Manusia dalam Video

Jianfeng XU, Satoshi KOMORITA, Kei KAWAMURA

  • pandangan teks lengkap

    1

  • Petikan Ini

Ringkasan:

Kami mencadangkan rangka kerja untuk penyepaduan rangkaian heterogen dalam anggaran pose manusia (HPE) dengan tujuan mengimbangi ketepatan dan kerumitan pengiraan. Walaupun banyak kaedah sedia ada boleh meningkatkan ketepatan HPE menggunakan berbilang bingkai dalam video, kaedah tersebut juga meningkatkan kerumitan pengiraan. Perbezaan utama di sini ialah rangka kerja heterogen yang dicadangkan mempunyai pelbagai rangkaian untuk jenis bingkai yang berbeza, manakala kaedah sedia ada menggunakan rangkaian yang sama untuk semua bingkai. Khususnya, kami mencadangkan untuk membahagikan bingkai video kepada dua jenis, termasuk bingkai utama dan bingkai bukan kunci, dan menggunakan tiga rangkaian termasuk rangkaian perlahan, rangkaian pantas dan rangkaian pemindahan dalam rangka kerja heterogen kami. Untuk bingkai utama, rangkaian perlahan digunakan yang mempunyai ketepatan tinggi tetapi kerumitan pengiraan yang tinggi. Untuk bingkai bukan kunci yang mengikuti bingkai utama, kami mencadangkan untuk meledingkan peta haba rangkaian perlahan daripada bingkai utama melalui rangkaian pemindahan dan menggabungkannya dengan rangkaian pantas yang mempunyai ketepatan yang rendah tetapi kerumitan pengiraan yang rendah. Tambahan pula, apabila melanjutkan kepada penggunaan bingkai jangka panjang di mana sebilangan besar bingkai bukan kunci mengikuti bingkai utama, korelasi temporal berkurangan. Oleh itu, apabila perlu, kami menggunakan rangkaian pemindahan tambahan yang meledingkan peta haba daripada bingkai bukan kunci bersebelahan. Keputusan percubaan pada set data PoseTrack 2017 dan PoseTrack 2018 menunjukkan bahawa FSPose yang dicadangkan mencapai keseimbangan yang lebih baik antara ketepatan dan kerumitan pengiraan berbanding kaedah pesaing. Kod sumber kami tersedia di https://github.com/Fenax79/fspose.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E106-D No.6 pp.1165-1174
Tarikh penerbitan
2023/06/01
Diumumkan
2023/03/20
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2022EDP7182
Jenis Manuskrip
PAPER
kategori
Pengecaman Imej, Penglihatan Komputer

Pengarang

Jianfeng XU
  KDDI Research, Inc.
Satoshi KOMORITA
  KDDI Research, Inc.
Kei KAWAMURA
  KDDI Research, Inc.

Kata kunci

Contents [show]