Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Open Access
Simultaneous Estimation of Dish Locations and Calories with Multi-Task Learning
Membuka akses
Anggaran Serentak Lokasi Hidangan dan Kalori dengan Pembelajaran Pelbagai Tugas

Takumi EGE, Keiji YANAI

  • pandangan teks lengkap

    76

  • Petikan Ini
  • Free PDF (2.6MB)

Ringkasan:

Dalam beberapa tahun kebelakangan ini, peningkatan dalam pemakanan sihat telah membawa kepada pelbagai aplikasi pengurusan makanan yang mempunyai fungsi pengecaman imej untuk merakam makanan harian secara automatik. Walau bagaimanapun, kebanyakan fungsi pengecaman imej dalam aplikasi sedia ada tidak berguna secara langsung untuk foto makanan berbilang hidangan dan tidak boleh menganggar kalori makanan secara automatik. Sementara itu, metodologi pada pengecaman imej telah berkembang pesat kerana kemunculan Rangkaian Neural Konvolusi (CNN). CNN telah meningkatkan ketepatan pelbagai jenis tugas pengecaman imej seperti pengelasan dan pengesanan objek. Oleh itu, kami mencadangkan anggaran kalori makanan berasaskan CNN untuk foto makanan berbilang hidangan. Kaedah kami menganggarkan lokasi hidangan dan kalori makanan secara serentak dengan pembelajaran pelbagai tugas pengesanan hidangan makanan dan anggaran kalori makanan dengan satu CNN. Ia dijangka mencapai kelajuan tinggi dan saiz rangkaian kecil dengan anggaran serentak dalam satu rangkaian. Oleh kerana pada masa ini tiada set data foto makanan berbilang hidangan beranotasi dengan kedua-dua kotak sempadan dan kalori makanan, dalam kerja ini kami menggunakan dua jenis set data secara bergilir-gilir untuk melatih satu CNN. Untuk dua jenis set data, kami menggunakan foto makanan berbilang hidangan beranotasi dengan kotak sempadan dan foto makanan hidangan tunggal dengan kalori makanan. Keputusan kami menunjukkan bahawa kaedah pelbagai tugas kami mencapai ketepatan yang lebih tinggi, kelajuan yang lebih tinggi dan saiz rangkaian yang lebih kecil daripada model berurutan pengesanan makanan dan anggaran kalori makanan.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E102-D No.7 pp.1240-1246
Tarikh penerbitan
2019/07/01
Diumumkan
2019/04/25
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2018CEP0004
Jenis Manuskrip
Special Section PAPER (Special Section on Multimedia for Cooking and Eating Activities)
kategori

Pengarang

Takumi EGE
  The University of Electro-Communications
Keiji YANAI
  The University of Electro-Communications

Kata kunci

Contents [show]