Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Incremental Estimation of Natural Policy Gradient with Relative Importance Weighting Anggaran Penambahan Kecerunan Dasar Semula Jadi dengan Wajaran Kepentingan Relatif

Ryo IWAKI, Hiroki YOKOYAMA, Minoru ASADA

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Saiz langkah ialah parameter kepentingan asas dalam pembelajaran algoritma, terutamanya untuk kaedah kecerunan dasar semula jadi (NPG). Kami memperoleh sempadan atas untuk saiz langkah dalam anggaran NPG tambahan, dan mencadangkan saiz langkah penyesuaian untuk melaksanakan sempadan atas terbitan. Saiz langkah penyesuaian yang dicadangkan menjamin bahawa parameter yang dikemas kini tidak melebihi sasaran, yang dicapai dengan menimbang sampel pembelajaran mengikut kepentingan relatifnya. Kami juga menyediakan sempadan atas dan bawah yang ketat untuk saiz langkah, walaupun ia tidak sesuai untuk pembelajaran tambahan. Kami mengesahkan kegunaan saiz langkah yang dicadangkan menggunakan penanda aras klasik. Untuk pengetahuan terbaik kami, ini ialah kaedah saiz langkah penyesuaian pertama untuk anggaran NPG.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E101-D No.9 pp.2346-2355
Tarikh penerbitan
2018/09/01
Diumumkan
2018/06/01
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2017EDP7363
Jenis Manuskrip
PAPER
kategori
Kecerdasan Buatan, Perlombongan Data

Pengarang

Ryo IWAKI
  Osaka University
Hiroki YOKOYAMA
  Tamagawa University
Minoru ASADA
  Osaka University

Kata kunci

Contents [show]