Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Deep Reinforcement Learning with Sarsa and Q-Learning: A Hybrid Approach Pembelajaran Pengukuhan Dalam dengan Sarsa dan Q-Learning: Pendekatan Hibrid

Zhi-xiong XU, Lei CAO, Xi-liang CHEN, Chen-xi LI, Yong-liang ZHANG, Jun LAI

  • pandangan teks lengkap

    0

  • Petikan Ini

Ringkasan:

Rangkaian Deep Q yang biasa digunakan diketahui melebihkan nilai tindakan dalam keadaan tertentu. Ia juga membuktikan bahawa anggaran yang terlalu tinggi mendatangkan kemudaratan kepada prestasi, yang mungkin menyebabkan ketidakstabilan dan perbezaan pembelajaran. Dalam kertas kerja ini, kami membentangkan algoritma Deep Sarsa dan Q Networks (DSQN), yang boleh dianggap sebagai penambahbaikan kepada algoritma Deep Q Networks. Pertama, algoritma DSQN mengambil kesempatan daripada pengalaman main semula dan teknik rangkaian sasaran dalam Deep Q Networks untuk meningkatkan kestabilan rangkaian saraf. Kedua, penganggar berganda digunakan untuk pembelajaran-Q untuk mengurangkan anggaran berlebihan. Terutamanya, kami memperkenalkan pembelajaran Sarsa kepada Deep Q Networks untuk menghapuskan anggaran yang berlebihan lagi. Akhir sekali, algoritma DSQN dinilai pada pengimbangan tiang kereta, kereta gunung dan tugas kawalan lunarlander dari Gim OpenAI. Keputusan penilaian empirikal menunjukkan bahawa kaedah yang dicadangkan membawa kepada pengurangan anggaran berlebihan, proses pembelajaran yang lebih stabil dan prestasi yang lebih baik.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E101-D No.9 pp.2315-2322
Tarikh penerbitan
2018/09/01
Diumumkan
2018/05/22
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2017EDP7278
Jenis Manuskrip
PAPER
kategori
Kecerdasan Buatan, Perlombongan Data

Pengarang

Zhi-xiong XU
  PLA University of Science and Technology
Lei CAO
  PLA University of Science and Technology
Xi-liang CHEN
  PLA University of Science and Technology
Chen-xi LI
  PLA University of Science and Technology
Yong-liang ZHANG
  PLA University of Science and Technology
Jun LAI
  PLA University of Science and Technology

Kata kunci

Contents [show]