Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

LFWS: Long-Operation First Warp Scheduling Algorithm to Effectively Hide the Latency for GPUs LFWS: Algoritma Penjadualan Warp Pertama Operasi Lama untuk Menyembunyikan Kependaman dengan Berkesan untuk GPU

Song LIU, Jie MA, Chenyu ZHAO, Xinhe WAN, Weiguo WU

  • pandangan teks lengkap

    24

  • Petikan Ini

Ringkasan:

GPU telah menjadi unit pengkomputeran yang dominan untuk memenuhi keperluan prestasi tinggi dalam pelbagai bidang pengiraan. Tetapi kependaman operasi yang panjang menyebabkan kurang penggunaan sumber pengkomputeran pada cip, mengakibatkan kemerosotan prestasi apabila menjalankan tugas selari pada GPU. Strategi penjadualan warp yang baik ialah penyelesaian yang berkesan untuk menyembunyikan kependaman dan meningkatkan penggunaan sumber. Walau bagaimanapun, kebanyakan algoritma penjadualan warp semasa pada GPU mengabaikan keupayaan operasi lama untuk menyembunyikan kependaman. Dalam makalah ini, kami mencadangkan algoritma penjadualan warp pertama operasi panjang, LFWS, untuk platform GPU. LFWS menapis meledingkan dalam keadaan sedia kepada baris gilir sedia dan mengemas kini baris gilir dalam masa mengikut perubahan dalam status meledingkan. LFWS membahagikan ledingan dalam baris gilir sedia kepada kumpulan operasi panjang dan pendek berdasarkan jenis operasi dalam penimbal arahan mereka, dan ia memberi keutamaan yang lebih tinggi kepada meledingkan operasi lama dalam baris gilir sedia. Ini boleh menggunakan operasi yang panjang dengan berkesan untuk menyembunyikan beberapa kependaman antara satu sama lain dan meningkatkan keupayaan sistem untuk menyembunyikan kependaman. Untuk mengesahkan keberkesanan LFWS, kami melaksanakan algoritma LFWS pada platform simulasi GPGPU-Sim. Percubaan dijalankan ke atas pelbagai aplikasi CUDA untuk menilai prestasi algoritma LFWS, berbanding dengan lima algoritma penjadualan warp yang lain. Keputusan menunjukkan bahawa algoritma LFWS mencapai peningkatan prestasi purata masing-masing sebanyak 8.01% dan 5.09%, lebih daripada tiga algoritma penjadualan tradisional dan dua novel, meningkatkan penggunaan sumber pengiraan pada GPU dengan berkesan.

Jawatankuasa
IEICE TRANSACTIONS on Fundamentals Vol.E106-A No.8 pp.1043-1050
Tarikh penerbitan
2023/08/01
Diumumkan
2023/02/10
ISSN dalam talian
1745-1337
DOI
10.1587/transfun.2022EAP1084
Jenis Manuskrip
PAPER
kategori
Algoritma dan Struktur Data

Pengarang

Song LIU
  Xi'an Jiaotong University
Jie MA
  Xi'an Jiaotong University
Chenyu ZHAO
  Xi'an Jiaotong University
Xinhe WAN
  Xi'an Jiaotong University
Weiguo WU
  Xi'an Jiaotong University

Kata kunci

Contents [show]