Fungsi carian sedang dalam pembinaan.
Fungsi carian sedang dalam pembinaan.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Open Access
MuSRGM: A Genetic Algorithm-Based Dynamic Combinatorial Deep Learning Model for Software Reliability Engineering
Membuka akses
MuSRGM: Model Pembelajaran Mendalam Kombinatorial Dinamik Berasaskan Algoritma Genetik untuk Kejuruteraan Kebolehpercayaan Perisian

Ning FU, Duksan RYU, Suntae KIM

  • pandangan teks lengkap

    270

  • Petikan Ini
  • Free PDF (1.9MB)

Ringkasan:

Dalam fasa ujian perisian, model pertumbuhan kebolehpercayaan perisian (SRGM) biasanya digunakan untuk menilai kebolehpercayaan sistem perisian. SRGM tradisional dihadkan oleh andaian mereka tentang corak pertumbuhan berterusan untuk kadar pengesanan kegagalan (FDR) sepanjang fasa ujian. Walau bagaimanapun, andaian itu terjejas oleh fenomena Change-Point, di mana turun naik FDR berpunca daripada variasi dalam kakitangan ujian atau pengubahsuaian prosedur, yang membawa kepada pengurangan ketepatan ramalan dan penilaian kebolehpercayaan perisian terjejas. Oleh itu, objektif kajian ini adalah untuk meningkatkan ramalan kebolehpercayaan perisian menggunakan pendekatan baru yang menggabungkan algoritma genetik (GA) dan SRGM berasaskan pembelajaran mendalam untuk mengambil kira fenomena Titik Perubahan. Pendekatan yang dicadangkan menggunakan GA untuk menggabungkan fungsi pengaktifan secara dinamik daripada pelbagai SRGM berasaskan pembelajaran mendalam kepada SRGM bermutasi baharu yang dipanggil MuSRGM. MuSRGM menangkap kelebihan kedua-dua SRGM cekung dan berbentuk S dan lebih sesuai untuk menangkap fenomena titik perubahan semasa ujian dan dengan lebih tepat menggambarkan situasi ujian sebenar. Selain itu, data kegagalan dianggap sebagai siri masa dan dianalisis menggunakan gabungan Memori Jangka Pendek Panjang (LSTM) dan mekanisme Perhatian. Untuk menilai prestasi MuSRGM, kami menjalankan eksperimen pada tiga set data kegagalan yang berbeza. Keputusan menunjukkan bahawa MuSRGM mengatasi kaedah garis dasar, menunjukkan ralat ramalan rendah (MSE) pada ketiga-tiga set data. Tambahan pula, MuSRGM menunjukkan keupayaan generalisasi yang luar biasa pada set data ini, kekal tidak terjejas oleh pengedaran data yang tidak sekata. Oleh itu, MuSRGM mewakili penyelesaian termaju yang sangat menjanjikan yang boleh memberikan peningkatan ketepatan dan kebolehgunaan untuk penilaian kebolehpercayaan perisian semasa fasa ujian.

Jawatankuasa
IEICE TRANSACTIONS on Information Vol.E107-D No.6 pp.761-771
Tarikh penerbitan
2024/06/01
Diumumkan
2024/02/06
ISSN dalam talian
1745-1361
DOI
10.1587/transinf.2023EDP7183
Jenis Manuskrip
PAPER
kategori
Kejuruteraan Perisian

1. Pengenalan

Mengurangkan masa dan kos pembangunan sambil mengekalkan kualiti perisian adalah cabaran yang dihadapi oleh semua syarikat perisian. Untuk menangani isu ini, SRGM telah mendapat populariti sebagai ukuran kualiti perisian [1]. Model ini menggunakan statistik untuk mewujudkan korelasi antara data kegagalan dan fungsi yang diketahui [2], seperti fungsi eksponen [3]. Jika korelasi disahkan, fungsi tersebut boleh digunakan untuk meramalkan bilangan kegagalan masa hadapan yang akan berlaku dalam sistem perisian.

Banyak SRGM telah dibangunkan dan digunakan semasa ujian perisian untuk menilai kebolehpercayaan perisian [4]. Dua kategori utama SRGM ialah model cekung dan model berbentuk S [5], [6], seperti yang ditunjukkan dalam Rajah 1. Model cekung adalah berdasarkan andaian bahawa kegagalan lebih mudah dikenal pasti dan diselesaikan semasa permulaan. fasa ujian. Akibatnya, FDR mengalami penurunan pesat pada awalnya, secara beransur-ansur meruncing dari semasa ke semasa dan membentuk arah aliran cekung [7]. Sebaliknya, model berbentuk S menunjukkan bahawa FDR mengalami peningkatan secara beransur-ansur pada peringkat awal ujian [8], [9]. Fasa awal ini sering mencerminkan proses pembelajaran pasukan ujian dan kerumitan untuk mendedahkan kesalahan yang kurang jelas. Apabila ujian berlangsung dan pemahaman pasukan semakin mendalam, FDR dijangka meneruskan aliran menaiknya [10]. Apabila menggunakan SRGM, salah satu daripada kategori ini mesti dipilih dan dikaitkan dengan data kegagalan [11]. SRGM tradisional menganggap bahawa FDR mengikut corak pertumbuhan berterusan, seperti malar, eksponen, atau undang-undang kuasa, sepanjang fasa ujian [12]. Walau bagaimanapun, andaian ini tidak sah jika terdapat perubahan yang tidak dijangka dalam penguji atau strategi ujian, yang dikenali sebagai titik perubahan. Perubahan dalam FDR disebabkan oleh titik perubahan menjejaskan ketepatan penilaian kebolehpercayaan perisian menggunakan SRGM tradisional.

Rajah 1  Model cekung dan berbentuk S

Penyelidik telah meneroka strategi yang berbeza untuk meningkatkan prestasi ramalan SRGM. Satu pendekatan melibatkan mempertimbangkan titik perubahan untuk meningkatkan ketepatan ramalan kesalahan dan mencapai ketepatan ramalan yang memuaskan. Jing Zhao et al. [13] dan Vikas Dhaka dengan Nidhi Nijhawan [14] telah menggabungkan titik perubahan dan faktor persekitaran, dengan ketara meningkatkan ketepatan. Namun begitu, kaedah ini masih bergantung pada fungsi proses Poisson (NHPP) tidak homogen, yang membawa kepada jurang yang ketara dalam ketepatan ramalan berbanding model kecerdasan buatan. Satu lagi kaedah penyelidikan memberi tumpuan kepada memanfaatkan teknik pembelajaran mendalam untuk meningkatkan ramalan kebolehpercayaan perisian [15]. Wu dan Huan [16] mencadangkan kaedah untuk mengubah SRGM tradisional menjadi model pembelajaran mendalam, menghasilkan keputusan yang menjanjikan. Walau bagaimanapun, pendekatan mereka hanya membungkus SRGM tradisional dengan teknik pembelajaran mendalam dan tidak berkesan menangani masalah titik perubahan.

Untuk menangani isu ini, kami memperkenalkan MuSRGM, model baru yang menyepadukan Algoritma Genetik (GA) dan SRGM berasaskan pembelajaran mendalam. Pendekatan kami melibatkan penguraian SRGM berasaskan pembelajaran mendalam ke dalam pelbagai lapisan tersembunyi, setiap satu ditakrifkan oleh fungsi pengaktifan yang berbeza. GA kemudiannya menggabungkan lapisan ini secara dinamik melalui fungsi kecergasan untuk menjana MuSRGM yang dioptimumkan. Inovasi MuSRGM meluas kepada pendekatannya kepada data kegagalan, menganggapnya sebagai siri masa untuk analisis komprehensif. Terbenam dalam rangkaian MuSRGM, Memori Jangka Pendek Panjang (LSTM) dan mekanisme perhatian bekerjasama untuk membongkar nuansa data kegagalan. LSTM digunakan untuk membezakan aliran keseluruhan dalam pengedaran data kegagalan, manakala mekanisme perhatian mahir dalam mengenal pasti anomali dalam siri masa ini yang mungkin menandakan titik perubahan. Penyepaduan sedemikian meningkatkan keupayaan MuSRGM untuk menavigasi kerumitan yang wujud dalam ujian perisian, terutamanya dalam konteks di mana terdapat titik perubahan.

MuSRGM menunjukkan ketepatan ramalan yang unggul pada tiga set data yang pelbagai, seperti yang dibuktikan oleh peningkatan ketara dalam prestasi min kuasa dua ralat (MSE), masing-masing menunjukkan peningkatan sebanyak 71.51%, 41.39% dan 96.02%, mengatasi SRGM berasaskan pembelajaran mendalam asas. Penemuan ini menyerlahkan keberkesanan MuSRGM dalam meningkatkan prestasi ramalan. Peningkatan yang konsisten dalam MSE merentas set data yang pelbagai menggariskan keupayaan generalisasi MuSRGM yang mantap, mengesahkan keberkesanannya dalam ramalan kebolehpercayaan perisian. Tidak seperti kaedah penyelidikan lain yang memadankan data menggunakan SRGM tradisional, MuSRGM bermula daripada data dan menyesuaikan model berdasarkan ciri unik set data kegagalan menggunakan GA. Akibatnya, MuSRGM mengatasi prestasi kaedah sedia ada yang didokumenkan dalam literatur.

Sumbangan utama kertas kerja ini diringkaskan seperti berikut:

  • Kaedah yang dicadangkan menggunakan algoritma genetik untuk menggabungkan secara dinamik fungsi pengaktifan SRGM berasaskan pembelajaran mendalam. Ini membolehkan penjanaan MuSRGM, disesuaikan dengan ciri khusus data kegagalan.
  • Untuk meningkatkan lagi ketepatan ramalan, MuSRGM menggabungkan kedua-dua Memori Jangka Pendek Panjang (LSTM) dan mekanisme Perhatian. Teknik ini membolehkan SRGM menangkap corak variasi tidak teratur data kegagalan dengan berkesan, yang membawa kepada pengenalpastian fenomena titik perubahan yang lebih tepat dalam data.
  • Kami secara berasingan memeriksa prestasi menggabungkan mekanisme Attention dan LSTM dengan rangkaian saraf untuk menganalisis set data kegagalan. Keputusan eksperimen menunjukkan bahawa menggabungkan mekanisme Perhatian dan LSTM boleh meningkatkan lagi ketepatan ramalan rangkaian saraf untuk set data kegagalan.

Organisasi bahagian yang tinggal dalam kertas ini adalah seperti berikut. Bahagian 2 menawarkan latar belakang dan tinjauan literatur untuk kajian ini. Dalam Mazhab. 3, kami membentangkan butiran pelaksanaan kaedah yang dicadangkan. Bahagian 4 menggariskan persediaan eksperimen dan menganalisis keputusan yang diperoleh daripada eksperimen. Kesimpulan kertas ini dibentangkan dalam Sek. 5.

2. Latar Belakang dan Kerja Berkaitan

Dalam bahagian ini, kami berhasrat untuk memberikan gambaran menyeluruh tentang pengetahuan latar belakang yang diperlukan untuk memahami pendekatan yang dicadangkan untuk MuSRGM. Latar belakang kepada MuSRGM termasuk konsep SRGM, fenomena titik perubahan dan SRGM berasaskan Pembelajaran Mendalam.

2.1 SRGM

Model pertumbuhan kebolehpercayaan perisian mengandaikan bahawa berlakunya kegagalan perisian adalah proses stokastik, jadi SRGM tradisional dicirikan sebagai fungsi NHPP dengan parameter tertentu. Parameter fungsi ini memberikan maklumat yang berharga, seperti jumlah bilangan kegagalan yang dijangkakan dalam projek, kadar kegagalan dikesan dan sebagainya. Fungsi ini boleh digunakan dalam ujian masa hadapan untuk kadar kegagalan masa hadapan atau bilangan kecacatan yang tinggal dalam kod [17], [18]. Salah satu SRGM yang paling terkenal ialah Model Goel-Okumoto (GO), yang diperkenalkan oleh Goel dan Okumoto pada tahun 1979 dan mengikut persamaan:

\[\begin{align} m(t) = a(1-e^{-bt}), a > 0, b > 0 \tag{1} \end{align}\]

Lokasi a ialah jumlah jangkaan bilangan kegagalan dalam projek perisian, b ialah kadar penemuan kegagalan, dan m(t) ialah bilangan terkumpul dijangka kegagalan yang ditemui dalam masa yang sepadan.

2.2 Titik Perubahan

SRGM tradisional menganggap bahawa FDR kekal sebagai corak pertumbuhan berterusan sepanjang fasa ujian, mengaitkan dengan kiraan kegagalan sistem yang tinggal. Walau bagaimanapun, andaian ini mungkin tidak berlaku dalam senario ujian sebenar. FDR boleh berbeza-beza disebabkan oleh faktor seperti perubahan dalam pasukan ujian, metodologi atau peralatan, yang membawa kepada apa yang dikenali sebagai 'titik perubahan'. Titik perubahan ini, yang mewakili penyelewengan mendadak dalam aliran pengesanan kegagalan, menunjukkan sifat bukan linear ujian perisian dan mencabar keberkesanan SRGM tradisional. Ini menyerlahkan keperluan untuk model yang lebih adaptif dan serba boleh untuk menilai kebolehpercayaan perisian dengan tepat.

2.3 SRGM Berasaskan Pembelajaran Mendalam

Dalam usaha untuk memperhalusi anggaran parameter untuk SRGM, satu langkah penting telah diambil oleh Wu dan Huan [16]. Mereka memperkenalkan paradigma inovatif melalui SRGM berasaskan Pembelajaran Dalam dan menjelaskan secara meluas proses mengubah SRGM konvensional kepada model pembelajaran mendalam. Kami mengambil Model Goel-Okumoto (GO) sebagai contoh untuk menggambarkan kaedah tersebut. Model GO diberikan oleh Pers. (1).

Persamaan di atas boleh ditafsirkan sebagai fungsi komposit dengan pembolehubah t, yang boleh diuraikan kepada tiga sub-fungsi yang berbeza. Ini ditunjukkan dalam Jadual 1 berikut.

Jadual 1  sub fungsi GO

Rangkaian pembelajaran mendalam terdiri daripada lapisan input, lapisan tersembunyi, dan lapisan output [19]. Seperti yang ditunjukkan dalam Rajah 2. Oleh itu, rangkaian pembelajaran mendalam boleh dianggap sebagai fungsi komposit yang dipetakan daripada input x kepada keluaran y. Ungkapan ditunjukkan seperti berikut: y= pengaktifan3(pengaktifan2(pengaktifan1(x))) [20]. di mana x ialah nilai input bagi rangkaian saraf dan y ialah nilai keluaran rangkaian saraf [21]. \(activation1()\), \(activation2()\), dan \(activation3()\) adalah fungsi pengaktifan lapisan tersembunyi rangkaian saraf. Dengan mengandaikan bahawa berat sebelah setiap tersembunyi adalah b, rangkaian saraf boleh disenaraikan dalam Jadual 2 berikut.

Rajah 2  Struktur rangkaian saraf

Jadual 2  Lapisan rangkaian saraf

Ia boleh dilihat bahawa model GO mempunyai struktur yang serupa dengan rangkaian Neural, jadi pemberat rangkaian Neural boleh digunakan untuk mensimulasikan parameter. a, dan b dalam model GO [22]. Kaedah khusus ditunjukkan dalam Rajah 3. Dengan pemberat w112 bersamaan dengan a and w111 bersamaan dengan b. Dengan cara ini, nilai parameter SRGM boleh ditentukan oleh rangkaian Neural.

Rajah 3  Simulasi rangkaian saraf

2.4 Kerja Berkaitan

Pelbagai kaedah telah dicuba untuk meramalkan kebolehpercayaan perisian, secara tradisinya memfokuskan pada pendekatan statistik dan berasaskan model. Namun begitu, dengan sifat pembangunan perisian yang dinamik, mengenal pasti dan menyesuaikan diri dengan titik perubahan telah menjadi penting untuk ramalan kebolehpercayaan yang tepat. Inoue [23] memperkenalkan rangka kerja pemodelan yang menggunakan titik perubahan untuk menilai kebolehpercayaan perisian, mencatatkan perubahan ketara dalam kadar bahaya yang berkaitan dengan titik ini. Zhao [13] membangunkan SRGM yang menyepadukan titik perubahan dengan faktor persekitaran daripada fasa ujian yang berbeza, meningkatkan pantulan model terhadap persekitaran ujian sebenar. Samal et al. [24] mengembangkan lagi konsep ini, dengan mengambil kira kesan penyahpepijatan dan titik perubahan yang tidak lengkap pada SRGM, dan menunjukkan ketepatan yang mengagumkan dalam pemadanan data kegagalan.

Selari dengan perkembangan ini, kemajuan teknologi AI, terutamanya pembelajaran mendalam, telah membawa kepada gelombang baharu kaedah ramalan kebolehpercayaan perisian. Lo [25] mempertingkatkan ketepatan ramalan kebolehpercayaan dengan memasukkan data kegagalan terus ke Rangkaian Neuro Feed-Forward (FFNN). Cai et al. [26] membahagikan data kegagalan kepada segmen masa X1, X2, X3, …, Xi, Xi + 1 dan digunakan X1, X2, X3, …, Xi sebagai input kepada rangkaian saraf untuk diramalkan Xi + 1. Apabila RNN semakin matang, Fu et al. [27] dan Gusmanov [28] kedua-duanya cuba menganalisis data kegagalan dan meramalkan kebolehpercayaan perisian menggunakan LSTM, mencapai keputusan yang baik. Su [29], Wang [17], dan Lakshmanan [19] telah menyumbang kepada gabungan SRGM tradisional dengan rangkaian saraf. Wu dan Huan [16] menganalisis ciri-ciri SRGM dan menguraikannya kepada fungsi pengaktifan dalam rangkaian saraf, melengkapkan transformasi daripada SRGM tradisional kepada SRGM berasaskan pembelajaran mendalam.

Selepas analisis menyeluruh terhadap kajian berkaitan, kertas kerja ini mencadangkan kaedah yang mengintegrasikan GA dengan SRGM berasaskan pembelajaran mendalam. Pendekatan kami mengeksploitasi sepenuhnya sifat SRGM yang berbeza (jenis cekung dan berbentuk S) dan tidak bergantung sepenuhnya pada model tetap untuk memuatkan data, sebaliknya menjana model secara dinamik berdasarkan ciri data. Akibatnya, ia boleh menyesuaikan fenomena titik perubahan dengan baik.

3. Cadangan Pendekatan

Dalam bahagian ini, kami menyediakan penerangan terperinci tentang MuSRGM. Kami bermula dengan gambaran keseluruhan metodologi penyelidikan, seperti yang digambarkan dalam Rajah 4, diikuti dengan penjelasan bagi setiap langkah, termasuk pengumpulan data, pemprosesan data, Penilaian individu dan operasi GA. Fenomena titik perubahan berlaku apabila terdapat perubahan mendadak dalam FDR, yang melanggar andaian FDR berterusan sepanjang fasa ujian. Oleh itu, model tunggal berbentuk S atau Concave tidak dapat menyesuaikan dengan tepat pengagihan data set data kegagalan. Dengan menggabungkan ciri-ciri model berbentuk S dan Concave, anggaran taburan kegagalan yang lebih baik dalam situasi ujian sebenar boleh dicapai. MuSRGM menggabungkan GA, teknik SRGM berasaskan pembelajaran mendalam, LSTM dan Perhatian untuk memanfaatkan sepenuhnya kelebihan teknologi yang berbeza dan meningkatkan ketepatan ramalan kebolehpercayaan perisian. Pertama, data kegagalan ialah urutan siri masa yang boleh dipelajari menggunakan LSTM untuk menangkap sambungan yang wujud antara data. Peranan mekanisme Perhatian adalah untuk mengenal pasti anomali dalam siri masa, iaitu, fenomena titik perubahan. Dengan menggabungkan GA dengan SRGM berasaskan pembelajaran mendalam, GA secara dinamik memilih gabungan fungsi pengaktifan terbaik berdasarkan ciri-ciri data kegagalan, menghasilkan model penilaian kebolehpercayaan yang optimum.

Rajah 4  Gambaran keseluruhan kaedah yang dicadangkan

Algoritma 1 menunjukkan pseudo-kod untuk MuSRGM. Data input terdiri daripada tiga bahagian: set data kegagalan, set pengaktifan SRGM berasaskan pembelajaran mendalam dan set hiperparameter yang diperlukan untuk melatih model pembelajaran mendalam. Set fungsi pengaktifan dan set hiperparameter digabungkan sebagai populasi permulaan GA. Fungsi kecergasan digunakan untuk mengira nilai kecergasan setiap individu dalam populasi, dan parameter rangkaian saraf dengan nilai kecergasan terendah adalah output sebagai hasil apabila keadaan berhenti operasi GA dipenuhi.

3.1 Pengumpulan Data

Sebelum menggunakan algoritma GA, kita perlu mengumpulkan data. Data ini terdiri daripada dua jenis: (1) set data kegagalan yang digunakan untuk melatih model pembelajaran mendalam, dan (2) set parameter untuk algoritma GA. Set data kegagalan terdiri daripada dua ciri: masa pengesanan kegagalan dan bilangan kumulatif kegagalan, yang digambarkan dalam Rajah 5. Masa pengesanan kegagalan boleh diwakili oleh masa kalendar, masa berjalan sistem atau bilangan ujian.

Rajah 5  Data kegagalan untuk projek JDT eclipse

Merekod masa kalendar kegagalan semasa ujian boleh menjadi tidak praktikal dan mahal. Selain itu, ujian selalunya dijalankan secara tidak segerak, dan kebarangkalian untuk mengesan jenis kegagalan yang serupa boleh berbeza-beza dari ujian ke ujian. Oleh itu, masa berjalan sistem bukanlah metrik yang baik. Sebaliknya, tempoh tetap operasi sistem adalah metrik yang paling sesuai untuk mengira bilangan kegagalan. Bilangan kumulatif kegagalan merujuk kepada kiraan kegagalan unik yang dikenal pasti dalam kod semasa tempoh sistem berjalan tertentu.

Set parameter kaedah berasaskan GA kami terdiri daripada dua jenis data: fungsi pengaktifan daripada SRGM berasaskan pembelajaran mendalam dan hiperparameter untuk latihan model. Mengikuti Wu dan Huan [16], Kami mengubah SRGM tradisional menjadi model pembelajaran mendalam dengan tiga lapisan tersembunyi, setiap satu menggabungkan fungsi pengaktifan sebagai sebahagian daripada set parameter. Memandangkan klasifikasi SRGM tradisional ke dalam model Concave dan berbentuk S mengikut FDR, SRGM berasaskan pembelajaran mendalam tiga lapisan kami direka bentuk untuk menjelmakan corak ini. Kami menggunakan pelbagai model, seperti Keluk Pertumbuhan Logaritma (LGC), Goel-Okumoto (GO), Keluk berbentuk S Tertunda (DSS), Musa-Okumoto Logaritma Poisson (Musa) dan Eksponen Yamada (YEX), untuk mewakili spektrum SRGM, masing-masing dengan aplikasi penting dan penyelidikan dalam kebolehpercayaan perisian. Khususnya, model LGC dan GO, ciri sifatnya yang cekung, adalah optimum untuk peringkat penemuan kecacatan awal apabila kadar penemuan menurun apabila ujian semakin maju. Sebaliknya, DSS, Musa dan YEX, sebagai model berbentuk S, berkesan menangkap kerumitan tambahan pada fasa ujian yang berbeza. Jadual 3 memperincikan fungsi pengaktifan model ini.

Jadual 3  Set fungsi pengaktifan

MuSRGM menggabungkan SRGM berasaskan pembelajaran mendalam dengan rangkaian LSTM dan mekanisme perhatian. Hiperparameter utama, seperti kadar pembelajaran, zaman latihan, saiz kelompok dan langkah masa, dioptimumkan menggunakan GA untuk keberkesanan maksimum. Objektif MuSRGM adalah untuk menggabungkan ciri kedua-dua model berbentuk Concave dan S, dengan berkesan menyesuaikan fenomena titik perubahan dengan menggabungkan elemen model dan hiperparameter secara sistematik.

3.2 Memproses Data

Matlamat kami adalah untuk meramalkan bilangan kegagalan yang akan berlaku dalam kitaran pengendalian sistem masa hadapan berdasarkan bilangan kumulatif kegagalan yang disediakan oleh set data kegagalan. Untuk mencapai matlamat ini, kami menggunakan model LSTM, yang menganggap data kegagalan sebagai siri masa. Setiap input ialah vektor data kegagalan, dan output ialah nilai tunggal yang mewakili bilangan kegagalan pada masa berikutnya. Rajah 6 menunjukkan bentuk data bagi data input dan output. Untuk melatih dan menguji model pembelajaran mendalam, kami membahagikan set data kegagalan kepada set latihan (90%) dan set ujian (10%), seperti yang digambarkan dalam Rajah 7.

Rajah 6  Bentuk data input dan output

Rajah 7  Memisahkan set data

Apabila memulakan algoritma GA, permulaan populasi diperlukan [30]. Rajah 8 menggambarkan proses pelaksanaan yang tepat. Setiap kromosom (penyelesaian individu) terdiri daripada dua bahagian: set fungsi pengaktifan SRGM berasaskan pembelajaran mendalam dan set hiperparameter untuk model [31]. Kami menentukan ruang carian yang sepadan untuk setiap parameter. Nilai rawak diberikan kepada setiap parameter dalam ruang carian semasa menjalankan awal algoritma GA.

Rajah 8  Penduduk awal

3.3 Menilai Individu

Selepas setiap lelaran algoritma genetik, generasi seterusnya populasi dijana. Keturunan perlu dinilai menggunakan fungsi kecergasan [32], [33]. Fungsi kecergasan menilai kedekatan penyelesaian individu dengan penyelesaian ideal [34], dan kami menggunakan Ralat Kuasa Dua (MSE) sebagai kriteria untuk fungsi kecergasan. MSE yang lebih rendah menunjukkan kesesuaian penyelesaian yang lebih tinggi. MuSRGM juga disepadukan ke dalam fungsi kecergasan, seperti yang ditunjukkan dalam Rajah 9. Ia termasuk gabungan dinamik SRGM yang terdiri daripada lapisan LSTM, lapisan Perhatian dan tiga lapisan tersembunyi yang terdiri daripada fungsi pengaktifan yang diekstrak daripada SRGM berasaskan pembelajaran mendalam.

Rajah 9  Fungsi kecergasan

Gabungan mekanisme LSTM dan Perhatian direka untuk menangkap fenomena titik perubahan yang berlaku semasa proses ujian. Dalam algoritma GA, setiap lelaran fungsi kecergasan membina model SRGM menggunakan penyelesaian semasa (satu kromosom). Set data latihan dihantar ke model SRGM untuk latihan, dan selepas model dilatih, set data ujian digunakan untuk mengira nilai MSE (nilai kecergasan). Proses ini diulang sehingga syarat penamatan GA dipenuhi. Model dengan nilai kecergasan terkecil (nilai MSE) ialah model terbaik yang dihasilkan oleh algoritma GA.

3.4 Operasi Berkaitan GA

Apabila syarat penamatan algoritma GA tidak dipenuhi, ia akan menjalani operasi pemilihan, Crossover atau Mutasi untuk menjana generasi seterusnya dan memanggil fungsi kecergasan sekali lagi untuk penilaian. Proses ini diulang sehingga syarat penamatan dipenuhi. Proses pelaksanaan pemilihan, Crossover, atau Mutasi digambarkan dalam Rajah 10. Setelah syarat penamatan dipenuhi, model dengan nilai kesesuaian terendah dianggap sebagai model terbaik, dan parameter berkaitan model ini adalah output akhir.

Rajah 10  operasi GA

4. Penilaian

Untuk mengesahkan model yang dicadangkan, soalan kajian berikut telah dibangunkan.

RQ1: Bagaimanakah kaedah yang dicadangkan dibandingkan dengan kaedah terkini yang lain dari segi pemadanan fenomena titik perubahan?

RQ2: Bagaimanakah kaedah yang dicadangkan berprestasi pada set data kegagalan yang berbeza dari segi Kebolehgeneralisasian?

RQ3: Adakah penambahan mekanisme perhatian berkesan meningkatkan prestasi ramalan SRGM?

RQ1 bertujuan untuk mengesahkan keberkesanan kaedah cadangan kami dalam menyesuaikan fenomena titik perubahan berbanding kaedah terkini yang lain. RQ2 menyiasat kebolehgeneralisasian kaedah yang dicadangkan untuk set data kegagalan yang berbeza. RQ3 mengkaji sama ada penambahan mekanisme perhatian boleh meningkatkan prestasi ramalan model dengan berkesan.

4.1 Persediaan Eksperimen
4.1.1 Set Data

Kami mengesahkan model yang dicadangkan menggunakan tiga set data: projek Alat Pembangunan Java (JDT) Eclipse, komponen rangkaian Kernel Linux dan projek platform Eclipse. Penerangan terperinci set data dibentangkan dalam Jadual 4.

Jadual 4  Set data kegagalan

Rajah 11 memaparkan graf lengkung kegagalan kumulatif untuk tiga set data. Dapat diperhatikan bahawa FDR tidak mengikut lengkung malar. Pada titik tertentu semasa ujian (ditunjukkan oleh bulatan putus-putus), FDR tiba-tiba berubah. Rajah 11 (a) menunjukkan perubahan ketara dalam FDR semasa pertengahan ujian. Selain itu, Rajah 11 (b) dan (c) menunjukkan bahawa dua perubahan berbeza dalam FDR berlaku semasa proses ujian. Fenomena ini dikenali sebagai titik perubahan, yang kerap berlaku semasa fasa ujian praktikal.

Rajah 11  Keluk kegagalan kumulatif untuk DS1, DS2, DS3

Semasa fasa ujian perisian, titik perubahan mungkin timbul daripada faktor yang disengajakan atau tidak disengajakan. Walau bagaimanapun, set data projek besar yang kami harapkan tidak memberikan maklumat pengelasan khusus pada titik perubahan. Namun begitu, reka bentuk fleksibel model MuSRGM membolehkannya menganalisis dan menangkap semua jenis titik perubahan. Model ini memanfaatkan gabungan analisis komprehensif data kegagalan sejarah dengan kekuatan pembelajaran mendalam dan algoritma genetik untuk mengenal pasti perubahan ketara semasa proses ujian, tidak kira sama ada perubahan ini dirancang atau rawak.

4.1.2 Metrik Penilaian

Kami membandingkan prestasi model yang dicadangkan dengan model lain menggunakan beberapa kriteria penilaian.

1. Ralat Purata Kuasa Dua (MSE): Ukuran perbezaan antara nilai yang diramalkan dan nilai sebenar, dikira sebagai purata perbezaan kuasa dua antara mereka. Ia merupakan nilai bukan negatif, dan MSE yang lebih rendah menunjukkan kesesuaian yang lebih baik antara nilai yang diramalkan dan nilai sebenar. MSE dikira seperti berikut:

\[\begin{aligned} \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (Y_{i} - \hat{Y}_{i})^2 \end{aligned}\]

2. Ralat Peratusan Mutlak Min (MAPE): Metrik yang menggunakan statistik untuk menilai ketepatan ramalan. Ia dikira seperti berikut:

\[\begin{aligned} MAPE=\frac{100\%}{n} \sum_{i=1}^{n} \left | \frac{Y_{i}-\hat{Y}_{i}}{Y_{i}}\right| \end{aligned}\]

3. Ralat Peratusan Mutlak Min Symmetric (SMAPE): Metrik yang menggunakan ralat peratusan untuk menilai ketepatan yang dijangkakan, yang dikira seperti berikut:

\[\begin{aligned} SMAPE=\frac{100\%}{n} \sum_{i=1}^{n} \left | \frac{\left | \hat{Y}_{i}-Y_{i} \right | }{(\left | Y_{i} \right |+\left | \hat{Y}_{i} \right |)/2 }\right| \end{aligned}\]

4. Ralat Peratusan Min (MPE): Ukuran yang menggunakan statistik untuk menilai min peratusan ralat antara nilai yang diramalkan dan sebenar:

\[\begin{aligned} MPE=\frac{100\%}{n} \sum_{i=1}^{n} \frac{Y_{i}-\hat{Y}_{i}}{Y_{i}} \end{aligned}\]

Dalam formula di atas,\(\hat{Y}_{i}\) mewakili bilangan kegagalan yang diramalkan menggunakan model pada masa itu \(i\), \(Y_{i}\) mewakili bilangan sebenar kegagalan pada masa itu \(i\), dan n mewakili jumlah data.

5. Purata Masa Antara Kegagalan (MTBF): Ukuran yang mengira purata masa berlalu antara dua kegagalan berturut-turut dalam sistem, yang dikira seperti berikut:

\[\begin{aligned} MTBF = \frac{T_{\text{total}}}{N} \end{aligned}\]

\(T_{total}\) mewakili jumlah masa berjalan dalam tempoh pemerhatian, dan \(N\) ialah jumlah bilangan kegagalan yang diperhatikan dalam sistem.

4.1.3 Kaedah Baseline

Berbanding dengan kerja yang berkaitan, kami mewujudkan kaedah asas menggunakan kaedah penyelidikan yang dinyatakan dan menggunakan garis dasar ini untuk menilai keunggulan prestasi model kami. Kami menetapkan sejumlah empat kaedah asas.

1. Rangkaian saraf

SRGM tradisional bergantung pada formula dengan parameter untuk tafsiran, tetapi disebabkan oleh batasan parameter ini, tiada satu pun daripada mereka boleh mencapai ramalan yang tepat pada semua data kegagalan. Sebaliknya, rangkaian saraf menggunakan pemberat untuk melaraskan jurang antara data input dan data berlabel tanpa had yang sama pada parameter, yang membawa kepada ketepatan yang lebih tinggi.

2. LSTM

LSTM ialah sejenis rangkaian RNN yang boleh meramalkan hasil masa hadapan berdasarkan pengetahuan terdahulu, dan ia boleh menangkap hubungan intrinsik antara data, yang menghasilkan ketepatan ramalan yang lebih tinggi.

3. SRGM berasaskan pembelajaran mendalam

SRGM berasaskan pembelajaran mendalam menggabungkan ciri-ciri SRGM tradisional dan rangkaian saraf. Mereka mensimulasikan parameter SRGM menggunakan berat rangkaian saraf, dan melaraskan pengaruh setiap SRGM pada output akhir melalui perambatan ke belakang ralat, menjadikannya lebih mudah disesuaikan dengan set data kegagalan yang berbeza.

4. SRGM berasaskan GA

Sebelum penggunaan teknik AI dalam SRGM, GA merupakan pendekatan yang popular untuk pengoptimuman parameter. Dalam kajian ini, GA digunakan dalam kombinasi dengan lima SRGM, dan keputusan ramalan yang terhasil digunakan sebagai salah satu kaedah asas untuk perbandingan.

5. SRGM dengan titik perubahan

SRGM dengan titik perubahan menganalisis secara komprehensif dinamik kebolehpercayaan perisian dengan menggabungkan FDR sebelum dan selepas titik perubahan. Penyepaduan ini menyediakan perspektif holistik tentang cara kebolehpercayaan perisian berkembang, dengan mengambil kira variasi dalam FDR semasa fasa ujian yang berbeza.

4.2 Keputusan Eksperimen

RQ1: Bagaimanakah kaedah yang dicadangkan dibandingkan dengan kaedah terkini yang lain dari segi pemadanan fenomena titik perubahan?

Tujuan penyiasatan ini adalah untuk menilai keberkesanan kaedah yang dicadangkan kami. Kami membandingkan prestasi ramalan model berasaskan GA, rangkaian saraf, rangkaian LSTM dan MuSRGM pada tiga set data dunia sebenar. Keputusan ramalan dibentangkan dalam Jadual 5-7. Setelah menyemak keputusan, adalah jelas bahawa SRGM tradisional berdasarkan GA mempamerkan prestasi yang lemah untuk tiga set data, dengan MSE yang satu susunan magnitud lebih tinggi daripada semua kaedah berasaskan pembelajaran mendalam. Walau bagaimanapun, terdapat juga perbezaan yang ketara dalam MSE bagi setiap kaedah berasaskan pembelajaran mendalam. Kaedah berasaskan LSTM menunjukkan prestasi paling lemah, seperti yang dibuktikan oleh skor MSE tertinggi antara semua model untuk dataset 1 (3372.14, seperti ditunjukkan dalam Jadual 5). Perbezaan MSE antara pelbagai kaedah adalah tidak ketara untuk dataset 2, dan perbezaan ramalan adalah agak kecil. Untuk set data 3, SRGM berasaskan pembelajaran mendalam mempamerkan prestasi terburuk dengan skor MSE tertinggi 7078.87 (seperti yang ditunjukkan dalam Jadual 7). Selepas memerhatikan tiga set data, MuSRGM menunjukkan prestasi unggul berbanding semua kaedah asas, mengesahkan keberkesanan penggabungan SRGM secara dinamik berdasarkan ciri-ciri data kegagalan dalam meningkatkan ketepatan ramalan. Ringkasnya, penemuan ini mengesahkan bahawa kaedah cadangan kami mengatasi semua kaedah lain dalam literatur. Model MuSRGM menghasilkan nilai yang sama untuk SMAPE dan MPE merentas ketiga-tiga set data, seperti ditunjukkan dalam Jadual 5, 6, dan 7 (0.000589, 0.001192, dan 0.000388, masing-masing). Ini disebabkan oleh julat nilai data yang kecil dan taburan ralat ramalan yang agak sekata berbanding dengan nilai sebenar. Ini seterusnya mengesahkan bahawa prestasi ramalan MuSRGM adalah lebih baik daripada kaedah lain.

Jadual 5  Keputusan eksperimen untuk DS1

Jadual 6  Keputusan eksperimen untuk DS2

Jadual 7  Keputusan eksperimen untuk DS3

Tambahan pula, ketepatan ramalan diukur dengan kedekatan MTBF yang diramalkan dengan data ujian sebenar MTBF. Analisis data yang dibentangkan dalam Jadual 8 mendedahkan kelebihan ketara SRGM berasaskan pembelajaran mendalam berbanding GA tersebut dan yang menggabungkan titik perubahan. Penemuan ini bukan sahaja menyerlahkan keupayaan ramalan luar biasa rangkaian saraf tetapi juga menekankan keberkesanan dan kebolehsuaian mereka dalam mengendalikan corak data yang kompleks. Yang penting, ramalan MTBF MuSRGM hampir sama dengan nilai sebenar 0.8234, 0.0706, dan 0.2500 untuk DS1, DS2 dan DS3, masing-masing, dengan nilai ramalan sebanyak 1.2271, 0.0787, dan 0.4104. Ini menunjukkan ketepatan MuSRGM dalam menyesuaikan fenomena titik perubahan dan menyerlahkan ketepatan ramalannya.

Jadual 8  Perbandingan MTBF

RQ2: Bagaimanakah kaedah yang dicadangkan berprestasi pada set data kegagalan yang berbeza dari segi Kebolehgeneralisasian?

Tujuan soalan kajian ini adalah untuk menilai kebolehgeneralisasian kaedah cadangan kami merentas set data yang berbeza. Keputusan ramalan individu dalam Jadual 5-7 menunjukkan variasi ketara dalam prestasi model merentas set data yang berbeza. Kami mendapati bahawa SRGM berasaskan GA umumnya mempamerkan nilai MSE yang tinggi dan prestasi yang lemah merentas ketiga-tiga set data. Sebaliknya, kaedah berasaskan pembelajaran mendalam menunjukkan perbezaan yang ketara dalam meramalkan model untuk set data yang berbeza. Sebagai contoh, sementara model LSTM menunjukkan skor MSE yang rendah pada dataset 2 (109.75, seperti yang ditunjukkan dalam Jadual 6), ia menunjukkan prestasi yang lemah pada dataset 1 dan 3. Sebaliknya, SRGM berasaskan pembelajaran mendalam menunjukkan prestasi yang kukuh pada dataset 1 dan 2 tetapi bernasib buruk pada dataset 3, seperti yang dibuktikan oleh skor MSE yang tinggi 7078.87 (seperti yang ditunjukkan dalam Jadual 7). Oleh itu, tiada model tunggal boleh berprestasi baik pada semua set data. Walau bagaimanapun, MuSRGM menggunakan pemilihan semula jadi untuk mencari ruang parameter dan menggunakan fungsi kecergasan untuk menentukan penyelesaian terbaik. Akibatnya, kaedah cadangan kami menunjukkan prestasi yang baik pada ketiga-tiga set data: DS1, DS2 dan DS3. Kami membuat kesimpulan bahawa kaedah yang dicadangkan kami lebih sesuai daripada kaedah sedia ada dalam literatur.

RQ3: Adakah penambahan mekanisme perhatian berkesan meningkatkan prestasi ramalan model?

Tujuan soalan kajian ini adalah untuk menilai keberkesanan penambahan mekanisme Perhatian kepada model ramalan kebolehpercayaan perisian. Kami menggunakan rangkaian Neural dan LSTM tanpa mekanisme Perhatian, serta rangkaian Neural dan LSTM dengan mekanisme Perhatian, kepada tiga set data kegagalan dan membentangkan keputusan ramalan dalam Jadual 9-11. Keputusan untuk rangkaian Neural dan LSTM tanpa mekanisme Perhatian menunjukkan bahawa rangkaian Neural berprestasi lebih baik daripada LSTM. Walau bagaimanapun, penambahan mekanisme Perhatian mempunyai kesan yang berbeza-beza terhadap prestasi ramalan model. Khususnya, gabungan mekanisme Perhatian dan rangkaian Neural menghasilkan hasil yang lebih buruk daripada menggunakan rangkaian Neural sahaja. Sebaliknya, menggabungkan mekanisme Perhatian dengan LSTM sangat meningkatkan prestasi ramalannya. Berdasarkan keputusan dalam Jadual 9, prestasi ramalan LSTM dengan model perhatian adalah lebih rendah sedikit daripada rangkaian saraf untuk DS1 (lihat 227.59). Walau bagaimanapun, untuk DS2 dan DS3, prestasi ramalan LSTM dengan model perhatian mengatasi rangkaian saraf. Penemuan ini mencadangkan bahawa gabungan LSTM dan perhatian boleh menangkap fenomena titik perubahan dalam data siri masa dengan berkesan, yang membawa kepada peningkatan dalam prestasi ramalan model.

Jadual 9  Perbandingan kesan mekanisme perhatian pada DS1

Jadual 10  Perbandingan kesan mekanisme perhatian pada DS2

Jadual 11  Perbandingan kesan mekanisme perhatian pada DS3

4.3 Ancaman terhadap Kesahihan

Bahagian ini menangani batasan kaedah yang dicadangkan kami. Seperti yang diakui secara meluas, mendapatkan set data kegagalan adalah aspek yang paling mencabar dalam penyelidikan kebolehpercayaan perisian. Kami berusaha untuk menguji prestasi model menggunakan beberapa set data, tetapi memandangkan setiap set data diperoleh daripada projek pembangunan perisian yang berbeza, keputusan ujian sama ada sangat positif atau negatif. Untuk mengurangkan ini, kami menilai model yang dicadangkan menggunakan set data yang sama seperti yang dicadangkan oleh Wu dan Huan [16]. Kami berharap institusi atau syarikat yang berkaitan dapat menyediakan set data kegagalan yang lebih tepat, membolehkan kami membuat ramalan yang lebih tepat tentang kebolehpercayaan perisian.

Selain itu, untuk mengesahkan keberkesanan model kami, kami menetapkan 9 garis dasar untuk perbandingan prestasi. Semasa melaksanakan setiap garis dasar berdasarkan kertas penyelidikan yang berkaitan, mungkin terdapat beberapa percanggahan berbanding kaedah asal yang dicadangkan dalam kertas tersebut.

5. Kesimpulan

Mengawal kos pembangunan perisian dengan memendekkan kitaran ujian sambil memastikan kualiti perisian adalah cabaran utama yang dihadapi oleh industri perisian hari ini. SRGM telah mendapat perhatian untuk meramalkan bilangan kegagalan yang mungkin berlaku dalam operasi sistem masa hadapan, membantu menganggarkan masa optimum untuk keluaran sistem. Walau bagaimanapun, SRGM tradisional, yang menganggap FDR berterusan sepanjang fasa ujian, dicabar oleh berlakunya titik perubahan; peristiwa ini bercanggah dengan andaian ini dan menjejaskan ketepatan ramalan serta penilaian kebolehpercayaan perisian.

Dalam makalah ini, kami mencadangkan pendekatan baru untuk ramalan kebolehpercayaan perisian dengan menggabungkan SRGM berasaskan pembelajaran mendalam dengan LSTM dan mekanisme Perhatian untuk menangkap fenomena titik perubahan dalam set data kegagalan. Fungsi Pengaktifan diekstrak daripada SRGM berasaskan pembelajaran mendalam dan digunakan untuk membentuk set baharu SRGM bermutasi. SRGM bermutasi ini kemudiannya dinilai menggunakan GA untuk mencari model SRGM optimum dengan nilai MSE terendah. SRGM baharu memanfaatkan kedua-dua jenis Concave dan berbentuk S, menghasilkan ketepatan ramalan yang lebih tinggi dan kebolehgunaan yang lebih baik.

Kami mengesahkan kaedah yang dicadangkan dengan tiga set data kegagalan yang berbeza dan menunjukkan bahawa ketepatan ramalan model kami adalah lebih baik daripada kaedah penyelidikan terkini. Tambahan pula, kaedah yang dicadangkan kami mencapai keputusan ramalan yang sangat baik untuk ketiga-tiga set data, menunjukkan kebolehgunaan unggul berbanding kaedah penyelidikan terkini. Ini akan membantu menilai dengan tepat kebolehpercayaan perisian, dengan itu memendekkan kitaran ujian dan menjimatkan kos pembangunan perisian.

Pada masa ini, data latihan yang digunakan dalam model yang dicadangkan hanya mempunyai satu ciri, iaitu bilangan kumulatif kegagalan. Untuk meningkatkan lagi prestasi ramalan model, kami akan mencari lebih banyak ciri data kegagalan untuk memperkaya set data latihan. Contohnya, jenis kegagalan, tahap keterukan kegagalan, dan sebagainya. Menggabungkan ciri data yang diperkaya dan model yang dicadangkan akan meningkatkan lagi ketepatan ramalan.

Penghargaan

Penyelidikan ini disokong oleh MSIT (Kementerian Sains dan ICT), Korea, di bawah program sokongan ITRC (Pusat Penyelidikan Teknologi Maklumat) (RS-2023-00259099) yang diselia oleh IITP (Institut Perancangan & Penilaian Teknologi Maklumat & Komunikasi) . Selain itu, penyelidikan ini disokong oleh Program Penyelidikan Sains Asas melalui Yayasan Penyelidikan Kebangsaan Korea (NRF) yang dibiayai oleh Kementerian Pendidikan (NRF-2022R1I1A3069233).

Rujukan

[1] M.R. Lyu, “Software reliability engineering: A roadmap,” Future of Software Engineering (FOSE ’07), pp.153-170, 2007.
CrossRef

[2] V. Almering, M. van Genuchten, G. Cloudt, and P.J.M. Sonnemans, “Using software reliability growth models in practice,” IEEE Softw., vol.24, no.6, pp.82-88, 2007.
CrossRef

[3] M.R.-T. Lyu, “Software reliability theory,” Encyclopedia of Software engineering, vol.2, pp.1611-1630, 2002.
CrossRef

[4] E. Zio, “Reliability engineering: Old problems and new challenges,” Reliability engineering & system safety, vol.94, no.2, pp.125-141, 2009.
CrossRef

[5] J. Zhang, Y. Lu, S. Yang, and C. Xu, “Nhpp-based software reliability model considering testing effort and multivariate fault detection rate,” Journal of Systems Engineering and Electronics, vol.27, no.1, pp.260-270, 2016.

[6] A. Wood, “Software reliability growth models,” Tandem Technical Report, vol.96, no.130056, p.900, 1996.

[7] N. Karunanithi, D. Whitley, and Y.K. Malaiya, “Using neural networks in reliability prediction,” IEEE Softw., vol.9, no.4, pp.53-59, 1992.
CrossRef

[8] Y. Tamura and S. Yamada, “Software reliability model selection based on deep learning with application to the optimal release problem,” Journal of Industrial Engineering and Management Science, vol.2019, no.1, pp.43-58, 2019.

[9] A.R. Pai, G. Joshi, and S. Rane, “Quality and reliability studies in software defect management: a literature review,” International Journal of Quality & Reliability Management, 2021.
CrossRef

[10] C. Smidts, “Research in software reliability engineering,” RAMS ’06. Annual Reliability and Maintainability Symposium, 2006., pp.228-233, 2006.
CrossRef

[11] K.K. Raghuvanshi, A. Agarwal, K. Jain, and V.B. Singh, “A time-variant fault detection software reliability model,” SN Applied Sciences, vol.3, no.1, pp.1-10, 2021.
CrossRef

[12] C.-Y. Huang and M.R. Lyu, “Estimation and analysis of some generalized multiple change-point software reliability models,” IEEE Trans. Rel., vol.60, no.2, pp.498-514, 2011.
CrossRef

[13] J. Zhao, H.-W. Liu, G. Cui, and X.-Z. Yang, “Software reliability growth model with change-point and environmental function,” Journal of Systems and Software, vol.79, no.11, pp.1578-1587, 2006.
CrossRef

[14] V. Dhaka and N. Nijhawan, “Effect of change in environment on reliability growth modeling integrating fault reduction factor and change point: a general approach,” Annals of Operations Research, pp.1-35, 2022.
CrossRef

[15] M.K. Bhuyan, D.P. Mohapatra, and S. Sethi, “A survey of computational intelligence approaches for software reliability prediction,” ACM SIGSOFT Software Engineering Notes, vol.39, no.2, pp.1-10, 2014.
CrossRef

[16] C.-Y. Wu and C.-Y. Huang, “A study of incorporation of deep learning into software reliability modeling and assessment,” IEEE Trans. Rel., vol.70, no.4, pp.1621-1640, 2021.
CrossRef

[17] G. Wang and W. Li, “Research of software reliability combination model based on neural net,” 2010 Second World Congress on Software Engineering, pp.253-256, 2010.
CrossRef

[18] J. Zheng, “Predicting software reliability with neural network ensembles,” Expert systems with applications, vol.36, no.2, pp.2116-2122, 2009.
CrossRef

[19] I. Lakshmanan and S. Ramasamy, “An artificial neural-network approach to software reliability growth modeling,” Procedia Computer Science, vol.57, pp.695-702, 2015.
CrossRef

[20] Y. Singh and P. Kumar, “Application of feed-forward neural networks for software reliability prediction,” ACM SIGSOFT Software Engineering Notes, vol.35, no.5, pp.1-6, 2010.
CrossRef

[21] G. Wang and W. Li, “Research of software reliability combination model based on neural net,” 2010 Second World Congress on Software Engineering, pp.253-256, IEEE, 2010.
CrossRef

[22] T. Yaghoobi, “Parameter optimization of software reliability models using improved differential evolution algorithm,” Mathematics and Computers in Simulation, vol.177, pp.46-62, 2020.
CrossRef

[23] S. Inoue and S. Yamada, “Optimal software release policy with change-point,” 2008 IEEE International Conference on Industrial Engineering and Engineering Management, pp.531-535, 2008.
CrossRef

[24] U. Samal, S. Kushwaha, and A. Kumar, “A testing-effort based srgm incorporating imperfect debugging and change point,” Reliability: Theory & Applications, vol.18, no.1, pp.86-93, 2023.

[25] J.-H. Lo, “The implementation of artificial neural networks applying to software reliability modeling,” Proc. 21st Annual International Conference on Chinese Control and Decision Conference, CCDC’09, pp.4385-4390, 2009.

[26] K.-Y. Cai, L. Cai, W.-D. Wang, Z.-Y. Yu, and D. Zhang, “On the neural network approach in software reliability modeling,” Journal of Systems and Software, vol.58, no.1, pp.47-62, 2001.
CrossRef

[27] F. Yangzhen, Z. Hong, Z. Chenchen, and F. Chao, “A software reliability prediction model: Using improved long short term memory network,” 2017 IEEE International Conference on Software Quality, Reliability and Security Companion (QRS-C), pp.614-615, IEEE, 2017.
CrossRef

[28] K. Gusmanov, “On the adoption of neural networks in modeling software reliability,” Proc. 2018 26th ACM Joint Meeting on European Software Engineering Conference and Symposium on the Foundations of Software Engineering, pp.962-964, 2018.
CrossRef

[29] Y.-S. Su and C.-Y. Huang, “Neural-network-based approaches for software reliability estimation using dynamic weighted combinational models,” Journal of Systems and Software, vol.80, no.4, pp.606-615, 2007.
CrossRef

[30] M. Saraswat, “Cost optimization of srgm using genetic algorithm,” International Journal of Computer Applications, vol.144, no.5, pp.13-20, 2016.
CrossRef

[31] A. Tickoo, P.K. Kapur, S.K. Khatri, and A.K. Verma, “Optimal release time determination for multi upgradation srgm with faults of different severity using genetic algorithm,” 2015 4th International Conference on Reliability, Infocom Technologies and Optimization (ICRITO)(Trends and Future Directions), pp.1-6, IEEE, 2015.
CrossRef

[32] J. Yang, M. Zhao, and W. Hu, “Web software reliability modeling with random impulsive shocks,” Journal of Systems Engineering and Electronics, vol.25, no.2, pp.349-356, 2014.
CrossRef

[33] K.K. San, H. Washizaki, Y. Fukazawa, K. Honda, M. Taga, and A. Matsuzaki, “Deep cross-project software reliability growth model using project similarity-based clustering,” Mathematics, vol.9, no.22, p.2945, 2021.
CrossRef

[34] D.G. KrishnaMohan, B. Sowmya, K. Mohanvamsi, and K. Sandeep, “An effective software reliability estimation with real-valued genetic algorithm,” International Journal of Engineering & Technology, vol.7, p.359, 2018.
CrossRef

[35] “Eclipse bugzilla,” https://bugs.eclipse.org/bugs/, accessed March 12, 2022.

[36] “Linux kernel bugzilla,” https://bugzilla.kernel.org/, accessed March 12, 2022.

Pengarang

Ning FU
  Jeonbuk National University

earned his Bachelor’s degree in Software Engineering from Dalian Jiaotong University, China, in 2004. He furthered his education by completing a Master’s degree in Software Engineering at Nanjing University of Science and Technology, China, in 2016. Currently, he is dedicated to pursuing a Ph.D. at Chonbuk National University in South Korea. Between May 2009 and December 2020, Ning Fu held the position of Senior Lecturer at Henan Agricultural Vocational College, China.

Duksan RYU
  Jeonbuk National University

earned a bachelor’s degree in computer science from Hanyang University in 1999 and a Master’s dual degree in software engineering from KAIST and Carnegie Mellon University in 2012. He received his Ph.D. degree from the School of Computing, KAIST in 2016. His research areas include software analytics based on AI, software defect prediction, mining software repositories, and software reliability engineering. He is currently an associate professor in the software engineering department at Jeonbuk National University.

Suntae KIM
  Jeonbuk National University

is a Full Professor in the Department of Software Engineering at Chonbuk National University. He earned his B.S. degree in computer science and engineering from Chung-Ang University in 2003, and both his M.S. and Ph.D. degrees in computer science and engineering from Sogang University in 2007 and 2010, respectively. His research focuses on software architecture, artificial intelligence, blockchain, and financial technology.

Kata kunci