Pengenalan pembelajaran adversarial untuk keamanan AI real-time merupakan peningkatan signifikan dibandingkan dengan mekanisme pertahanan statis konvensional. Seiring serangan yang didorong oleh AI menjadi semakin canggih, memanfaatkan pembelajaran penguatan dan model bahasa besar, mereka menimbulkan risiko yang semakin besar yang tidak dapat ditangani secara efektif oleh tata kelola tradisional.
Penyerang siber semakin menggunakan strategi kompleks, termasuk penalaran multi-langkah dan generasi kode otomatis, untuk menghindari langkah-langkah keamanan yang telah ditetapkan. Perubahan ini memerlukan pergeseran menuju sistem 'pertahanan autonomik', yang dapat belajar dan merespons ancaman tanpa intervensi manusia. Namun, penerapan model pertahanan canggih ini secara historis menghadapi tantangan, terutama terkait masalah latensi.
Pembelajaran adversarial, yang melibatkan pelatihan terus-menerus model ancaman dan pertahanan satu sama lain, memberikan pendekatan yang menjanjikan untuk melawan ancaman AI yang jahat. Namun, mengintegrasikan arsitektur berbasis transformer yang diperlukan ke dalam lingkungan produksi langsung telah menciptakan hambatan operasional. Abe Starosta, Manajer Riset Terapan Utama di Microsoft NEXT.ai, menekankan bahwa keberhasilan pembelajaran adversarial dalam produksi bergantung pada pencapaian keseimbangan antara latensi, throughput, dan akurasi.
Sebelumnya, tuntutan komputasi untuk menjalankan model yang padat memaksa organisasi untuk memilih antara deteksi yang lebih lambat dengan akurasi tinggi dan heuristik yang lebih cepat namun kurang akurat. Kolaborasi antara Microsoft dan NVIDIA telah menunjukkan bagaimana percepatan perangkat keras dan optimasi tingkat kernel dapat menghilangkan hambatan ini, menjadikan pertahanan adversarial real-time layak pada skala perusahaan.
Dalam pengujian, pengaturan berbasis CPU menunjukkan latensi end-to-end sebesar 1239,67ms, yang tidak praktis untuk sektor seperti keuangan atau e-commerce. Beralih ke arsitektur yang dipercepat GPU, khususnya menggunakan unit NVIDIA H100, mengurangi latensi menjadi 17,8ms. Optimasi lebih lanjut dalam mesin inferensi dan proses tokenisasi mencapai latensi akhir yang mengesankan sebesar 7,67ms, memungkinkan model deteksi beroperasi dengan akurasi lebih dari 95% pada tolok ukur pembelajaran adversarial. Kemajuan ini menekankan perlunya perangkat keras khusus dan solusi yang disesuaikan untuk memenuhi tuntutan keamanan AI real-time.