
In this article (3)
The UK Government Ran Weekly AI Hackathons and Found 400+ Vulnerabilities. Here's What That Tells Builders.
Key Takeaways
- Hackathon AI mingguan GC3 di 9 departemen pemerintah Inggris menemukan dan menambal 400+ kerentanan, membuktikan bahwa evaluasi adversarial berulang lebih unggul dibandingkan audit satu kali.
- Pembangun yang menerapkan AI frontier harus memperlakukan red-teaming sebagai praktik berkelanjutan: berikan tim akses model, permukaan target yang nyata, dan putaran umpan balik, bukan sekadar kotak centang pra-peluncuran.
- AI dapat menemukan kerentanan dan menyarankan perbaikan, tetapi pemahaman manusia terhadap kedua langkah tersebut tetap krusial; ketergantungan berlebihan pada tambalan yang dihasilkan AI menurunkan akurasi remediasi.
Program red-teaming terstruktur GC3 menunjukkan bahwa evaluasi adversarial oleh badan pemerintah kini menjadi kekuatan nyata dalam keamanan AI frontier.
Program red-teaming terstruktur dari GC3 menunjukkan bahwa evaluasi adversarial oleh lembaga pemerintah kini menjadi kekuatan nyata dalam keamanan AI frontier.
Bayangkan tim keamanan kamu memesan ruang rapat setiap minggu, memberikan akses ke model AI mutakhir, dan berkata: temukan sesuatu yang rusak. Tidak ada satu metode yang diwajibkan, tidak ada satu perangkat alat yang seragam, hanya rasa ingin tahu adversarial yang terstruktur dan diarahkan ke repositori kode publik. Itu bukan sekadar eksperimen pikiran. Itulah yang benar-benar dilakukan oleh UK Government Cyber Coordination Centre (GC3), dan angka utama dari latihan ini adalah lebih dari 400 kerentanan yang ditemukan dan diperbaiki. Ini bukan kisah tentang AI yang berbahaya dalam arti abstrak dan samar-samar. Ini adalah kisah tentang apa yang terjadi ketika kamu menerapkan red-teaming yang disiplin dan dapat diulang pada model mutakhir dalam konteks operasional nyata. Bagi siapa pun yang membangun di atas model-model ini, pelajarannya bersifat praktis sekaligus sedikit merendahkan hati.
Apa yang Sebenarnya Dilakukan GC3 (dan Mengapa Metodenya Penting)
Menurut Infosecurity Magazine dan studi kasus pemerintah Inggris sendiri, GC3 adalah inisiatif bersama antara National Cyber Security Centre (NCSC) dan Department for Science, Innovation and Technology (DSIT). Program ini mengorganisir acara hackathon mingguan tatap muka dengan tujuan eksplisit menggunakan model AI mutakhir untuk memindai repositori kode publik di sembilan departemen pemerintah.
Skalanya layak untuk dicermati: sembilan departemen, sesi mingguan yang berulang, dan total akhir lebih dari 400 kerentanan yang ditemukan dan diperbaiki. Yang membuat metodologinya menarik adalah ketiadaan standardisasi kaku yang disengaja pada tahap awal. Seperti yang digambarkan dalam studi kasus GOV.UK, tim diberikan akses model dan diperbolehkan membangun perangkat alat mereka sendiri, dengan program yang mengamati apa yang berhasil setiap minggu dan melakukan iterasi dari sana. Pendekatan itu — membiarkan para praktisi bereksperimen lalu mengkodifikasi apa yang benar-benar berhasil — merupakan kontras yang bermakna dengan mandat dari atas ke bawah yang sering menghasilkan teater kepatuhan alih-alih sinyal keamanan yang nyata. GC3, pada dasarnya, menjalankan eksperimen hidup dalam red-teaming AI terapan.
Mengapa Red-Teaming Pemerintah Adalah Sinyal yang Layak Dibaca
Lab AI melakukan red-teaming pada model mereka sendiri sebelum dirilis. Itu sudah terdokumentasi dengan baik dan, sejujurnya, sudah diharapkan. Yang lebih jarang terjadi, dan lebih bermanfaat, adalah badan pemerintah eksternal yang melakukan evaluasi adversarial terstruktur dalam program operasional yang berkelanjutan, bukan audit satu kali. Temuan GC3 menunjukkan bahwa permukaan kerentanan model mutakhir yang diterapkan dalam alur kerja nyata cukup luas sehingga ritme mingguan di seluruh departemen pemerintah terus menghasilkan temuan baru.
Hal ini sejalan dengan serangkaian kekhawatiran yang lebih luas dari badan regulasi Inggris. Pernyataan bersama dari Bank of England, FCA, dan HM Treasury mencatat bahwa kemampuan siber model AI mutakhir saat ini sudah melampaui apa yang dapat dicapai oleh seorang praktisi terampil, dan dengan kecepatan yang jauh lebih tinggi, skala yang lebih besar, serta biaya yang lebih rendah. Pernyataan yang sama memperingatkan bahwa perusahaan yang kurang berinvestasi dalam dasar-dasar keamanan siber inti kemungkinan akan semakin terekspos seiring tersedianya model yang lebih canggih. Itu adalah cara yang sopan untuk mengatakan: kesenjangan antara organisasi yang siap dan yang tidak siap akan segera menjadi sangat lebar, sangat cepat.
UK AI Security Institute (AISI) juga telah menerbitkan Frontier AI Trends Report-nya, sebuah penilaian berbasis bukti publik yang didasarkan pada dua tahun pengujian model mutakhir, yang memberikan konteks tambahan untuk memahami bagaimana sistem-sistem ini berkembang dari perspektif keamanan. RAND, yang ditugaskan oleh UK AISI, secara terpisah menyelidiki potensi penggunaan model AI mutakhir untuk serangan siber ofensif, khususnya memeriksa bagaimana pelaku ancaman berketerampilan rendah terpengaruh oleh akses AI. Penelitian tersebut memperkuat alasan mengapa sisi defensif dari persamaan ini — jenis pekerjaan yang dilakukan GC3 — bukanlah pilihan.
Apa yang Bisa Dipetik oleh Para Pembangun dari Ini
Jika sebuah program pemerintah yang memindai repositori publik di sembilan departemen dapat menemukan lebih dari 400 kerentanan dalam program mingguan yang berkelanjutan, pelajaran yang tersirat bagi siapa pun yang membangun di atas AI mutakhir tidaklah menyenangkan. Yaitu bahwa evaluasi adversarial bukan sekadar kotak centang satu kali sebelum peluncuran. Ini adalah praktik yang berulang.
Model GC3 menawarkan cetak biru yang sebenarnya dapat direplikasi dalam skala yang lebih kecil. Kamu tidak membutuhkan sembilan departemen pemerintah. Yang kamu butuhkan adalah: akses model, tim yang memiliki izin untuk merusak sesuatu, permukaan target yang jelas (repositori kode kamu sendiri, integrasi kamu sendiri, prompt kamu sendiri), dan putaran umpan balik yang menangkap apa yang berhasil. Pendekatan GC3 sendiri menekankan membiarkan tim membangun perangkat alat mereka sendiri daripada mewajibkan satu metode, yang secara langsung sesuai dengan bagaimana tim rekayasa yang matang sudah menjalankan tinjauan keamanan internal. Lapisan AI-nya baru; disiplin berpikir adversarial tidak.
Ada juga poin tandingan yang berguna untuk direnungkan. Sebuah pembicaraan terpisah di NDC Sydney menganalisis lebih dari 400 patch keamanan yang dihasilkan AI dan menemukan penurunan signifikan dalam akurasi remediasi ketika pengembang hanya mengandalkan saran AI, dengan banyak peserta yang tidak dapat menjelaskan bagaimana patch tertentu mengatasi masalah yang mendasarinya. AI dapat menemukan kerentanan dan AI dapat mengusulkan perbaikan, tetapi kemampuan manusia untuk memahami dan memverifikasi kedua langkah tersebut tetap penting. Program GC3 secara implisit mengkodekan ini: ia menempatkan manusia di dalam ruangan, setiap minggu, membangun dan mengkritik serta melakukan iterasi.
Bagi para pelajar dan praktisi yang ingin membangun kumpulan keterampilan ini, titik awalnya adalah memahami apa yang sebenarnya melibatkan red-teaming: pemeriksaan adversarial sistematis dengan cakupan yang ditentukan, temuan yang terdokumentasi, dan remediasi yang diverifikasi. Hasil GC3 adalah pengingat bahwa model mutakhir yang diterapkan dalam sistem nyata bukanlah artefak tertutup dan teruji. Mereka adalah permukaan yang hidup, dan evaluasi adversarial terstruktur adalah cara kamu tetap selangkah lebih maju dari apa yang ada di dalamnya.
Perhatikan bagaimana program GC3 menerbitkan temuan lebih lanjut, bagaimana Laporan Tren AISI membentuk kebijakan keamanan AI Inggris, dan apakah pemerintah lain mendirikan program berulang serupa. Model ritme berulang — bukan audit satu kali — tampaknya menjadi pendekatan yang benar-benar menghasilkan hasil.