
Dalam artikel ini (4)
Perangkat Keras Probabilistik, Bukan Akselerator yang Lebih Besar, Mungkin Menjadi Lompatan Efisiensi AI Berikutnya
Poin utama
- Nilai klaim efisiensi AI berdasarkan kesesuaian beban kerja, bukan hanya ukuran akselerator atau node proses.
- Perhatikan perangkat keras probabilistik karena model denoising mungkin cocok dengan arsitektur transistor khusus.
- Perlakukan hasil energi 10.000 kali sebagai sinyal riset yang terkait dengan tolok ukur gambar sederhana.
Sebuah makalah Nature berpendapat bahwa model mirip difusi mungkin membutuhkan sirkuit yang dirancang untuk probabilitas, bukan sekadar tungku matematika yang lebih besar.
Sebuah makalah Nature berpendapat bahwa model mirip difusi mungkin membutuhkan sirkuit yang dirancang untuk probabilitas, bukan tungku matematika yang lebih besar lagi.
Akselerator AI paling menarik di ruangan itu mungkin bukan lempengan silikon yang lebih besar yang meminta jalur daya tambahan dan loop pendingin yang komitmennya meragukan. Bisa jadi langkah yang lebih aneh: berhenti membuat model probabilistik berpura-pura sebagai matematika deterministik biasa, lalu membangun mesin di sekitar probabilitas itu sendiri. Itulah pintu rahasia dalam An efficient probabilistic hardware architecture for diffusion-like models, yang diterbitkan di npj Unconventional Computing. Akselerator yang lebih besar adalah buldoser komputasi AI; makalah ini bertanya apakah model mirip difusi mungkin lebih cocok dengan kunci pembuka.
Potret Rangka dari Nature
Nature mencantumkan karya ini di npj Unconventional Computing, volume 3, Nomor artikel 30, pada 2026, dan abstraknya membingkai masalahnya sebagai ketidakcocokan perangkat keras. Menurut Nature, komputer stokastik khusus sebelumnya menjanjikan peningkatan efisiensi tetapi gagal mendapatkan daya tarik karena bergantung pada teknik pemodelan yang terbatas dan perangkat keras eksotis yang sulit diskalakan. Jalan keluar yang diusulkan adalah komputer probabilistik serba-transistor yang menerapkan model denoising yang kuat di tingkat perangkat keras. Frasa serba-transistor itu adalah pengikat tersembunyi dalam bongkarannya: para penulis tidak meminta probabilitas untuk hidup di terarium laboratorium fisika, mereka mencoba membuatnya berperilaku di wilayah transistor.
Poin praktisnya bukan bahwa akselerator konvensional itu bodoh. GPU sangat baik sebagai tungku matematika serbaguna, jenis mesin yang mengubah pekerjaan matriks menjadi panas dengan disiplin yang mengagumkan. Namun model mirip difusi dibangun di sekitar denoising probabilistik, dan abstrak Nature mengatakan proposal ini memindahkan struktur denoising itu ke perangkat keras. Jika beban kerjanya adalah kasino dengan aturan, mungkin chip sebaiknya berhenti bertingkah seperti lemari arsip.
Jalur Daya arXiv
Versi arXiv memberikan spesifikasi yang membuat seorang insinyur elektro meraih pena merah. Menurut arXiv, analisis tingkat sistem menunjukkan bahwa perangkat berbasis arsitektur yang diusulkan dapat mencapai performa setara dengan GPU pada tolok ukur gambar sederhana sambil menggunakan energi sekitar 10.000 kali lebih sedikit. Itulah kalimat yang bersembunyi di bawah penyebar panas. Kalimat itu tidak sekadar mengatakan lakukan aritmetika yang sama dengan lebih efisien; ia mengatakan cocokkan arsitektur fisik dengan bentuk probabilistik komputasinya.
Mengapa Anda perlu peduli? Karena makalah arXiv juga mengatakan perusahaan-perusahaan AS menghabiskan lebih dari biaya program Apollo yang telah disesuaikan dengan inflasi setiap tahun untuk pusat data yang berfokus pada AI, dan bahwa pada 2030 pusat data ini dapat mengonsumsi 10% dari seluruh energi yang diproduksi di AS. Itu angka infrastruktur, bukan trivia kutu buku. Ketika energi menjadi batasan desain kelas utama, arsitektur berhenti menjadi trik ruang tamu akademis dan mulai tampak seperti adegan perampokan sistem penghantaran daya, di mana setiap perjalanan memori yang dihindari berarti satu penjaga lagi tertidur di meja.
Konteks Beban Kerja dari Springer
Sebuah tinjauan Springer Nature tentang model AI besar memberikan latar belakang mengapa hal ini penting: model AI skala besar telah menjadi titik fokus, dengan contoh termasuk BERT dari Google dan GPT dari OpenAI, serta ukuran parameter yang mencapai ratusan miliar atau bahkan puluhan triliun. Tinjauan yang sama mengaitkan sebagian kenaikan itu dengan data pelatihan yang jauh lebih besar. Dengan kata lain, cerita arus utama selama ini adalah skala, lebih banyak parameter, lebih banyak data, lebih banyak komputasi, lebih banyak semuanya. Cerita itu berhasil sampai stopkontak mulai berdeham.
Model mirip difusi membuat pertanyaan arsitektur menjadi lebih tajam karena mereka bukan sekadar beban kerja anonim lain yang lewat melalui pabrik tensor. Penekanan makalah Nature pada model denoising menunjukkan pemetaan yang lebih dekat antara algoritma dan rangkaian, seperti membuat kunci khusus untuk satu gembok alih-alih membawa pendobrak hidrolik ke setiap pintu. Di sinilah perangkat keras yang baik mendapat rasa hormat: bukan dengan meneriakkan angka yang lebih besar, tetapi dengan membuang lebih sedikit gerakan. Transistor yang ikut serta dalam struktur masalah melakukan lebih dari sekadar berpindah keadaan; ia bergabung dalam konspirasi.
Metadata arXiv dan Hal yang Perlu Diamati
Catatan arXiv mengidentifikasi karya ini sebagai arXiv:2510.23972 dalam Ilmu Komputer, dengan subjek Machine Learning dan Artificial Intelligence, serta mencantumkan 13 halaman dengan 6 gambar. Itu penting karena menambatkan klaim pada artefak riset, bukan pada siklus peluncuran produk. Cara yang tepat untuk membacanya adalah sebagai argumen arsitektural dengan target energi yang sangat besar terpasang. Cara yang keliru adalah memperlakukan angka 10.000 kali sebagai stiker pengganti universal untuk setiap beban kerja GPU.
Hal berikutnya yang perlu diperhatikan adalah apakah perangkat keras probabilistik terus bergerak dari analisis tingkat sistem menuju bukti implementasi yang lebih konkret dalam literatur publik. Bagi pembaca yang membangun, membeli, atau mengevaluasi sistem AI, pelajarannya sudah berguna: efisiensi bukan hanya cerita tentang node proses, bandwidth memori, atau pendinginan. Ini juga cerita tentang bentuk beban kerja. Jika AI generatif terus condong ke komputasi probabilistik, pertanyaan akselerator paling penting mungkin bukan lagi seberapa besar chip-nya, melainkan seberapa jujur chip itu mencocokkan diri dengan matematikanya.