Dalam artikel ini (4)
Scaled Cognition Mengumpulkan $100 Juta karena Menilai AI Saat Ini Pada Dasarnya Tidak Bisa Digunakan untuk Bisnis
Poin utama
- Scaled Cognition mengumpulkan $100 juta pada valuasi $750 juta untuk membangun APT, sebuah arsitektur agentik yang mengutamakan verifikasi keluaran dibandingkan skala model mentah.
- Perusahaan ini sudah berproduksi dengan sebuah perusahaan Fortune 500, menjadikan metrik keandalan langsung—bukan tolok ukur—sebagai ujian nyata dari tesisnya.
- Insinyur yang mengevaluasi AI perusahaan harus memperhatikan apakah arsitektur penalaran deterministik mengungguli model probabilistik yang disetel dengan RLHF dalam pengaturan produksi yang dapat diaudit.
Khosla Ventures baru saja mempertaruhkan $100 juta dengan keyakinan bahwa masalah nyata AI enterprise adalah keandalan, bukan kemampuan mentah.
Khosla Ventures baru saja mempertaruhkan $100 juta dengan keyakinan bahwa masalah nyata AI perusahaan adalah keandalan, bukan kemampuan mentah.
Sebagian besar pengumuman pendanaan AI hadir dengan klaim bombastis bahwa suatu model baru mencetak skor lebih tinggi pada tolok ukur yang belum pernah didengar siapa pun tiga minggu sebelumnya. Tawaran Scaled Cognition justru sebaliknya: menurut diagnosis mereka sendiri, AI saat ini pada dasarnya mustahil diterapkan pada masalah bisnis nyata. Itu adalah pernyataan yang aneh untuk diucapkan ketika kamu juga sedang meminta investor sebesar $100 juta. Khosla Ventures rupanya menganggap argumen itu meyakinkan.
Tesis: Keandalan Adalah Masalah yang Belum Terpecahkan
Scaled Cognition, sebuah laboratorium AI di Mountain View, berhasil menutup putaran Series A senilai $100 juta yang dipimpin oleh Khosla Ventures, dengan The Wall Street Journal melaporkan valuasi sekitar $750 juta, sebagaimana dikutip oleh The Next Web. Argumen intinya bukan bahwa model bahasa besar yang ada sekarang itu bodoh. Melainkan bahwa model-model tersebut tidak andal dengan cara yang secara struktural menyulitkan penerapannya di mana pun kesalahan membawa biaya nyata. Menurut HyperAI, CEO perusahaan menggambarkan LLM saat ini seperti "jenius skizofren": sangat mampu sesekali, namun salah secara tak terduga di waktu lainnya. Framing itu cukup blak-blakan hingga hampir terasa tidak sopan bagi setiap lab AI lain yang kini sedang menghabiskan daya komputasi, tetapi juga merupakan deskripsi yang wajar tentang apa yang sebenarnya dialami pembeli enterprise ketika mereka mencoba menyambungkan LLM ke dalam alur kerja yang tidak bisa mentoleransi bahkan tingkat halusinasi yang kecil sekalipun.
Respons arsitektur yang diusulkan Scaled Cognition bukan model dasar yang lebih besar. Menurut HyperAI, perusahaan ini menekankan jalur penalaran deterministik, lapisan validasi yang ditingkatkan, dan ketergantungan yang lebih rendah pada generasi stokastik. Dalam bahasa sederhana: mereka mencoba membangun sistem yang dapat memverifikasi outputnya sendiri sebelum menampilkannya, alih-alih mengambil sampel dari distribusi probabilitas dan berharap hasilnya benar. Apakah hal itu dapat dicapai pada skala produksi adalah pertanyaan bernilai miliaran dolar (enfin, $750 juta secara teknis). Liputan National Law Review atas siaran pers tersebut mengonfirmasi bahwa putaran pendanaan ditutup pada 25 Juni 2026, dan memposisikan penggalangan dana ini secara eksplisit di sekitar pembangunan "AI enterprise yang andal."
Apa yang Sebenarnya Dilakukan APT
Produknya disebut APT, atau Agentic Pretrained Transformer, dan namanya saja sudah memberi tahu kamu sesuatu tentang positioning strategis mereka. Framing "agentic" berarti Scaled Cognition tidak menjual model yang kamu panggil lewat API dan berharap berperilaku benar; mereka menjual arsitektur yang dirancang untuk beroperasi dalam alur kerja multi-langkah di mana sistem perlu mengambil tindakan, memeriksa hasil, dan pulih dari kesalahan tanpa melibatkan manusia untuk setiap keputusan. Itu berbeda secara bermakna dari membungkus model dasar dalam sebuah for-loop dan menyebutnya agen (sebuah teknik yang sejarahnya lebih panjang dari yang diakui sebagian siaran pers belakangan ini).
The Next Web melaporkan bahwa Scaled Cognition sudah berjalan di produksi bersama setidaknya satu perusahaan Fortune 500, yang entah merupakan kalimat terpenting dalam artikel ini atau klaim yang sangat tepat waktu, tergantung bagaimana kamu membaca perjanjian pilot enterprise. Penerapan produksi lebih penting di sini dibanding kebanyakan pengumuman AI, justru karena tesisnya adalah tentang keandalan: sistem yang mengklaim tidak berhalusinasi harus membuktikannya di suatu tempat yang nyata sebelum klaimnya berarti apa-apa. Penerapan di Fortune 500 adalah bukti keseriusan yang wajar, meski detailnya belum diungkapkan.
Konteks Kompetitif
Ada baiknya dicatat apa yang bukan merupakan Scaled Cognition. Nama tersebut menimbulkan kebingungan nyata karena Cognition AI, perusahaan terpisah yang berfokus pada agen pengkodean, berhasil menggalang $400 juta pada valuasi $10,2 miliar, sebagaimana dilaporkan oleh Tech Funding News. Dua perusahaan dengan nama serupa dan positioning agentic yang tumpang tindih adalah hal yang membuat proses uji tuntas menjadi menarik. Scaled Cognition adalah yang lebih kecil, lebih awal, dan lebih berfokus pada keandalan enterprise dari keduanya; Cognition AI adalah yang membangun agen pengkodean dan mengantongi valuasi sekitar 13 kali lebih besar.
Pertanyaan kompetitif yang lebih luas adalah apakah keandalan-sebagai-arsitektur merupakan keunggulan yang tahan lama atau sekadar fitur yang pada akhirnya akan diserap oleh lab-lab besar. OpenAI, Anthropic, dan Google semuanya telah berinvestasi besar dalam mengurangi tingkat halusinasi melalui RLHF, constitutional AI, dan teknik grounding. Argumen tandingan Scaled Cognition, yang tersirat dalam liputan HyperAI, adalah bahwa pendekatan-pendekatan tersebut hanya memperbaiki sistem probabilistik secara marginal; mereka tidak mengubah arsitektur fundamental. Jalur penalaran deterministik dan lapisan validasi eksplisit adalah filosofi desain yang berbeda, bukan sekadar satu sesi fine-tuning. Itu adalah tesis yang koheren. Namun juga merupakan jenis tesis yang terdengar sangat meyakinkan sampai saat kompetitor yang memiliki sumber daya besar memutuskan untuk menerapkan ide yang sama dalam skala besar.
Apa yang Perlu Diperhatikan para Pembangun
Bagi para engineer yang mengevaluasi infrastruktur AI enterprise, penggalangan dana Scaled Cognition adalah sinyal yang berguna tentang di mana uang institusional melihat hambatan sesungguhnya berada. Argumen bahwa kemampuan bukan lagi kendalanya, melainkan keandalan dan prediktabilitas, selaras dengan apa yang dilaporkan sebagian besar engineer ML ketika mereka mencoba memindahkan demo ke produksi. Kamu bisa membuat model melakukan hal-hal mengesankan dalam sebuah notebook. Membuat model melakukan hal-hal mengesankan yang sama secara konsisten, dapat diaudit, dan tanpa seorang manusia yang meninjau setiap output adalah masalah rekayasa yang sama sekali berbeda.
Penggalangan dana $100 juta pada valuasi $750 juta, mengutip The Wall Street Journal sebagaimana dikutip The Next Web, berarti Scaled Cognition memiliki landasan pacu yang nyata untuk membuktikan tesis APT di lingkungan produksi di luar keterlibatan awal Fortune 500. Hal yang perlu diperhatikan selama 12 hingga 18 bulan ke depan bukan entri papan peringkat tolok ukur lainnya; melainkan apakah perusahaan dapat mempublikasikan metrik keandalan yang dapat direproduksi dari penerapan langsung, dan apakah jumlah pelanggan Fortune 500 bertambah. Jika tesisnya benar, buktinya akan ada pada tingkat kesalahan, bukan jumlah parameter.
Sebuah perusahaan AI yang bertaruh bahwa AI saat ini terlalu tidak andal untuk digunakan adalah entah tawaran paling jujur di industri ini atau yang paling tepat waktunya. Mungkin keduanya.
