
Dans cet article (4)
Sakana AI's RSI Lab pense que l'IA auto-améliorante pourrait rendre obsolète la construction de centres de données à 100 milliards de dollars
Points clés
- Le laboratoire RSI de Sakana AI unifie six projets de recherche réels, notamment la Machine de Darwin Godel et The AI Scientist, en un programme formel visant à rendre le développement de l'IA auto-améliorant plutôt que simplement gourmand en calcul.
- Le pari central est que l'auto-amélioration par effet cumulatif peut se substituer à la mise à l'échelle par la force brute, remettant directement en question l'hypothèse selon laquelle les progrès de l'IA de pointe nécessitent des dépenses en capital massives.
- Pour les apprenants en apprentissage automatique, l'optimisation des préférences, les algorithmes évolutionnaires et les pipelines de recherche automatisés sont les domaines techniques à surveiller dans ce laboratoire, tous avec une pertinence croissante sur le marché du travail.
Une startup basée à Tokyo vient de parier officiellement que l'auto-amélioration par accumulation progressive surpasse la mise à l'échelle par la force brute, et elle dispose de deux ans de recherche pour étayer cette affirmation.
Une startup basée à Tokyo vient de parier officiellement que l'amélioration de soi par effet cumulatif surpasse la mise à l'échelle par la force brute, et elle dispose de deux ans de recherche pour étayer cette affirmation.
Imaginez deux chemins vers une IA plus intelligente. Premier chemin : dépenser 100 milliards de dollars en centres de données, acheter tous les GPU disponibles sur trois continents et faire évoluer le modèle jusqu'à ce qu'il s'améliore. Deuxième chemin : apprendre à l'IA à se redéfinir elle-même, puis laisser l'effet cumulatif faire son œuvre. La majeure partie de l'industrie sprinte sur le premier chemin. Sakana AI, la startup basée à Tokyo dirigée par le co-fondateur et PDG David Ha, vient de s'engager formellement sur le deuxième.
Ce qu'est vraiment le laboratoire RSI
Sakana AI a lancé le Sakana AI Recursive Self-Improvement (RSI) Lab, un groupe de recherche dédié basé à Tokyo avec pour mission de repenser le processus de développement de l'IA lui-même en utilisant l'IA, selon l'annonce officielle publiée sur sakana.ai. La thèse du laboratoire est simple à énoncer, mais véritablement difficile à mettre en œuvre : plutôt que de s'appuyer sur une mise à l'échelle par la force brute, il s'agit de construire des systèmes qui s'améliorent de manière itérative, créant un cycle cumulatif de gains en capacités sans augmentation proportionnelle des dépenses de calcul. Dans son annonce, l'entreprise présente cette contrainte propre au Japon comme un avantage stratégique, en faisant une analogie avec la domination manufacturière japonaise, obtenue non pas grâce à l'abondance de ressources naturelles, mais grâce à la philosophie de l'amélioration continue et cumulative sur le plancher d'usine. C'est le genre de récit fondateur qui semble avoir été peaufiné autour d'un bol de ramen, mais la lignée de recherche sous-jacente est bien réelle. Le laboratoire n'est pas une idée tombée du ciel. Comme le rapporte The Decoder, Sakana a passé les deux dernières années à poser les fondations techniques du RSI, et le nouveau laboratoire formalise ce travail en un groupe unique et ciblé. La page de recrutement pour le poste de Membre du Personnel Technique (RSI Lab) décrit le groupe comme étant « chargé de repenser le processus de développement de l'IA lui-même avec l'IA » et travaillant directement avec le PDG David Ha, Sakana cherchant activement à renforcer ses ressources en recherche et ingénierie à Tokyo en vue de ce qu'il appelle une « explosion d'intelligence cumulative ».
Les recherches qui étayent cette affirmation
Avant d'acquiescer ou de lever les yeux au ciel, il vaut la peine de regarder sur quoi Sakana s'appuie concrètement. Selon l'annonce de l'entreprise sur sakana.ai et une analyse détaillée de The Decoder, le RSI Lab unifie six fils de recherche antérieurs.
LLM-Squared (LLM²) utilise des modèles de langage pour automatiser la recherche et inventer de meilleurs algorithmes d'optimisation des préférences. La Darwin Gödel Machine permet à des agents de réécrire de manière autonome leur propre base de code, doublant apparemment les performances en ingénierie logicielle. ShinkaEvolve se concentre sur l'évolution de programmes hyper-efficace en termes d'échantillons, construisant de nouvelles fonctions de perte pour les modèles Mixture-of-Experts. ALE-Agent permet à des agents de renforcement de surpasser des centaines d'experts humains grâce à l'auto-apprentissage. Digital Red Queen explore la coévolution adversariale ouverte comme base du RSI en cybersécurité. Et The AI Scientist, le plus en vue du lot, vise l'automatisation de bout en bout de la recherche en IA et a récemment été publié dans Nature, selon l'annonce de sakana.ai.
Chacun de ces projets est un véritable artefact de recherche, pas seulement un diaporama. La Darwin Gödel Machine en particulier est le genre de chose qui fait faire une double prise aux chercheurs en ML : un système qui génère, teste et fait évoluer des variantes de sa propre base de code, comme le note The Decoder. Ce n'est pas une métaphore de l'auto-amélioration. C'est littéralement un agent qui modifie son propre code et exécute le résultat.
Pourquoi l'efficacité de calcul est le vrai argument ici
Le chiffre de 100 milliards de dollars n'est pas une simple figure rhétorique. Il reflète la trajectoire réelle des dépenses en infrastructure d'IA de pointe, et la contre-thèse de Sakana est qu'un laboratoire opérant sous des contraintes de ressources — comme Sakana le présente explicitement pour sa base tokyoïte — est contraint de trouver des voies plus intelligentes vers la capacité, plutôt que de simplement les élargir. L'institut de recherche d'Anthropic a lui-même noté séparément que l'IA accélère déjà le développement des systèmes d'IA, en citant des données internes montrant que les ingénieurs d'Anthropic livrent significativement plus de code par trimestre à mesure que les outils d'IA s'améliorent, selon l'analyse de l'Anthropic Institute sur l'auto-amélioration récursive. Il s'agit d'une organisation différente faisant une observation structurellement similaire : l'automatisation du développement de l'IA se produit déjà à plus petite échelle, et la trajectoire mérite d'être suivie.
Pour les apprenants qui réfléchissent aux lois d'échelle, la distinction conceptuelle importante ici est entre l'échelle comme nom (plus de calcul, plus de paramètres, plus de données) et l'échelle comme verbe (un processus qui se cumule sur lui-même). Le RSI est un pari sur la seconde acception. La question de savoir si elle peut totalement se substituer à la première reste, pour le dire avec bienveillance, une question de recherche ouverte. L'article de Wikipédia sur l'auto-amélioration récursive note que le concept a une longue histoire théorique, et l'écart entre un système qui améliore une capacité étroite et un système qui améliore de manière récursive le développement général de l'IA est considérable.
Ce que cela signifie si vous apprenez le ML en ce moment Si vous étudiez
le machine learning, ce lancement est une occasion utile de réfléchir simultanément à deux aspects. Premièrement, les concepts techniques : l'optimisation des préférences, les algorithmes évolutionnaires, les agents générateurs de code et les pipelines de recherche automatisés sont tous des domaines de recherche actifs avec une vraie pertinence sur le marché de l'emploi, et le portefeuille RSI de Sakana les touche tous. La Darwin Gödel Machine et The AI Scientist méritent d'être lus comme des articles de recherche, pas seulement comme des communiqués de presse. Deuxièmement, le cadrage stratégique : le débat entre calcul et efficacité façonne l'orientation des financements de recherche et des talents, et comprendre les deux côtés fait de vous un praticien plus éclairé.
Le RSI Lab de Sakana en est à ses débuts, les ambitions sont grandes, et la distance entre « agents qui améliorent des tâches spécifiques » et « systèmes qui pilotent de manière autonome le progrès général de l'IA » est réelle et non résolue. Mais les fils de recherche unifiés ici sont légitimes, le laboratoire recrute, et la question fondamentale posée — l'auto-amélioration cumulative peut-elle accomplir ce que la mise à l'échelle par la force brute accomplit à une fraction du coût — est l'un des problèmes ouverts les plus intéressants du domaine.
Suivez la Darwin Gödel Machine et The AI Scientist pour les articles de suivi. C'est là que les preuves s'accumuleront.
L'hypothèse la plus coûteuse dans l'IA en ce moment est que l'intelligence nécessite un capital infini. Sakana construit une référence pour l'autre côté de cet argument.