Dans cet article (4)
La valorisation annoncée de 5 milliards de dollars d’Etched et son milliard de dollars de ventes de puces d’IA mettent le silicium d’inférence spécialisé à l’épreuve face à Nvidia
Points clés
- Évaluez les puces spécialisées en fonction de votre charge de travail d’inférence réelle, et non de grands benchmarks spectaculaires.
- Surveillez la migration logicielle et la fiabilité de l’approvisionnement ; la vitesse du silicium à elle seule ne remplace pas l’écosystème de Nvidia.
- Considérez les ventes rapportées d’Etched comme un signal d’intérêt des acheteurs, et non comme la preuve que les GPU sont soudainement obsolètes.
La bonne question n’est pas de savoir si Etched fait du bruit, mais si du matériel spécialisé pour les transformers peut rendre l’inférence suffisamment peu coûteuse pour compter.
La question utile n’est pas de savoir si Etched fait parler de lui, mais si un matériel spécialisé pour transformeurs peut rendre l’inférence suffisamment peu coûteuse pour compter.
1 milliard de dollars de ventes déclarées de puces d’IA, ce n’est pas un tour d’honneur. C’est un reçu, ou du moins le genre de reçu qui pousse les équipes d’infrastructure à arrêter de faire défiler avec angoisse les graphiques de disponibilité des accélérateurs et à se redresser sur leur chaise. Yahoo Finance a rapporté que le concurrent de Nvidia, Etched, a atteint une valorisation de 5 milliards de dollars et 1 milliard de dollars de ventes pour sa puce d’IA, ce qui fait passer l’entreprise du statut de présentation intéressante à celui d’expérience en conditions réelles. Cette expérience est simple à formuler et pénible à évaluer, ce qui prouve qu’elle appartient bien au monde de l’infrastructure d’IA. Du matériel d’inférence spécialisé peut-il rivaliser avec la domination des accélérateurs généralistes de Nvidia lorsque la charge de travail est prévisible ? Je laisserai à Theo le combat en cage autour du plan d’implantation des transistors, mais du point de vue du ML, c’est le bon affrontement : l’inférence, c’est là que les modèles deviennent des factures, des budgets de latence et des réunions d’achat sous lumière fluorescente.
Ce qui s’est passé, selon Yahoo Finance
Yahoo Finance a rapporté qu’Etched a atteint une valorisation de 5 milliards de dollars et 1 milliard de dollars de ventes pour sa puce d’IA. Un autre article de Yahoo Finance a indiqué qu’Etched avait levé 800 millions de dollars alors que la course aux puces d’IA s’intensifiait. Ces chiffres ne doivent pas être mixés en un grand smoothie de méga-chiffres ; ils décrivent des signaux différents — valorisation, ventes et capital — chacun utile à sa manière. Le chiffre des ventes est le plus intéressant pour les bâtisseurs. Les valorisations peuvent léviter en présence d’une humidité PowerPoint suffisante, mais des ventes de puces déclarées suggèrent que des clients sont au moins prêts à parier en dehors du chemin par défaut de Nvidia. Cela ne signifie pas qu’Etched a battu Nvidia. Cela signifie que le marché est suffisamment sous pression à cause du coût de l’inférence, de la disponibilité et des contraintes de passage à l’échelle pour essayer une voie spécialisée.
TechCrunch affirme que l’étroitesse est le produit
TechCrunch a décrit Etched comme construisant une puce d’IA qui n’exécute qu’un seul type de modèle : les modèles transformer. Cela semble absurde jusqu’à ce que l’on se souvienne que la spécialisation a toujours été la façon dont le matériel est devenu rapide, des codecs vidéo aux mineurs de bitcoin, jusqu’au grille-pain qui n’a exactement qu’un seul travail et parvient malgré tout à brûler le bagel. Le pari d’Etched est que l’inférence des transformers restera suffisamment stable et précieuse pour justifier l’ancrage de cette charge de travail dans le silicium. L’avantage est simple : si vous retirez de la flexibilité, vous pouvez souvent économiser de l’énergie, simplifier l’exécution et viser un meilleur débit pour la charge cible. L’inconvénient est tout aussi simple : si la charge de travail change, votre élégant accélérateur devient un monument très coûteux aux choix d’architecture de l’année dernière. C’est le problème de la machine à omelettes. Elle prépare des omelettes avec une efficacité terrifiante, jusqu’au moment précis où tout le monde commande des nouilles.
SiliconANGLE situe le défi plus large face à Nvidia
SiliconANGLE a présenté Etched.ai et Cerebras Systems comme des licornes des puces d’IA recevant un coup de pouce financier tout en visant Nvidia. C’est important, car Etched n’est pas seule à soutenir que le GPU ne devrait pas être la réponse par défaut à chaque question de calcul en IA. Le marché au sens large teste si le silicium spécialisé par charge de travail peut se tailler des niches durables pendant que Nvidia continue de faire briller sa couronne d’accélérateur généraliste jusqu’à obtenir un poli miroir. Le plus difficile n’est pas seulement de fabriquer une puce rapide. L’avantage de Nvidia, c’est aussi le logiciel, la familiarité des développeurs, les schémas de déploiement et toute la machinerie opérationnelle ennuyeuse qui rend les accélérateurs utilisables à grande échelle. Le silicium spécialisé doit gagner suffisamment en coût ou en performance pour compenser la douleur de la migration, parce que personne n’a envie de réécrire une infrastructure de service pour un gain de vitesse marginal et un sweat à capuche commémoratif.
Ce que les lecteurs devraient surveiller ensuite
Après la valorisation déclarée de 5 milliards de dollars et le chiffre de 1 milliard de dollars de ventes rapportés par Yahoo Finance, le prochain signal utile n’est pas un autre gros titre de financement. Regardez si les clients d’Etched passent de l’intérêt à des déploiements répétés, si les contraintes « transformer uniquement » restent acceptables, et si la pile logicielle donne à la migration l’impression de faire de l’ingénierie plutôt que de l’archéologie. Si vous exécutez des charges de travail fortement axées sur l’inférence, la conclusion pratique est de faire des benchmarks avec la forme réelle de votre propre trafic, et non avec le graphique qui utilise la police la plus dramatique. Etched est utile parce qu’elle rend le débat sur les puces d’IA testable. Si le silicium d’inférence spécialisé fonctionne, cela se verra dans des coûts de service plus bas, un meilleur débit et des acheteurs prêts à tolérer moins de flexibilité. Sinon, nous aurons appris que la plus grande qualité du GPU n’était pas sa généralité, mais la réticence de tous les autres à être suffisamment étranges pendant suffisamment longtemps.
