En este artículo (4)
La valoración reportada de 5.000 millones de dólares de Etched y sus 1.000 millones de dólares en ventas de chips de IA ponen a prueba el silicio de inferencia especializado frente a Nvidia
Puntos Clave
- Evalúa los chips especializados frente a tu carga de trabajo real de inferencia, no frente al espectáculo de los benchmarks generales.
- Vigila la migración de software y la fiabilidad del suministro; la velocidad del silicio por sí sola no reemplaza el ecosistema de Nvidia.
- Trata las ventas reportadas de Etched como una señal de los compradores, no como prueba de que las GPU hayan quedado obsoletas de repente.
La pregunta útil no es si Etched hace mucho ruido, sino si el hardware de transformadores estrechos puede hacer que la inferencia sea lo bastante barata como para importar.
La pregunta útil no es si Etched hace ruido, sino si el hardware de transformadores especializado puede hacer que la inferencia sea lo bastante barata como para importar.
$1B en ventas reportadas de chips de IA no es una vuelta de la victoria. Es un recibo, o al menos el tipo de recibo que hace que los equipos de infraestructura dejen de desplazarse con pesimismo por los gráficos de disponibilidad de aceleradores y se sienten más erguidos. Yahoo Finance informó que Etched, competidor de Nvidia, alcanzó una valoración de $5B y $1B en ventas de su chip de IA, lo que convierte a la empresa de una presentación interesante en un experimento en vivo. Ese experimento es fácil de enunciar y molesto de evaluar, que es como sabes que pertenece a la infraestructura de IA. ¿Puede el hardware de inferencia especializado competir con el dominio de los aceleradores de propósito general de Nvidia cuando la carga de trabajo es predecible? Le dejaré a Theo el combate en la jaula del plano de transistores, pero desde el lado del ML, esta es la pelea correcta: la inferencia es donde los modelos se convierten en facturas, presupuestos de latencia y reuniones de compras con iluminación fluorescente.
Qué ocurrió, según Yahoo Finance Yahoo
Finance informó que Etched alcanzó una valoración de $5B y $1B en ventas de su chip de IA. Otro informe de Yahoo Finance dijo que Etched recaudó $800 millones mientras la carrera de chips de IA se intensificaba. Esas cifras no deberían mezclarse en un batido de megacifra; describen señales diferentes —valoración, ventas y capital—, cada una útil a su manera. La cifra de ventas es la más interesante para quienes construyen. Las valoraciones pueden levitar en presencia de suficiente humedad de PowerPoint, pero las ventas de chips reportadas sugieren que los clientes al menos están dispuestos a apostar fuera del camino predeterminado de Nvidia. Eso no significa que Etched haya vencido a Nvidia. Significa que el mercado está lo bastante presionado por el costo de inferencia, la disponibilidad y la presión de escalado como para probar una vía especializada.
TechCrunch dice que la estrechez es el producto
TechCrunch describió a Etched como una empresa que está construyendo un chip de IA que solo ejecuta un tipo de modelo: modelos transformer. Eso suena absurdo hasta que recuerdas que la especialización es la forma en que el hardware siempre se ha vuelto rápido, desde códecs de video hasta mineros de bitcoin y la tostadora que tiene exactamente un trabajo y aun así de algún modo quema el bagel. La apuesta de Etched es que la inferencia con transformers seguirá siendo lo suficientemente estable y valiosa como para justificar endurecer esa carga de trabajo en silicio. La ventaja es sencilla: si eliminas flexibilidad, a menudo puedes ahorrar energía, simplificar la ejecución y buscar mayor rendimiento para la carga de trabajo objetivo. La desventaja también es sencilla: si la carga de trabajo cambia, tu elegante acelerador se convierte en un monumento muy caro a las decisiones de arquitectura del año pasado. Este es el problema de la máquina de tortillas. Hace tortillas con una eficiencia aterradora, justo hasta que todo el mundo pide fideos.
SiliconANGLE enmarca el desafío más amplio a Nvidia
SiliconANGLE presentó a Etched.ai y Cerebras Systems como unicornios de chips de IA que reciben un gran impulso de financiación mientras apuntan a Nvidia. Eso importa porque Etched no es la única en sostener que la GPU no debería ser la respuesta predeterminada a toda pregunta de cómputo de IA. El mercado más amplio está explorando si el silicio específico para cargas de trabajo puede abrirse nichos duraderos mientras Nvidia mantiene la corona de aceleradores amplios pulida hasta dejarla como un espejo. La parte difícil no es solo fabricar un chip rápido. La ventaja de Nvidia también incluye software, familiaridad de los desarrolladores, patrones de despliegue y la maquinaria operativa aburrida que hace que los aceleradores sean utilizables a escala. El silicio especializado tiene que ganar lo suficiente en costo o rendimiento para compensar el dolor de migración, porque nadie quiere reescribir la infraestructura de serving por una mejora marginal de velocidad y una sudadera conmemorativa.
Qué deberían observar los lectores
a continuación Después de la valoración reportada por Yahoo Finance de $5B y la cifra de ventas de $1B, la próxima señal útil no es otro titular de financiación. Observa si los clientes de Etched pasan del interés a despliegues repetidos, si las limitaciones de solo transformers siguen siendo aceptables y si la pila de software hace que la migración se sienta como ingeniería en lugar de arqueología. Si ejecutas cargas de trabajo con mucha inferencia, la conclusión práctica es hacer benchmarks contra la forma de tu propio tráfico, no contra el gráfico que tenga la tipografía más dramática. Etched es útil porque hace que el debate sobre chips de IA sea comprobable. Si el silicio de inferencia especializado funciona, se verá en menores costos de serving, mejor rendimiento y compradores dispuestos a tolerar menos flexibilidad. Si no funciona, habremos aprendido que la mayor característica de la GPU no era la generalidad, sino la renuencia de todos los demás a ser lo suficientemente raros durante el tiempo suficiente.
