
En este artículo (4)
OpenAI construyó su propio chip. Por qué esa apuesta es más grande de lo que parece.
Puntos Clave
- El ahorro de costos de aproximadamente el 50% de Jalapeno frente a las GPU, citado por el CEO de Broadcom Hock Tan, es el argumento comercial central para que OpenAI posea su propio silicio de inferencia en lugar de alquilar cómputo de propósito general.
- Los ASIC intercambian flexibilidad por eficiencia; Jalapeno está ajustado específicamente para la inferencia de LLM, lo que significa que gana en costo a escala pero no puede adaptarse fácilmente si los patrones de inferencia cambian.
- La asociación OpenAI-Broadcom-Celestica divide el diseño de chips, la implementación de silicio y los sistemas de producción entre tres especialistas, un modelo que vale la pena estudiar para cualquiera que construya infraestructura de IA a escala.
Jalapeño, el primer ASIC de inferencia personalizado de OpenAI desarrollado con Broadcom, sacrifica flexibilidad a cambio de reducir costos y ganar control a escala de LLM.
Jalapeño, el primer ASIC de inferencia personalizado de OpenAI desarrollado con Broadcom, sacrifica flexibilidad a cambio de costo y control a escala de LLM.
Las H100 de Nvidia son para la infraestructura de IA lo que el tema predeterminado de WordPress es para el diseño web: perfectamente funcionales, ampliamente utilizadas, y una señal de que alguien todavía no ha pensado demasiado en sus restricciones específicas. OpenAI, que sí ha pensado mucho en las suyas, acaba de anunciar que tiene un plan diferente. Conoce Jalapeno, el primer chip de inferencia personalizado de OpenAI, construido con Broadcom y optimizado desde cero para la inferencia de modelos de lenguaje a gran escala.
Qué es realmente Jalapeno
Jalapeno es un ASIC, un circuito integrado de aplicación específica, lo que significa que deliberadamente no es un acelerador de propósito general. Mientras que una GPU es una navaja suiza que maneja entrenamiento, inferencia, gráficos y cualquier otra cosa que le encargues, un ASIC es una única hoja muy afilada. Según el anuncio oficial de OpenAI, el chip fue diseñado a partir de la comprensión profunda de OpenAI sobre los fundamentos de los LLM, informada por su hoja de ruta de modelos, kernels, sistemas de servicio y necesidades de producto. Vale la pena detenerse en ese último punto: este chip está moldeado por el mismo equipo que decide qué modelos se construyen y cómo se sirven. El ciclo de retroalimentación arquitectónica es extremadamente corto.
Según reportes de DBTA, las muestras de ingeniería de Jalapeno ya están ejecutando cargas de trabajo de ML en el laboratorio a la frecuencia y potencia objetivo de producción, incluyendo GPT-5.3-Codex-Spark, lo cual es una señal alentadora de progreso real o un detalle muy específico elegido para que los inversores se sientan bien. Probablemente ambas cosas. Según Tom's Hardware, el chip pasó del concepto al tape-out en nueve meses, un ritmo que el reporte describe como ultra-rápido para un ASIC del tamaño de un reticle. Los propios modelos de IA de OpenAI supuestamente aceleraron el diseño y la optimización del chip durante ese período, lo que significa que Jalapeno es, de manera agradablemente recursiva, un producto de IA que fue diseñado en parte por IA.
El argumento del costo lo es todo
Las historias de silicio personalizado suelen presentarse con benchmarks de rendimiento y diagramas de arquitectura, pero el argumento real es casi siempre económico. Según AI Weekly, el CEO de Broadcom, Hock Tan, citó públicamente un ahorro de costos de aproximadamente el 50% en comparación con las GPU de IA típicas, convirtiéndose en la primera cifra de costo concreta de cualquiera de las dos empresas. Para un negocio que ejecuta inferencia a la escala en la que opera OpenAI, una reducción del 50% en el costo de cómputo no es una nota al pie; es el argumento de negocio completo para el sprint de nueve meses, la asociación de varios años y la carga organizacional de convertirse, en efecto, en una empresa de chips.
El equilibrio que implica un ASIC es real y vale la pena nombrarlo claramente. Las GPU de propósito general justifican su precio en parte por su flexibilidad: puedes reentrenar, ajustar, experimentar y cambiar cargas de trabajo sin rediseñar el silicio. Un ASIC apuesta a que tus patrones de inferencia son lo suficientemente estables como para que la especialización valga la pena. OpenAI está haciendo esa apuesta de forma explícita, y AI Weekly señala que Jalapeno está estrechamente ajustado para la inferencia de LLM, intercambiando adaptabilidad por costo y eficiencia a escala. Si los patrones de servicio de LLM cambian drásticamente, el chip no cambia con ellos. Ese es el riesgo implícito en el número de ahorro.
La estructura de la asociación detrás del chip
Jalapeno no es un proyecto en solitario. Según DBTA, OpenAI diseñó el chip desde cero en torno a sus fundamentos de LLM, mientras que Broadcom y Celestica se encargaron de la implementación del chip, la integración de sistemas de placas y racks, las redes de alto rendimiento y los sistemas de producción escalables. Esa división del trabajo importa: OpenAI aporta el conocimiento de modelos y los requisitos de inferencia; Broadcom aporta la experiencia en ejecución de silicio; Celestica industrializa la pila física. Es una separación limpia de lo que cada parte realmente hace bien, algo más escaso en las asociaciones tecnológicas de lo que los comunicados de prensa dan a entender.
La colaboración estratégica precede a este anuncio del chip por varios meses. Según el propio anuncio de OpenAI de octubre de 2025, las empresas ya se habían comprometido a desplegar 10 gigavatios de aceleradores de IA diseñados por OpenAI como parte de una asociación de varios años que abarca sistemas de aceleradores y redes para clústeres de IA de próxima generación. Jalapeno es el primer producto que materializa ese compromiso, no un anuncio independiente. Es la generación uno de una plataforma de cómputo de múltiples generaciones declarada, según el comunicado para inversores de Broadcom.
Lo que los desarrolladores deberían realmente observar
Para cualquiera que piense en infraestructura de IA más allá del proyecto inmediato que tiene delante, el anuncio de Jalapeno lleva una señal estructural que vale la pena seguir. OpenAI está apostando explícitamente a que ser dueño de la capa de inferencia, no solo alquilar tiempo de GPU, es la manera de controlar el costo y la latencia a escala. Esa lógica no requiere que construyas tu propio chip; sí requiere que pienses en adónde van tus costos de inferencia a medida que el uso escala, y si la prima por flexibilidad que estás pagando por el hardware de propósito general realmente te está comprando algo útil.
El objetivo de despliegue de 10 gigavatios del anuncio de colaboración de octubre de 2025 sugiere que OpenAI no está tratando a Jalapeno como una cobertura. Es una dirección de infraestructura primaria. Para el resto del ecosistema de desarrolladores de IA, la interesante pregunta derivada es si la experiencia de Broadcom co-diseñando esta plataforma eventualmente produce opciones de silicio de inferencia que no sean exclusivas de OpenAI. Eso no ha sido anunciado. Pero los patrones de diseño, el proceso de tape-out de nueve meses supuestamente acelerado por modelos de IA, y el modelo de asociación en capas entre el propietario del modelo, el diseñador del chip y el integrador de sistemas son cosas que vale la pena seguir a medida que otros grandes operadores de inferencia enfrenten el mismo cálculo de costos.