O quanto o Jalapeno é mais barato em comparação com as GPUs de IA padrão?

O CEO da Broadcom, Hock Tan, citou publicamente uma economia de custos de aproximadamente 50% em comparação com GPUs de IA típicas, de acordo com o AI Weekly. Este é o primeiro número concreto de custo divulgado por qualquer uma das empresas.

Quanto tempo levou para construir o chip Jalapeno?

De acordo com o Tom's Hardware, o chip passou do conceito ao tape-out em nove meses, um ritmo descrito como ultrarrápido para um ASIC do tamanho de um reticle. Os próprios modelos de IA da OpenAI teriam ajudado a acelerar o design e a otimização do chip durante esse período.

Quem são os parceiros envolvidos na construção do Jalapeno?

A OpenAI projetou o chip com base em seus requisitos de inferência de LLM. A Broadcom ficou responsável pela implementação do chip e pela rede de alto desempenho, enquanto a Celestica gerenciou a integração de placas e sistemas de rack, além dos sistemas de produção em escala, conforme o DBTA.

O Jalapeno faz parte de um plano de infraestrutura maior da OpenAI?

Sim. A OpenAI e a Broadcom anunciaram uma colaboração estratégica em outubro de 2025 com o objetivo de implantar 10 gigawatts de aceleradores de IA projetados pela OpenAI. O Jalapeno é o primeiro chip do que ambas as empresas descrevem como uma plataforma de computação de múltiplas gerações.

1 / 1

OpenAI Broadcom Chip Jalapeno Inferência de IA Silício Personalizado Infraestrutura de IA ASIC breaking-news

Hallucination Free Hoje

In this article (4)

Circuito integrado de aplicação específica ## O que é um circuito integrado de aplicação específica? Um circuito integrado de aplicação específica (ASIC, do inglês *Application-Specific Integrated Circuit*) é um chip de computador projetado para realizar uma tarefa específica, em vez de ser um processador de uso geral. Ao contrário de chips como a CPU do seu computador — que pode executar qualquer tipo de software — um ASIC é construído para fazer uma única coisa com extrema eficiência. ## Por que usar um ASIC? Os ASICs oferecem grandes vantagens quando você precisa executar a mesma operação bilhões de vezes com velocidade máxima e consumo mínimo de energia. Isso os torna ideais para: - Processamento de sinais de rede em roteadores e switches - Codificação e decodificação de vídeo em TVs e câmeras - Mineração de criptomoedas - Processamento de pagamentos em terminais de ponto de venda - Funções de segurança em smartphones ## Como os ASICs são projetados A criação de um ASIC envolve várias etapas: 1. **Especificação** — Os engenheiros definem exatamente o que o chip precisa fazer. 2. **Design em RTL** — O comportamento do circuito é descrito usando uma linguagem de descrição de hardware, como VHDL ou Verilog. 3. **Síntese** — O software converte essa descrição em um diagrama de circuito lógico. 4. **Layout** — O circuito lógico é mapeado em componentes físicos no chip. 5. **Fabricação** — O design é enviado a uma foundry (fábrica de semicondutores) para ser produzido em silício. 6. **Teste** — Cada chip é verificado para garantir que funciona corretamente. ## ASICs versus outras soluções de chips | Tipo de chip | Flexibilidade | Velocidade | Consumo de energia | Custo inicial | |---|---|---|---|---| | CPU de uso geral | Alta | Moderada | Moderado | Baixo | | FPGA | Média | Alta | Moderado | Médio | | ASIC | Baixa | Muito alta | Muito baixo | Alto | Um **FPGA** (*Field-Programmable Gate Array*) é um tipo de chip intermediário — ele pode ser reprogramado após a fabricação, o que o torna mais flexível do que um ASIC, porém menos eficiente. As empresas frequentemente usam FPGAs para testar um design antes de investir na fabricação cara de um ASIC. ## O custo de fabricar um ASIC Desenvolver um ASIC personalizado pode custar de centenas de milhares a dezenas de milhões de dólares, considerando as taxas de design e fabricação. Por esse motivo, os ASICs geralmente fazem sentido financeiro apenas quando você planeja produzir um grande número de unidades — porque o alto custo inicial se dilui ao longo de milhões de chips vendidos. ## Exemplos do mundo real - **Apple Silicon (M1, M2, M3)** — Os chips da Apple para Mac e iPad são ASICs altamente customizados, otimizados para o software da Apple. - **Google TPU** — A Unidade de Processamento de Tensores (*Tensor Processing Unit*) do Google é um ASIC projetado especificamente para acelerar cargas de trabalho de aprendizado de máquina. - **Chips de mineração de Bitcoin** — Os mineradores usam ASICs construídos exclusivamente para calcular hashes SHA-256, o algoritmo central da mineração de Bitcoin. ## Pontos principais - Um ASIC faz uma coisa, mas faz com excepcional eficiência. - O alto custo de desenvolvimento é compensado por melhor desempenho e menor consumo de energia em produção de alto volume. - Os ASICs estão presentes em praticamente todos os dispositivos eletrônicos modernos, muitas vezes nos bastidores, realizando tarefas críticas de forma invisível.

OpenAI Criou Seu Próprio Chip. Veja Por Que Essa Aposta É Maior Do Que Parece.

Key Takeaways

A economia de custos de ~50% do Jalapeno em relação às GPUs, citada pelo CEO da Broadcom Hock Tan, é o argumento central de negócio para a OpenAI possuir seu próprio silício de inferência em vez de alugar computação de uso geral.
ASICs trocam flexibilidade por eficiência; o Jalapeno é ajustado especificamente para inferência de LLM, o que significa que vence em custo em escala, mas não consegue se adaptar facilmente caso os padrões de inferência mudem.
A parceria OpenAI-Broadcom-Celestica divide o design do chip, a implementação do silício e os sistemas de produção entre três especialistas — um modelo que vale ser estudado por qualquer pessoa que esteja construindo infraestrutura de IA em escala.

What Jalapeno Actu…The Cost Argument …The Partnership St…What Builders Shou…

Hallucination Free · Hoje

Jalapeno, o primeiro ASIC de inferência personalizado da OpenAI, desenvolvido em parceria com a Broadcom, troca flexibilidade por custo e controle na escala de LLMs.

Jalapeño, o primeiro ASIC de inferência personalizado da OpenAI desenvolvido com a Broadcom, troca flexibilidade por custo e controle na escala de LLMs.

Os H100s da Nvidia são para a infraestrutura de IA o que o tema padrão do WordPress é para o design de sites: perfeitamente funcionais, amplamente utilizados, e um sinal de que alguém ainda não pensou muito sobre suas restrições específicas. A OpenAI, que pensou bastante sobre suas restrições específicas, acaba de anunciar que tem um plano diferente. Conheça o Jalapeno, o primeiro chip de inferência personalizado da OpenAI, desenvolvido com a Broadcom e otimizado do zero para inferência de modelos de linguagem de grande escala.

What Jalapeno Actually Is

Jalapeno is an ASIC, an application-specific integrated circuit, which means it is deliberately not a general-purpose accelerator. Where a GPU is a Swiss Army knife that handles training, inference, graphics, and whatever else you throw at it, an ASIC is a single very sharp blade. According to the official announcement from OpenAI, the chip was designed around OpenAI's deep understanding of LLM fundamentals, informed by its roadmap of models, kernels, serving systems, and product needs. That last part is worth pausing on: this chip is shaped by the same team that decides what models get built and how they get served. The architectural feedback loop is extremely short. Per reporting from DBTA, engineering samples of Jalapeno are already running ML workloads in the lab at production target frequency and power, including GPT-5.3-Codex-Spark, which is either an encouraging sign of real progress or a very specific detail chosen to make investors feel good. Probably both. According to Tom's Hardware, the chip went from concept to tape-out in nine months, a pace the report describes as ultra-fast for a reticle-sized ASIC. OpenAI's own AI models reportedly accelerated chip design and optimization during that window, which means Jalapeno is, in a pleasingly recursive way, an AI product that was partly designed by AI.

The Cost Argument Is the Whole

Argument Custom silicon stories usually come dressed in performance benchmarks and architectural diagrams, but the real argument is almost always economic. According to AI Weekly, Broadcom CEO Hock Tan publicly cited roughly 50% cost savings compared to typical AI GPUs, making that the first concrete cost figure from either company. For a business running inference at the scale OpenAI operates, a 50% reduction in compute cost is not a footnote; it is the entire business case for the nine-month sprint, the multi-year partnership, and the organizational overhead of becoming, in effect, a chip company. The ASIC tradeoff is real and worth naming clearly. General-purpose GPUs earn their premium partly through flexibility: you can retrain, fine-tune, experiment, and pivot workloads without redesigning silicon. An ASIC bets that your inference patterns are stable enough that specialization pays. OpenAI is making that bet explicitly, and AI Weekly notes that Jalapeno is narrowly tuned for LLM inference, trading adaptability for cost and efficiency at scale. If LLM serving patterns shift dramatically, the chip does not shift with them. That is the risk embedded in the savings number.

The Partnership Structure Behind

the Chip Jalapeno is not a solo project. According to DBTA, OpenAI designed the chip from scratch around its LLM fundamentals, while Broadcom and Celestica handled chip implementation, board and rack system integration, high-performance networking, and scalable production systems. That division of labor matters: OpenAI brings the model knowledge and inference requirements; Broadcom brings the silicon execution experience; Celestica industrializes the physical stack. It is a clean separation of what each party actually does well, which is rarer in tech partnerships than the press releases imply. The strategic collaboration predates this chip announcement by several months. According to OpenAI's own announcement from October 2025, the companies had already committed to deploying 10 gigawatts of OpenAI-designed AI accelerators as part of a multi-year partnership covering accelerator and network systems for next-generation AI clusters. Jalapeno is the first product materializing from that commitment, not a standalone announcement. It is generation one of a stated multi-generation compute platform, per the Broadcom investor release.

What Builders Should Actually Watch

For anyone thinking about AI infrastructure beyond the immediate project in front of them, the Jalapeno announcement carries a structural signal worth tracking. OpenAI is explicitly betting that owning the inference layer, not just renting GPU time, is how you control cost and latency at scale. That logic does not require you to build your own chip; it does require you to think about where your inference costs go as usage scales, and whether the flexibility premium you are paying for general-purpose hardware is actually buying you anything useful. The 10-gigawatt deployment target from the October 2025 collaboration announcement suggests OpenAI is not treating Jalapeno as a hedge. It is a primary infrastructure direction. For the rest of the AI builder ecosystem, the interesting downstream question is whether Broadcom's experience co-designing this platform eventually produces inference silicon options that aren't exclusive to OpenAI. That has not been announced. But the design patterns, the nine-month tape-out process reportedly accelerated by AI models, and the layered partnership model between model owner, chip designer, and systems integrator are all things worth watching as other large inference operators face the same cost math.

Fontes

Questions & answers

O Jalapeno é o primeiro chip de inferência de IA personalizado da OpenAI, um ASIC desenvolvido em colaboração com a Broadcom e projetado especificamente para cargas de trabalho de inferência de modelos de linguagem de grande porte. Amostras de engenharia já estão executando cargas de trabalho de ML no laboratório, incluindo o GPT-5.3-Codex-Spark.