Atualizações da Nvidia na Conferência de Desenvolvedores
Introdução
O discurso de abertura do CEO da Nvidia, Jensen Huang, durante o evento anual para desenvolvedores realizado na segunda-feira, trouxe anúncios de novos produtos e insights sobre as perspectivas de receita da empresa.
Novo Chip de Inferência
Anúncio do Chip
Jensen apresentou o novo chip de inferência da Nvidia, desenvolvido com a tecnologia licenciada no final do ano passado da startup de chips de IA Groq, em um contrato avaliado em cerca de US$ 20 bilhões. Na sexta-feira, publicamos uma análise detalhada sobre a origem da Groq e a crescente competição que a Nvidia enfrenta na computação de inferência, que se refere ao uso diário de modelos de IA após o treinamento.
Evolução da Computação de IA
Embora as unidades de processamento gráfico (GPUs) da Nvidia sejam líderes no treinamento, a área de computação de IA está evoluindo, criando uma demanda por chips de inferência mais especializados. A tecnologia da Groq, que designa seus chips como unidades de processamento de linguagem (language processing units), é otimizada para tarefas específicas de inferência onde a velocidade é crucial, frequentemente referidas como de baixa latência.
Detalhes do Processador
A Nvidia denomina seu processador com a tecnologia da Groq de LPX, que estará disponível juntamente com a nova geração de chips chamada Vera Rubin, que será lançada ainda este ano. Vera se refere à CPU e Rubin à GPU, que sucederão a família Blackwell. O LPX já está em produção em larga escala na fabricante terceirizada Samsung e estará disponível em algum momento do terceiro trimestre.
A Nvidia fornecerá o chip de inferência em uma prateleira de servidor que contém 256 processadores LPX. O termo "prateleira" se refere a um computador em tamanho de gabinete, que inclui tanto os motores de "processamento" quanto a tecnologia de rede que conecta os chips. Um data center tem fileiras e mais fileiras de prateleiras de servidores. Jensen explicou que a ideia não é substituir completamente os servidores de GPU mais CPU da Nvidia para inferência, mas que ambos coexistam em um data center, colaborando para melhorar o desempenho.
Considerações sobre Tarefas
Jensen afirmou que o LPX não será necessário para todos os tipos de tarefas. Ele observou: "Se a maior parte da sua carga de trabalho for de alto rendimento, eu recomendaria manter apenas 100% Vera Rubin". Por outro lado, ele sugeriu que, se uma parte significativa da carga de trabalho envolver codificação e geração de tokens de engenharia de alto valor, a inclusão do Groq poderia ser benéfica, recomendando a adição de Groq em cerca de 25% do total do data center, sendo que o restante seria de servidores Vera Rubin. Esta abordagem, segundo ele, proporciona uma ideia de como integrar Groq ao Vera Rubin, aumentando seu desempenho e valor.
Futuras Versões
Jensen também indicou que versões novas e melhoradas do chip LPX estarão disponíveis nos próximos anos, consolidando sua presença no roadmap mais amplo da Nvidia, que incluirá novos CPUs, GPUs e tecnologia de rede. Como parte do acordo de licenciamento, a Nvidia contratou funcionários-chave da Groq, incluindo o cofundador e ex-CEO Jonathan Ross.
Consideramos que este chip de inferência é significativo e ajuda a Nvidia a enfrentar a concorrência emergente, incluindo iniciativas de chips internos como as unidades de processamento tensorial (TPUs) do Google, co-desenhadas pela Broadcom, além de outros fabricantes de chips, como a Advanced Micro Devices.
Visibilidade até 2027
Expectativas de Receitas
Jensen mencionou que a Nvidia espera que os pedidos para seus chips das gerações Blackwell e Vera Rubin totalizem US$ 1 trilhão até 2027, oferecendo uma perspectiva atualizada sobre a demanda futura nos próximos anos. Para contextualizar, é importante revisar o que foi apresentado anteriormente.
Durante uma conferência da Nvidia no outono passado, Jensen afirmou que a empresa possuía pedidos no valor de US$ 500 bilhões para seus chips Blackwell e Rubin, além de equipamentos de rede relacionados, até o final de 2026. Mais tarde, na teleconferência de resultados de fevereiro da Nvidia, a CFO Colette Kress indicou que a empresa estava percebendo um aumento em relação àquela oportunidade de receita de desempenho.
Reação do Mercado
Após o anúncio do número de US$ 1 trilhão na tarde de segunda-feira, as ações da Nvidia ganharam impulso, atingindo a marca de US$ 188,88, com um aumento de cerca de 4,8%. Porém, esse aumento não se sustentou, e as ações fecharam o dia a US$ 183,22, com uma alta de 1,65%.
Embora seja complexo determinar com precisão as razões pelas quais o mercado se comporta de determinadas maneiras, parece que, neste caso, os investidores e traders revisaram como essa divulgação de US$ 1 trilhão se comparam com o consenso de Wall Street e seus próprios modelos, concluindo que não estava tão acima do consenso quanto poderia parecer inicialmente.
Cronograma e Expectativas
Os comentários de Jensen devem contribuir para uma revisão das estimativas de receita do data center da Nvidia para 2027, assim como das estimativas de lucro. Entretanto, neste momento, a magnitude exata dessa revisão ainda não é clara. A Nvidia tem agendada uma sessão de perguntas e respostas com analistas financeiros para a terça-feira, o que pode ajudar a trazer mais clareza.
Jim Cramer também entrevistará Jensen na terça-feira, na CNBC, oferecendo mais oportunidades de esclarecimento. As declarações de Jensen provavelmente reforçarão a confiança nas estimativas para 2027 — investidores que estão preocupados com um possível fim dos gastos em IA devem se sentir mais aliviados agora que Jensen está discutindo a visibilidade da empresa até o próximo ano. A duração do crescimento do capital em IA tem sido um tópico de debate em relação às ações da Nvidia há vários anos, e até agora não houve sinais de desaceleração.
Comentários de Analistas
Em uma nota aos clientes na manhã de segunda-feira, antes do discurso de Jensen, analistas da Morgan Stanley abordaram a incerteza nas estimativas para 2027, ressaltando por que os comentários de Jensen são valiosos. A Morgan Stanley escreveu: "Quanto à questão da duração, a empresa geralmente tem dito as coisas certas, e temos visto validação por meio do ecossistema de que o investimento será persistente, incluindo comentários sobre hiperescalabilidade apenas na semana passada; nossa visão é que é uma questão de tempo até que os investidores comecem a se sentir confortáveis com a perspectiva para 2027."
Esse cenário ainda requer um mercado de capitais vibrante, que é o principal risco, mas esperamos que o entusiasmo por IA permaneça elevado e que as restrições de semicondutores impeçam que os investimentos atinjam níveis excessivos. O que Jensen apresentou na segunda-feira é exatamente o tipo de atualização que deve ajudar a criar essa confiança — mesmo que isso não ocorra imediatamente.
Fonte: www.cnbc.com


