Preocupações com a IA e a Resposta da Alphabet
A Alphabet abordou as preocupações de que a inteligência artificial poderia ameaçar seu império tecnológico Google. Uma de suas principais estratégias nesse desafio é o uso de chips de silício desenvolvidos internamente. As unidades de processamento tensorial (TPUs) criadas pela Google atuam como motor do chatbot Gemini, que, no último ano, melhorou a imagem da empresa em comparação a concorrentes como o ChatGPT da OpenAI. Além disso, essas chips são uma parte fundamental do rapidamente crescente negócio de computação em nuvem da Google, onde clientes — incluindo a startup de IA Anthropic — alugam acesso aos chips; em alguns casos, agora é possível adquirir TPUs para seus próprios data centers.
Parceria e Demanda no Mercado
A Google também estabeleceu uma nova joint venture de computação em IA com o gigante de gestão de ativos Blackstone, que se centraliza em torno das TPUs. A divisão de computação da Google está enfrentando uma forte demanda, com Wall Street projetando um aumento de aproximadamente 64% na receita da Google Cloud este ano, alcançando US$ 96 bilhões, de acordo com a FactSet. Analistas preveem uma expansão robusta até 2027, com crescimento estimado superior a 50%. Dada a crescente demanda por potência de computação de IA, as TPUs da Google estão sendo vistas como uma alternativa atraente às unidades de processamento gráfico (GPUs) da Nvidia, líder de mercado.
Esta posição beneficia tanto os esforços internos em IA da Google quanto ajuda a ganhar clientes externos — uma combinação lucrativa que contribui para a admiração de Jim Cramer pelas ações da empresa. Brad Gastwirth, chefe de pesquisa de mercado e inteligência de mercado da Circular Technology, uma empresa focada em infraestrutura de computação, afirmou que a Google "provavelmente é o concorrente mais subestimado da Nvidia".
Estágios Principais da Computação em IA
A computação em IA pode ser entendida a partir de duas etapas primárias:
Treinamento
Esta é a fase inicial. O treinamento ensina um modelo de IA, alimentando-o com enormes quantidades de dados para que ele possa aprender padrões e aprimorar suas respostas. É nesta fase que empresas desenvolvem grandes modelos de linguagem, como o Gemini. O treinamento exige uma enorme quantidade de poder de computação, tornando-se uma das partes mais caras da construção de sistemas de IA.
Inferência
Esse é o processo pelo qual um modelo de IA treinado faz previsões ou decisões com base em novos dados. A inferência é, em geral, menos pesada em termos computacionais em relação ao treinamento em uma base por tarefa. No entanto, uma vez que um modelo é implantado, a inferência teoricamente ocorre constantemente. Assim, os custos acumulados de inferência para um modelo podem superar os custos de treinamento ao longo de sua vida útil. De forma simples, o propósito do treinamento é aprender, enquanto o propósito da inferência é fazer previsões.
Características e Vantagens das TPUs
As TPUs são uma classe de chips conhecidos como circuitos integrados específicos de aplicação (ASICs). Gastwirth comparou os ASICs a um traje sob medida — mas, em vez de serem moldados para o corpo de uma pessoa, os processadores são projetados especificamente para certas tarefas. As TPUs são otimizadas para tarefas de aprendizado de máquina, como treinar modelos e executá-los em tempo real, em um processo conhecido como inferência.
A Google co-projeta os chips com a Broadcom. A especialização das TPUs confere-lhes uma vantagem em eficiência, com o analista da William Blair, Ralph Schackart, observando que elas podem oferecer mais saída computacional com menos energia. "A maioria dos ASICs consome de 20% a 40% menos energia do que os processadores da Nvidia, permitindo maior desempenho por dólar", disse Schackart. Esses benefícios em termos de custo permitem que a Google cobre cerca de 20% a 30% menos pela capacidade computacional excedente, atraindo startups de IA para suas ofertas, incluindo seus serviços de nuvem e empresariais.
Desafios e Concorrência
As ambições de computação em IA da Google enfrentam uma competição significativa, e é necessário investir em inovação para manter-se na vanguarda. Além disso, todos os envolvidos no setor de computação em IA enfrentam riscos relacionados à disponibilidade de componentes — desde chips de memória até outros materiais de entrada — e a capacidade de fabricação limitada. Custos elevados de memória, em particular, têm pressionado as ações de grandes empresas de tecnologia nesta semana.
Outra preocupação emergiu recentemente sobre os esforços de IA da Google, especificamente a perda de talentosos pesquisadores na área de IA para a OpenAI e a Anthropic. Embora esses funcionários estivessem focados no desenvolvimento de modelos de IA e não no desenvolvimento de TPUs, o sucesso da empresa se baseou em ter sistemas de IA capazes funcionando em hardware otimizado e bem projetado, que se complementam.
Desempenho das Ações da Alphabet
As ações da Alphabet caíram 16% desde seu pico no início de maio, coincidindo com um período mais amplo de fraqueza entre empresas de grande porte. No entanto, ao longo do ano, as ações da Alphabet ainda estão em alta de aproximadamente 8%, superando empresas como Microsoft, Amazon e Meta Platforms.
A Nvidia continua sendo a maior empresa no mercado de computação em IA. Os GPUs da Nvidia oferecem mais flexibilidade em comparação a um ASIC, como uma TPU — afinal, as GPUs foram inicialmente projetadas para melhorar gráficos computacionais 3D antes de seu poder de processamento ser utilizado para uma variedade mais ampla de tarefas, incluindo IA. Atualmente, os GPUs da Nvidia dominam o espaço de treinamento de modelos de IA e também são usados para inferências diárias.
A Evolução do Cenário de IA
No entanto, a Nvidia enfrenta desafios à sua posição de liderança. À medida que a adoção de IA cresce, os analistas afirmam que o mercado está se movendo de um regime orientado ao treinamento para um regime orientado à inferência até o final de 2026. Após a chegada do ChatGPT no final de 2022, a primeira onda de computação em IA foi dominada pelo treinamento, à medida que as empresas corriam para criar novos modelos.
Com o passar do tempo, os modelos de IA estão vendo uma rápida adoção tanto por consumidores quanto por empresas. Isso explica por que a mudança em direção à inferência está se acelerando, com uma crescente ênfase nos custos de computação e no retorno sobre o investimento.
O Papel dos CPUs e o Interesse em Silício Personalizado
Recentemente, as unidades de processamento central (CPUs) viram uma onda de demanda após terem sido inicialmente ignoradas durante o boom da computação em IA. Embora desempenhem um papel diferente no cenário de computação em IA em comparação com GPUs e aceleradores personalizados, as CPUs trabalham em conjunto com chips de aceleração, realizando tarefas mais gerais e mantendo os aceleradores operando.
Outro fator impulsionando o interesse por silício personalizado é a crescente demanda por computação em IA, criando um ambiente de oferta restrita. A pressão está levando as empresas com capital a desenvolver chips especializados para atender à crescente demanda computacional.
Além das TPUs da Google, a Amazon desenvolveu uma linha de chips personalizados, incluindo sua CPU, Graviton, e seu acelerador de IA, Trainium, usados internamente e comercializados para clientes. A Microsoft criou seu próprio silício chamado Maia para energizar sua infraestrutura de nuvem. A Meta Platforms também está desenvolvendo seus processadores MTIA (Meta Training and Inference Accelerator) para executar modelos de IA em sua família de aplicativos.
A Descoberta das TPUs pela Google
A Google foi pioneira nesse campo desde o início, com a descoberta das TPUs ocorrendo em 2013. A liderança da empresa projetou que a demanda por computação em seus produtos superaria sua infraestrutura atual. "Fizemos algumas contas simples considerando quanto poder computacional seria necessário para gerenciar centenas de milhões de pessoas interagindo com o Google por apenas três minutos ao dia", declarou Jeff Dean, cientista-chefe da Google, em um post no blog da empresa em 2024.
Após perceber que o mercado não oferecia soluções que atendessem à demanda, a equipe iniciou o desenvolvimento da primeira TPU. A primeira versão da TPU foi implantada internamente em 2015 e rapidamente se tornou uma parte crucial em várias áreas da Google.
Avanços nas TPUs e o Futuro
Desde então, as TPUs se tornaram mais avançadas e eficientes a cada geração. A mais recente geração, anunciada em abril no Google Cloud Next, marca um novo marco, introduzindo variantes especializadas para treinamento e inferência: a TPU 8t para treinamento de modelos e a TPU 8i para inferência. Estes chips foram concebidos para atender a cargas de trabalho de IA exigentes.
Os chips são até três vezes mais rápidos para treinamento de modelos e oferecem 80% melhor desempenho por dólar. Assim, espera-se que essa nova geração de TPUs permita a criação do maior cluster de treinamento do mundo, aumentando a eficiência da Google e sua capacidade de oferecer serviços em nuvem competitivos.
Por fim, as TPUs da Google estão atraindo laboratórios de IA de alta reputação. A Anthropic comprometeu-se a usar múltiplos gigawatts de TPUs da Google para aumentar seus recursos computacionais, enquanto a Meta assinou um acordo de bilhões com a Alphabet para o uso das TPUs.
Com uma crescente demanda por TPUs além do setor de IA, a expectativa é que plataformas como finanças e computação de alto desempenho também se beneficiem das inovações da Google.
Fonte: www.cnbc.com


