
Em um movimento estratégico para se destacar no campo da inteligência artificial, o Google revelou um novo chip dedicado à inferência em IA. O anúncio foi feito durante o evento Google Cloud Next 25′, realizado em Las Vegas. Este avanço tecnológico promete reduzir os custos de processamento, ao mesmo tempo, em que reforça o compromisso da empresa com investimentos robustos em infraestrutura.
O CEO do Google, Sundar Pichai, destacou que a empresa está investindo pesadamente no futuro, com um capital de investimento previsto de 75 bilhões de dólares para 2025. Este investimento reflete a determinação do Google em liderar a “era da inferência”, onde a inteligência artificial generativa desempenhará um papel central na criação e resposta a dados.
O Que é o Chip Ironwood?
O novo chip, denominado Ironwood, é a primeira unidade de processamento de tensor (TPU) desenvolvida especificamente para inferência. A inferência é o processo pelo qual modelos de IA já treinados respondem a comandos, como perguntas feitas por usuários em um chat de IA ou ações solicitadas a assistentes virtuais. Este chip é projetado para aumentar a velocidade e eficiência dessas respostas.
Clientes do Google Cloud terão a opção de escolher entre duas capacidades de computação baseadas nos novos modelos: uma configuração com 256 chips e outra com 9.216 chips. O Google afirma que o desempenho do Ironwood é mais de 3 mil vezes superior ao de TPUs anteriores, com uma eficiência energética 29 vezes maior.
Por Que a Inferência é Importante?

A inferência está se tornando um componente crucial na computação em nuvem, especialmente à medida que a demanda por IA generativa cresce. Analistas do Morgan Stanley preveem que, nos próximos anos, 75% da demanda computacional e de energia dos data centers estará centrada em inferência. Isso está motivando empresas como o Google Cloud e concorrentes como a AWS a desenvolverem suas próprias soluções de chips dedicados à inferência.
Com a Nvidia dominando atualmente este mercado, o Google busca se posicionar como um forte concorrente, oferecendo soluções que não apenas melhoram o desempenho, mas também reduzem o consumo de energia, um fator crítico para a sustentabilidade e eficiência dos data centers.
Qual é o Impacto dos Investimentos em Infraestrutura?
Os investimentos em infraestrutura são uma preocupação constante para as big techs, especialmente quando se trata de expandir suas capacidades computacionais. O Google está ciente dos desafios e está tomando medidas proativas para garantir que seus data centers estejam preparados para a crescente demanda por processamento de IA.
Esses investimentos são vistos como essenciais para manter a competitividade no mercado de tecnologia, onde a inovação contínua é necessária para atender às expectativas dos clientes e superar a concorrência. O novo chip Ironwood é um exemplo claro de como o Google está se preparando para o futuro da computação em nuvem e inteligência artificial.
O post Google lança novo chip de IA para lidar com nova demanda computacional! apareceu primeiro em BM&C NEWS.