Por mais de um ano, o Google tem corrido para construir uma tecnologia que possa se igualar ao ChatGPT, o chatbot revelador oferecido pela startup OpenAI de IA de São Francisco.
Na quarta-feira, a gigante da tecnologia deu mais um passo na corrida em curso, lançando uma nova versão do seu chatbot, o Google Bard. O bot atualizado está disponível para falantes de inglês em mais de 170 regiões e países, incluindo os EUA, a partir de agora, e é alimentado por uma nova tecnologia de IA chamada Gemini, que a empresa vem desenvolvendo desde o início do ano.
“Este é o início da era Gemini”, disse o CEO do Google, Sundar Pichai, em entrevista. “É a concretização da visão que tínhamos quando criamos o Google DeepMind, o laboratório de inteligência artificial da empresa. O Google lançará três versões diferentes da tecnologia em uma ampla gama de produtos e serviços nos próximos meses”, disse ele.
O Gemini é mais poderoso do que as tecnologias anteriores de chatbot do Google e pode gerar respostas mais precisas e chegar mais perto de imitar o raciocínio humano em algumas situações, disseram Pichai e Demis Hassabis, que lideram o Google DeepMind.
“Estamos muito satisfeitos com o desempenho do Gemini”, disse o Dr. Hassabis.
Quando a OpenAI impressionou o mundo com seu chatbot ChatGPT com tecnologia de IA no final do ano passado, o Google ficou surpreso. A gigante da tecnologia passou anos desenvolvendo tecnologia semelhante, mas, como outros gigantes da tecnologia – principalmente a Meta – tem sido relutante em lançar tecnologia que possa gerar informações tendenciosas, falsas ou tóxicas.
Em março, o Google lançou seu chatbot, Bard, para avaliações médias. Um mês depois, a empresa anunciou que fundiu seus dois laboratórios de inteligência artificial – Google Brain e DeepMind – reunindo mais de 2.000 pesquisadores e engenheiros. E em maio, na inovadora conferência Google I/O, anunciou que o novo laboratório DeepMind do Google havia começado a desenvolver o Gemini.
Depois de fundar o Brain Lab em 2011, o Google adquiriu a DeepMind em 2014, pagando US$ 650 milhões pela startup de IA de Londres. A DeepMind operou em grande parte de forma independente do Brain Lab e do resto do Google por uma década, e até tentou sair da empresa em 2017. Mas enquanto o Google lutava para alcançar o OpenAI, Pichai fundiu os dois laboratórios sob o comando do Dr. neurocientista que foi cofundador da DeepMind.
O Google divulgou resultados de benchmark afirmando que a versão mais poderosa do Gemini superou a mais recente tecnologia OpenAI, GPT-4, em diversas áreas importantes. Pichai disse que é melhor na geração de códigos de computador do que as técnicas anteriores do Google e pode resumir artigos de notícias e outros documentos de texto com mais precisão.
O Gemini também foi projetado para analisar imagens e sons, mas essas habilidades só serão incorporadas ao chatbot do Bard mais tarde.
O Google construiu três versões do Gemini com três conjuntos de habilidades diferentes. O maior, o Ultra, foi projetado para lidar com tarefas complexas e será lançado no próximo ano. Pro, a oferta intermediária, será implementada em vários serviços do Google a partir de quarta-feira, usando o chatbot Bard. O Nano, a versão menor, irá potencializar alguns recursos do smartphone Pixel 8 Pro, como resumir gravações de áudio e oferecer sugestões de respostas de texto no WhatsApp a partir de quarta-feira.
Gemini é o que os cientistas chamam de modelo de linguagem grande, ou LLM, um sistema matemático complexo que pode aprender habilidades analisando grandes quantidades de dados, incluindo livros digitais, artigos da Wikipédia e quadros de avisos online. Ao identificar padrões em todo esse texto, o LLM aprende a criar texto por conta própria. Isso significa que ele pode escrever artigos de pesquisa, criar códigos de computador e até mesmo manter uma conversa.
Através do Gemini, o Google também treinou tecnologia em imagens e sons digitais. Isto é o que os investigadores chamam de sistema “multimodal”, o que significa que pode analisar e responder a imagens e sons. Se você lhe der um problema de matemática envolvendo linhas, formas e outras imagens, por exemplo, ele poderá responder da mesma forma que um estudante do ensino médio.
No entanto, esta tecnologia não estará disponível aos consumidores até o próximo ano. O Google também reconheceu que o Gemini, assim como sistemas similares, é vulnerável a erros. Pode interpretar os fatos de maneira errada ou até mesmo “alucinar” – inventar coisas.
O Google Cloud, que fornece serviços de IA e computação para outras empresas, está ansioso para fornecer Gemini aos clientes enquanto compete por negócios com a OpenAI e a Microsoft. Depois que a OpenAI forçou brevemente Sam Altman, seu CEO, a renunciar no mês passado, deixando a empresa no limbo, o Google Cloud criou um plano de migração na tentativa de roubar os clientes de seu rival.
Os clientes podem pagar ao Google o mesmo preço do OpenAI atual e receber créditos ou descontos na nuvem.
O Google disse que os clientes da nuvem terão acesso ao Gemini Pro – a oferta de nível intermediário – em 13 de dezembro. Pichai disse que alguns estranhos estão testando o Gemini Ultra – a versão mais poderosa da tecnologia.
Embora o Google tenha passado o ano passado correndo para recuperar a liderança em IA da OpenAI, Pichai disse que há espaço suficiente no mercado para todos os fornecedores de IA.
“Está longe de ser um jogo de soma zero”, disse Pichai. “Estamos entusiasmados com o que estamos lançando. Também percebemos que ainda é muito cedo porque podemos ver o progresso que estamos fazendo no acompanhamento.
“Viciado em TV certificado. Ninja zumbi irritantemente humilde. Defensor do café. Especialista em web. Solucionador de problemas.”
More Stories
Como os especialistas em IA do novo programa Gemini Gems do Google podem impulsionar seu SEO
Vazamentos revelam o nome e design do suposto dispositivo PS5 Pro
Os jogadores reclamam do longo tempo de matchmaking no PS5 conforme os números do Concord caem