O chatbot Bard do Google está adicionando a funcionalidade de geração de imagens por IA, alcançando uma função que o concorrente ChatGPT Plus já possui há meses.
Os usuários podem instruir o Bard a gerar imagens usando o modelo de texto para imagem Imagen 2 do Google. O Bard, agora alimentado pelo grande modelo de linguagem Gemini Pro do Google, sempre teria a capacidade de gerar imagens. A expectativa era que o modelo mais poderoso, o Gemini Ultra, o impulsionasse; no entanto, esse modelo ainda está em desenvolvimento.
O Google tem posicionado o Bard como um concorrente digno do ChatGPT Plus da OpenAI, que utiliza o GPT-4 e permite que os usuários gerem imagens graças à integração com o DALL-E 3.
Para os que não sabem, DALL-E é um modelo de inteligência artificial desenvolvido pela OpenAI, projetado para gerar imagens a partir de descrições textuais.
Ambos os chatbots têm bom desempenho, mas a falta de recursos de texto para imagem do Bard deu ao ChatGPT Plus uma pequena vantagem.
As pessoas podem usar o Bard atualizado com Imagen 2 sem custo, ao contrário do ChatGPT Plus, que depende de uma assinatura paga.
Segurança
A geração de imagens por IA recentemente foi criticada após imagens falsas da Taylor Swift inundarem o X(twiiter).
Ainda não se sabe quais plataformas foram usadas para gerar essas imagens, mas as empresas de tecnologia começaram a criar restrições em suas plataformas de geração de imagens, para coibir esse tipo de incidente.
O Google afirmou que a capacidade de geração de imagens do Bard foi “projetada com responsabilidade em mente“. O recurso de marca d’água da empresa será incorporado aos pixels das imagens, indicando que as imagens foram geradas por IA.
O Google também afirmou ter implementado salvaguardas técnicas e de segurança para evitar a geração de imagens de pessoas conhecidas e limitar conteúdo violento, ofensivo ou explicitamente sexual.
ImageFX
A geração de imagens não se limitará ao Bard. O Google lançou uma nova ferramenta experimental de geração de imagens alimentada pelo Imagen 2 chamada ImageFX.
O ImageFX permite que os usuários criem imagens com simples prompts de texto, para que as pessoas possam brincar com a IA generativa de imagem, com os feedbacks indo diretamente para os engenheiros do Google.
Assim como no Bard, todas as imagens geradas por meio do ImageFX serão marcadas pelo SynthID e seguirão os princípios do Google relativos à IA e as salvaguardas técnicas do Google.
Expansão
O Bard também está recebendo várias outras expansões. Embora a geração de imagens esteja disponível apenas em inglês por enquanto, o chatbot se expandiu para mais de 40 idiomas em mais de 230 países.
A versão anterior só funcionava em inglês e estava disponível em 170 países. Alguns dos idiomas suportados incluem árabe, bengali, tâmil e urdu.
O Google também expandiu o recurso de verificação dupla para 40 idiomas, o que permite que os usuários avaliem as respostas, buscando automaticamente na internet fonte para apoiar ou contradizer o conteúdo.