Google Lens agora permite pesquisar gravando um vídeo
O Google Lens já permite pesquisar algo com base em imagens, mas agora o Google está dando um passo adiante com a capacidade de pesquisar com um vídeo. Isso significa que você pode gravar um vídeo de algo que deseja pesquisar, fazer uma pergunta durante o vídeo e a IA do Google tentará obter respostas relevantes da web.
Gemini responderá perguntas sobre sua biblioteca de fotos
O Google está lançando um novo recurso neste verão que pode ser uma bênção para qualquer pessoa com anos – ou até mais de uma década – de fotos para examinar.
“Ask Photos” permite que Gemini se debruce sobre sua biblioteca do Google Fotos em resposta às suas perguntas, e o recurso vai além de apenas exibir fotos de cães e gatos. O CEO Sundar Pichai demonstrou perguntando a Gemini qual é o número da sua placa.
A resposta foi o próprio número, seguido de uma foto dele para que ele pudesse ter certeza de que estava certo.
O principal modelo Gemini do Google fica mais rápido e mais capaz
O Google introduziu um novo modelo de IA em sua linha: Gemini 1.5 Flash. O novo modelo multimodal é tão poderoso quanto o Gemini 1.5 Pro, mas é otimizado para “tarefas estreitas, de alta frequência e baixa latência”. Isso o torna melhor na geração de respostas rápidas.
O Google também fez algumas alterações no Gemini 1.5 que, segundo ele, melhorarão sua capacidade de traduzir, raciocinar e codificar. Além disso, o Google diz que dobrou a janela de contexto do Gemini 1.5 Pro (quanta informação ele pode absorver) de 1 milhão para 2 milhões de tokens.
Gemini se junta aos usuários no Workspace
O Google está lançando seu mais recente modelo de linguagem convencional, Gemini 1.5 Pro, na barra lateral do Documentos, Planilhas, Apresentações, Drive e Gmail. Quando for lançado para assinantes pagos no próximo mês, ele se tornará mais um assistente de uso geral no Workspace, que pode buscar informações de todo e qualquer conteúdo do seu Drive, não importa onde você esteja.
Ele também poderá fazer coisas por você, como escrever e-mails que incorporem informações de um documento que você está visualizando ou lembrá-lo mais tarde de responder a um e-mail que você está lendo.
Alguns testadores iniciais já têm acesso a esses recursos, mas o Google diz que os lançará para todos os assinantes pagos do Gemini no próximo mês.
Projeto Astra é o futuro Star Trek AI do Google
O Projeto Astra do Google é um assistente de IA multimodal que a empresa espera que se torne um assistente virtual que faz tudo, que pode observar e entender o que vê através da câmera do seu dispositivo, lembrar onde estão suas coisas e fazer coisas por você.
Ele está alimentando muitas das demonstrações mais impressionantes do I/O deste ano, e o objetivo da empresa é ser um agente de IA honesto que não pode apenas falar com você, mas também fazer coisas em seu nome.
Veo traz geração de vídeo no estilo Sora para criadores
A resposta do Google ao Sora da OpenAI é um novo modelo generativo de IA que pode produzir vídeo 1080p com base em texto, imagem e prompts baseados em vídeo.
Os vídeos podem ser produzidos em vários estilos, como fotos aéreas ou timelapses, e podem ser ajustados com mais prompts.
A empresa já está oferecendo o Veo a alguns criadores para uso em vídeos do YouTube, mas também está oferecendo-o a Hollywood para uso em filmes.
Gems traz criação de chatbot personalizado para Gemini
O Google está lançando um criador de chatbot personalizado chamado Gems. Assim como os GPTs da OpenAI, o Gems permite que os usuários dêem instruções ao Gemini para personalizar como ele responderá e em que se especializará.
Se você deseja que ele seja um treinador de corrida positivo e insistente, com motivações diárias e planos de corrida – também conhecido como meu pior pesadelo – você ‘ poderei fazer isso em breve (se você for assinante do Gemini Advanced).
Gêmeos se torna um melhor parceiro de conversa
O novo recurso Gemini Live visa tornar os bate-papos de voz com o Gemini mais naturais. A voz do chatbot será atualizada com alguma personalidade extra, e os usuários poderão interrompê-lo no meio da frase ou pedir para assistir pela câmera do smartphone e dar informações sobre o que vê em tempo real.
Gemini também está recebendo novas integrações que permitem atualizar ou extrair informações do Google Agenda, Tarefas e Keep, usando recursos multimodais para fazer isso (como adicionar detalhes de um folheto ao seu calendário pessoal).
Circle to Search pode ajudar a resolver problemas matemáticos agora
Se você estiver em um telefone ou tablet Android, agora poderá circular um problema matemático na tela e obter ajuda para resolvê-lo. A IA do Google não resolverá o problema para você – portanto, não ajudará os alunos a colar nos deveres de casa – mas irá dividi-lo em etapas que devem facilitar a conclusão.
A Pesquisa Google passa por uma revisão de IA
O Google lançará “Visões gerais de IA” – anteriormente conhecidas como “Experiência generativa de pesquisa”, um bocado – para todos nos EUA esta semana.
Agora, um modelo Gemini “especializado” projetará e preencherá páginas de resultados com respostas resumidas da web (semelhante ao que você vê em ferramentas de pesquisa de IA, como Perplexity ou Arc Search).
Android obtém detecção de golpes com tecnologia de IA
Usando a inteligência Gemini Nano AI no dispositivo, o Google diz que os telefones Android serão capazes de ajudá-lo a evitar chamadas fraudulentas, observando sinais de alerta, como padrões comuns de conversa de golpistas, e exibindo avisos em tempo real. A empresa promete oferecer mais detalhes sobre o recurso ainda neste ano.
Dispositivos Android estão prestes a obter IA mais inteligente
O Google afirma que em breve o Gemini poderá permitir que os usuários façam perguntas sobre vídeos na tela e responderá com base em legendas automáticas.
Para usuários pagos do Gemini Advanced, ele também pode ingerir PDFs e oferecer informações. Essas e outras atualizações multimodais para Gemini no Android chegarão nos próximos meses.
O Google Chrome está ganhando um assistente de IA
O Google anunciou que está adicionando Gemini Nano, a versão leve de seu modelo Gemini, ao Chrome para desktop. O assistente integrado usará IA no dispositivo para ajudá-lo a gerar texto para postagens em mídias sociais, análises de produtos e muito mais diretamente no Google Chrome.
Google atualiza sua marca d’água SynthID AI
O Google diz que está expandindo o que o SynthID pode fazer – a empresa diz que incorporará marcas d’água no conteúdo criado com seu novo gerador de vídeo Veo e que agora também pode detectar vídeos gerados por IA.
Pesquisa, Curadoria, Edição, formatação e finalização:
Werney Lima, maio 15, 2024 (Quarta-feira)