Você Acha que Quantidade Importa?
Então, Vamos Listar Algumas das Ferramentas/Aplicações Mencionadas no Evento Google I/O 2024
Gemini
- Ask Photos: Ferramenta de reconhecimento visual que permite aos usuários perguntar sobre fotos para identificar carros, pessoas e contextos específicos.
- Gemini 1.5 Pro: Expande a capacidade de contextos para até 1 milhão de tokens, permitindo integrar grandes volumes de dados multimodais (texto, áudio, vídeo, código). Disponível globalmente em 35 línguas.
- Gemini 1.5 Flash: Modelo mais leve comparado ao Pro, também suporta até 1 milhão de tokens e está disponível no Google AI Studio e Vertex AI.
- Gemini Advanced: Versão avançada do Gemini para usuários que exige maiores capacidades contextuais e personalização.
- Gemini Nano: Modelo mais recente com capacidades multimodais estendidas, integrando acessibilidade através do TalkBack.
- Gems: Especialistas personalizados que podem ser configurados pelos usuários para fornecer ajuda especializada em vários tópicos.
Notebook LM
- Ferramenta de discussão científica que utiliza materiais fornecidos como entrada para gerar discussões personalizadas e dinâmicas, especialmente útil para educação em ciências.
Project Astra
- Iniciativa focada no desenvolvimento de assistentes de IA para o futuro, com ferramentas generativas avançadas para imagem, música e vídeo.
Vertex AI
- Plataforma que permite treinamento e implantação de modelos de machine learning e IA da Google, agora incluindo modelos Gemini.
Imagen 3
- Imagen 3: Modelo avançado de geração de imagens fotorrealistas com detalhes precisos. Parte da suíte de ferramentas de IA no labs.google.com.
ImageFX
- ImageFX: Ferramenta dentro da suíte de Imagen para aprimoramento de imagens com qualidade superior e menos artefatos visuais.
Music AI Sandbox
- Suíte de ferramentas de IA para música desenvolvida em parceria com o YouTube, permitindo criar seções instrumentais do zero e transferir estilos entre faixas.
Veo
- Veo: Modelo de vídeo generativo que cria vídeos de alta qualidade (1080p) a partir de prompts de texto, imagem ou vídeo.
VideoFX
- VideoFX: Ferramenta experimental para edição de vídeos, incluindo storyboarding e geração de cenas longas, disponível para criadores selecionados.
TPUs Trillium
- Sexta geração de TPUs (Tensor Processing Units) com melhoria de 4,7x no desempenho de computação por chip, disponível para clientes da nuvem no final de 2024.
Google Search
- Novas capacidades de raciocínio multi-step e integração de vídeo para fornecer respostas mais complexas e detalhadas.
Gmail
- Novo painel lateral impulsionado pelo Gemini para sumarizar e responder e-mails, organizar recibos e automatizar fluxos de trabalho.
Google Meet
- Facilita resumos de reuniões gravadas, permitindo destacar pontos-chave automaticamente.
PaliGemma
- Primeiro modelo de linguagem visual aberto disponível para integração em ferramentas de visão computacional.
Synth ID
- Expande para novas modalidades (texto e vídeo) com marca d’água em texto de código aberto.
LearnLM
- Nova família de modelos baseados no Gemini, ajustados para aprendizado, incluindo gems pré-fabricados como Learning Coach.
TalkBack
- Funcionalidade aprimorada com capacidades multimodais do Gemini Nano para navegação por toque e feedback falado, mesmo offline.
Pesquisa, Curadoria, Edição, formatação e finalização:
Werney Lima, maio 17, 2024 (Sexta-feira) – 09:46 hrs.