A inteligência artificial (IA) tem evoluído em um ritmo acelerado, e a última semana foi particularmente intensa, com anúncios significativos de gigantes da tecnologia como OpenAI, Meta, Microsoft e Google. Neste post, exploraremos as principais novidades que estão moldando o futuro da IA.
OpenAI: Inovação e Expansão
AI Dev Day e Novos Recursos
A OpenAI realizou o AI Dev Day, focado principalmente em desenvolvedores, onde anunciou:
- Canvas no ChatGPT:
- Sugestões de edição: O ChatGPT agora oferece recomendações para melhorar seu texto.
- Ajuste de comprimento: Altere o tamanho do texto para mais curto ou mais longo conforme necessário.
- Nível de leitura: Modifique o texto para diferentes níveis educacionais, desde o jardim de infância até o ensino superior.
- Polimento final: Verificação gramatical e de clareza para aprimorar a qualidade.
- Adição de emojis: Torne as conversas mais expressivas.
- Recursos de código: Revisão, adição de logs, comentários, correção de bugs e portabilidade entre linguagens.
- Disponibilidade: Sam Altman anunciou que o Canvas está disponível para todos os assinantes do ChatGPT Plus.
Agentes de IA em 2025
Durante uma sessão de perguntas, o CEO Sam Altman mencionou que 2025 será o ano em que os agentes de IA realmente se destacarão, sugerindo o lançamento de modelos autônomos capazes de executar tarefas sem intervenção humana.
Novas Funcionalidades para Desenvolvedores
- Afinamento de Visão na API: Desenvolvedores podem aprimorar o GPT-4.0 com imagens e texto, melhorando as capacidades de visão.
- API em Tempo Real: Integração dos recursos de voz avançados em aplicativos de terceiros.
- Destilação de Modelo: Uso de saídas de modelos avançados para melhorar modelos mais econômicos, como o GPT-4.0 Mini.
- Cache de Prompt na API: Redução significativa dos custos de uso da API.
Financiamento e Crescimento
A OpenAI levantou US$ 6,6 bilhões em financiamento, avaliando a empresa em US$ 157 bilhões, tornando-se a terceira maior startup do mundo. Há especulações sobre uma possível transição para uma empresa com fins lucrativos.
Meta: Expansão em IA e Dispositivos Inteligentes
Novos Recursos nos Óculos Ray-Ban
A Meta lançou atualizações para os óculos Ray-Ban, incluindo:
- Memória Integrada: Permite comandos como “lembre onde estacionei”.
- Reconhecimento de QR Codes: Escaneie códigos e abra automaticamente no telefone.
- Chamadas Telefônicas: Realize ligações ao detectar números na câmera.
Esses recursos aprimoram a interação do usuário, tornando os óculos mais intuitivos e funcionais.
Lançamento do Llama 3.2
A Meta apresentou o Llama 3.2, um avanço significativo na tecnologia de IA:
- Capacidades de Visão: Os modelos maiores (11B e 90B) agora entendem texto e imagens.
- Modelos Leves: Disponíveis em 1B e 3B, ideais para dispositivos móveis.
- Grande Janela de Contexto: Suporta até 128.000 tokens, permitindo inserir grandes volumes de informação.
- Otimização de Hardware: Otimizado para Qualcomm e Mediatek.
- Open Source: Disponível para download em llama.com ou Hugging Face.
- Segurança: Introdução do Llama Guard 3 para uso responsável dos modelos.
Microsoft: Co-Pilot Plus e Novas Funcionalidades
Recursos Avançados em Dispositivos com NPU
Os novos PCs Co-Pilot Plus vêm equipados com Unidades de Processamento Neural (NPU), proporcionando:
- Funcionalidade Recall:
- Salva um histórico detalhado das atividades no computador.
- Privacidade: Os dados são armazenados localmente, sem envio para a Microsoft.
- Funcionalidade Click-To-Do:
- Ações rápidas ao clicar em imagens, como:
- Pesquisa visual com o Bing.
- Desfocar fundo com o aplicativo Fotos.
- Apagar objetos ou remover fundo.
- Ações relacionadas a texto: reescrever, resumir, explicar, enviar e-mails e realizar pesquisas.
Melhorias em Aplicativos e Ferramentas
- Pesquisa do Windows com IA:
- Reconhecimento de imagens, mesmo com nomes genéricos de arquivos.
- Funciona offline utilizando a NPU.
- Novos Recursos em Aplicativos:
- Super Resolução no Fotos: Aprimore a qualidade das imagens.
- Preenchimento Generativo e Apagar no Paint: Recursos semelhantes ao Adobe Photoshop.
Co-Pilot Labs e Co-Pilot Vision
- Think Deeper: Permite que o Co-Pilot raciocine sobre problemas mais complexos.
- Co-Pilot Vision:
- Compreende a página visualizada e responde a perguntas sobre o conteúdo.
- Sugere próximos passos e auxilia em tarefas.
- Opt-In: Ativado somente se o usuário permitir.
Atualização na Busca Generativa do Bing
- Expansão para Consultas Informativas: Respostas mais detalhadas para perguntas complexas.
- Pagamento a Editores: Remuneração para editores cujo conteúdo aparece nas respostas generativas.
Visão de Mustafa Suleyman
O chefe de IA da Microsoft compartilhou que o Co-Pilot evoluirá para um agente personalizado, alinhado com os interesses do usuário, salvaguardando privacidade e segurança de dados.
Google: Inovações no Google Lens e Busca
Novas Funcionalidades do Google Lens
- Compreensão de Vídeos: Agora pode entender o conteúdo de vídeos e responder perguntas.
- Perguntas por Voz: Permite interações mais naturais com o dispositivo.
- Compra pelo que Você Vê: Identifique e compre produtos a partir de imagens.
- Identificação de Músicas: Similar ao Shazam, mas integrado ao Lens.
- Organização de Resultados de Busca com IA: Melhorias na apresentação e relevância.
Anúncios em Respostas de IA
O Google começará a inserir anúncios nas respostas geradas por IA, integrando patrocínios relacionados à consulta do usuário.
Avanços em Modelos de Linguagem (LLM)
Gemini 1.5 Flash 8B
Novo modelo de linguagem lançado pelo Google:
- Benefícios:
- 50% mais barato.
- Limites de taxa duas vezes maiores.
- Menor latência em prompts curtos.
- Foco em Desenvolvedores: Disponível via API.
NVLMD 72B da NVIDIA
A NVIDIA apresentou um modelo de linguagem de código aberto com capacidades de visão:
- Desempenho: Rivaliza com modelos proprietários líderes, como o GPT-4V.
- Open Source: Disponível para a comunidade, incentivando inovações.
Outros Destaques Tecnológicos
- IA Generativa para Imagens de Produtos: Anunciantes podem aprimorar visualmente seus produtos, tornando-os mais atraentes.
Flux 1.1 Pro da Black Forest Labs
- Novo Modelo de Geração de Imagens:
- Melhor compreensão de texto.
- Geração de imagens mais precisas.
- Disponível em plataformas como Together AI e Replicate.
Leonardo AI
- Referência de Estilo: Usuários podem carregar até quatro imagens para direcionar a estética.
- Image-to-Image com o Preset Phoenix: Transformações de imagens existentes com alta qualidade.
Adobe Photoshop Elements e Premiere Elements
- Novas Funcionalidades de IA:
- Remoção de objetos.
- Correção de cores por IA.
- Simulação de profundidade de campo.
Luma’s Dream Machine
- Geração de Vídeos Hiper-Rápida: Inferência 10 vezes mais rápida, melhorando a eficiência.
Pika 1.5
- Novo Modelo de Vídeo por IA:
- Conhecido por gerar vídeos de objetos sendo alterados, como objetos sendo esmagados ou explodindo.
ByteDance
- Novo Gerador de Vídeo por IA:
- Empresa por trás do TikTok revela ferramenta que rivaliza com líderes do mercado.
DreamWorld no Steam
- Criação de Mundos Virtuais:
- Usuários podem criar e inserir qualquer objeto 3D.
- Expande possibilidades em jogos e criação de conteúdo.
Legislação e Ética em IA
Projetos de Lei na Califórnia
- SB 1047 Vetado:
- O governador Gavin Newsom vetou o projeto que responsabilizaria empresas de IA por danos catastróficos causados por terceiros.
- AB 2839 Bloqueado:
- Projeto relacionado a deepfakes foi bloqueado por preocupações com a liberdade de expressão.
Amazon e Novos Dispositivos
- Tablets Fire com IA Integrada:
- Assistentes de escrita.
- Resumos de páginas da web.
- Criação de wallpapers a partir de prompts.
Robótica Avançada
Robô Quadrúpede que Sobe Escadas
- Desenvolvimento Inovador:
- Robô capaz de subir escadas usando garras especiais.
- Permite acesso a áreas perigosas sem colocar humanos em risco.
Eventos e Oportunidades
Hackathon de IA em Santa Mônica
- Datas: 12 e 13 de outubro.
- Participação:
- Aberto a todos, mesmo sem experiência em desenvolvimento.
- Possibilidade de usar IA para ajudar na programação.
- Oportunidade:
- Interação com profissionais da área.
- Desenvolvimento de projetos inovadores.
Conclusão
A velocidade com que a inteligência artificial avança é impressionante, influenciando desde dispositivos que usamos diariamente até complexos modelos de linguagem e robôs avançados. Com empresas líderes investindo e inovando constantemente, além de discussões legislativas em andamento, é essencial manter-se informado para entender o impacto dessas tecnologias em nossas vidas.
Pesquisa, Edição, formatação e finalização:
Werney Lima, sábado, 5 de outubro de 2024 – 08:29 (sábado)