Novidades da Semana no Mundo da IA

A inteligência artificial (IA) tem evoluído em um ritmo acelerado, e a última semana foi particularmente intensa, com anúncios significativos de gigantes da tecnologia como OpenAI, Meta, Microsoft e Google. Neste post, exploraremos as principais novidades que estão moldando o futuro da IA.

OpenAI: Inovação e Expansão

AI Dev Day e Novos Recursos

A OpenAI realizou o AI Dev Day, focado principalmente em desenvolvedores, onde anunciou:

  • Canvas no ChatGPT:
  • Sugestões de edição: O ChatGPT agora oferece recomendações para melhorar seu texto.
  • Ajuste de comprimento: Altere o tamanho do texto para mais curto ou mais longo conforme necessário.
  • Nível de leitura: Modifique o texto para diferentes níveis educacionais, desde o jardim de infância até o ensino superior.
  • Polimento final: Verificação gramatical e de clareza para aprimorar a qualidade.
  • Adição de emojis: Torne as conversas mais expressivas.
  • Recursos de código: Revisão, adição de logs, comentários, correção de bugs e portabilidade entre linguagens.
  • Disponibilidade: Sam Altman anunciou que o Canvas está disponível para todos os assinantes do ChatGPT Plus.

Agentes de IA em 2025

Durante uma sessão de perguntas, o CEO Sam Altman mencionou que 2025 será o ano em que os agentes de IA realmente se destacarão, sugerindo o lançamento de modelos autônomos capazes de executar tarefas sem intervenção humana.

Novas Funcionalidades para Desenvolvedores

  • Afinamento de Visão na API: Desenvolvedores podem aprimorar o GPT-4.0 com imagens e texto, melhorando as capacidades de visão.
  • API em Tempo Real: Integração dos recursos de voz avançados em aplicativos de terceiros.
  • Destilação de Modelo: Uso de saídas de modelos avançados para melhorar modelos mais econômicos, como o GPT-4.0 Mini.
  • Cache de Prompt na API: Redução significativa dos custos de uso da API.

Financiamento e Crescimento

A OpenAI levantou US$ 6,6 bilhões em financiamento, avaliando a empresa em US$ 157 bilhões, tornando-se a terceira maior startup do mundo. Há especulações sobre uma possível transição para uma empresa com fins lucrativos.

Meta: Expansão em IA e Dispositivos Inteligentes

Novos Recursos nos Óculos Ray-Ban

A Meta lançou atualizações para os óculos Ray-Ban, incluindo:

  • Memória Integrada: Permite comandos como “lembre onde estacionei”.
  • Reconhecimento de QR Codes: Escaneie códigos e abra automaticamente no telefone.
  • Chamadas Telefônicas: Realize ligações ao detectar números na câmera.

Esses recursos aprimoram a interação do usuário, tornando os óculos mais intuitivos e funcionais.

Lançamento do Llama 3.2

A Meta apresentou o Llama 3.2, um avanço significativo na tecnologia de IA:

  • Capacidades de Visão: Os modelos maiores (11B e 90B) agora entendem texto e imagens.
  • Modelos Leves: Disponíveis em 1B e 3B, ideais para dispositivos móveis.
  • Grande Janela de Contexto: Suporta até 128.000 tokens, permitindo inserir grandes volumes de informação.
  • Otimização de Hardware: Otimizado para Qualcomm e Mediatek.
  • Open Source: Disponível para download em llama.com ou Hugging Face.
  • Segurança: Introdução do Llama Guard 3 para uso responsável dos modelos.

Microsoft: Co-Pilot Plus e Novas Funcionalidades

Recursos Avançados em Dispositivos com NPU

Os novos PCs Co-Pilot Plus vêm equipados com Unidades de Processamento Neural (NPU), proporcionando:

  • Funcionalidade Recall:
  • Salva um histórico detalhado das atividades no computador.
  • Privacidade: Os dados são armazenados localmente, sem envio para a Microsoft.
  • Funcionalidade Click-To-Do:
  • Ações rápidas ao clicar em imagens, como:
    • Pesquisa visual com o Bing.
    • Desfocar fundo com o aplicativo Fotos.
    • Apagar objetos ou remover fundo.
  • Ações relacionadas a texto: reescrever, resumir, explicar, enviar e-mails e realizar pesquisas.

Melhorias em Aplicativos e Ferramentas

  • Pesquisa do Windows com IA:
  • Reconhecimento de imagens, mesmo com nomes genéricos de arquivos.
  • Funciona offline utilizando a NPU.
  • Novos Recursos em Aplicativos:
  • Super Resolução no Fotos: Aprimore a qualidade das imagens.
  • Preenchimento Generativo e Apagar no Paint: Recursos semelhantes ao Adobe Photoshop.

Co-Pilot Labs e Co-Pilot Vision

  • Think Deeper: Permite que o Co-Pilot raciocine sobre problemas mais complexos.
  • Co-Pilot Vision:
  • Compreende a página visualizada e responde a perguntas sobre o conteúdo.
  • Sugere próximos passos e auxilia em tarefas.
  • Opt-In: Ativado somente se o usuário permitir.

Atualização na Busca Generativa do Bing

  • Expansão para Consultas Informativas: Respostas mais detalhadas para perguntas complexas.
  • Pagamento a Editores: Remuneração para editores cujo conteúdo aparece nas respostas generativas.

Visão de Mustafa Suleyman

O chefe de IA da Microsoft compartilhou que o Co-Pilot evoluirá para um agente personalizado, alinhado com os interesses do usuário, salvaguardando privacidade e segurança de dados.

Google: Inovações no Google Lens e Busca

Novas Funcionalidades do Google Lens

  • Compreensão de Vídeos: Agora pode entender o conteúdo de vídeos e responder perguntas.
  • Perguntas por Voz: Permite interações mais naturais com o dispositivo.
  • Compra pelo que Você Vê: Identifique e compre produtos a partir de imagens.
  • Identificação de Músicas: Similar ao Shazam, mas integrado ao Lens.
  • Organização de Resultados de Busca com IA: Melhorias na apresentação e relevância.

Anúncios em Respostas de IA

O Google começará a inserir anúncios nas respostas geradas por IA, integrando patrocínios relacionados à consulta do usuário.

Avanços em Modelos de Linguagem (LLM)

Gemini 1.5 Flash 8B

Novo modelo de linguagem lançado pelo Google:

  • Benefícios:
  • 50% mais barato.
  • Limites de taxa duas vezes maiores.
  • Menor latência em prompts curtos.
  • Foco em Desenvolvedores: Disponível via API.

NVLMD 72B da NVIDIA

A NVIDIA apresentou um modelo de linguagem de código aberto com capacidades de visão:

  • Desempenho: Rivaliza com modelos proprietários líderes, como o GPT-4V.
  • Open Source: Disponível para a comunidade, incentivando inovações.

Outros Destaques Tecnológicos

Pinterest

  • IA Generativa para Imagens de Produtos: Anunciantes podem aprimorar visualmente seus produtos, tornando-os mais atraentes.

Flux 1.1 Pro da Black Forest Labs

  • Novo Modelo de Geração de Imagens:
  • Melhor compreensão de texto.
  • Geração de imagens mais precisas.
  • Disponível em plataformas como Together AI e Replicate.

Leonardo AI

  • Referência de Estilo: Usuários podem carregar até quatro imagens para direcionar a estética.
  • Image-to-Image com o Preset Phoenix: Transformações de imagens existentes com alta qualidade.

Adobe Photoshop Elements e Premiere Elements

  • Novas Funcionalidades de IA:
  • Remoção de objetos.
  • Correção de cores por IA.
  • Simulação de profundidade de campo.

Luma’s Dream Machine

  • Geração de Vídeos Hiper-Rápida: Inferência 10 vezes mais rápida, melhorando a eficiência.

Pika 1.5

  • Novo Modelo de Vídeo por IA:
  • Conhecido por gerar vídeos de objetos sendo alterados, como objetos sendo esmagados ou explodindo.

ByteDance

  • Novo Gerador de Vídeo por IA:
  • Empresa por trás do TikTok revela ferramenta que rivaliza com líderes do mercado.

DreamWorld no Steam

  • Criação de Mundos Virtuais:
  • Usuários podem criar e inserir qualquer objeto 3D.
  • Expande possibilidades em jogos e criação de conteúdo.

Legislação e Ética em IA

Projetos de Lei na Califórnia

  • SB 1047 Vetado:
  • O governador Gavin Newsom vetou o projeto que responsabilizaria empresas de IA por danos catastróficos causados por terceiros.
  • AB 2839 Bloqueado:
  • Projeto relacionado a deepfakes foi bloqueado por preocupações com a liberdade de expressão.

Amazon e Novos Dispositivos

  • Tablets Fire com IA Integrada:
  • Assistentes de escrita.
  • Resumos de páginas da web.
  • Criação de wallpapers a partir de prompts.

Robótica Avançada

Robô Quadrúpede que Sobe Escadas

  • Desenvolvimento Inovador:
  • Robô capaz de subir escadas usando garras especiais.
  • Permite acesso a áreas perigosas sem colocar humanos em risco.

Eventos e Oportunidades

Hackathon de IA em Santa Mônica

  • Datas: 12 e 13 de outubro.
  • Participação:
  • Aberto a todos, mesmo sem experiência em desenvolvimento.
  • Possibilidade de usar IA para ajudar na programação.
  • Oportunidade:
  • Interação com profissionais da área.
  • Desenvolvimento de projetos inovadores.

Conclusão

A velocidade com que a inteligência artificial avança é impressionante, influenciando desde dispositivos que usamos diariamente até complexos modelos de linguagem e robôs avançados. Com empresas líderes investindo e inovando constantemente, além de discussões legislativas em andamento, é essencial manter-se informado para entender o impacto dessas tecnologias em nossas vidas.


Pesquisa, Edição, formatação e finalização:
Werney Lima, sábado, 5 de outubro de 2024 – 08:29 (sábado)

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *