Claude 3.5 Sonnet

Esta é uma tradução do artigo da Anthropic sobre o Claude 3.5 Sonnet publicado em 21/06/2024.

https://www.anthropic.com/news/claude-3-5-sonnet

Hoje, estamos lançando Claude 3.5 Sonnet—nossa primeira versão na futura família de modelos Claude 3.5. Claude 3.5 Sonnet eleva o padrão da indústria em termos de inteligência, superando modelos concorrentes e Claude 3 Opus em uma ampla gama de avaliações, com a velocidade e o custo do nosso modelo intermediário, Claude 3 Sonnet.
Experimente no Claude.ai

Claude 3.5 Sonnet está agora disponível gratuitamente no Claude.ai e no aplicativo Claude para iOS, enquanto assinantes dos planos Claude Pro e Team têm acesso a limites de taxa significativamente maiores.

Ele também está disponível via Anthropic API, Amazon Bedrock e Vertex AI do Google Cloud.

O modelo custa US$3 por milhão de tokens de entrada e US$15 por milhão de tokens de saída, com uma janela de contexto de 200.000 tokens.
Amazon Bedrock
Vertex AI do Google Cloud

Inteligência de ponta ao dobro de velocidade

Claude 3.5 Sonnet estabelece novos parâmetros de referência na indústria para raciocínio em nível de pós-graduação (GPQA), conhecimento em nível de graduação (MMLU) e proficiência em codificação (HumanEval).

Apresenta uma melhoria notável na compreensão de nuances, humor e instruções complexas, e é excepcional na redação de conteúdo de alta qualidade com um tom natural e relacionável.

Claude 3.5 Sonnet opera ao dobro da velocidade do Claude 3 Opus. Esse aumento de desempenho, combinado com preços economicamente viáveis, torna o Claude 3.5 Sonnet ideal para tarefas complexas, como atendimento ao cliente sensível ao contexto e orquestração de fluxos de trabalho multietapas.

Em uma avaliação interna de codificação agente, Claude 3.5 Sonnet resolveu 64% dos problemas, superando o Claude 3 Opus que resolveu 38%.

Nossa avaliação testa a capacidade do modelo de corrigir um bug ou adicionar funcionalidades a uma base de código de código aberto, dada uma descrição em linguagem natural da melhoria desejada.

Quando instruído e fornecido com as ferramentas relevantes, Claude 3.5 Sonnet pode escrever, editar e executar código de forma independente, com capacidades sofisticadas de raciocínio e solução de problemas.

Ele lida com traduções de código com facilidade, tornando-se particularmente eficaz para a atualização de aplicações legadas e migração de bases de código.
avaliação interna de codificação agente
fornecido com as ferramentas relevantes

Visão de ponta

Claude 3.5 Sonnet é nosso modelo de visão mais forte até agora, superando o Claude 3 Opus em benchmarks de visão padrão.

Essas melhorias são mais perceptíveis em tarefas que requerem raciocínio visual, como a interpretação de gráficos e tabelas.

Claude 3.5 Sonnet também pode transcrever texto com precisão a partir de imagens imperfeitas—uma capacidade central para os setores de varejo, logística e serviços financeiros, onde a IA pode obter mais insights de uma imagem, gráfico ou ilustração do que apenas do texto.

Artifacts—uma nova forma de usar Claude

Hoje, estamos também introduzindo Artifacts no Claude.ai, um novo recurso que expande a forma como os usuários podem interagir com Claude.

Quando um usuário pede a Claude para gerar conteúdo como trechos de código, documentos de texto ou designs de sites, esses Artifacts aparecem em uma janela dedicada ao lado da conversa.

Isso cria um espaço de trabalho dinâmico onde eles podem ver, editar e construir em cima das criações de Claude em tempo real, integrando perfeitamente o conteúdo gerado por IA em seus projetos e fluxos de trabalho.

Este recurso de pré-visualização marca a evolução de Claude de uma IA conversacional para um ambiente de trabalho colaborativo.

É apenas o início de uma visão mais ampla para o Claude.ai, que em breve será expandido para apoiar a colaboração em equipe.

No futuro próximo, equipes—a eventualmente organizações inteiras—poderão centralizar de forma segura seus conhecimentos, documentos e trabalhos em andamento em um espaço compartilhado, com Claude atuando como um colega de equipe sob demanda.

Compromisso com a segurança e privacidade

Nossos modelos são submetidos a testes rigorosos e foram treinados para reduzir o uso indevido.

Apesar do salto em inteligência do Claude 3.5 Sonnet, nossas avaliações com red teaming concluíram que Claude 3.5 Sonnet permanece no ASL-2. Mais detalhes podem ser encontrados no adendo da card do modelo.
ASL-2
adendo da card do modelo

Como parte de nosso compromisso com a segurança e transparência, envolvemos especialistas externos para testar e refinar os mecanismos de segurança deste último modelo.

Recentemente, fornecemos Claude 3.5 Sonnet ao Instituto de Segurança de Inteligência Artificial do Reino Unido (UK AISI) para uma avaliação de segurança pré-deployment.

O UK AISI completou os testes do 3.5 Sonnet e compartilhou seus resultados com o Instituto de Segurança de IA dos EUA (US AISI) como parte de um Memorando de Entendimento, possibilitado pela parceria entre os US e UK AISIs anunciada no início deste ano.
anunciada no início deste ano

Integrámos feedback de políticas de especialistas externos para garantir que nossas avaliações são robustas e levam em conta novas tendências de abuso. Esse envolvimento ajudou nossas equipes a ampliar nossa capacidade de avaliar o 3.5 Sonnet contra vários tipos de uso indevido.

Por exemplo, usamos feedback de especialistas em segurança infantil da Thorn para atualizar nossos classificadores e ajustar nossos modelos.
Thorn

Um dos princípios constitucionais centrais que guiam nosso desenvolvimento de modelos de IA é a privacidade. Não treinamos nossos modelos generativos com dados enviados por usuários, a menos que um usuário nos dê permissão explícita para fazê-lo.

Até agora, não usamos nenhum dado de cliente ou enviado por usuário para treinar nossos modelos generativos.

Próximos lançamentos

Nosso objetivo é melhorar substancialmente a curva de tradeoff entre inteligência, velocidade e custo a cada poucos meses.

Para completar a família de modelos Claude 3.5, lançaremos Claude 3.5 Haiku e Claude 3.5 Opus ainda este ano.

Além de trabalhar em nossa próxima geração de modelos, estamos desenvolvendo novas modalidades e recursos para apoiar mais casos de uso para negócios, incluindo integrações com aplicativos empresariais.

Nossa equipe também está explorando recursos como Memória, que permitirá ao Claude lembrar-se das preferências e histórico de interações de um usuário conforme especificado, tornando sua experiência ainda mais personalizada e eficiente.

Estamos constantemente trabalhando para melhorar o Claude e adoramos ouvir de nossos usuários.

Você pode enviar feedback sobre Claude 3.5 Sonnet diretamente no produto para informar nossa roadmap de desenvolvimento e ajudar nossas equipes a melhorar sua experiência.

Como sempre, estamos ansiosos para ver o que você construirá, criará e descobrirá com Claude.

Resources:
https://twitter.com/intent/tweet?text=https://www.anthropic.com/news/claude-3-5-sonnet
https://www.linkedin.com/shareArticle?mini=true&url=https://www.anthropic.com/news/claude-3-5-sonnet

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *