ChatML, ou Linguagem de Marcação de Chat, é um formato proposto para estruturar a entrada e a saída de modelos de linguagem grandes (LLMs) como o ChatGPT. Ele visa abordar vários desafios:

Segurança:
LLMs são vulneráveis a ataques de injeção de prompt, onde usuários maliciosos podem manipular a entrada do modelo para gerar saídas prejudiciais ou enganosas. O ChatML ajuda a prevenir isso separando claramente os papéis do usuário, do sistema e do modelo em uma conversa.

Transparência:
Pode ser difícil entender como os LLMs chegam às suas saídas. O ChatML torna o processo de raciocínio mais transparente marcando explicitamente diferentes partes da conversa, como a consulta do usuário, a resposta do sistema e o texto gerado pelo modelo.

Controle:
O ChatML dá aos usuários mais controle sobre a conversa, permitindo que eles especifiquem o tipo de resposta que desejam do modelo (por exemplo, factual, criativo, humorístico).

Padronização:
O ChatML pode se tornar uma maneira padrão de interagir com LLMs, tornando mais fácil para desenvolvedores criar aplicativos que usam esses modelos.

Aqui está um exemplo de como o ChatML pode ser usado em uma conversa:

Usuário: Qual é a capital da França? Sistema (ChatML): O usuário fez uma pergunta sobre a capital da França. Modelo: Paris é a capital da França.

Neste exemplo, a consulta do usuário é identificada, o sistema reconhece o tipo de pergunta e o modelo fornece a resposta. Isso deixa claro quem disse o quê e por quê.

Enquanto o ChatML ainda está em desenvolvimento, ele tem o potencial de melhorar a forma como interagimos com LLMs. Ele pode tornar esses modelos mais seguros, transparentes, controláveis e padronizados.

Aqui estão alguns detalhes adicionais sobre o ChatML:

  • Ele é baseado em JSON, um formato de dados comum que é fácil de ler e escrever.
  • Ele usa tags para identificar diferentes partes da conversa, como a consulta do usuário, a resposta do sistema e o texto gerado pelo modelo.
  • Ele pode ser usado com uma variedade de modelos LLM, incluindo GPT-3 e Jurassic-1 Jumbo.

Espero que isso dê a você uma compreensão melhor do ChatML!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *