Capitao IA

Diretrizes, guardrails e transferência para humano

Como manter o Capitão IA dentro do escopo: diretrizes de resposta, guardrails como camada de segurança, ferramenta de handoff e configuração das mensagens de transferência e resolução.

Diretrizes, guardrails e transferência para humano

Manter o Capitão IA útil em produção depende de três frentes: orientar como ele responde (diretrizes), proibir o que ele não pode fazer (guardrails) e garantir que ele passe a conversa para um humano quando algo fugir do controle. Esses três mecanismos funcionam em camadas e não se substituem.

Diretrizes de resposta

O campo Diretrizes de resposta (response_guidelines) do assistente é uma lista de orientações de estilo. Cada item é uma frase em linguagem natural que o motor injeta no contexto antes de gerar cada resposta.

Bons exemplos:

  • "Responda sempre em português brasileiro, mesmo se o cliente escrever em outra língua."
  • "Use no máximo três frases por mensagem; se precisar explicar algo extenso, divida em mais de uma resposta."
  • "Quando confirmar um pedido, repita o número e o valor antes de fechar a conversa."
  • "Inclua um cumprimento na primeira mensagem da conversa, mas evite repetir cumprimentos nas mensagens seguintes."
  • "Se o cliente compartilhar um e-mail ou telefone, confirme antes de salvar como atributo do contato."

Diretrizes valem para todo o assistente — incluindo cenários, respostas baseadas em FAQ e respostas livres baseadas em documentos.

Guardrails

O campo Guardrails é a camada de segurança. São proibições absolutas, escritas com clareza, que o motor respeita mesmo quando o cliente insiste no contrário.

Bons exemplos:

  • "Não compartilhe informações de outros clientes sob nenhuma circunstância."
  • "Não prometa prazos de entrega; sempre direcione para a equipe de logística."
  • "Não emita opinião sobre concorrentes nem comparações de preço."
  • "Não solicite dados de cartão de crédito, CPF completo ou senhas."
  • "Não invente políticas; se a informação não está na base de conhecimento, diga que vai consultar a equipe."

Diretrizes orientam o tom; guardrails impedem comportamentos. Use guardrails curtos e categóricos. Frases ambíguas ("seja cuidadoso com dados") são menos eficazes que frases imperativas ("nunca peça CPF").

A ferramenta de handoff

Todo assistente do Capitão IA tem disponível, automaticamente, uma ferramenta interna chamada handoff. Quando ela é acionada:

  1. O assistente envia a mensagem de handoff configurada no perfil dele (por padrão algo como "Vou transferir você para um atendente humano agora").
  2. A conversa é marcada para atribuição manual à equipe humana.
  3. O assistente para de responder naquela conversa até que um agente humano resolva ou retransfira.

O assistente decide acionar handoff em três situações:

  • A pergunta está fora do escopo definido pela descrição e diretrizes.
  • Um guardrail proíbe responder o que foi pedido.
  • O cliente pede explicitamente falar com um humano.

Você também pode acionar handoff explicitamente em cenários, mencionando-o como passo final da instrução ("após coletar os três campos, faça o handoff para a equipe Comercial").

Mensagens de sistema do assistente

Três mensagens configuráveis no assistente reforçam a previsibilidade da experiência:

  • Mensagem de boas-vindas — primeira fala em uma conversa nova. Apresenta o assistente e o escopo de ajuda.
  • Mensagem de handoff — usada quando o assistente transfere a conversa. Sinaliza claramente para o cliente que ele agora fala com um humano.
  • Mensagem de resolução — usada quando o assistente decide que a dúvida foi resolvida e encerra a conversa por conta própria.

Personalizar essas três frases é uma forma simples de alinhar a experiência do Capitão IA com o tom da sua marca.

Validação de ferramentas

Quando você cria um cenário que invoca ferramentas customizadas com a sintaxe [@Nome](tool://slug), o sistema valida no salvamento que todas as ferramentas referenciadas existem e estão habilitadas. Cenários com referência a ferramenta inválida não salvam — você é forçado a corrigir antes. Isso evita execuções em produção que falhariam silenciosamente por ferramenta desligada ou renomeada.

Boas práticas

  • Comece restrito, abra com cuidado. É mais fácil flexibilizar guardrails depois de validar com clientes reais do que retirar uma resposta problemática que já foi enviada.
  • Diretrizes em primeira pessoa do assistente. Frases como "responda…", "use…", "evite…" funcionam melhor que afirmações descritivas.
  • Guardrails categóricos. "Nunca", "jamais", "sob nenhuma circunstância" são úteis aqui — o motor leva linguagem absoluta a sério.
  • Teste cada guardrail no playground. Ao adicionar um guardrail, simule a tentativa de quebrá-lo no playground. Se o assistente cedeu, reescreva.
  • Não dependa só de guardrail para escopo amplo. Para temas inteiros que estão fora do produto, é melhor configurar handoff automático no cenário do que tentar listar tudo o que o assistente "não deve" falar.

Próximos passos

Acompanhe quantas conversas terminam em handoff, quantas FAQs estão pendentes e quanto da cota de respostas você consumiu em Métricas, playground e acompanhamento.

Esse artigo respondeu sua duvida?

Falar com o time