Diretrizes, guardrails e transferência para humano

Manter o Capitão IA útil em produção depende de três frentes: orientar como ele responde (diretrizes), proibir o que ele não pode fazer (guardrails) e garantir que ele passe a conversa para um humano quando algo fugir do controle. Esses três mecanismos funcionam em camadas e não se substituem.

Diretrizes de resposta

O campo Diretrizes de resposta (response_guidelines) do assistente é uma lista de orientações de estilo. Cada item é uma frase em linguagem natural que o motor injeta no contexto antes de gerar cada resposta.

Bons exemplos:

"Responda sempre em português brasileiro, mesmo se o cliente escrever em outra língua."
"Use no máximo três frases por mensagem; se precisar explicar algo extenso, divida em mais de uma resposta."
"Quando confirmar um pedido, repita o número e o valor antes de fechar a conversa."
"Inclua um cumprimento na primeira mensagem da conversa, mas evite repetir cumprimentos nas mensagens seguintes."
"Se o cliente compartilhar um e-mail ou telefone, confirme antes de salvar como atributo do contato."

Diretrizes valem para todo o assistente — incluindo cenários, respostas baseadas em FAQ e respostas livres baseadas em documentos.

Guardrails

O campo Guardrails é a camada de segurança. São proibições absolutas, escritas com clareza, que o motor respeita mesmo quando o cliente insiste no contrário.

Bons exemplos:

"Não compartilhe informações de outros clientes sob nenhuma circunstância."
"Não prometa prazos de entrega; sempre direcione para a equipe de logística."
"Não emita opinião sobre concorrentes nem comparações de preço."
"Não solicite dados de cartão de crédito, CPF completo ou senhas."
"Não invente políticas; se a informação não está na base de conhecimento, diga que vai consultar a equipe."

Diretrizes orientam o tom; guardrails impedem comportamentos. Use guardrails curtos e categóricos. Frases ambíguas ("seja cuidadoso com dados") são menos eficazes que frases imperativas ("nunca peça CPF").

A ferramenta de handoff

Todo assistente do Capitão IA tem disponível, automaticamente, uma ferramenta interna chamada handoff. Quando ela é acionada:

O assistente envia a mensagem de handoff configurada no perfil dele (por padrão algo como "Vou transferir você para um atendente humano agora").
A conversa é marcada para atribuição manual à equipe humana.
O assistente para de responder naquela conversa até que um agente humano resolva ou retransfira.

O assistente decide acionar handoff em três situações:

A pergunta está fora do escopo definido pela descrição e diretrizes.
Um guardrail proíbe responder o que foi pedido.
O cliente pede explicitamente falar com um humano.

Você também pode acionar handoff explicitamente em cenários, mencionando-o como passo final da instrução ("após coletar os três campos, faça o handoff para a equipe Comercial").

Mensagens de sistema do assistente

Três mensagens configuráveis no assistente reforçam a previsibilidade da experiência:

Mensagem de boas-vindas — primeira fala em uma conversa nova. Apresenta o assistente e o escopo de ajuda.
Mensagem de handoff — usada quando o assistente transfere a conversa. Sinaliza claramente para o cliente que ele agora fala com um humano.
Mensagem de resolução — usada quando o assistente decide que a dúvida foi resolvida e encerra a conversa por conta própria.

Personalizar essas três frases é uma forma simples de alinhar a experiência do Capitão IA com o tom da sua marca.

Validação de ferramentas

Quando você cria um cenário que invoca ferramentas customizadas com a sintaxe [@Nome](tool://slug), o sistema valida no salvamento que todas as ferramentas referenciadas existem e estão habilitadas. Cenários com referência a ferramenta inválida não salvam — você é forçado a corrigir antes. Isso evita execuções em produção que falhariam silenciosamente por ferramenta desligada ou renomeada.

Boas práticas

Comece restrito, abra com cuidado. É mais fácil flexibilizar guardrails depois de validar com clientes reais do que retirar uma resposta problemática que já foi enviada.
Diretrizes em primeira pessoa do assistente. Frases como "responda…", "use…", "evite…" funcionam melhor que afirmações descritivas.
Guardrails categóricos. "Nunca", "jamais", "sob nenhuma circunstância" são úteis aqui — o motor leva linguagem absoluta a sério.
Teste cada guardrail no playground. Ao adicionar um guardrail, simule a tentativa de quebrá-lo no playground. Se o assistente cedeu, reescreva.
Não dependa só de guardrail para escopo amplo. Para temas inteiros que estão fora do produto, é melhor configurar handoff automático no cenário do que tentar listar tudo o que o assistente "não deve" falar.

Próximos passos

Acompanhe quantas conversas terminam em handoff, quantas FAQs estão pendentes e quanto da cota de respostas você consumiu em Métricas, playground e acompanhamento.