Diretrizes, guardrails e transferência para humano
Manter o Capitão IA útil em produção depende de três frentes: orientar como ele responde (diretrizes), proibir o que ele não pode fazer (guardrails) e garantir que ele passe a conversa para um humano quando algo fugir do controle. Esses três mecanismos funcionam em camadas e não se substituem.
Diretrizes de resposta
O campo Diretrizes de resposta (response_guidelines) do assistente é uma lista de orientações de estilo. Cada item é uma frase em linguagem natural que o motor injeta no contexto antes de gerar cada resposta.
Bons exemplos:
- "Responda sempre em português brasileiro, mesmo se o cliente escrever em outra língua."
- "Use no máximo três frases por mensagem; se precisar explicar algo extenso, divida em mais de uma resposta."
- "Quando confirmar um pedido, repita o número e o valor antes de fechar a conversa."
- "Inclua um cumprimento na primeira mensagem da conversa, mas evite repetir cumprimentos nas mensagens seguintes."
- "Se o cliente compartilhar um e-mail ou telefone, confirme antes de salvar como atributo do contato."
Diretrizes valem para todo o assistente — incluindo cenários, respostas baseadas em FAQ e respostas livres baseadas em documentos.
Guardrails
O campo Guardrails é a camada de segurança. São proibições absolutas, escritas com clareza, que o motor respeita mesmo quando o cliente insiste no contrário.
Bons exemplos:
- "Não compartilhe informações de outros clientes sob nenhuma circunstância."
- "Não prometa prazos de entrega; sempre direcione para a equipe de logística."
- "Não emita opinião sobre concorrentes nem comparações de preço."
- "Não solicite dados de cartão de crédito, CPF completo ou senhas."
- "Não invente políticas; se a informação não está na base de conhecimento, diga que vai consultar a equipe."
Diretrizes orientam o tom; guardrails impedem comportamentos. Use guardrails curtos e categóricos. Frases ambíguas ("seja cuidadoso com dados") são menos eficazes que frases imperativas ("nunca peça CPF").
A ferramenta de handoff
Todo assistente do Capitão IA tem disponível, automaticamente, uma ferramenta interna chamada handoff. Quando ela é acionada:
- O assistente envia a mensagem de handoff configurada no perfil dele (por padrão algo como "Vou transferir você para um atendente humano agora").
- A conversa é marcada para atribuição manual à equipe humana.
- O assistente para de responder naquela conversa até que um agente humano resolva ou retransfira.
O assistente decide acionar handoff em três situações:
- A pergunta está fora do escopo definido pela descrição e diretrizes.
- Um guardrail proíbe responder o que foi pedido.
- O cliente pede explicitamente falar com um humano.
Você também pode acionar handoff explicitamente em cenários, mencionando-o como passo final da instrução ("após coletar os três campos, faça o handoff para a equipe Comercial").
Mensagens de sistema do assistente
Três mensagens configuráveis no assistente reforçam a previsibilidade da experiência:
- Mensagem de boas-vindas — primeira fala em uma conversa nova. Apresenta o assistente e o escopo de ajuda.
- Mensagem de handoff — usada quando o assistente transfere a conversa. Sinaliza claramente para o cliente que ele agora fala com um humano.
- Mensagem de resolução — usada quando o assistente decide que a dúvida foi resolvida e encerra a conversa por conta própria.
Personalizar essas três frases é uma forma simples de alinhar a experiência do Capitão IA com o tom da sua marca.
Validação de ferramentas
Quando você cria um cenário que invoca ferramentas customizadas com a sintaxe [@Nome](tool://slug), o sistema valida no salvamento que todas as ferramentas referenciadas existem e estão habilitadas. Cenários com referência a ferramenta inválida não salvam — você é forçado a corrigir antes. Isso evita execuções em produção que falhariam silenciosamente por ferramenta desligada ou renomeada.
Boas práticas
- Comece restrito, abra com cuidado. É mais fácil flexibilizar guardrails depois de validar com clientes reais do que retirar uma resposta problemática que já foi enviada.
- Diretrizes em primeira pessoa do assistente. Frases como "responda…", "use…", "evite…" funcionam melhor que afirmações descritivas.
- Guardrails categóricos. "Nunca", "jamais", "sob nenhuma circunstância" são úteis aqui — o motor leva linguagem absoluta a sério.
- Teste cada guardrail no playground. Ao adicionar um guardrail, simule a tentativa de quebrá-lo no playground. Se o assistente cedeu, reescreva.
- Não dependa só de guardrail para escopo amplo. Para temas inteiros que estão fora do produto, é melhor configurar handoff automático no cenário do que tentar listar tudo o que o assistente "não deve" falar.
Próximos passos
Acompanhe quantas conversas terminam em handoff, quantas FAQs estão pendentes e quanto da cota de respostas você consumiu em Métricas, playground e acompanhamento.