Base de conhecimento: documentos e FAQs

A base de conhecimento é a fonte primária de informação do Capitão IA. É a partir dela que o assistente formula respostas, deduz o tom adequado e aciona cenários quando o cliente pede algo previsto. A base é organizada em duas entidades complementares: documentos (conteúdo bruto) e FAQs (perguntas e respostas curadas).

Onde encontrar

Em Configurações → Capitão IA → Documentos você vê a lista de tudo que o assistente sabe. Cada documento pertence a um único assistente e fica disponível somente para as caixas vinculadas àquele assistente.

Tipos de fonte aceitos

Existem duas formas de alimentar o assistente:

URL externa

Cole o endereço de uma página pública (FAQ no site, documentação, artigo de blog) e o sistema dispara um job de crawl. Ele baixa o HTML, extrai o texto principal, indexa para busca semântica e marca o documento como disponível. URLs duplicadas dentro do mesmo assistente são bloqueadas — o sistema não permite cadastrar a mesma página duas vezes.

Arquivo PDF

Você envia um PDF diretamente. Validações importantes:

O arquivo precisa ter MIME application/pdf.
O tamanho máximo é de 50 MB por documento. Acima disso o upload é rejeitado com a mensagem "PDF excede o limite de tamanho".
O conteúdo é extraído e indexado em segundo plano; o documento começa em status em processamento e migra para disponível quando o processamento termina.

O limite de 200 MB que você vê em outros artigos vale para envio de mídia em conversas (anexos respondidos ao cliente), não para documentos da base de conhecimento.

Status do documento

Cada documento percorre dois eixos de status:

Status geral — em processamento ou disponível. O assistente só consulta documentos disponíveis.
Sincronização — syncing, synced ou failed. Indica como foi o último ciclo de re-crawl da URL ou processamento do PDF. Documentos com status failed precisam ser reprocessados manualmente; o motivo do erro fica registrado no metadata do documento.

A re-sincronização de URLs roda periodicamente para capturar mudanças no conteúdo da página. Para PDFs, qualquer atualização exige reupload.

FAQs: perguntas e respostas curadas

Sempre que um documento entra em estado disponível, o motor dispara um job que gera automaticamente perguntas e respostas a partir do conteúdo. Essas FAQs aparecem na fila de aprovação com status pending, e nenhuma delas entra em produção sem revisão humana.

A fila fica em Configurações → Capitão IA → Respostas (ou na aba FAQs dentro do assistente). Para cada pergunta gerada você pode:

Aprovar — muda o status para approved e a resposta passa a ser usada nas conversas. Aprovar é o ato que efetivamente coloca aquele conhecimento em produção.
Editar — antes de aprovar, ajuste a pergunta ou a resposta. Edições marcam o registro como edited, sinalizando que ele já passou por curadoria humana.
Rejeitar — descarta a sugestão.

Você também pode cadastrar manualmente perguntas e respostas que sabe que vão aparecer com frequência, sem depender da geração automática.

Como o assistente usa tudo isso

Quando uma mensagem chega, o motor:

Calcula um vetor semântico da pergunta do cliente.
Busca pelas FAQs aprovadas semanticamente próximas. Se houver match alto, a resposta da FAQ é usada como base.
Se nenhuma FAQ casar, busca trechos relevantes nos documentos disponíveis.
Combina o que encontrou com a descrição do assistente, as diretrizes e os guardrails para gerar a resposta final.
Se o assistente tem citações ativadas, ele indica de qual documento ou FAQ veio a informação.

Boas práticas

Comece pelas perguntas mais frequentes. Cadastre manualmente as 10 a 20 dúvidas que mais aparecem no atendimento humano. É o caminho mais rápido para o assistente ser útil.
Revise as FAQs geradas antes de aprovar. Geração automática é um ponto de partida — o conteúdo pode estar desatualizado ou impreciso. Aprovar sem ler é o que produz respostas erradas em produção.
Quebre PDFs longos por assunto. Documentos focados (políticas de troca, prazos de entrega, configurações de conta) recuperam mais bem do que um manual único de 200 páginas.
Atualize a fonte, não o documento. Quando uma política mudar, edite a página ou o PDF original e dispare a re-sincronização. Manter a fonte como verdade evita divergência.
Limite de armazenamento depende do plano. Cada plano tem uma cota de documentos por workspace. Excedeu? Apague documentos obsoletos ou contrate expansão.

Próximos passos

Com a base alimentada, configure os fluxos guiados em Receitas de fluxo e defina como o assistente deve se portar nos limites em Validações e handoff.