IA auditavel para financas: a arquitetura da Kepler com Claude que separa raciocinio de computacao
Kepler construiu uma plataforma de IA verificavel para servicos financeiros usando Claude, separando raciocinio de computacao. Um case que serve de blueprint para IA empresarial em qualquer setor regulado.

Eu li o case da Kepler com Claude e uma frase ficou martelando na minha cabeca: How am I supposed to trust something I cant audit? Foi isso que um managing director de um fundo bilionario perguntou aos founders da Kepler durante uma rodada de pesquisa com 147 firmas financeiras. Essa pergunta sintetiza o maior gargalo da IA em setores regulados e a resposta que a Kepler construiu e, na minha visao, o blueprint mais honesto de IA empresarial que eu vi este ano. Nao e sobre o modelo ser mais inteligente; e sobre a arquitetura ser honesta sobre o que o modelo faz e o que ele nao deve fazer.
O problema de confianca que trava a IA nas financas
Os founders da Kepler Vinoo Ganesh e John McRaven, ambos ex-Palantir entrevistaram 147 firmas financeiras entre private equity, hedge funds e investment banks antes de escrever uma linha de codigo. O refrao foi o mesmo: IA sabe interpretar linguagem natural, IA sabe fazer contas, mas ninguem confia no resultado porque o modelo faz as duas coisas no mesmo passo. Se o modelo erra, voce nao sabe onde. Cada numero que um LLM produz sai de uma caixa-preta probabilistica, e em financas cada figura precisa rastrear ate a linha exata do documento de origem pagina, paragrafo, linha. Esse nao e um problema de prompt engineering. E um problema de arquitetura.
A separacao que muda tudo: raciocinio vs. computacao
A sacada da Kepler foi separar radicalmente o que o Claude faz do que a infraestrutura faz e isso e o que diferencia um experimento de um sistema em producao. Claude e o motor de raciocinio: interpreta a pergunta do analista, desambigua termos financeiros, quebra o problema em etapas e gera um plano de execucao estruturado. Mas quem executa as operacoes que precisam ser deterministicamente corretas calcular indices financeiros, resolver periodos fiscais, buscar numeros em filings da SEC e um ambiente de execucao separado, nao o modelo.
Cada operacao computacional e auditavel, cada numero tem proveniencia ate a pagina e linha do documento original. Claude nao faz conta; Claude decide qual conta fazer e o motor verificavel executa. Isso lembra o que discuti no post sobre The Founders Playbook da Anthropic: construir uma startup AI-native de verdade exige pensar em arquitetura de confianca desde o primeiro dia, nao como um afterthought.
Opus 4.7 e Sonnet 4.6: cada modelo no seu estagio certo
A Kepler nao usa um modelo so e isso e outro sinal de maturidade no design. Para o raciocinio complexo decompor intencao do usuario, resolver ambiguidades semanticas, gerar planos com multiplas etapas interdependentes eles usam Opus 4.7. Para estagios de alta vazao com tarefas mais constraintadas, entra Sonnet 4.6.
O co-founder Ganesh contou que, em planos longos com dependencias, outros modelos comecavam bem e discretamente dropavam uma constraint no passo cinco. Claude foi o unico que manteve o plano coeso. E mais: quando um termo financeiro tinha dois significados possiveis, outros modelos chutavam; Claude parava e pedia esclarecimento ao analista. Ganesh disse que esse comportamento vale mais que qualquer benchmark e eu concordo. Um pressuposto errado no comeco de uma analise financeira quebra tudo que vem depois. Detalhei isso tambem no guia completo do Claude Code, onde mostro como configurar o ecossistema Claude para diferentes cargas de trabalho.
Proveniencia arquitetada desde o primeiro dia
Diferente de empresas que tentam adicionar audit trail depois, a Kepler desenhou a proveniencia como parte do core da plataforma desde o inicio. Cada resposta gerada vem com um link clicavel que leva o analista direto a linha exata no documento de origem. Os numeros sao impressionantes: 26 milhoes de filings da SEC indexados, mais de 50 milhoes de documentos publicos e 1 milhao de documentos privados, cobrindo 14 mil empresas em 27 mercados globais tudo construido em menos de tres meses por um time enxuto.
Em termos de compliance, a Kepler ja tem SOC 2 Type II e esta em processo de certificacao ISO 27001. Ambientes de cliente completamente isolados, logging auditavel de todas as operacoes, e modelos de taxonomy proprienarios que atingiram 94% de precisao contra 38-46% de outros modelos no mapeamento de labels de demonstracoes financeiras para codigos padronizados. Esse nivel de sofisticacao em tao pouco tempo e o que acontece quando voce tem um time que ja construiu sistemas criticos na Palantir.
O que devs podem aprender com a arquitetura da Kepler
Tres licoes que eu tirei desse case e que se aplicam a qualquer um construindo com IA hoje:
(1) Separe raciocinio de computacao. Essa e a licao mais transferivel de longe. Se o seu sistema de IA mistura interpretacao com execucao de operacoes criticas, voce nao vai conseguir auditar nem escalar. O modelo interpreta e planeja; um motor deterministico executa o que precisa ser correto. (2) Prompt engineering otimiza uma chamada, mas content engineering otimiza o sistema inteiro. Essa frase do CTO McRaven e das melhores que li sobre engenharia de IA. O que a Kepler chama de content engineering e desenhar ontologias financeiras, pipelines de contexto e ambientes de execucao deterministicos coisas que nenhum prompt conserta. (3) Modele os estagios do seu pipeline com o modelo certo para cada um. Opus para o que requer julgamento aberto, Sonnet para o que e repetitivo e bem definido. Gastar o modelo caro em tarefas simples e desperdicio; gastar o modelo barato em tarefas que exigem raciocinio profundo e risco.
O padrao se repete: financas, healthcare, legal
O que a Kepler construiu nao e so um case de IA em financas. O co-founder Ganesh foi direto: Kepler Finance e o primeiro produto. Nao sera o ultimo. Eles ja estao de olho em healthcare reconciliacao de dados de ensaios clinicos e em legal rastreamento de precedentes jurisprudenciais. O padrao arquitetural e o mesmo: Claude interpreta e raciocina, uma camada verificavel executa e audita, e o usuario final confia no resultado porque pode rastrear cada passo.
Falei sobre aplicacoes de Claude em setores regulados no post sobre Claude na industria juridica, onde 87% dos General Counsel ja usam IA generativa. O mesmo padrao de validacao e auditabilidade aparece la e a tendencia e que se intensifique.
Conclusao
O case da Kepler e a demonstracao de que o proximo salto da IA empresarial nao vem de modelos maiores vem de arquiteturas que sabem onde cada modelo encaixa e, mais importante, onde ele nao deve encaixar. A pergunta que abre o artigo original como confiar em algo que nao posso auditar? nao tem resposta magica. Tem resposta arquitetural. E a Kepler deu. Leia o artigo original da Anthropic aqui para mergulhar nos detalhes tecnicos.
Comentários
Nenhum comentário ainda. Seja o primeiro a compartilhar suas ideias.