Visão geral
Eu trato “quant” como uma fábrica. O produto não é uma ideia. O produto é uma linha de produção com controle de qualidade, que entrega resultados repetíveis.
O que muda quando vira unidade de negócio
- P&L e dono: Tem quem assuma responsabilidade por entregas, custos e indicadores.
- Gates: Avanços são feitos só quando o sistema prova qualidade, estabilidade e controle de risco.
- Reuso: É feita a criação da plataforma e processos para lançar novos produtos sem “reinventar o mundo”.
Tese e racional
Por que agora
- Distribuição: a XP tem escala para transformar uma estratégia boa em um negócio grande.
- Cliente: há demanda por produtos sistemáticos e transparência de risco.
- Execução: a barreira real é governança + plataforma + time certo, não “uma ideia genial”.
O que eu não proponho
- Não é um laboratório sem dono e sem métricas.
- Não é hackathon nem “prova de conceito eterna”.
- Não é apostar em caixa-preta. Eu quero explicabilidade operacional.
O que eu proponho
Um núcleo: Quant / Systematic Platform
- Plataforma: dados, backtest, simulação, execução, observabilidade e controle.
- Pesquisa: hipóteses, validação, robustez, capacidade e risco.
- Operação: paper trading, reconciliação, incidentes, rollback e “kill switch”.
Linhas de receita (3 opções; começamos por A)
Linha A — Produtos (Asset): como vira unidade de negócio
Nesta linha, o time cria produtos de investimento sistemáticos (fundos) com tese, regras, governança e capacidade de distribuição. O objetivo é transformar “research e engenharia” em um produto vendável, com métrica financeira clara e responsabilidade fiduciária.
Escopo do “produto” (o que entregamos de ponta a ponta)
- Tese e mandato: classe de ativos, universo, restrições, objetivos (retorno/risco), horizonte e capacidade.
- Processo sistemático: geração de sinais, construção de portfólio, sizing, gestão de risco, regras de exceção.
- Execução: integração com OMS/EMS, controles de slippage, limites, reconciliação e trilha auditável.
- Operação: precificação, eventos corporativos, calendário, conciliação, incidentes e rotinas.
- Reporte: fatos do fundo (exposição, risco, P&L), explicabilidade de mudanças e comunicação de eventos.
Artefatos mínimos
- Model Card / Strategy Card: tese, premissas, hipóteses, regimes, limites e falhas esperadas.
- Playbook operacional: rotinas diárias, contingências, rollback e critérios de “pausar”.
- Trilha de auditoria: dados usados, versões de código/config, ordens e justificativas.
Modelo de operação (do sinal ao cliente)
Gates e métricas (go/no-go que o time usa)
Gates técnicos
- Dados: integridade, latência aceitável, cobertura e teste de backfill/replay.
- Reprodutibilidade: backtest determinístico, versionamento de código/config, seed e trilha de execução.
- Robustez: validação fora da amostra, stress de regimes, sensibilidade a custos e slippage.
- Execução: controles de risco pré-trade, pós-trade, reconciliação e circuit breakers.
- Operação: runbooks, alarmes, monitoração, e procedimento claro de pausa/retomada.
Métricas de negócio
- AUM: crescimento líquido, estabilidade e concentração por canal/segmento.
- Receita: bps de administração, performance fees (quando houver), e sensibilidade a capacidade.
- Retenção: churn do produto e comportamento em drawdowns.
- Risco percebido: aderência ao mandato, drawdown, volatilidade, e transparência do reporte.
Estrutura de time (núcleo) para a Linha A
A Linha A exige um núcleo pequeno, mas completo. O time precisa cobrir pesquisa, engenharia, risco e operação. A distribuição escala depois que o processo prova estabilidade.
Núcleo (primeiros 90–180 dias)
- Lead de Produto/Investimento: mandato, comunicação, interface com compliance/risco e definição de métricas.
- Quant Research: hipóteses, validação, documentação e governança de modelos.
- Quant Engineering: backtester, pipelines, integração com execução, qualidade e observabilidade.
- Dados/Market Data: ingestão, qualidade, eventos corporativos, calendários e SLAs de dados.
- Risco/Operação: pré-trade, pós-trade, conciliação, incident response e controles.
Escala (após prova)
- Especialistas por classe: quando o portfólio de produtos cresce (juros, FX, equities, etc.).
- Automação operacional: reduzir custo marginal com tooling, evitando aumento linear de headcount.
- Distribuição e suporte: enablement para canais, materiais, Q&A e ciclo de feedback do cliente.
Custos e dependências (para não subestimar)
- Pessoas: núcleo + coberturas críticas (risco/operacional/compliance) e redundância mínima.
- Dados: market data, corporates, calendários, storage e ferramentas de validação/linhagem.
- Compute: backtests, pipelines, ambientes de simulação e monitoramento.
- Execução: custos explícitos (corretagem/bolsa) e implícitos (slippage, market impact).
- Governança: políticas, auditoria interna, trilhas, segregação de funções e revisões periódicas.
Sondagem de mercado (referência principal: BBA) — sinais que orientam execução
A sondagem foi usada como termômetro de maturidade para times de quant e plataformas de trading/tesouraria. O objetivo foi identificar padrões de execução que reduzem risco operacional e aumentam previsibilidade de entrega.
- Separar Market Data de Electronic Trading: um fluxo estabiliza dados e indicadores; outro foca em robôs/estratégias. Isso reduz acoplamento e incidentes.
- Convergir depois: com as bases sólidas, os fluxos convergem. O time evita big-bang.
- Refazer após provar valor: validar rápido com medição; depois endurecer arquitetura, automação e governança.
- Processo claro & governança: “burocracia boa” é a que deixa explícito “quem aprova o quê”, com rollback e trilha.
- Avaliar por arquitetura e comunicação: transparência (“isso aqui está ruim”) e raciocínio de trade-offs valem tanto quanto código.
- Remuneração alinhada ao bar: faixa é consequência do nível exigido; evita subcontratar posições críticas.
Definição (didática)
Carteiras sistemáticas são mandatos de investimento onde a decisão de alocação, rebalance e controle de risco segue regras e modelos predefinidos. Diferente de um fundo, a “embalagem” não precisa ser um veículo CVM. Pode ser uma carteira administrada ou um modelo de carteira aplicado em escala (com governança, suitability e trilha de auditoria).
Por que isso vira unidade de negócio na XP
- Receita recorrente (fee-based): monetiza o serviço de gestão, reduz dependência de “evento” (trade) e melhora previsibilidade.
- Aumento de share-of-wallet: cliente que terceiriza disciplina tende a concentrar mais patrimônio e reduzir churn.
- Escala via padronização: uma biblioteca de modelos (conservador/moderado/arrojado) pode ser distribuída com governança e medição.
- Qualidade consistente: regras reduzem dispersão entre assessores e evitam “portfolio drift” por decisão ad-hoc.
- Compliance como feature: suitability e limites entram no motor, reduzindo risco de recomendações inadequadas.
Sinais da sondagem (referência BBA) que ajudam no desenho
- Separar domínios: modelo (pesos/regras) separado de execução (rebalance/ordens) reduz acoplamento e exceções.
- Processo claro acelera: gates e aprovações explícitas reduzem retrabalho e “heroísmo” operacional.
- Refactor após medição: provar com piloto “funcionando e medido” e depois endurecer arquitetura e automação.
Arquitetura do produto (modelo mental)
Contrato de serviço (o que precisa ser explícito)
- Objetivo: manter a carteira próxima do risco-alvo, com disciplina e custo controlado.
- Frequência: rebalance periódico (ex.: mensal/trimestral) + rebalance por evento (drift acima da banda).
- Bandas: “quanto pode desviar antes de agir” (reduz giro e custo).
- Restrições: ativos permitidos, concentração, liquidez mínima, horários, impostos e regras internas.
- Explicabilidade: cada rebalance precisa de motivo registrável e comunicável.
Modelo de receita (e por que funciona)
- Fee-based: uma taxa pelo serviço de gestão (tipicamente proporcional ao AUM administrado na carteira do cliente).
- Unidade econômica clara: receita ≈ AUM em carteiras × fee.
- Retenção: com disciplina e transparência, o cliente permanece mais tempo e consolida patrimônio.
- Upsell natural: mais classes de ativos, modelos diferenciados e camadas premium (ex.: proteção/overlay).
Gates (90–180 dias) — go/no-go objetivo
- Tempo de setup: quanto tempo leva para “colocar um cliente” com governança.
- Giro e custo: impacto de rebalance em custo e imposto (onde aplicável).
- Qualidade operacional: incidência de exceções, falhas de dados, eventos corporativos e reversões.
- Drift controlado: % de carteiras fora da banda por tempo excessivo.
- Execução consistente: slippage e fill-rate dentro de limites por classe.
- Satisfação / retenção: taxa de permanência e concentração de AUM ao longo do piloto.
Time (mínimo viável) e interfaces
- Quant/Research: define modelos, bandas, hipóteses e métricas (com testabilidade).
- Engenharia: motor de rebalance, integrações, trilhas e confiabilidade.
- Execução/Trading interface: define regras de execução, janelas, limitações e tratamento de liquidez.
- Compliance & Suitability: regras e validações antes de operar em escala.
- Produto/Wealth: UX de oferta e relato (o cliente precisa entender).
- Operações: conciliação, eventos corporativos, exceções e suporte.
Definição (didática)
Linha C é o conjunto de sistemas e modelos que determinam como executar ordens de forma eficiente e segura: escolha de rota/venue, fracionamento, controle de risco pré-trade e intra-trade, tratamento de eventos de mercado, e mecanismos de estabilidade. A unidade econômica é o “delta” entre executar bem vs. executar mal.
Por que isso importa na XP
- Reduz custo por ordem: menos slippage e menor impacto de mercado em produtos e carteiras.
- Melhora estabilidade operacional: menos incidentes em picos, menos retries, menos degradação de canal.
- Aumenta conversão: ordens aceitas e executadas com menos fricção e menos erros no funil.
- Protege reputação: evita “execuções ruins” visíveis ao cliente e reduz reclamações.
- Base para escala: sem um motor de execução e controles, crescer volume amplifica custo e risco.
Sinais da sondagem (referência BBA) que ajudam no desenho
- Separar Market Data de Execution: dados e modelagem (curvas/indicadores) não podem competir com latência de execução.
- Processo claro vira estabilidade: mudança controlada, rollback e critérios objetivos de produção reduzem incidentes.
- Provar e depois refazer: primeiro gerar valor mensurável, depois endurecer arquitetura e automatizar controles.
Como medir (sem “achismo”)
- Slippage: diferença entre preço esperado e preço executado (com baseline claro).
- Implementation Shortfall: custo total vs. um preço de referência (arriving price, VWAP, etc.).
- Market Impact: estimar impacto marginal do próprio fluxo (principalmente em ativos menos líquidos).
- Spread capture / adverse selection: perdas por executar “do lado errado” do micro-movimento.
- Acceptance rate: % de ordens que passam validação e chegam ao mercado.
- Fill-rate: % executada, parcial vs. total, e tempo para executar.
- Reject rate: rejeições por regra, por limite, por erro de canal ou por condição de mercado.
- Latência p95/p99: do clique ao envio de ordem, e do envio ao primeiro fill (quando aplicável).
- Incidentes: quedas, circuit breakers acionados, backlog e eventos em DLQ/quarentena.
Arquitetura do domínio (modelo mental)
Componentes-chave (o que precisa existir de verdade)
Motor de execução (algos e comportamento)
- Slicing: dividir ordens grandes para reduzir impacto e evitar “chamar atenção” no livro.
- Timing: decidir quando agredir vs. esperar (trade-off: preço vs. risco de não executar).
- Roteamento: escolher rota/venue (quando aplicável) com critérios explícitos.
- Adaptação: reagir a spread/volatilidade/volume e a mudanças rápidas no book.
- Cancel/Replace seguro: reprecificar sem gerar tempestade de mensagens nem quebrar limites.
Controles (guardrails e proteção)
- Pré-trade risk: limites por ativo, por carteira, por cliente, por estratégia e por janela de tempo.
- Price bands: proteção contra preços fora do mercado (fat finger, book vazio, gaps).
- Rate limiting: limitar burst por sessão/estratégia para não degradar canal e nem gerar incidentes.
- Circuit breakers: desligamento controlado por sinais objetivos (latência, rejects, volatilidade extrema).
- Kill-switch: acionamento rápido, auditável, com escopo claro (por estratégia, por classe, por ambiente).
Gates (90–180 dias) — entregas com impacto mensurável
- Dashboards: slippage, fill-rate, rejects, latência e incidentes por fluxo.
- Trilha auditável: ordem → validações → decisões de execução → fills.
- Definição de referência: arriving price / VWAP / mid, com regras consistentes.
- Queda de rejects: menos rejeição por regra mal calibrada e menos falhas por canal.
- Melhora de slippage: redução em pontos-base em segmentos com volume relevante.
- Estabilidade: menos picos de latência e menos incidentes em janelas críticas.
Time mínimo viável (e interfaces)
- Quant/Execution Research: define baselines, modelos de impacto, heurísticas e validação estatística.
- Engenharia de baixa latência: implementa motor, roteamento e controles com confiabilidade.
- Market Data: garante dados consistentes e performance para sinais de execução.
- Risco/Compliance: valida guardrails, kill-switch, critérios e auditoria.
- Operações: conciliação, exceções, incident response e pós-trade.
- Produto/Canais: integra experiência do cliente e reduz fricções no funil.
Estrutura e governança
Guardrails (o que fica explícito)
- Model Risk: versionamento, aprovação, validação, expiração e rollback.
- Limites: exposição, perdas, alavancagem, liquidez, concentração e frequência.
- Controles de execução: price bands, rate limiting, circuit breakers e kill-switch (quando aplicável).
- Reprodutibilidade: dados, código e parâmetros com trilha e replay (quando possível).
- Segregação e acesso: quem pode pesquisar, promover, operar e pausar (com logs).
Quem aprova o quê (para não virar “burocracia ruim”)
- Produto: mandato, público-alvo, comunicação e métricas de sucesso.
- Risco: limites, cenários de stress, critérios de pausa e kill-switch.
- Compliance: suitability (quando aplicável), registros e obrigações de reporte.
- Engenharia: SLOs, observabilidade, plano de rollback e readiness operacional.
- Operações: conciliação, rotinas, exceções, incident response e playbooks.
Trilha de decisão (auditável)
Cadência (como o time mantém a disciplina)
- Revisão semanal: exceções, custos, slippage, rejects e degradações.
- Release gates: mudanças relevantes só entram com plano e evidência.
- Post-mortem: incidente gera aprendizado e ação. Não gera culpado.
- Revalidação periódica: modelos e limites expiram se não forem revisados.
Plano em 180 dias (sem teatro)
Fase 0 — Mandato, métricas e alinhamento (2–4 semanas)
- Charter da unidade: escopo, responsabilidades, interfaces (Produto/Risco/Compliance/Operações) e KPIs.
- Escolha do “primeiro alvo”: Linha A como default (produto/fundo) com alternativa clara de Linha B se os gates indicarem melhor fit.
- Definição de baseline: como medir custo/risco/impacto (custos, slippage, drawdown, churn/retensão, etc.).
- Plano de capacidade e custos: limites operacionais, premissas e budget inicial em tranches (com critérios para liberar a próxima tranche).
Fase 1 — Plataforma mínima + candidatos (8–10 semanas)
- Pipeline de dados: ingestão, validações, backfills, lineage e SLAs mínimos.
- Backtest reprodutível: custos, slippage, limites, capacity e trilha de execução (código/config/dados).
- Pacote padrão de research: 2 candidatos (estratégias ou modelos) com evidência, regimes, riscos e falhas esperadas.
- Primeiros dashboards: P&L, risco, exposição, custos e qualidade de dados (com baseline).
Fase 2 — Paper trading + operação (6–10 semanas)
- Paper trading: execução simulada com logs, reconciliação diária e P&L explain.
- Observabilidade: latência, falhas de dados, rejects simulados, drift e alertas úteis.
- Runbooks: incident response, pausas, rollback e rotinas (sem depender de “heróis”).
- Relato objetivo: relatório mensal curto (o que funcionou, o que falhou, por quê, e o que muda).
Fase 3 — Primeira linha de receita pronta para decisão (até 180 dias)
- Go/no-go formal: para Linha A (produto) ou Linha B (carteira), com critérios e evidência.
- Operação e governança prontas: trilha auditável, critérios de pausa e rotina de incidentes aplicados ao piloto.
- Plano de distribuição: público, suitability (quando aplicável), material de comunicação e expectativas.
- SLOs e “custos de verdade”: métricas que conectam execução/risco/experiência (slippage, estabilidade, churn/retensão, etc.).
Orçamento e custos (tranches)
Principais custos (onde o dinheiro vai)
- Pessoas: núcleo sênior para pesquisa + engenharia + risco/operacional.
- Dados/licenças: market data, corporates, calendários, qualidade/linhagem (escala por cobertura e latência).
- Infra: ambientes, storage, CI/CD, observabilidade e custo de backtests/pipelines.
- Controles: compliance/legal/auditoria interna (para operar e escalar com segurança).
- Execução: custos explícitos e implícitos (slippage/impact) — medidos como parte do produto.
Como o time controla custo (sem “buffet livre”)
- Compra de dados com propósito: cada vendor entra com hipótese e métrica de impacto.
- Reuso de plataforma: a mesma base atende Linhas A/B/C (evita rebuild por produto).
- Design para custo previsível: retenção/expurgo, pipelines determinísticos e jobs com limites.
- Escopo e cobertura por estágio: começar com universo reduzido e aumentar após evidência.
- Automação antes de headcount: crescer volume sem crescer pessoas na mesma proporção.
Tranches sugeridas (amarradas ao plano de 180 dias)
- Entregáveis: charter, baseline (custos/risco), interfaces e critérios de go/no-go.
- Libera a próxima tranche se: KPIs/SLOs definidos e responsáveis claros por decisão e operação.
- Entregáveis: pipeline + validações, backtest com custos e trilha, dashboards iniciais.
- Libera a próxima tranche se: resultados reproduzíveis, custo/risco explicados e candidatos “passam” robustez.
- Entregáveis: paper trade estável, reconciliação diária, alertas úteis, runbooks.
- Libera a próxima tranche se: o sistema roda por semanas com incidentes controlados e métricas confiáveis.
- Entregáveis: decisão formal go/no-go, plano de distribuição, SLOs e controles aplicados ao piloto.
- Critério: evidência + rastreabilidade + operação mínima pronta.
Time e hunting
Núcleo (mínimo viável)
- Liderança da unidade: dono do mandato, prioridades, interfaces e gates (produto/risco/compliance).
- Quant Research (1–2): hipóteses, validação, portfolio construction, robustez e documentação.
- Quant Engineering / Execution (1–2): backtester, pipelines, integração, performance e qualidade.
- Data / Market Data (1): ingestão, qualidade, eventos corporativos, SLAs e custos.
- Plataforma / MLOps (0.5–1): deploy, observabilidade, segurança e CI/CD.
- Risk/Controls (parcial ou dedicado): limites, pré-trade/pós-trade, auditoria e kill-switch.
Como avaliar sem “desafio show”
- Etapa 1 — Caso curto: memo de research (hipótese, evidência, riscos, falhas e como medir).
- Etapa 2 — Código e reprodutibilidade: implementação mínima com custos e execução determinística.
- Etapa 3 — Arquitetura e trade-offs: review de um sistema/trecho real; decisão com transparência (“isso aqui está ruim por X”).
- Etapa 4 — Operação: incidentes, rollback, limites, observabilidade e postura de produção.
KPIs e SLOs (para ficar objetivo)
Linha A (Produtos / Asset)
- AUM: captação líquida, estabilidade e concentração por canal.
- Retorno ajustado a risco: drawdown, volatilidade, stress e aderência ao mandato.
- Capacidade: impacto de escalar volume vs. custos/slippage.
- Explicabilidade: % de P&L explicado (fatores/regimes) e lista de exceções.
Linha B (Carteiras / Wealth)
- Adesão: novos clientes e tempo de setup ponta-a-ponta.
- Churn e retenção: permanência, concentração de AUM e evolução de share-of-wallet.
- Disciplina: % de carteiras rebalanceadas conforme regra e tempo fora da banda.
- Qualidade de experiência: fricção no funil, reversões, exceções e reclamações relacionadas.
Linha C (Execução / Infra)
- Custo de execução: slippage e implementation shortfall (bps) nos fluxos alvo.
- Conversão: acceptance rate, fill-rate, reject rate e tempo para primeiro fill (onde aplicável).
- Estabilidade: latência p95/p99, backlog/DLQ/quarentena e incidentes por janela crítica.
- Qualidade de dados: freshness, gaps, divergências e taxa de correção/backfill.
SLOs (exemplos que o time fecha no baseline)
- Dados: freshness por fonte, taxa de gaps, SLA de backfill e alertas.
- Execução: latência p99 por fluxo, limites de reject rate e circuit breaker por critério objetivo.
- Reconciliação: janela diária, tolerância de divergência e procedimento de correção.
Pedido concreto (para viabilizar)
Decisões que precisam sair nessa semana
- Sponsor executivo nomeado: responsável por destravar prioridades e arbitrar trade-offs (escopo vs. prazo vs. risco).
- Mandato e “primeiro alvo”: Linha A como default; Linha B como alternativa; Linha C como fundação obrigatória (baseline/execução/controles).
- Gates e critérios: o que define “passou” na Fase 0/1/2 e o que dispara pausa (kill-switch de produto, não só de execução).
- Tranche 0 aprovada: orçamento mínimo para charter + baseline + desenho de arquitetura e operação.
Pontos focais (para operar com governança)
- Risco/Compliance (focal): define limites, aprova guardrails e valida trilha auditável (mesmo que parcial no início).
- Operações (focal): define reconciliação, rotinas, exceções e incident response desde o paper trade.
- Dados/Market Data (focal): define SLA de dados, qualidade, lineage e critérios de backfill/replay.
- Finanças/Controladoria (focal): valida modelo de P&L e como o custo/retorno será reportado por tranche.
Reuniões mínimas (para fechar o “go” com clareza)
- Entrada: contexto, restrições (canais, classes, compliance), e objetivo do primeiro semestre.
- Saída: charter resumido + tranche 0 aprovada + critérios de go/no-go e pausa.
- Entrada: proposta de métricas (slippage, rejects, latência, reconciliação, AUM/fee) e referência de baseline.
- Saída: checklist de evidência por fase e formato de reporte por tranche.