MCP/API entra em GA
Integração de dados B2B: endpoints, MCP servers, playground e observabilidade de uso.
MCP/API sai de beta hoje. O foco é validar no playground e levar o mesmo fluxo para integração técnica em produção.
- Endpoints para companies e people
- Servidores MCP conectáveis ao runtime
- Playground para validar filtros e enrichment
- Chaves, custos e health checks no backoffice
- SLA técnico por volume contratado
O plano substitui stacks fragmentados de dados por uma integração única com base nacional, enrichment e observabilidade.
Performance da busca — 3x mais rápida
Tuning de HNSW + RRF e cache de embeddings. P95 de busca semântica caiu 67%.
Aceleramos a busca semântica em 3 frentes principais sem perder qualidade.
- HNSW efSearch 80 → 40 (recall mantido em 97%+, latência -45%)
- Cache de embeddings com TTL ajustado para queries repetidas
- Batch de embeddings com limite e cache para queries repetidas
- P95 antes: 4.2s · agora: 1.4s
Playground companies/people 1.0
Playground para validar filtros, empresas, pessoas, enrichment e export antes de integrar.
A versão 1.0 do playground está disponível para companies e people. Você valida dados no navegador antes de levar o fluxo para API ou MCP.
- Busca companies com filtros operacionais
- People search associado a empresas
- Enrichment sob demanda com custo explícito
- MCP servers nativos para expor fluxos
- Export e API keys para integração
Cache unificado de providers pagos
BigDataCorp, Apollo, Prospeo, Blitz e Lemit agora passam por um único wrapper com cache 30d + log de auditoria.
Toda chamada a provider externo cobrável passa por @/lib/api-cache com cache 30 dias para hits úteis, 7 dias para misses.
- Tabela api_cache cross-provider (substitui bdc_cache legacy)
- Log de auditoria em enrichment_api_calls (custo, latência, hit/miss)
- Detector isUsefulData distingue hit real de miss por provider
- Dashboard de custos: top callers, hit rate, projeção mensal
v1.3.002 Abr 2026·FeatureBusca semântica em português
Embeddings Qwen3-Embedding-0.6B (768d) + hybrid search com RRF (dense + tsvector PT) em 32M empresas.
Você descreve a empresa em linguagem natural; a busca combina similaridade vetorial e full-text PT-BR via Reciprocal Rank Fusion.
- Qwen3-Embedding-0.6B via TEI (FP16, batch 16384)
- Dim 768 com MRL truncate de 1024 + L2 re-normalize
- Hybrid RRF: pgvector cosine + tsvector português
- halfvec FP16: índice HNSW 50% menor sem perder recall
v1.2.018 Mar 2026·FeatureBase completa: 32M empresas + 28M pessoas
Receita Federal + LinkedIn + web scraping próprio + dados públicos + parceiros pagos. Indexação completa.
Toda a base está online: 32M CNPJs com sócios, CNAE, endereço, capital social; 28M perfis profissionais com cargo e departamento.
- Receita Federal: 32M empresas completas
- LinkedIn: 28M perfis B2B mapeados
- Web scraping próprio: 459K empresas enriquecidas com IA
- Parceiros pagos: BigDataCorp, Apollo, Prospeo via cache unificado
- Indexação: GIN para tsvector + HNSW para embeddings