Skip to content

AI Search — Ponto Neural do Hub CSV

Ponto Neural

O Hub CSV agora possui uma API de busca semântica que indexa automaticamente todo o conteúdo do repositório. Qualquer agente, automação ou SaaS pode consultar o arsenal completo do Hub em linguagem natural.

O que é

O Cloudflare AI Search transforma o conteúdo estático do Hub CSV (markdown, HTML, JSON, CSV, PDF) em uma base de conhecimento vetorial consultável via API REST. A cada push no repositório, o conteúdo é sincronizado automaticamente para o bucket R2 e re-indexado.

Não é uma interface de chat. É uma API robusta projetada para ser o ponto de conexão entre o Hub e o restante do ecossistema digital: agentes, automações, SaaS e, em especial, o Extensio.

Arquitetura

Hub CSV (GitHub) → GitHub Actions → R2 (hub-csv-knowledge) → AI Search (hub-csv) → API REST

                                                              Extensio / LLMs / Make / Agentes
ComponenteRecursoDetalhes
RepositórioGitHub grupocsv/hubFonte primária de todo o conteúdo
ArmazenamentoR2 hub-csv-knowledge191 objetos sincronizados
Instância AI Searchhub-csv189 arquivos indexados, 384 vetores
Embeddingqwen3-embedding-0.6b2048 tokens por chunk, 10% overlap
AI Gatewaycsv_ai_gatewayRoteamento e observabilidade
Vectorizeai-search-hub-csvBanco vetorial Cloudflare

Endpoints

Endpoint 1 — AI Search (busca + geração)

Recebe uma pergunta em linguagem natural, busca nos vetores, e retorna uma resposta gerada com citações das fontes.

http
POST /client/v4/accounts/da0c29123f448f3c3892f784cd9f7cac/autorag/rags/hub-csv/ai-search
Host: api.cloudflare.com
Authorization: Bearer SEU_AI_SEARCH_TOKEN
Content-Type: application/json

Body:

json
{
  "query": "Qual o mandato da AxiaCare?",
  "stream": false,
  "rewrite_query": true,
  "max_num_results": 10
}

Resposta: JSON com response (texto gerado), search_results (documentos fonte com score e filename).

Endpoint 2 — Search (busca vetorial pura)

Retorna apenas os documentos mais relevantes, sem geração de texto. Ideal para alimentar agentes que fazem sua própria síntese.

http
POST /client/v4/accounts/da0c29123f448f3c3892f784cd9f7cac/autorag/rags/hub-csv/search
Host: api.cloudflare.com
Authorization: Bearer SEU_AI_SEARCH_TOKEN
Content-Type: application/json

Body:

json
{
  "query": "Signal edição mais recente",
  "max_num_results": 5
}

Parâmetros

ParâmetroTipoDescrição
querystringPergunta em linguagem natural
streambooleanStreaming da resposta (SSE)
rewrite_querybooleanReescrever a query para melhorar busca
max_num_resultsintegerMáximo de documentos retornados (1-20)
system_promptstringPrompt de sistema para contextualizar

System Prompt Recomendado

Ao usar o endpoint ai-search, inclua este system_prompt no body para contextualizar as respostas:

text
Você é o assistente do Hub CSV, a base de conhecimento pessoal
de Guilherme Thomé, médico executivo e fundador do Grupo CSV.
O Hub contém: mandatos institucionais (AxiaCare, Thera, MedValor, ICDS),
boletins estratégicos (Signal, Compass), dashboards operacionais
(Unimed GV, Unihealth), calculadoras clínicas, identidade visual
e documentação técnica. Responda sempre em português do Brasil,
com precisão e citando as fontes quando disponíveis.

Sincronização Automática

O fluxo de atualização é totalmente automatizado:

Push no main → deploy.yml (VitePress + Pages) → sync-r2-ai-search.yml → R2 → Re-index

O workflow sync-r2-ai-search.yml roda automaticamente após cada deploy bem-sucedido. Também pode ser disparado manualmente via workflow_dispatch.

Arquivos sincronizados: .md, .html, .json, .csv, .txt, .pdf (até 4 MB cada).

Excluídos: .git/, node_modules/, cache do VitePress, package-lock.json.

Pontos de Conexão

O AI Search foi projetado para ser consumido por múltiplos canais:

CanalComo conectar
LLMs (Manus, Claude, ChatGPT)Chamar a API REST diretamente como tool/function
Make (automações)Módulo HTTP com POST para o endpoint
AgentesFunction calling apontando para /ai-search
SaaS diversosWebhook ou integração HTTP
Extensio (segundo cérebro)Ponto neural dedicado — lê Hub via API
MCP (Model Context Protocol)Endpoint /mcp quando disponível

Extensio

O Extensio é o segundo cérebro digital que concentra diversos pontos neurais. O AI Search do Hub CSV é um desses pontos. O Extensio já lê e-mails, WhatsApp, Notion e GitHub. Com o AI Search, ele passa a ter acesso semântico a todo o conteúdo do Hub: mandatos, boletins, dashboards, identidade visual e documentação técnica.

Exemplo de Integração (Python)

python
import requests

ACCOUNT_ID = "da0c29123f448f3c3892f784cd9f7cac"
TOKEN = "SEU_AI_SEARCH_TOKEN"

def ask_hub(query: str) -> dict:
    url = f"https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/autorag/rags/hub-csv/ai-search"
    headers = {
        "Authorization": f"Bearer {TOKEN}",
        "Content-Type": "application/json"
    }
    body = {
        "query": query,
        "stream": False,
        "rewrite_query": True
    }
    r = requests.post(url, json=body, headers=headers, timeout=30)
    return r.json()

resultado = ask_hub("Quais são os portais do Hub CSV?")
print(resultado["result"]["response"])

Exemplo de Integração (cURL)

bash
curl -X POST \
  "https://api.cloudflare.com/client/v4/accounts/da0c29123f448f3c3892f784cd9f7cac/autorag/rags/hub-csv/ai-search" \
  -H "Authorization: Bearer SEU_AI_SEARCH_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"query": "O que é o Signal?", "stream": false, "rewrite_query": true}'

Exemplo de Integração (Make)

Para conectar no Make, use o módulo HTTP > Make a request:

  • URL: https://api.cloudflare.com/client/v4/accounts/da0c29123f448f3c3892f784cd9f7cac/autorag/rags/hub-csv/ai-search
  • Method: POST
  • Headers: Authorization: Bearer SEU_TOKEN e Content-Type: application/json
  • Body type: Raw (JSON)
  • Body: conforme exemplos acima

Infraestrutura e Credenciais

RecursoValor
Account IDda0c29123f448f3c3892f784cd9f7cac
Instânciahub-csv
Bucket R2hub-csv-knowledge
AI Gatewaycsv_ai_gateway
Token APIArmazenado no Notion (Guia Técnico) e GitHub Secrets
Endpoint basehttps://api.cloudflare.com/client/v4/accounts/.../autorag/rags/hub-csv/

Testes Realizados

QueryQualidadeObservação
Quais são os portais do Hub CSV?BoaListou corretamente os 6 portais com URLs
Qual o mandato da AxiaCare?ExcelenteResposta completa com missão, valores e escopo
O que é o Signal?BoaIdentificou como boletim estratégico do Grupo CSV
NeurodesenvolvimentoRuimTermo ambíguo, sem contexto suficiente

Ciclo Virtuoso

O design do sistema cria um ciclo de retroalimentação positiva:

  1. Quanto mais conteúdo é adicionado ao Hub, mais rica fica a base vetorial.
  2. Quanto mais rica a base, mais útil é a API para os agentes e automações.
  3. Quanto mais útil a API, maior o incentivo para alimentar o Hub.

O Hub deixa de ser apenas um repositório de páginas e se torna o núcleo de conhecimento operacional do Grupo CSV.