GrepAI

CLI de busca semântica de código para agentes de IA, 100% local. Indexa o significado do código usando vector embeddings (via Ollama), permitindo buscas em linguagem natural que encontram código conceitualmente relevante — mesmo quando os nomes das variáveis e funções não correspondem ao termo buscado. Também oferece rastreamento de call graphs para descobrir quem chama quem em múltiplas linguagens.


Como funciona

Indexação semântica

O GrepAI percorre os arquivos do projeto e gera vector embeddings para cada trecho de código usando um modelo de embeddings local via Ollama (modelo recomendado: nomic-embed-text). Em vez de buscar pelo texto literal, a ferramenta busca pelo significado — um query como "error handling" retorna arquivos que implementam tratamento de erro, mesmo que o código use nomes como catch, recover ou handleErr.

Call graph

A feature trace mapeia as relações entre funções — quem chama uma função e o que ela chama. Suporta dois modos:

  • Regex (rápido): extração por padrão textual
  • AST (preciso): parsing da árvore sintática do código

Linguagens suportadas: Go, TypeScript, JavaScript, Python, PHP, Java, C, C#, C++, Rust, Zig

Eficiência de tokens

Ao invés de passar 47 arquivos para o agente porque todos contêm a palavra “auth”, o GrepAI retorna apenas os 5 que implementam lógica de autenticação. Isso reduz em ~27% o consumo de tokens no Claude Code segundo benchmarks da comunidade.


Instalação

macOS (Homebrew)

brew install yoanbernabeu/tap/grepai

Linux / macOS (script)

curl -fsSL https://raw.githubusercontent.com/yoanbernabeu/grepai/main/install.sh | sh

Windows (PowerShell)

irm https://raw.githubusercontent.com/yoanbernabeu/grepai/main/install.ps1 | iex

Pré-requisito: modelo de embeddings

ollama pull nomic-embed-text

Uso básico

# Indexar o projeto atual
grepai index
 
# Busca semântica em linguagem natural
grepai search "error handling"
grepai search "user authentication logic"
 
# Rastrear call graph de uma função
grepai trace Login
 
# Iniciar o servidor MCP (para integração com agentes)
grepai mcp

Integração MCP

O GrepAI expõe suas capacidades via Model Context Protocol, permitindo que agentes de IA usem busca semântica como ferramenta nativa. Compatível com:

Configuração no claude_desktop_config.json ou mcp.json:

{
  "mcpServers": {
    "grepai": {
      "command": "grepai",
      "args": ["mcp"]
    }
  }
}

Skills (27 disponíveis)

O projeto mantém um repositório separado com 27 skills prontas para uso com agentes de IA: github.com/yoanbernabeu/grepai-skills


Performance

  • Indexação de 10.000+ arquivos em segundos
  • Buscas em milissegundos
  • Redução de ~27% no consumo de tokens em sessões de Claude Code

Comparação com ferramentas similares

FerramentaTipo de buscaLocalCall graphMCP
grepTexto literal (regex)
ripgrepTexto literal (regex, rápido)
GrepAISemântica (embeddings)

Referências