GrepAI
CLI de busca semântica de código para agentes de IA, 100% local. Indexa o significado do código usando vector embeddings (via Ollama), permitindo buscas em linguagem natural que encontram código conceitualmente relevante — mesmo quando os nomes das variáveis e funções não correspondem ao termo buscado. Também oferece rastreamento de call graphs para descobrir quem chama quem em múltiplas linguagens.
- Repositório: https://github.com/yoanbernabeu/grepai
- Documentação: https://yoanbernabeu.github.io/grepai/
- Licença: open source
- Privacidade: 100% local — nenhum dado sai da máquina
Como funciona
Indexação semântica
O GrepAI percorre os arquivos do projeto e gera vector embeddings para cada trecho de código usando um modelo de embeddings local via Ollama (modelo recomendado: nomic-embed-text). Em vez de buscar pelo texto literal, a ferramenta busca pelo significado — um query como "error handling" retorna arquivos que implementam tratamento de erro, mesmo que o código use nomes como catch, recover ou handleErr.
Call graph
A feature trace mapeia as relações entre funções — quem chama uma função e o que ela chama. Suporta dois modos:
- Regex (rápido): extração por padrão textual
- AST (preciso): parsing da árvore sintática do código
Linguagens suportadas: Go, TypeScript, JavaScript, Python, PHP, Java, C, C#, C++, Rust, Zig
Eficiência de tokens
Ao invés de passar 47 arquivos para o agente porque todos contêm a palavra “auth”, o GrepAI retorna apenas os 5 que implementam lógica de autenticação. Isso reduz em ~27% o consumo de tokens no Claude Code segundo benchmarks da comunidade.
Instalação
macOS (Homebrew)
brew install yoanbernabeu/tap/grepaiLinux / macOS (script)
curl -fsSL https://raw.githubusercontent.com/yoanbernabeu/grepai/main/install.sh | shWindows (PowerShell)
irm https://raw.githubusercontent.com/yoanbernabeu/grepai/main/install.ps1 | iexPré-requisito: modelo de embeddings
ollama pull nomic-embed-textUso básico
# Indexar o projeto atual
grepai index
# Busca semântica em linguagem natural
grepai search "error handling"
grepai search "user authentication logic"
# Rastrear call graph de uma função
grepai trace Login
# Iniciar o servidor MCP (para integração com agentes)
grepai mcpIntegração MCP
O GrepAI expõe suas capacidades via Model Context Protocol, permitindo que agentes de IA usem busca semântica como ferramenta nativa. Compatível com:
- Claude Code
- Cursor
- Windsurf
Configuração no claude_desktop_config.json ou mcp.json:
{
"mcpServers": {
"grepai": {
"command": "grepai",
"args": ["mcp"]
}
}
}Skills (27 disponíveis)
O projeto mantém um repositório separado com 27 skills prontas para uso com agentes de IA: github.com/yoanbernabeu/grepai-skills
Performance
- Indexação de 10.000+ arquivos em segundos
- Buscas em milissegundos
- Redução de ~27% no consumo de tokens em sessões de Claude Code
Comparação com ferramentas similares
| Ferramenta | Tipo de busca | Local | Call graph | MCP |
|---|---|---|---|---|
| grep | Texto literal (regex) | ✅ | ❌ | ❌ |
| ripgrep | Texto literal (regex, rápido) | ✅ | ❌ | ❌ |
| GrepAI | Semântica (embeddings) | ✅ | ✅ | ✅ |