Menos tokens. Mesma inteligência.
Proxy LLM open-source com pipeline de compressão de 4 camadas. Reduz tokens, custos e impacto ambiental — em Claude, GPT-4o, Gemini, Grok e mais 6 providers.
A partir de
Open-source
Open-source sob licença MIT. Instala, configura, usa — sem custos.

Cada token desnecessário custa dinheiro — e desperdiça energia
A maioria do contexto enviado a um LLM é redundante: repetição de turnos anteriores, formatação excessiva, documentos inteiros quando só algumas secções importam. O Toquenz comprime esse contexto antes de cada chamada, reportando o que foi poupado — em tokens, custo, CO₂ e água — em todos os providers simultaneamente.
até 50%
Redução de tokens por sessão
10
Providers suportados em simultâneo
MIT
Licença open-source — grátis para sempre
Funcionalidades
Pipeline de 4 camadas
Cleaner → Truncator → Chunker → Cache. Transformações determinísticas sem alterar o significado.
Cache semântico
Reutilização do system prompt via Anthropic Prompt Caching a 10% do custo normal.
Multi-provider
Claude, GPT-4o, Gemini, Grok, DeepSeek, Mistral, Groq, Together, Perplexity e Cohere.
Métricas ambientais
CO₂ e consumo de água calculados por sessão — reportáveis em declarações ESG e EU AI Act.
Dashboard de sessão
Evolução turn-a-turn de tokens, custo e impacto ambiental. Exportação de sessão completa.
Drop-in replacement
Funciona como proxy transparente — os teus prompts não mudam, só a eficiência aumenta.