RAG Text Chunker (Divisão para Embedding)
Dividir texto longo em segmentos otimizados para ingestão em Embedding / RAG. Suporta 4 estratégias: contagem de caracteres fixa, contagem de tokens fixa, baseada em parágrafos e baseada em títulos Markdown; inclui ajuste de sobreposição, visualização de segmentos e opções de exportação JSON / JSONL / Markdown.
100% Free
No signup
Browser-only
Instant download
5 languages
Dark mode
Número de chunks
0
tamanho médio
0
Máximo
0
❓ Perguntas frequentes
Recommended chunk size?
Embedding models: 256-512 tokens (OpenAI text-embedding-3-small) / 512-1024 (Voyage, Cohere). Big enough to preserve meaning
How much overlap?
10-20% of chunk size is standard — prevents context loss at boundaries
Why heading strategy?
Semantic chunks → often higher retrieval precision than fixed size (esp. for docs / code / FAQ)
🐛 Você encontrou um problema com esta ferramenta?
Completamente gratuito e sem registro. Até as etapas de reprodução são suficientes. Os relatos recebidos chegam diretamente aos operadores e servem como referência para correções.
✅
Obrigado por seu relato!
Recebido pelos administradores. Usaremos como referência para melhorias.