Pular para o conteúdo

RAG Text Chunker (Divisão para Embedding)

Dividir texto longo em segmentos otimizados para ingestão em Embedding / RAG. Suporta 4 estratégias: contagem de caracteres fixa, contagem de tokens fixa, baseada em parágrafos e baseada em títulos Markdown; inclui ajuste de sobreposição, visualização de segmentos e opções de exportação JSON / JSONL / Markdown.

100% Free No signup Browser-only Instant download 5 languages Dark mode
Relacionado: 💰 Cálculo de preços de Embeddings · 🪙 Cálculo de Tokens LLM
Número de chunks
0
tamanho médio
0
Máximo
0

    

❓ Perguntas frequentes

Recommended chunk size?
Embedding models: 256-512 tokens (OpenAI text-embedding-3-small) / 512-1024 (Voyage, Cohere). Big enough to preserve meaning
How much overlap?
10-20% of chunk size is standard — prevents context loss at boundaries
Why heading strategy?
Semantic chunks → often higher retrieval precision than fixed size (esp. for docs / code / FAQ)
🐛 Você encontrou um problema com esta ferramenta?

Completamente gratuito e sem registro. Até as etapas de reprodução são suficientes. Os relatos recebidos chegam diretamente aos operadores e servem como referência para correções.

※ Para reproduzir problemas, informações do navegador (UA / tamanho de tela / idioma / URL) são enviadas automaticamente