RAG Text Chunker (Aufteilung für Embedding)
Langen Text in für Embedding / RAG optimierte Chunks aufteilen. Unterstützt 4 Strategien: feste Zeichenanzahl, feste Token-Anzahl, absatzbasiert und Markdown-Überschriften-basiert; einschließlich Overlap-Anpassung, Chunk-Visualisierung und JSON / JSONL / Markdown-Exportoptionen.
100% Free
No signup
Browser-only
Instant download
5 languages
Dark mode
Anzahl der Chunks
0
durchschnittliche Größe
0
Maximum
0
❓ Häufig gestellte Fragen
Recommended chunk size?
Embedding models: 256-512 tokens (OpenAI text-embedding-3-small) / 512-1024 (Voyage, Cohere). Big enough to preserve meaning
How much overlap?
10-20% of chunk size is standard — prevents context loss at boundaries
Why heading strategy?
Semantic chunks → often higher retrieval precision than fixed size (esp. for docs / code / FAQ)
🐛 Sind Sie auf ein Problem mit diesem Tool gestoßen?
Vollständig kostenlos und ohne Registrierung. Auch Reproduktionsschritte sind ausreichend. Eingegangene Berichte werden direkt an die Betreiber weitergeleitet und dienen als Referenz für Korrektionen.
✅
Vielen Dank für Ihren Bericht!
An den Administrator übermittelt. Wir werden es als Referenz für Verbesserungen nutzen.