Zum Inhalt springen

RAG Text Chunker (Aufteilung für Embedding)

Langen Text in für Embedding / RAG optimierte Chunks aufteilen. Unterstützt 4 Strategien: feste Zeichenanzahl, feste Token-Anzahl, absatzbasiert und Markdown-Überschriften-basiert; einschließlich Overlap-Anpassung, Chunk-Visualisierung und JSON / JSONL / Markdown-Exportoptionen.

100% Free No signup Browser-only Instant download 5 languages Dark mode
Verwandt: 💰 Embeddings-Preisberechnung · 🪙 LLM-Token-Berechnung
Anzahl der Chunks
0
durchschnittliche Größe
0
Maximum
0

    

❓ Häufig gestellte Fragen

Recommended chunk size?
Embedding models: 256-512 tokens (OpenAI text-embedding-3-small) / 512-1024 (Voyage, Cohere). Big enough to preserve meaning
How much overlap?
10-20% of chunk size is standard — prevents context loss at boundaries
Why heading strategy?
Semantic chunks → often higher retrieval precision than fixed size (esp. for docs / code / FAQ)
🐛 Sind Sie auf ein Problem mit diesem Tool gestoßen?

Vollständig kostenlos und ohne Registrierung. Auch Reproduktionsschritte sind ausreichend. Eingegangene Berichte werden direkt an die Betreiber weitergeleitet und dienen als Referenz für Korrektionen.

※ Um Probleme zu reproduzieren, werden Browser-Informationen (UA / Bildschirmgröße / Sprache / URL) automatisch gesendet