コンテンツにスキップ

RAG テキストチャンカー (Embedding 用分割)

長文テキストを Embedding / RAG に投入しやすい単位にチャンク分割。文字数固定 / トークン固定 / 段落単位 / Markdown 見出し単位の 4 戦略、オーバーラップ調整、各チャンクの可視化、JSON / JSONL / Markdown エクスポート対応。

完全無料 登録不要 ブラウザ完結 即ダウンロード 5 言語対応 ダークモード
関連: 💰 Embeddings 料金計算 · 🪙 LLM トークン計算
チャンク数
0
平均サイズ
0
最大
0

    

❓ よくある質問

チャンクサイズの目安?
Embedding モデル: 256-512 トークン (OpenAI text-embedding-3-small) / 512-1024 (Voyage / Cohere)。意味の塊を保てる範囲で
オーバーラップは何 % にすべき?
チャンクサイズの 10-20% が定番。境界で文脈が切れることによる検索 miss を防ぐ
Markdown 見出し戦略の利点は?
セマンティックな塊で切れるので、検索精度が固定サイズより高くなる場合が多い (特にドキュメント / コード / FAQ)
🐛 このツールで問題が発生しましたか?

完全無料・登録不要。再現手順だけでも結構です。届いたご報告は運営者に直接届き、修正の参考にします。

※ 不具合再現のため、ブラウザ情報 (UA / 画面サイズ / 言語 / URL) を自動で送信します