RAG テキストチャンカー (Embedding 用分割)
長文テキストを Embedding / RAG に投入しやすい単位にチャンク分割。文字数固定 / トークン固定 / 段落単位 / Markdown 見出し単位の 4 戦略、オーバーラップ調整、各チャンクの可視化、JSON / JSONL / Markdown エクスポート対応。
完全無料
登録不要
ブラウザ完結
即ダウンロード
5 言語対応
ダークモード
チャンク数
0
平均サイズ
0
最大
0
❓ よくある質問
チャンクサイズの目安?
Embedding モデル: 256-512 トークン (OpenAI text-embedding-3-small) / 512-1024 (Voyage / Cohere)。意味の塊を保てる範囲で
オーバーラップは何 % にすべき?
チャンクサイズの 10-20% が定番。境界で文脈が切れることによる検索 miss を防ぐ
Markdown 見出し戦略の利点は?
セマンティックな塊で切れるので、検索精度が固定サイズより高くなる場合が多い (特にドキュメント / コード / FAQ)
🐛 このツールで問題が発生しましたか?
完全無料・登録不要。再現手順だけでも結構です。届いたご報告は運営者に直接届き、修正の参考にします。
✅
ご報告ありがとうございます!
運営者に届きました。改善の参考にさせていただきます。