📷 OCR — 画像・PDF からテキスト抽出
Tesseract 5 + 日本語学習済みモデルで画像 (PNG / JPEG / WebP / GIF) や PDF からテキストを抽出。最大 50MB、PDF は 50 ページまで。
完全無料
登録不要
サーバー処理
ログ・DB 保存なし
レート制限あり
VPS 高精度版
OSS ベース
5 言語対応
🔒 プライバシーについて
- ・アップロードファイルは Tesseract に渡された後、即座に削除されます (一時ディレクトリに数秒のみ存在)
- ・OCR 結果テキスト、入力ファイル名、入力サイズ等のログは一切残しません
- ・1 IP あたり 1 分 30 リクエストの上限あり
ここにドラッグ&ドロップ または クリックで選択
PNG / JPEG / WebP / GIF / PDF · ≤50MB
📖 使い方
-
1
ファイルを選択画像 (PNG / JPEG / WebP / GIF) または PDF をドラッグ & ドロップ。最大 50 MB。
-
2
言語を選ぶ日本語 + 英語 (推奨)、日本語のみ、英語のみから選択。
-
3
実行 → コピーまたはダウンロード「OCR 実行」をクリック。結果はコピー、または .txt としてダウンロード可能。
❓ よくある質問
精度はどの程度?
Tesseract 5 と日本語学習済みモデル (jpn.traineddata) を使用。きれいな印刷物 (本・PDF・スキャン) で 90% 以上、手書き・複雑な背景・低解像度では精度が落ちます。
PDF は何ページまで?
PDF は 1 〜 50 ページまで。Ghostscript で 300dpi のグレースケール PNG にラスタライズしてから各ページを OCR します。
アップロードしたファイルは保存されますか?
いいえ。一時ディレクトリに数秒だけ置かれ、Tesseract が処理を終えた直後に削除されます。OCR 結果テキスト・ファイル名・サイズ等のログも一切残しません。
🔗 関連ツール
🐛 このツールで問題が発生しましたか?
完全無料・登録不要。再現手順だけでも結構です。届いたご報告は運営者に直接届き、修正の参考にします。
✅
ご報告ありがとうございます!
運営者に届きました。改善の参考にさせていただきます。