コンテンツにスキップ

📷 OCR — 画像・PDF からテキスト抽出

Tesseract 5 + 日本語学習済みモデルで画像 (PNG / JPEG / WebP / GIF) や PDF からテキストを抽出。最大 50MB、PDF は 50 ページまで。

完全無料 登録不要 サーバー処理 ログ・DB 保存なし レート制限あり VPS 高精度版 OSS ベース 5 言語対応

🔒 プライバシーについて

📂
ここにドラッグ&ドロップ または クリックで選択
PNG / JPEG / WebP / GIF / PDF · ≤50MB

📖 使い方

  1. 1
    ファイルを選択
    画像 (PNG / JPEG / WebP / GIF) または PDF をドラッグ & ドロップ。最大 50 MB。
  2. 2
    言語を選ぶ
    日本語 + 英語 (推奨)、日本語のみ、英語のみから選択。
  3. 3
    実行 → コピーまたはダウンロード
    「OCR 実行」をクリック。結果はコピー、または .txt としてダウンロード可能。

❓ よくある質問

精度はどの程度?
Tesseract 5 と日本語学習済みモデル (jpn.traineddata) を使用。きれいな印刷物 (本・PDF・スキャン) で 90% 以上、手書き・複雑な背景・低解像度では精度が落ちます。
PDF は何ページまで?
PDF は 1 〜 50 ページまで。Ghostscript で 300dpi のグレースケール PNG にラスタライズしてから各ページを OCR します。
アップロードしたファイルは保存されますか?
いいえ。一時ディレクトリに数秒だけ置かれ、Tesseract が処理を終えた直後に削除されます。OCR 結果テキスト・ファイル名・サイズ等のログも一切残しません。

🔗 関連ツール

🐛 このツールで問題が発生しましたか?

完全無料・登録不要。再現手順だけでも結構です。届いたご報告は運営者に直接届き、修正の参考にします。

※ 不具合再現のため、ブラウザ情報 (UA / 画面サイズ / 言語 / URL) を自動で送信します