Zum Inhalt springen

📷 OCR — Textextraktion aus Bild und PDF

Extrahiert Text aus Bildern (PNG / JPEG / WebP / GIF) und PDFs mit Tesseract 5 + vortrainiertem japanischem Modell. Max. 50MB, PDFs bis zu 50 Seiten.

100% Free No signup Server-side No logs / DB Rate-limited VPS high-accuracy OSS-based 5 languages

🔒 Über Datenschutz

📂
Ziehen und ablegen oder klicken Sie zum Auswählen
PNG / JPEG / WebP / GIF / PDF · ≤50MB

📖 Wie man es benutzt

  1. 1
    Choose file
    Drag & drop an image (PNG / JPEG / WebP / GIF) or PDF (max 50 MB).
  2. 2
    Pick language
    Pick Japanese + English (recommended), Japanese only, or English only.
  3. 3
    Run → copy or download
    Click Run OCR. Copy the result or download as .txt.

❓ Häufig gestellte Fragen

How accurate is it?
Uses Tesseract 5 with the official Japanese trained model. Clean print (books, PDFs, scans) achieves 90%+; handwriting, complex backgrounds, and low resolution degrade accuracy.
PDF page limit?
PDF: pages 1–20. Ghostscript rasterizes each page to 300 dpi grayscale PNG, then OCR runs per page.
Are uploaded files stored?
No. Files live in a temp directory for a few seconds and are deleted right after Tesseract finishes. No logs of OCR text, file names, or sizes are kept.

🔗 Verwandte Tools

🐛 Sind Sie auf ein Problem mit diesem Tool gestoßen?

Vollständig kostenlos und ohne Registrierung. Auch Reproduktionsschritte sind ausreichend. Eingegangene Berichte werden direkt an die Betreiber weitergeleitet und dienen als Referenz für Korrektionen.

※ Um Probleme zu reproduzieren, werden Browser-Informationen (UA / Bildschirmgröße / Sprache / URL) automatisch gesendet