Pular para o conteúdo

📷 OCR — Extração de texto de imagem e PDF

Extrai texto de imagens (PNG / JPEG / WebP / GIF) e PDFs usando Tesseract 5 + modelo treinado em japonês. Máximo 50MB, PDFs até 50 páginas.

100% Free No signup Server-side No logs / DB Rate-limited VPS high-accuracy OSS-based 5 languages

🔒 Sobre Privacidade

📂
Arraste e solte aqui ou clique para selecionar
PNG / JPEG / WebP / GIF / PDF · ≤50MB

📖 Como usar

  1. 1
    Choose file
    Drag & drop an image (PNG / JPEG / WebP / GIF) or PDF (max 50 MB).
  2. 2
    Pick language
    Pick Japanese + English (recommended), Japanese only, or English only.
  3. 3
    Run → copy or download
    Click Run OCR. Copy the result or download as .txt.

❓ Perguntas frequentes

How accurate is it?
Uses Tesseract 5 with the official Japanese trained model. Clean print (books, PDFs, scans) achieves 90%+; handwriting, complex backgrounds, and low resolution degrade accuracy.
PDF page limit?
PDF: pages 1–20. Ghostscript rasterizes each page to 300 dpi grayscale PNG, then OCR runs per page.
Are uploaded files stored?
No. Files live in a temp directory for a few seconds and are deleted right after Tesseract finishes. No logs of OCR text, file names, or sizes are kept.

🔗 Ferramentas relacionadas

🐛 Você encontrou um problema com esta ferramenta?

Completamente gratuito e sem registro. Até as etapas de reprodução são suficientes. Os relatos recebidos chegam diretamente aos operadores e servem como referência para correções.

※ Para reproduzir problemas, informações do navegador (UA / tamanho de tela / idioma / URL) são enviadas automaticamente