📷 OCR — Extração de texto de imagem e PDF

Extrai texto de imagens (PNG / JPEG / WebP / GIF) e PDFs usando Tesseract 5 + modelo treinado em japonês. Máximo 50MB, PDFs até 50 páginas.

100% Free No signup Server-side No logs / DB Rate-limited VPS high-accuracy OSS-based 5 languages

🔒 Sobre Privacidade

・Os arquivos enviados são imediatamente deletados após serem passados para o Tesseract (existem no diretório temporário por apenas alguns segundos)
・Nenhum log de texto de resultado OCR, nome de arquivo de entrada, tamanho de entrada etc. é mantido
・Limite de 30 requisições por minuto por IP

Seleção de arquivo (imagem ou PDF)

📂

Arraste e solte aqui ou clique para selecionar

PNG / JPEG / WebP / GIF / PDF · ≤50MB

Idioma

Texto do resultado

📖 Como usar

1

Choose file

Drag & drop an image (PNG / JPEG / WebP / GIF) or PDF (max 50 MB).
2

Pick language

Pick Japanese + English (recommended), Japanese only, or English only.
3

Run → copy or download

Click Run OCR. Copy the result or download as .txt.

❓ Perguntas frequentes

How accurate is it?

Uses Tesseract 5 with the official Japanese trained model. Clean print (books, PDFs, scans) achieves 90%+; handwriting, complex backgrounds, and low resolution degrade accuracy.

PDF page limit?

PDF: pages 1–20. Ghostscript rasterizes each page to 300 dpi grayscale PNG, then OCR runs per page.

Are uploaded files stored?

No. Files live in a temp directory for a few seconds and are deleted right after Tesseract finishes. No logs of OCR text, file names, or sizes are kept.

🔗 Ferramentas relacionadas

🐛 Você encontrou um problema com esta ferramenta?

Completamente gratuito e sem registro. Até as etapas de reprodução são suficientes. Os relatos recebidos chegam diretamente aos operadores e servem como referência para correções.

📷 OCR — Extração de texto de imagem e PDF

🔒 Sobre Privacidade

📖 Como usar

❓ Perguntas frequentes

🔗 Ferramentas relacionadas

Obrigado por seu relato!