📷 OCR — Extração de texto de imagem e PDF
Extrai texto de imagens (PNG / JPEG / WebP / GIF) e PDFs usando Tesseract 5 + modelo treinado em japonês. Máximo 50MB, PDFs até 50 páginas.
100% Free
No signup
Server-side
No logs / DB
Rate-limited
VPS high-accuracy
OSS-based
5 languages
🔒 Sobre Privacidade
- ・Os arquivos enviados são imediatamente deletados após serem passados para o Tesseract (existem no diretório temporário por apenas alguns segundos)
- ・Nenhum log de texto de resultado OCR, nome de arquivo de entrada, tamanho de entrada etc. é mantido
- ・Limite de 30 requisições por minuto por IP
Arraste e solte aqui ou clique para selecionar
PNG / JPEG / WebP / GIF / PDF · ≤50MB
📖 Como usar
-
1
Choose fileDrag & drop an image (PNG / JPEG / WebP / GIF) or PDF (max 50 MB).
-
2
Pick languagePick Japanese + English (recommended), Japanese only, or English only.
-
3
Run → copy or downloadClick Run OCR. Copy the result or download as .txt.
❓ Perguntas frequentes
How accurate is it?
Uses Tesseract 5 with the official Japanese trained model. Clean print (books, PDFs, scans) achieves 90%+; handwriting, complex backgrounds, and low resolution degrade accuracy.
PDF page limit?
PDF: pages 1–20. Ghostscript rasterizes each page to 300 dpi grayscale PNG, then OCR runs per page.
Are uploaded files stored?
No. Files live in a temp directory for a few seconds and are deleted right after Tesseract finishes. No logs of OCR text, file names, or sizes are kept.
🔗 Ferramentas relacionadas
🐛 Você encontrou um problema com esta ferramenta?
Completamente gratuito e sem registro. Até as etapas de reprodução são suficientes. Os relatos recebidos chegam diretamente aos operadores e servem como referência para correções.
✅
Obrigado por seu relato!
Recebido pelos administradores. Usaremos como referência para melhorias.