📷 OCR — 图像 / PDF 转文本
Tesseract 5 + 日语训练模型。从图像 / PDF 提取文本(最大 50 MB,PDF 50 页)。
完全免费
无需注册
服务器处理
无日志 / 数据库
限速
VPS 高精度
基于开源
5 种语言
🔒 关于隐私
- ・上传文件传给 Tesseract 后立即删除(/tmp 中存在数秒)。
- ・不保留 OCR 结果、文件名、大小等任何日志。
- ・每个 IP 每分钟 30 次请求限制。
拖放或点击选择
PNG / JPEG / WebP / GIF / PDF · ≤50MB
📖 使用方法
-
1
选择文件拖放图像或 PDF(最大 50 MB)。
-
2
选择语言日语 + 英语(推荐) / 仅日语 / 仅英语。
-
3
执行 → 复制或下载点击执行,复制或下载为 .txt。
❓ 常见问题
准确度如何?
使用 Tesseract 5 与官方日语模型。清晰印刷品 90%+,手写、复杂背景、低分辨率精度下降。
PDF 最多多少页?
PDF 1 ~ 50 页。Ghostscript 转 300dpi PNG 后逐页 OCR。
上传文件会保存吗?
不会。文件在 /tmp 中存在数秒,OCR 完成后立即删除。不保留任何日志。
🔗 相关工具
🐛 此工具出现问题了吗?
免费、无需注册。仅提供复现步骤也有帮助。报告将直接发送给运营者并用于改进。
✅
感谢您的反馈!
已送达运营者,将用于改进工具。