跳到内容

📷 OCR — 图像 / PDF 转文本

Tesseract 5 + 日语训练模型。从图像 / PDF 提取文本(最大 50 MB,PDF 50 页)。

完全免费 无需注册 服务器处理 无日志 / 数据库 限速 VPS 高精度 基于开源 5 种语言

🔒 关于隐私

📂
拖放或点击选择
PNG / JPEG / WebP / GIF / PDF · ≤50MB

📖 使用方法

  1. 1
    选择文件
    拖放图像或 PDF(最大 50 MB)。
  2. 2
    选择语言
    日语 + 英语(推荐) / 仅日语 / 仅英语。
  3. 3
    执行 → 复制或下载
    点击执行,复制或下载为 .txt。

❓ 常见问题

准确度如何?
使用 Tesseract 5 与官方日语模型。清晰印刷品 90%+,手写、复杂背景、低分辨率精度下降。
PDF 最多多少页?
PDF 1 ~ 50 页。Ghostscript 转 300dpi PNG 后逐页 OCR。
上传文件会保存吗?
不会。文件在 /tmp 中存在数秒,OCR 完成后立即删除。不保留任何日志。

🔗 相关工具

🐛 此工具出现问题了吗?

免费、无需注册。仅提供复现步骤也有帮助。报告将直接发送给运营者并用于改进。

※ 为复现问题,浏览器信息 (UA / 屏幕 / 语言 / URL) 将自动发送