Umi-OCR v2.1.0 批量图片识别 中文绿色版

Umi-OCR用于批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件。 除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能。类似含水印的视频截图、含有UI/按钮的游戏截图等,往往只需要提取字幕区域的文本,而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字,来实现这一目的。尤其是,特别适合用于批量提取Galgame截图中的台词。当有大量的影视和游戏截图需要整理归档,或者想翻找包含某一段台词/字幕的截图;将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷。

软件特点

忽略区域功能

忽略区域是本软件特色功能。可用于批量识别视频截图时排除右上角水印的干扰,批量识别游戏截图时排除UI与按钮的干扰,让识别结果只留下干净的台词文本。

“忽略区域”是指图片上指定位置与大小的矩形区域,完全处于这些区域内的文字块,将被排除。

点击 设置 选项卡中的 添加忽略区域 ,进入忽略区域选择窗口。

将任意图片 拖入 该窗口,可预览该图片。将新图片拖入窗口可切换预览,但已绘制的忽略区域不会消失;可切换不同图片来仔细调整忽略区域。

绘制 忽略区域 :拖入图片后,点击选中左起第一按钮 +忽略区域 1 ,然后在图片上按住左键拖拽,绘制矩形区域。可 撤销 步骤。

绘制完后,点击 完成 返回软件主窗口。若不想应用此次绘制,则右上角X,取消。

本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序 ,使用过程中无需联网。支持更换Paddle官方模型(v2.x版本)或自己训练的模型,支持修改PaddleOCR参数。通过添加不同的语言模型,软件可识别多国语言。

更新日志

v2.1.0

  • 批量文档识别。支持 pdf, epub, mobi 等多种格式的文档,对扫描件进行OCR或提取原有文本。可输出为 双层可搜索PDF 。
  • 更强大的 排版解析 功能,代替之前的段落合并。基于 间隙树排序算法 ,解析多栏布局图片与文档时有较好的精度。
  • HTTP接口参数作出了部分改动,并提供了一些更方便的选项。有需要的用户请重新参考 README_HTTP.md 。

下载说明

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)

Umi-OCR_Paddle_v2.0.0.7z.exe (125MB)
SHA256: 141f9a9bd82666862335e71d20743b43e3d231738f255012c1cb1c39aa83f976

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.0.0.7z.exe (95MB)
SHA256: de850eb92c23306f57ad07eb9a35e5d11cba966de4f97d680c5f7e84febce921

下载地址

相关文件下载地址
如遇下载链接失效或无法下载,请联系客服处理!客服①QQ:752523399 客服②QQ:752523388
THE END