快速入门¶
软件安装¶
完整版¶
Windows完整版解压到任意目录后运行ImageTrans.exe即可,Mac完整版打开dmg文件安装ImageTrans到应用目录即可。
跨平台版¶
下载zip压缩包,解压到任意目录,双击ImageTrans.jar或者命令行输入 java -jar ImageTrans.jar
即可运行。
软件依赖JRE 1.8以上运行环境,请先下载安装。下载地址:1. Liberica JRE 11.0.19 full version 2. 百度网盘(提取码:mhsy)
软件依赖OpenCV,请根据系统下载运行库文件,解压后放在ImageTrans的目录下。下载地址:1. GitHub, 2. 百度网盘
OCR与机器翻译的配置¶
本工具集成了常见的在线OCR和机器翻译服务。一般这些服务均需要设置API密钥才能使用。ImageTrans内置了部分服务的API密钥,可以直接使用:
OCR: 百度、OCRSPACE、Azure
机器翻译: 百度、腾讯、云译、mymemory、DeepL免密钥版
另外也支持若干离线OCR和机器翻译。
离线OCR:
- Tesseract
需要使用Tesseract进行OCR的话请自行下载安装(地址),并在ImageTrans里指定Tesseract的路径。
这里再提供一个Windows的绿色版本:百度网盘(提取码:ktpt)。下载后将tesseract-ocr目录和ImageTrans放在一起。额外的语言包请放在 tesseract-ocr\tessdata
目录下。
- Windows10自带OCR
Windows10自带OCR功能,但需要先安装所需语言。它和Azure、OCRSPACE的引擎其实是同一个。ImageTrans中这一OCR引擎的名字叫做WinRT,因为它是基于Windows的Windows Runtime API。
- mangaOCR
该OCR能十分准确地识别日漫的文字。安装说明见此:https://github.com/xulihang/ImageTrans_plugins/tree/master/mangaOCR。
- macOCR
macOS版本10.15以上系统自带的OCR。使用说明见此:https://github.com/xulihang/ImageTrans-docs/issues/341。
- ABBYY
支持调用ABBYY FineReader进行OCR,需要在偏好设置里指定软件的FineCMD.exe的路径。
- PaddleOCR、EasyOCR
需要自行安装Python和上述软件,并用提供的server脚本运行,例如PaddleOCR的Server。
离线机器翻译:
- OPUS-CAT。OPUS-CAT是芬兰赫尔辛基自然语言处理小组的离线机器翻译引擎,到官网下载安装后使用OPUS-CAT机器翻译插件调用。
- eztrans xp。这是一个日韩翻译软件。使用方法见issue29。
新建项目¶
菜单栏点击文件-新建项目,选择一个位置并输入项目文件名以保存。
添加图片¶
菜单栏点击文件-导入图片文件夹,选择图片存在的位置。该操作会读取该文件夹下所有的子目录并导入存在的jpg、png文件。
或者用右键菜单-粘贴图片的方式添加单张图片。
此外亦能导入PDF文件,并提取可复制的文字。
文字转录¶
工具支持框选文字区域并识别。提供手动框选和四种自动框选,并支持精细调整文本框。
OCR¶
选中文字区域,选择语言和OCR引擎,点击识别进行OCR。
自动识别文字¶
选择语言和OCR引擎,点击菜单-编辑-自动识别文字,可以自动检测文字区域并转录。其中有道和谷歌是按段落识别,其它引擎是按行识别,可以通过右侧编辑区域的合并左右区域和合并上下区域进行合并。
自动识别气泡¶
点击菜单-编辑-自动识别气泡,可以自动识别气泡。默认使用百度的在线气泡检测服务,可以自行配置离线气泡检测,详见气泡检测。
另提供较为复杂的启发式和自然场景文字检测方法,详见文字区域检测。
自动OCR所有区域¶
我们可以先把文字区域框出,然后批量进行OCR。点击菜单-编辑-自动OCR所有区域进行操作。
导出¶
导出有多种选项。
- Tab分割的TXT文档,包含坐标信息、字体样式、文字等信息
- XLSX表格,和TXT的内容一样
- XLSX表格-根据目录建立工作表,按子目录保存图片名、原文和译文信息
- 所有文本,按每张图片生成包含图片文字的txt文档
- 供翻译的文档,将原文和译文信息以表格的形式导出为一个docx、txt或者XLIFF文件
- 网页,将项目导出为网页,可供局域网内的手机阅读,支持语音朗读和按分镜阅读
- 图像PDF,将项目导出为PDF
- TMX,导出原文译文为翻译记忆文件
翻译¶
在译文区域输入译文并点击保存可以完成一个文字区域的翻译。
可以将翻译导出为docx、txt或者XLIFF文档供外部人员翻译,之后再通过菜单-导回翻译进行导回。
计算机辅助翻译软件BasicCAT支持直接操作ImageTrans的项目文件进行翻译。
翻译记忆、机器翻译和术语管理¶
切换右侧的操作区到辅助翻译页面,可以使用翻译记忆、机器翻译和术语管理这三个功能。机器翻译需要在偏好设置里设置API,并进行启用。另外还需要设置项目的语言,通过项目-设置-选择语言对进行设置。
预翻译¶
点击菜单-项目-批处理-预翻译,可以使用翻译记忆或者机器翻译进行批量翻译。当前只支持机器翻译。
查看翻译¶
勾选左下角的查看翻译,可以查看翻译后的图片。精确模式会生成文字掩膜并修复背景,非精确模式则会用背景颜色进行遮盖。
在查看翻译状态下勾选排版模式,译文区域将被框出,并支持调整位置和修改样式。
生成成品图¶
首先将图片比例调整为100%,之后点击查看翻译,得到成品图。点击文件-导出当前图片为-JPG,结果将输出在对应图片的文件夹的out文件夹中。另一选项ORA支持将文件导出为多层图像格式ORA,该格式能保存图层信息,供PS、Gimp和Krita等图像编辑软件编辑。
除此以外,ImageTrans可支持导出PSD。
设置文字样式¶
设置文字样式主要有两个作用,一个是在ImageTrans中使用,一个是用于导出PSD时设置字体。
点击菜单-项目-设置-字体样式可以设置全局样式,设置选项包括使用的字体、文字大小、文字方向、行距、对齐方式、旋转角度、描边等等。
如果要修改某个样式,请点击该样式以加载设置,修改后点击添加,然后删去原来的样式。排在第一的样式是默认样式。在样式上方右键可以执行排序和删除操作,在列表的空白处右键可以选择从其它项目导入样式。
设置全局样式后可以给文字区域指定使用哪个样式。
另外也支持设置本地样式。本地样式的优先级大于全局样式。
点击左侧的字体按钮以启用字体设置工具栏,可以便捷地设置本地样式。
也可以通过文字区域列表上方的字体设置进行设置。它有一个专门的界面,能设置描边、旋转、是否启用本地样式。它能调出全局字体样式的设置界面进行更详细的设置(会读取添加在末尾的样式为本地字体样式)。
点击左侧的多选按钮以启动多选工具栏,可以调整多个文本框的位置并统一其字体样式。
获取Photoshop用字体名¶
因为Photoshop需要的字体名比较特殊,需要从PS中获得。方法是在PS中新建一张图片,建立一个文本框,设置所需字体,并完成文字编辑操作,是文本框处于非编辑状态。之后在ImageTrans中点击读取即可。非Windows系统需要使用readFont.jsx脚本。
自动调整字体大小¶
软件默认能根据文字区域大小自动调整字体大小。可以在项目设置中设置是否启用该功能以及最大、最小字体大小。
字体大小的优先级是这样的:
本地样式中的字体大小>自动调整字体大小>全局样式中的字体大小。
富文本¶
ImageTrans可以使用BBCode来标记富文本格式,比如下图中运用的粗体和斜体。
是使用这样的标记文本表示的: 留[b][fi]性感[/fi][/b]的绿发,穿绿皮衣的那个人。
。
下面是支持的标记说明:
标签名 | 效果 | 用例 |
---|---|---|
b | 粗体 | [b]文本[/b] |
i | 斜体 | [i]文本[/i] |
fb | 仿粗体 | [fb]文本[/fb] |
fi | 仿斜体 | [fi]文本[/fi] |
fontfamily | 字体名 | [fontname=Arial]文本[/fontname] |
fontsize | 文字大小 | [fontsize=32]文本[/fontsize] |
fontcolor | 文字颜色 | [fontcolor=#FF0000]文本[/fontcolor] |
点编辑区域右侧的按钮R可以启用富文本编辑器,便于快速插入对应的BBCode代码。
批处理¶
以上对单个图片的操作都可以通过菜单-项目-批处理对所有图片进行操作。