快速入门
软件安装
完整版
Windows完整版解压到任意目录后运行ImageTrans.exe即可,Mac完整版打开dmg文件安装ImageTrans到应用目录即可。
跨平台版
下载zip压缩包,解压到任意目录,双击ImageTrans.jar或者命令行输入java -jar ImageTrans.jar即可运行。
软件依赖JRE 11以上运行环境,请先下载安装。下载地址:Liberica JRE 11.0.19 full version
软件依赖OpenCV,请根据系统下载运行库文件,解压后放在ImageTrans的目录下。下载地址:GitHub
OCR与机器翻译的配置
本工具集成了常见的在线OCR和机器翻译服务。一般这些服务均需要设置API密钥才能使用。ImageTrans内置了部分服务的API密钥,可以直接使用:
OCR: 百度、OCRSPACE、Azure
机器翻译: 百度、腾讯、云译、mymemory、DeepL免密钥版
另外也支持若干离线OCR和机器翻译。
离线OCR:
Tesseract
需要使用Tesseract进行OCR的话请自行下载安装(地址),并在ImageTrans里指定Tesseract的路径。
这里再提供一个Windows的安装版本:UB-Mannheim Tesseract5。
Windows10自带OCR
Windows10自带OCR功能,但需要先安装所需语言。它和Azure、OCRSPACE的引擎其实是同一个。ImageTrans中这一OCR引擎的名字叫做WinRT,因为它是基于Windows的Windows Runtime API。
mangaOCR
该OCR能十分准确地识别日漫的文字。安装说明见此:https://github.com/xulihang/ImageTrans_plugins/tree/master/mangaOCR。
macOCR
macOS版本10.15以上系统自带的OCR。使用说明见此:https://github.com/xulihang/ImageTrans-docs/issues/341。
ABBYY
支持调用ABBYY FineReader进行OCR,需要在偏好设置里指定软件的FineCMD.exe的路径。
PaddleOCR、EasyOCR
需要自行安装Python和上述软件,并用提供的server脚本运行,例如PaddleOCR的Server。
离线机器翻译:
OPUS-CAT。OPUS-CAT是芬兰赫尔辛基自然语言处理小组的离线机器翻译引擎,到官网下载安装后使用OPUS-CAT机器翻译插件调用。
eztrans xp。这是一个日韩翻译软件。使用方法见issue29。
验证登录
运行ImageTrans时,会显示验证器,需要填入购买时填写的email和订单号。订单号可以在订单页面中找到。
一个email可以在三台设备上使用,要更换设备则需要使用邮箱进行重置。
新建项目
菜单栏点击文件-新建项目,选择一个位置并输入项目文件名以保存。
添加图片
菜单栏点击文件-导入图片文件夹,选择图片存在的位置。该操作会读取该文件夹下所有的子目录并导入存在的jpg、png文件。
或者用右键菜单-粘贴图片的方式添加单张图片。
此外亦能导入PDF文件,并提取可复制的文字。
文字转录
工具支持框选文字区域并识别。提供手动框选和四种自动框选,并支持精细调整文本框。
手动框选文字
在图片上双击建立选择框,点住中间区域进行移动,点住右下角调整大小。
或者点击左侧工具栏的快速框选按钮,可以直接滑动建框。
OCR
选中文字区域,选择语言和OCR引擎,点击识别进行OCR。
自动识别文字
选择语言和OCR引擎,点击菜单-编辑-自动识别文字,可以自动检测文字区域并转录。其中有道和谷歌是按段落识别,其它引擎是按行识别,可以通过右侧编辑区域的合并左右区域和合并上下区域进行合并。
自动识别气泡
点击菜单-编辑-自动识别气泡,可以自动识别气泡。默认使用百度的在线气泡检测服务,可以自行配置离线气泡检测,详见气泡检测。
另提供较为复杂的启发式和自然场景文字检测方法,详见文字区域检测。
自动OCR所有区域
我们可以先把文字区域框出,然后批量进行OCR。点击菜单-编辑-自动OCR所有区域进行操作。
排序
支持根据坐标信息对文字区域进行排序。
另外针对漫画,提供分镜检测功能,可以在分镜的基础上进行排序,详见issue147。
导出
导出有多种选项。
Tab分割的TXT文档,包含坐标信息、字体样式、文字等信息
XLSX表格,和TXT的内容一样
XLSX表格-根据目录建立工作表,按子目录保存图片名、原文和译文信息
所有文本,按每张图片生成包含图片文字的txt文档
供翻译的文档,将原文和译文信息以表格的形式导出为一个docx、txt或者XLIFF文件
网页,将项目导出为网页,可供局域网内的手机阅读,支持语音朗读和按分镜阅读
图像PDF,将项目导出为PDF,支持添加可搜索的文字层
TMX,导出原文译文为翻译记忆文件
分镜,导出分镜图像为单张图片、条漫或者PDF
翻译
在译文区域输入译文并点击保存可以完成一个文字区域的翻译。
可以将翻译导出为docx、txt或者XLIFF文档供外部人员翻译,之后再通过菜单-导回翻译进行导回。
计算机辅助翻译软件BasicCAT支持直接操作ImageTrans的项目文件进行翻译。
翻译记忆、机器翻译和术语管理
切换右侧的操作区到辅助翻译页面,可以使用翻译记忆、机器翻译和术语管理这三个功能。机器翻译需要在偏好设置里设置API,并进行启用。另外还需要设置项目的语言,通过项目-设置-选择语言对进行设置。
预翻译
点击菜单-项目-批处理-预翻译,可以使用翻译记忆或者机器翻译进行批量翻译。
查看翻译
勾选左下角的查看翻译,可以查看翻译后的图片。精确模式会生成文字掩膜并修复背景,非精确模式则会用背景颜色进行遮盖。
在查看翻译状态下勾选排版模式,译文区域将被框出,并支持调整位置和修改样式。
生成成品图
点击文件-导出当前图片为-JPG,结果将输出在对应图片的文件夹的out文件夹中。选项ORA支持将文件导出为多层图像格式ORA,该格式能保存图层信息,供PS、Gimp和Krita等图像编辑软件编辑。
除此以外,ImageTrans可支持导出PSD。
如果要生成全部图片的成品图,需要通过项目-批处理-导出所有图片的成品图进行操作。
设置文字样式
设置文字样式主要有两个作用,一个是在ImageTrans中使用,一个是用于导出PSD时设置字体。
点击菜单-项目-设置-字体样式可以设置全局样式,设置选项包括使用的字体、文字大小、文字方向、行距、对齐方式、旋转角度、描边等等。
排在第一的样式是默认样式。在样式上方右键可以执行排序和删除操作,在列表的空白处右键可以选择从其它项目导入样式。
设置全局样式后可以给文字区域指定使用哪个样式。
另外也支持设置本地样式。本地样式的优先级大于全局样式。
点击左侧的字体按钮以启用字体设置工具栏,可以便捷地设置本地样式。
也可以通过文字区域列表上方的字体设置进行设置。它有一个专门的界面,能设置描边、旋转、是否启用本地样式。它能调出全局字体样式的设置界面进行更详细的设置(会读取添加在末尾的样式为本地字体样式)。
点击左侧的多选按钮以启动多选工具栏,可以调整多个文本框的位置并统一其字体样式。
获取Photoshop用字体名
因为Photoshop需要的字体名比较特殊,需要从PS中获得。方法是在PS中新建一张图片,建立一个文本框,设置所需字体,并完成文字编辑操作,是文本框处于非编辑状态。之后在ImageTrans中点击读取即可。非Windows系统需要使用readFont.jsx脚本。
自动调整字体大小
软件默认能根据文字区域大小自动调整字体大小。可以在项目设置中设置是否启用该功能以及最大、最小字体大小。
字体大小的优先级是这样的:
本地样式中的字体大小>自动调整字体大小>全局样式中的字体大小。
富文本
ImageTrans可以使用BBCode来标记富文本格式,比如下图中运用的粗体和斜体。
是使用这样的标记文本表示的: 留[b][fi]性感[/fi][/b]的绿发,穿绿皮衣的那个人。 。
下面是支持的标记说明:
标签名 |
效果 |
用例 |
|---|---|---|
b |
粗体(需要字体本身支持粗体) |
[b]文本[/b] |
i |
斜体(需要字体本身支持斜体) |
[i]文本[/i] |
fb |
仿粗体(仅用于横排) |
[fb]文本[/fb] |
fi |
仿斜体(仅用于横排) |
[fi]文本[/fi] 或者 [fi=2,2,2]文本[/fi] 2,2,2分别代表倾斜程度、纵坐标偏移量和高度偏移量 |
u |
下划线(仅用于横排) |
[u]文本[/u] |
s |
删除线(仅用于横排) |
[s]文本[/s] |
h |
竖排内横排(仅用于竖排) |
[h]文本[/h] |
offsetx |
横向偏移量(仅用于竖排) |
[offsetx=5]文本[/offsetx] |
offsety |
纵向偏移量(仅用于竖排) |
[offsety=5]文本[/offsety] |
fontfamily |
字体名 |
[fontname=Arial]文本[/fontname] |
fontsize |
文字大小 |
[fontsize=32]文本[/fontsize] |
fontcolor |
文字颜色 |
[fontcolor=#FF0000]文本[/fontcolor] |
点编辑区域右侧的按钮R可以启用富文本编辑器,便于快速插入对应的BBCode代码。
批处理
以上对单个图片的操作都可以通过菜单-项目-批处理对所有图片进行操作。可以通过自定义工作流功能一次性对所有图片执行所需的操作。
工具栏
点击程序左侧工具栏按钮,可以切换不同的工具栏。
目前支持以下工具栏:
OCR。
多选。支持选中多个区域并进行对齐、删除、合并、统一字体等操作。
文字区域分割。
快速建框。
字体。
排序。支持检测分镜和在文字区域上显示序号。
原图相关。支持调整译文图层透明度和与原文区域进行对齐。
编辑。支持旋转、翻转等图像编辑操作。