众所周知,大香蕉生成的一致性非常好,所以按理来说可以用来翻译漫画(字体也可以保持的很像,嵌字都可以免了),尤其是表漫,直接传过去让香蕉翻译就可以
但是黄漫怎么办呢,上传整个图片的话会被截断,这么一想就可以只截取对话的部分,剩下黄色部分的就不让大香蕉看到,那么这个项目就诞生了
目前核心能力包括:
选区翻译工作流
手动画框、批量处理、逐区进度反馈,适合精修和校对。 两种处理模式 - 全图遮罩模式:保留上下文,减少多次请求。(这个功能实测其实并不太好,现在多个选区也能一次请求完成)
- 分片模式:按选区逐块处理,便于复杂场景回退和对比。
预翻译与文本检测
支持先做文本检测/预翻译,再进入重绘阶段,降低错译和漏译概率。(这个功能可开可不开,开了浪费token,效果和不开差不多) 模型与接口可配置
支持自有 API Key,也支持网站统一 API(可在后台配置),方便个人和团队不同使用方式。 账单与管理能力
有基础的充值、账单、后台配置页面,便于后续做更稳定的多人使用。
这个项目还在持续迭代中,最近重点在优化:
- 复杂背景文字(拟声词、网点背景)
- 竖排/横排保持
- 遮罩模式与分片模式的一致性和稳定性
如果你愿意试用,欢迎直接提问题和建议:
- 哪类漫画页最难处理?
- 你更常用遮罩模式还是分片模式?
- 对“自动检测 + 预翻译”有什么期待?
感谢大家的反馈,我会持续更新。 下面举个例子 可以看到,我框选了两个类型,一种就是有背景的特殊字,一种是气泡框里的字 然后开始生成,可以看到结果(这边建议一次性少选几个选区,好像多选了几个选区后翻译质量会下降) 下面的连接设置里可以配置自己的API key,如果没有可以试用网站的key,一个账号可以试用10次,同时建议选择4K生成,这样中文就不会产生乱码,下面的两个功能(全图遮罩和预翻译)可以关闭,省token和时间。下面的模型也可以自定义,理论上其他可以生图的模型也可以,但是结果估计不太好 上面的提示词可以自己指定,可以让他修改风格什么的,自动检测文本并生成选区的功能适合粗修懒人使用,建议精修还是自己手动选区 其他的问题请阅读文档。有需要新的功能可以评论出来
|