关于用AI(banana香蕉模型)翻译漫画的使用教程
本帖最后由 DragonJay 于 2026-3-6 10:45 编辑从 写了一个利用大香蕉翻译漫画的工具 继续:
https://i.postimg.cc/zfVzt3WC/image.png
没想到有一位坛友用了,然后遇到了问题(一键机翻我没试过),也是说出个教程。那么我就用我最~最最喜欢的画师https://i.postimg.cc/0yvKBG24/image.png的一部作品来演示
主流程
那么首先进入编辑页,我们上传一张图片(当然如果图片多可以选择整个文件夹,但是我没用这个功能,没测试)
https://i.postimg.cc/wMHdpBt0/image.png
可以看到也是支持手机端的,不过很鸡肋
https://i.postimg.cc/66DMTPY8/chrome-capture-2026-03-05.gif
https://i.postimg.cc/nc3M0ygm/chrome-capture-2026-03-05.gif
https://i.postimg.cc/8CQGHwps/chrome-capture-2026-03-05-(1).gif
以上是GIF动图,可能会加载慢点
鼠标滚轮滚动可以放大和缩小,鼠标右键可以拖拽图片,左键框选选区,框选完选区后按删除键可以删除选区
https://i.postimg.cc/X7RtSJTF/image.png
OCR 引擎选AI识别,你可以独立配置识别的模型,提示词可以填:
0. 使用banana pro
1. 请用中文翻译替换掉图片里的日文。
2. 生成一张只有中文的图
3. 强调:不是让你续写、续画,而是对这张图的文字进行更换,换为中文https://i.postimg.cc/K8YfWyzb/image.png
后面记得把剥离深度思考内容给关掉,这个是给deepseek用的,其他模型基本上不会出现这个问题,然后建议把慢速回退重试(防截断)打开,这样返回的图片会获得更好的效果。
https://i.postimg.cc/1RJNjVVC/image.png
下面连接设置这块,网站提供的api寄了,所以得自己配置,使用Gemini的最好(其他的没测,而且Gemini的一致性断崖式领先)。还有就是如果漫画文本是横着的就千万不要打开默认竖排文字(新文本框)。生成分辨率4K拉满,2k可能会产生火星文(翻译成英语可以用2k)
https://i.postimg.cc/0Nj8rryc/image.png
https://i.postimg.cc/R0WB48gk/image.png
接着就是重点,配置API,这里支持Gemini和openai接口,使用官方的话就api地址这块可以留空,使用中转站请填中转站的地址,openai格式连接后面记得加个/v1,Gemini格式连接后面记得加个/v1beta,具体请看中转站里的模型支持接口。模型的话可以自定义,比如我这里就使用的是gemini-3.1-flash-image-preview,目前谷歌最新的模型,成本也比pro低了不止一点半点,效果都差不多。剩下的设置保持默认就ok
那么现在开始翻译,点击上面的开始生成,千万不要点一键机翻(没测试)
https://i.postimg.cc/gjZjjj47/image.png
可以看到进度,已经在跑了
https://i.postimg.cc/C1WbLzbf/image.png
这时候如果遇到返回的图片有问题,这个位置的颜色不正确,就会自动修补,绿色的状态就表示翻译成功
https://i.postimg.cc/050NNzY0/image.png
可以看到结果,有错位的地方,因为之前框选的时候框多了,修补工具会根据框选的区域进行判断修正,所以就会出现这种情况,这时候可以减少框选区域后点击左上角的开始生成重新生成
下面是修正过后的原图和结果
https://i.postimg.cc/Pqd37NS6/image.png
https://i.postimg.cc/D04BGGzP/image.png
可以看到这回就没有错位的情况了
然后就是不建议一次性把图中所有的框都款选让Gemini翻,因为目前经过测试,处理的选区越多出错的概率越高,最好一次性就框选三个选区让AI翻译。
返回后如果想继续框选剩下的选区请点击应用为原图的选项,如下图所示
https://i.postimg.cc/15jVTdJy/chrome-capture-2026-03-06.gif
以下图片是一次性翻译图片里所有的气泡选区的结果,
https://i.postimg.cc/9FrrGpC2/01.png
整体上看起来没什么大问题,但是仔细看可以看到其中一个气泡框里的文字有出现火星文的迹象
然后如果你实在很懒,不想手动框选气泡选区,你可以点击下图所示的自动检测,注意要把独立 OCR 模型配置打开,不然用的模型是gemini-2.5-flash,位置参考后面截图,具体还是得自己调整。
https://i.postimg.cc/J4VzkW6r/image.png
其他功能
https://i.postimg.cc/6Qh9pSRH/image.png
这个功能是识别文本功能,对于想要自己修改翻译以及依赖上下文联系的朋友可以使用这个功能。点击翻译后会弹出一个窗口,会让你编辑修改,如果你事先已经准备好了翻译文本,可以填进去。
https://i.postimg.cc/760NYktV/image.png
然后记得一定要把独立 OCR 模型配置打开,填入模型,不然就会默认调用gemini-2.5-flash
https://i.postimg.cc/Wpx9v59H/image.png
https://i.postimg.cc/NGX61B4M/image.png
这个时候旁边就会有文本的显示,点击文本可以重新编辑。那么问题来了,该如何把文字嵌入进去呢?
https://i.postimg.cc/x8GNBjxR/image.png
这个时候就可以点击顶部菜单栏里的按已编辑OCR回填生成
https://i.postimg.cc/7PXxtTmq/image.png
然后就可以看到结果(示例因为其他的框我没有进行ocr识别,然后我使用了OCR回填,所以就导致了其他的框的翻译结果和这个一样)
最性价比
那还得是艺术字/特殊字,这个如果纯手扣应该需要不少时间吧,那么继续往下看
https://i.postimg.cc/020ZgPhJ/image.png
https://i.postimg.cc/9M9tLhGQ/image.png
可以看到艺术/特殊字也是可以翻的。如果成本过高,可以先在其他软件里把气泡翻了,然后剩下翻不了的字可以放到这里翻
地址是 https://manga.dragonjay.top/editor
如果有什么不懂的问题可以回帖或者私信我
先进!直接用token(Money)换工作量
现在有了3.1 Flash,也就是Nana Banana 2成本降低,真正进入可用状态 好强的教程!感觉看完已经跃跃欲试了
针对这种带气泡的文字效果蛮好的,不带气泡框的怎么样,会不会导致背景糊了() 虽然文字还有可能出现小瑕疵,但是从工作流程上真的比手动做有很大优势呢 楼主的教程好详细呀,感觉可以自己动手翻译漫画了{:6_165:} 技术力好高的样子,果然AI改变生活~
以后是不是就有了更多的汉化组~ 想当初做汉化还是逐字逐句的翻译,然后润色,最后嵌字,过程繁琐且费时,现在往以后会出现更多ai翻译,逐渐大众化,不知是喜还是忧 确实很强,但ai在逐渐进步,我希望以后他能直接自己识别翻译。其实感觉下一代模型就可以了 感觉也可以用在嵌入图片背景的VN文本惹,PS用不好人群有救惹XDD 牛大了,麻麻以后再也不用担心我啃不动生肉本子了{:4_86:} 教程的详细程度非常高了,一键式汉化也是很方便了 还挺方便的欸~看着半透文本框后面的背景也正常的~连拟声词都可以哇 居然可以直接替換文字?!
會不會以後漢化組都不找嵌字了:funk: 挺强的,半透明气泡也能处理 这个是真实用哈哈哈,下次试一试 这些再也不用愁怎么啃生肉了 谢谢大佬 翻译嵌字要下岗了(X 一些细节的还要自己调 声效字也能翻译还不错呢{:6_194:} 被大包吓到惹直接惹,这么大一包 好详细的教程!感谢老师的教学 现在的汉化确实可以ai翻译再人工润色 感觉方便多了 感谢分享,现在ai工具真的好用