B站的AI语音合成-IndexTTS2 开源了
本帖最后由 f360967847 于 2025-12-26 00:24 编辑目前B站已经有少部分视频使用了indexTTS2,来进行语音模仿:
比如下方这个视频,在手机端会提示有这个【原声翻译】功能给你测试,开启后这个视频就是全程英文阅读了。(这个应该不是实时应该是先生成好的,要不然B站服务器早就挤爆了)
https://www.bilibili.com/video/BV12gYjzxEix
其他UP测试:
【最强AI音色克隆发布,B站IndexTTS2整合包,支持音色保存、批量生成、长文本生成,情感控制效果超级强大!-哔哩哔哩】 https://b23.tv/ngxYDfY
下面是本地部署自己随意调的,没有特别深入研究:这个TTS的好处是,不需要训练音色模型,直接拿参考音频就可以模仿。
原语音:
试听:
https://onedrive.fgh1995.dpdns.org//IndexTTS2/music_48420172.mp3
备用链接:
http://share.sunjiada.cn/data/music_48420172.mp3台词:
我的一部分感到恶心。他为此放弃了人性,为了他。但该死...我的一部分还记得我们曾经拥有的东西。
直接参考原音频语气:
试听:
https://onedrive.fgh1995.dpdns.org//IndexTTS2/music_66351012.mp3
备用链接:
http://share.sunjiada.cn/data/music_66351012.mp3
情感描述-厌恶,下方是情感权重:
试听:
https://onedrive.fgh1995.dpdns.org//IndexTTS2/music_74037220.mp3
备用链接:
http://share.sunjiada.cn/data/music_74037220.mp3直接把原文当做情感描述,下方是情感权重:
试听:
https://onedrive.fgh1995.dpdns.org//IndexTTS2/music_88245376.mp3
备用链接:http://share.sunjiada.cn/data/music_88245376.mp3
不知道哪个网站外链,支持在论坛直接播放音频。。。。
所以点“如果无法播放,请点击此处在新窗口打开”下载试听吧。。。
听起来是很像话剧的表演了,感情比日常对话要更加饱满一些 喔⊙ω⊙效果可以欸~ai生成完整自定gv的日子越来越近咯~ 有一说一,配音行业ai优势很大了,最近声优闹瓜屡见不鲜,真是自己不珍惜自己的饭碗 AI在语音方面进步很快啊。以假乱真不远了 感觉AI完全可以取代配音演员了 反正我是判断不了是不是AI Air的语音技术水平越来越高了惹,开源了还是很不错的 https://img.gamemale.com/album/202508/31/011439y0p26vv9hzhhhlz6.jpg.thumb.jpg五味杂陈 已经无法判断ai是利是弊了 感觉又有一大批相关从业者要失业 开源基本上就是已經被用爛了的東西, 想像不到更高階的東西會妨害到多少的工位呢 现在好多视频都是ai配音,开始挤压配音员的生存空间了 看LZ的帖子感觉科技真的是每天都在进步呢... AI能够做的事真的是越来越多了 很强大的AI工具,可以直接模仿参考音频不用训练模型很方便 现在的ai发展真是很快了,能做的事情越来越多了啊 AI越来越强大了 配音都快要被取代了 现在好多AI配音已经听不出了媲美人声 有一个被取代的职业诞生了惹 似乎有点意思,比传统TTS强太多了。{:3_52:} 抖音老早就有类似功能的了,这个可以加入情绪真的很棒了 感觉比我之前体验过的ai已经进步了太多了:$