获取验证码
B站自研的IndexTTS 2.0官方本地安装包,是突破行业瓶颈的零样本语音合成工具。它首次在自回归架构中实现精准时长控制,音画同步误差低于0.02%,完美适配影视配音等场景。其核心优势在于音色与情感解耦,支持通过文本描述或音频独立调控情绪,搭配GPT潜在表征技术,强情感场景下仍保持清晰自然。支持中文,零样本即可克隆音色,本地部署保障数据安全,有Windows与Mac系统可选,是创作者与开发者的实用之选。
💡:资源分2个包分别支持Windows和macOS,下载的时候选择自己需要的系统即可,注意系统要求,配置低电脑预计不可用。
💡:资源为本地下载,省去了烦人的网盘。
💡:资源已经完成本地部署,没有魔法也可正常使用,也不用自己部署,下载即可用。
💡:Windows版本资源数太多,资源预览功能已隐藏。
【windows使用说明】
系统要求:
1. windows 10及以上系统
2. 至少16GB内存
3. 至少40GB硬盘存储空间(压缩包和解压后的文件都会占用空间)
使用说明:
特别提醒:解压路径中不能含有中文、空格或特殊字符!!!!!
1. 有英伟达显卡的话安装【cuda_12.8.1_572.61_windows.exe】(没有显卡就忽略吧,可以使用cpu)
2. 安装【VC_redist.x64.exe】
3. 双击运行【一键启动.bat】文件。
4. 启动成功后,会自动打开浏览器(保持命令行窗口运行,关闭命令行窗口TTS服务也会关闭)。
其他问题:
1. 不支持AMD显卡
2. 如果你有英伟达的显卡,请先双击安装【cuda_12.8.1_572.61_windows.exe】(请使用12.8版本)
3. 如果你是新电脑,或者刚重装完系统,可能需要安装【VC_redist.x64.exe】
4. 如果你安装CUDA失败了,那么可能需要安装【vs_BuildTools.exe】
1. 运行【vs_BuildTools.exe】
2. 勾选【使用C++的桌面开发】
3. 点击安装
【macos使用说明】
macos系统要求:
1. 至少有32G的内存
2. 至少剩余50G的硬盘存储空间
使用说明:
1. 第一次使用请双击【一键启动(第一次打开点这个).command】
2. 第一次使用会安装各种依赖,所以时间会比较久,如果没有报错就让它自己运行就好了,完成后会自动打开浏览器的
3. 运行成功后,后续可以双击【快速.command】启动速度会快一点
4. 使用时请保持终端运行,关闭终端TTS服务也会关闭
其他:
1. 不要在移动硬盘或U盘中使用,会导致失败!!
2. 如果出现意外情况可以执行【uninstall_uv_python.sh】删除已经安装的环境,然后再次执行【一键启动(第一次打开点这个).command】
IndexTTS是B站推出的一款先进的零样本文本转语音系统。其2.0版本在自回归架构中首次引入时间编码机制,实现了精准的语音时长控制,可明确指定生成的token数量以实现毫秒级语音时长控制,也能自由生成以保留原始韵律。此外,该系统还实现了情感特征与说话人音色的解耦,用户可以分别指定音色来源和情绪来源,在零样本条件下精准还原目标音色并完全重现指定情绪。
如果你平时想给视频配个顺口的旁白,或者想让AI用喜欢的声音读故事,却总怕操作太复杂?别愁!B站最近放了个大招——IndexTTS2,这可是款连小白都能玩转的AI语音工具,不仅能“复制”别人的声音,还能让AI说话带感情,甚至能装在自己电脑上用,今天咱们就把它扒得明明白白!
简单说,IndexTTS2是B站做的“AI语音生成器”,但比普通的厉害多了。以前的AI说话要么干巴巴没感情,要么时长控制不准,配视频总对不上画面,这玩意儿直接把这些问题解决了,咱们普通人用它也能搞出专业级的语音。
1.想让语音多长就多长,配视频再也不头疼
比如你剪了个15秒的短视频,想让旁白刚好15秒结束,以前的AI可能读快了剩几秒空镜,或者读慢了没说完就切画面。但IndexTTS2能精准控制时长,你说要15秒,它就不会多一秒少一秒,音画同步直接一步到位,不用反复剪音频。
2.声音和感情能分开调,玩法超灵活
举个例子:你想让AI用你闺蜜的声音,却带着开心的语气读生日祝福;或者用主播的声音,用温柔的感觉讲睡前故事——这事儿它能搞定!它把“声音是谁的”和“说话啥情绪”拆开来了,你想怎么搭就怎么搭,比以前的AI灵活太多。
3.不用录一堆素材,少量声音就能“克隆”
以前想让AI用特定声音说话,得录好几分钟素材,还不一定像。但IndexTTS2不用这么麻烦,只要少量声音片段,就能把目标音色还原得很像,而且感情表达还特别稳,不会忽冷忽热。
第一步:先搞到安装包(Windows和Mac都能用)
官网:https://github.com/index-tts/index-tts,不好下的直接用本站资源即可,“一键整合包”——不用自己装复杂插件,解压后跟着提示点就行。
第二步:看教程,跟着做就会装
怕自己装不明白?B站有专门的教程视频,链接是https://bilibili.com/video/BV136a9zqEk5,up主会一步步教你点哪里、怎么设置,不用懂代码,跟着操作就行。
第三步:想先试试水?在线体验也能行
要是不想先装电脑上,想先感受下效果,可以去这个在线页面:https://huggingface.co/spaces/IndexTeam/IndexTTS-2-Demo。不过要注意,这个页面可能需要点小技巧才能打开,实在搞不定的话,还是装本地版更稳妥。
做短视频配音:不管是抖音、B站的小视频,还是小红书的讲解视频,用它配旁白,时长准、有感情,不用再手动调音频。
录有声书/故事:给孩子录睡前故事,能给不同角色配不同声音+情绪,比自己读还生动;想做有声书副业,用它也能提高效率。
智能客服/教学:要是自己做小生意,用它做客服自动回复的语音,会比机械音亲切;老师录知识点讲解,也能选温柔的声音,学生听着更舒服。
游戏/动画小创作:自己在家搞个小动画、小游戏,用它给角色配音,不用找专业配音,成本低还好玩。
别觉得AI工具都很复杂,IndexTTS2连小白都能玩转,安装包、教程都给你准备好了,还是B站出的,靠谱程度也放心。想给视频配好音、玩语音创作的朋友,赶紧试试,真的能省不少事!