跳转至主要内容

身边的趣闻

[ComfyUI]Index-TTS:极速语音克隆神器!高效&高质量&拼音纠正,可自定义音色

wzy
最后编辑于 2025年 5月 5日

 

Index-TTS:极速语音克隆!

🌹大家好!欢迎来到破狼主页。感谢大家的支持与鼓励。在AIGC探索道路上,我将与你一路同行。喜欢就星标关注破狼文末扫码加入交流群 !

Index-TTS语音克隆简介

今天文章介绍一款语音克隆模型Index TTSIndex TTS是一种 GPT 风格的文本到语音(TTS)模型,主要基于 XTTS 和 Tortoise。它能够使用拼音纠正汉字的发音,并通过标点符号(-)在任意位置控制停顿。同时Index TTS对系统的多个模块进行了增强,包括改进说话者条件特征表示,以及整合 BigVGAN2 以优化音频质量。该模型在数万小时的数据上进行了训练,具有优秀的性能表现。

Index TTS虽然不是当前最优秀的语音模型,但它以极速的音频克隆和生成著称。同时还支持通过”-“标点符号的停顿控制,以及汉字拼音的纠正。

• [ComfyUI]阶跃星辰Step-Audio:开源实时语音对话!语音克隆&多语言情感对话&哼唱&RAP

• 项目主页:https://index-tts.github.io/
• GitHub:https://github.com/index-tts/index-tts

Index-TTS语音克隆ComfyUI体验

本文使用ComfyUI_IndexTTS插件体验。模型文末网盘获取

• ComfyUI_IndexTTS:https://github.com/billwuhao/ComfyUI_IndexTTS
• ICEdit-MoE-LoRA:下载模型repo放置目录 ComfyUI/models/TTS/Index-TTS。下载:https://huggingface.co/IndexTeam/Index-TTS/tree/main

Index-TTS语音克隆ComfyUI工作流

Index-TTS语音克隆ComfyUI工作流下载地址:

• RunningHUB-极速语音克隆Index-TTShttps://www.runninghub.cn/ai-detail/1918608105117257729/?inviteCode=kol01-rh059
• LIBLIB下载https://www.liblib.art/modelinfo/3a52bd779d4547f2998a5fd22e13d838?mine=1&from=personal_page&versionUuid=3dcc090e938f4842a65a3608f456fcdd
图片
注意
• Index-TTS支持中文和英文的语音克隆。同时可以通过speed参数设置语速控制,默认为1。
• Index-TTS克隆语音生成速率很快,12秒视频大约2分钟即可完成工作流全过程。
• RunningHUB在线体验-极速语音克隆https://www.runninghub.cn/ai-detail/1918608105117257729/?inviteCode=kol01-rh059
• 更多图文和视频ComfyUI工作流参见个人主页:https://www.runninghub.cn/user-center/1890418187312222210?utm_source=kol01-RH059

01.关注破狼

大家好!欢迎来到破狼主页。感谢大家的支持与鼓励。在AIGC探索道路上,我将与你一路同行。喜欢就星标关注破狼或文末扫码加入交流群 !

02.西藏旅行

那次独自旅行至西藏的经历让我至今难以忘怀,辽阔的天空和雪山让人感受到大自然的壮丽,平静的湖泊和安静的村庄也让我体会到内心的平和。

03.AIGC冷笑话

有一天,一个程序员问 AIGC:“你能帮我写一个冷笑话吗?”
AIGC 回答:“当然可以!为什么程序员总是把咖啡放在电脑旁边?因为它们都需要 Java 来运行!”
程序员笑了,然后又问:“那你能不能写一个更冷的?”
AIGC 沉思片刻,说:“好的,那我再写一个!为什么 AI 永远不会成为喜剧演员?因为它写的段子总是让人觉得 深度学习 了错误的东西……”

• 推荐不想本地自己折腾的同学一个可在线使用Runninghub平台可在线体验AI应用和工作流(注册即送1000积分可用)。主页更多精彩工作流可在线体验: https://www.runninghub.cn/user-center/1890418187312222210?utm_source=kol01-RH059  。阿里万相-最强开源图生视频AI应用https://www.runninghub.cn/ai-detail/1894632237306937345?utm_source=kol01-RH059  。AI工作流https://www.runninghub.cn/post/1894584540348743681/aiDetail?utm_source=kol01-RH059 

图片
• 推荐使用云端镜像体验:新注册即送 8 元免费白嫖额度,4090D 大约 1.59 元/小时。注册链接:https://www.xiangongyun.com/register/UJ6IVE 。万相和混元视频推理和炼丹一体镜像操作指南https://www.xiangongyun.com/image/detail/4453a18e-f61f-4562-b4a5-2b9faa02100b?r=UJ6IVE
• 更多AGI资料:https://www.yuque.com/yuqueyonghuwhsczq/isrggf/ypl2f4ey6q8l8f2o?singleDoc#
• 网盘下载https://pan.quark.cn/s/3904bd466510
更多推荐文章:

• Step1X-Edit:期待已久的开源来啦!动动嘴即可完成GPT-4O风格图像编辑

• [ComfyUI]ICEdit:图像编辑ID身份一致性新突破,面部一致无需再抽卡!
• [ComfyUI]HiDreamt:线稿手绘风格LORA!HiDream LORA训练参数分享
• [ComfyUI]Wan2.1:万相灵动画风分享,水墨国风关羽打卡记
• Step1X-Edit:期待已久的开源来啦!动动嘴即可完成GPT-4O风格图像编辑
• [ComfyUI]FantasyTalking:最新修复版已更新!支持真人&动漫&动物等拟人泛化
• [ComfyUI]字节Phantom:电商直播带货福音和行业警醒!多主体一致性参考视频生成

• FLF2V首尾帧:迎来ComfyUI原生支持!98%首尾帧匹配率,视频抖动率降低37%

感兴趣加入[AGI技术交流群]+V

图片

如果觉得文章不错,就请在看转发三连

 

wzy

分类:

评论已关闭。