盘天下 | 免费精选资源分享

F5-TTS:上海交大开源超逼真声音克隆 TTS

编程开发 盘天下 | 网盘资源分享 2024-11-22 1185 0


F5-TTS:上海交大开源超逼真声音克隆 TTS

一款基于流匹配的全非自回归文本到语音转换系统,零样本,支持声音克隆、速度控制、控制语音 情感 表现、长文本合成、中 英文语言 合成,并支持商用。

不需要复杂的 设计 如持续 时间 模型、文本编码器和音素对齐,能够快速训练并实现实时因素(RTF)0.15 的 推理 速度,显著优于当前基于扩散的 TTS 模型。

F5-TTS 在公共的 100K 小时 多语言 数据 集上进行训练,展现出高 自然 性和表现力的零样本能力、无缝代码切换能力和速度控制 效率

开源地址:https:// github .com/SWivid/F5-TTS

【新用户手机夸克APP转存可以获得1TB免费空间】

夸克网盘「电影」精选合集:https://pan.quark.cn/s/0755e002f4b6

夸克网盘「纪录片」精选合集:https://pan.quark.cn/s/8c76cd47e8be

夸克网盘「短剧」精选合集:https://pan.quark.cn/s/0f27fae4301e

夸克网盘「音乐」精选合集:https://pan.quark.cn/s/c999e39a7f49

夸克网盘「教程」精选合集:https://pan.quark.cn/s/27984fcacdad

夸克网盘「书籍」精选合集:https://pan.quark.cn/s/2532536273dd

冲上云霄

转载请注明出处,本文链接:https://www.80srz.com/pantx/14041.html

(1)
收藏 (0)
取消

感谢您的支持,我们会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开 支付宝 扫一扫,即可进行扫码打赏哦

评论列表