3秒让AI “说人话”！出门问问重磅发布新七代TTS 引擎TicVoice 7.0 ，开启语音生成新范式

出门问问（02438.HK）联合香港科技大学、上海交通大学、南洋理工大学、西北工业大学等研究机构，共同开源新一代语音生成模型 Spark-TTS，并重磅推出了Spark-TTS 的商业化高品质 TTS 引擎：TicVoice 7.0。

TicVoice 7.0作为出门问问的第七代 TTS 引擎，能在不借助额外生成模型的辅助下（比如基于flow matching进一步预测声学特征），仅用语言模型（序列猴子）以单阶段、单流方式实现 TTS 生成。它不仅具备超自然的语音克隆与跨语种生成能力，还可根据用户需求定制精品专属声音。

目前，出门问问已经将 TicVoice 7.0落地于旗下AI配音产品「魔音工坊」，为用户带来了更好的服务及效果体验，包括 SOTA 的3秒语音克隆能力、更卓越的精品发音人定制效果等，在客服、有声书、情感直播、影视解说、影视配音等应用场景下带来更极致的用户体验。

TicVoice 7.0 ：开启全新语音编码范式，技术 Buff 叠满

出门问问自 2012 年成立以来，便坚持在人工智能语音领域深耕，不断迭代 TTS 引擎。凭借深厚的技术积累及先进的产品应用经验，出门问问先后推出了「魔音工坊」「奇妙元」「元创岛」等语音或搭载语音功能的产品，牢牢占据领先行业的技术与产品生态位。

图片1.png

近日，出门问问联合国内外顶尖的学术研究机构香港科技大学、上海交通大学、南洋理工大学、西北工业大学，开源了新一代语音生成模型 Spark-TTS，并发布于开源社区 SparkAudio。

图片2.png

https://github.com/SparkAudio/Spark-TTS

模型一经发布，便迅速登上 Hugging Face 趋势榜 TTS 前二名，且增长势头强劲。而伴随着相关论文的发布，Spark-TTS 再次点燃学术圈的热情。

图片6.png

https://arxiv.org/pdf/2503.01710

Spark-TTS 或者说 TicVoice 7.0 何以引发如此重大反响？最重要的原因在于，它为行业带来了全新的语音编码范式，且实现了建模结构与文本 LLMs 结构的高度统一：

直击主流语音 token 痛点

TicVoice 7.0和Spark-TTS提出了一种全新的语音编码方式，可有效解决主流语音离散编码存在的两大核心问题：

单码本的语义 token 需要经过多个阶段才能生成声学特征，在大语言模型的自回归建模过程中，难以对音色等属性进行精准控制。

声学编码通常依赖多个码本，导致模型设计复杂化，同时缺乏与语义的强关联性，增加了预测的不确定性和难度。

图片3.png

BiCodec示意图

如图所示，BiCodec 将输入语音编码为互补的两部分，即固定序列长度的 Global Token 和低码率的 Semantic Tokens（50 TPS, token per second）：

Global Token 负责建模时序无关的全局特征（如音色），确保语音生成的全局可控性。

Semantic Tokens 以 wav2vec 2.0 提取的特征为输入，编码与文本紧密相关的信息，确保语义的强相关性。

这种设计使 BiCodec 既能利用 Semantic Tokens 的低码率和强语义关联性，同时又能在自回归语言模型中实现对音色等属性的精准控制，兼顾高效性与可控性。

实现建模结构与文本 LLMs 结构的高度统一

BiCodec 采用全离散、单流的编码方式，使语音 token 的建模与文本 token 的建模完全统一：

统一的模型结构：Spark-TTS直接复用 Qwen2.5 的原生架构，并扩展其 Tokenizer 以支持语音相关 token，使 Spark-TTS 的建模方式与文本建模高度一致。

属性控制：通过引入属性标签（如性别、基频等级）和细粒度属性值（如精确基频），Spark-TTS 以文本+属性标签为输入，采用链式思考（CoT, Chain of Thought）的方式，依次预测细粒度属性值 → Global Tokens → Semantic Tokens，从而实现音色生成高度可控。

图片4.png

Spark-TTS的语言模型示意图

再度刷新行业语音克隆能力标准，极大提升用户体验

TicVoice 7.0展现出卓越的语音克隆能力，尤其在跨语言声音克隆方面表现出色。我们分别将其与出门问问上一代产品 MeetVoice Pro及国内外优秀的同类产品做了评测，发现 TicVoice 7.0在“3秒克隆”和“至臻Pro-精品发音人”方面领先优势明显。

让 AI “说人话”，大大提升情感表现力

TicVoice 7.0能够在3秒内敏锐地捕捉声纹特征，让AI不仅能“说人话”，更能模仿人类的叹息、停顿。相比上一代的语音大模型，TicVoice 7.0的效果得到全面提升，3秒克隆经评测，其国际通用 MOS 评分从 3.9 提升至 4.2。其在音色相似度、情感表现以及稳定性上都有近10%的提升。总体而言，新一代语音大模型在听感上更自然、更悦耳、更稳定、情感表现力更强，可有效提升用户在客服、情感直播、有声书等场景的体验。

个性化定制更加精准，轻松获得播音级配音体验

TicVoice 7.0支持用户通过调整性别、语速、基频等多种属性（即将上线），精准塑造独特的声音风格。尤其在“至臻 Pro-精品发音人”定制方面，用户可通过 20-200句语料获得获得播音级的专业配音体验。

相比上一代的语音大模型，TicVoice 7.0在国际通用 MOS 分数上从 4.3 提升至 4.7。这意味着语音生成效果非常自然的，语音达到了广播级水平，普通人很难区分合成语音和广播语音的区别。总体而言，新一代语音大模型的语音更加清晰流畅、悦耳动听、容易理解、易于接受，可真正应用于影视/游戏角色配音等场景，为定制用户带来专业级体验。

TicVoice 7.0的发布不仅标志着出门问问在人工智能语音生成领域的又一次重大突破，更通过开源生态与产学研深度协同，为行业发展注入了新动能。

未来，出门问问将持续深化与顶尖学术机构的合作，不断提升用户的产品体验，探索语音生成技术与多模态 AI 的融合边界，从“听得懂”到“听得真”，从“能表达”到“有情感”，让 AI 真正成为人类情感与智慧的延伸。

了解更多demo效果参见：https://sparkaudio.github.io/spark-tts/

图片5.png

标签：

猜你喜欢

引领生态旅居新风尚新加坡微型屋品牌Tiny Away登陆内地

艾芬达电热毛巾架：一键除湿，把阳光搬回家！

绿动IWN“女神节”公益行动：让月经羞耻止于深山

“三八”妇女节不止于鲜花，揭秘华住"宠她"的365天服务密码

拉芳曹海磊：用'中国芯'打赢国货突围战！

京东工业城市峰会首站落地安徽长丰分享太璞数实一体化供应链解决方案创新成果

谱写滇池人鸥情缘，等你来创作！—— “浪漫滇池鸥歌春城”原创歌曲征集活动正式启动

香港沙田新城市广场女神节独家专属礼遇

头部品牌抢滩《北上》热播期，爱奇艺大家剧场成大剧营销新宠

安徽师范大学“望道书屋·新教育书房” 揭牌

深度数科企业文化日志：自驱之星宋晓鹏以梦为马，砥砺前行

市场地位证明：享佳集团领航银发健康服务，铸就行业第一品牌

京东工业城市峰会首站落地安徽长丰分享太璞数实一体化供应链解决方案创新成果

首航新能以技术创新为核心驱动力，不断提升产品性能和服务质量

3月桃厂会员日上线，多重福利To闪光的她

她力量专题重磅上线!华为浏览器携手权威媒体打造高品质“爆款”

MAMMUT猛犸象野雪安全“开挂”神器，一套解锁FWT 2025潮玩新姿势

华为浏览器系列沙龙：人生是旷野，一起遇见不被定义的她

爱尔眼科潘伟华：四十余载仁心仁术，为大家点亮希望之光

2025年德国iF奖揭晓：徕芬高速吹风机Mini以卓越设计折桂

许千千携《谢谢你的包容》从女神节启航，冲击亚洲艺术电影节金海燕奖

领跑高端深耕用户|卡百利第五届奥斯卡盛典曁明星经销商峰会圆满举办

南山区领导莅临十方融海调研，共探AI应用新蓝图

线上也能做冥想，在帆书冥想空间给压力做减法

大兴区举办“花开新大兴·凤舞新国门” 女企业家、人才“三八”国际妇女节活动

京东家政荣获北京市“三八红旗集体”称号

以代码为锚，女性开发者在鸿蒙生态中定义自由新坐标

行业首个！京东珠宝饰品设计师平台上线为消费者定制独一无二珠宝饰品

笛杨集团香港办公室开业，打造跨境服务新高地

热点图片

要闻

京东健康赋能女性健康科普：互联网助力女性健康认知提升
3月1日，在国际劳动妇女节前夕，由中国人口福利基金会发起的粉色火焰传递行动——健康
金函竹：智慧餐饮的创新驱动者，行业未来的变革力量
在全球经济迅速发展的浪潮中，餐饮行业正迎来一次深刻的变革。从传统管理到数字化赋能
杨学棒：以书法之笔，绘文人风骨
杨学棒先生是一位在艺术领域多有建树的艺术家，他不仅在陶瓷艺术上取得了卓越成就，在
“她力量”在鸿蒙生态绽放：女性开发者重塑数字生活新范式
随着HarmonyOS NEXT正式进入规模化商用阶段，鸿蒙生态中已经拥有超过2万个原生鸿蒙应
3.8女神节福利：安吉尔“净”心守护，助力健康生活
时代浪潮奔涌向前,当代女性以柔韧之姿平衡多重社会角色,却常将自我关怀放在最后。值此
深度赋能新型工业化山东信息通信业实施“三新”工程九大行动
3月4日，山东省通信管理局印发《2025年山东信息通信业现代化发展底座新升级、数智新赋
四款全新便携型双筒望远镜：徕卡Ultravid Compact Colorline
2025年3月7日，中国大陆。徕卡运动光学现推出四款便携型双筒望远镜：全新徕卡Ultrav
原生鸿蒙致敬“她力量”：用代码书写女性成长方程式
在国际妇女节来临之际，原生鸿蒙致敬她力量主题正片《她自由，她力量》上线，聚焦原
华为云开年采购季云上云下一体化安全解决方案，打造高效、安全管理平台
在全球智能化浪潮下，随着企业数字化转型的推进，企业面临的安全挑战越来越多。如何守
“人工智能+”成两会热词，华为云助力中小企业“登云用智”
尤其对中小企业而言，拥抱AI+面临技术门槛高、部署成本大、场景适配难等痛点，如何通

3秒让AI “说人话”！出门问问重磅发布新七代TTS 引擎TicVoice 7.0 ，开启语音生成新范式

相关阅读

猜你喜欢

热点图片

要闻