黄仁勋与ElevenLabs联合创始人Mati Staniszewski的会面视频中,一句“语音转文本只是技术,文本转语音则是艺术”点明了这位芯片巨头掌门人对AI语音价值的深刻理解。
“只要我的声音通过人工智能数字方式呈现,用的就是ElevenLabs平台。” 英伟达CEO黄仁勋在近期与ElevenLabs联合创始人Mati Staniszewski的会面中这样表示。
今年夏天,他刚刚使用ElevenLabs生成的AI声音,在Computex主题演讲中完成了英文与普通话的双语旁白。
2025年9月底,英伟达正式宣布对AI语音初创公司ElevenLabs进行战略投资。虽然投资金额未公开,但这一举动揭示了英伟达在AI语音领域的重要布局。
01 投资细节:战略布局的深层逻辑
ElevenLabs联合创始人兼CEO Mati Staniszewski在2025年9月27日通过LinkedIn公开了英伟达战略投资的消息。
他发布了一段与黄仁勋的会面视频,并写道:“很高兴分享——在Jensen的支持下,NVIDIA正在投资ElevenLabs。”
不同于常规的财务投资,英伟达此次举动有着明显的战略意义。黄仁勋在视频中对ElevenLabs团队表示:
“尽情用NVIDIA的一切资源。如果你们想去世界上某个地方去不了,告诉我;如果还有哪家公司你们没谈成合作,也告诉我——我们帮你们打通。”
这种全方位的支持承诺,远超普通投资关系。
ElevenLabs在2025年1月完成C轮融资1.8亿美元,估值33亿美元;而本月早些时候,公司以66亿美元估值发起1亿美元股份回购。
短短9个月内,估值翻倍,显示市场对AI语音领域充满信心。
02 技术协同:从硬件到语音的生态闭环
英伟达与ElevenLabs的合作关系并非一朝一夕。根据官方信息,ElevenLabs在“最早期的日子”就与英伟达有过合作。
黄仁勋一直是其技术的“长期粉丝”。
技术层面,ElevenLabs“利用英伟达软件及DGX B200系统,开发可生成70+种语言、自然超真实语音的AI语音技术”。
其模型已广泛应用于“实时对话代理、本地化、叙事、为失语者提供无障碍工具,以及有声书配音、游戏角色动画等”多个领域。
黄仁勋精准指出了ElevenLabs技术的独特价值:“语音转文本只是技术,文本转语音则是艺术;把工艺融入产品、再与技术整合,你们正在规模化地做这件事。”
他进一步强调,ElevenLabs的文本转语音技术已超越单纯的技术层面,达到了“艺术”的高度,并能够传递情感和同理心。
03 市场前景:快速增长的AI语音赛道
英伟达此次投资并非孤立事件,而是看中了AI语音赛道的巨大潜力。根据QYResearch的统计及预测,2024年全球文本转语音AI模型市场销售额达到了55.04亿美元。
预计2031年将达到134.2亿美元,年复合增长率达15.3%(2025-2031)。
而在更细分的在线AI配音解决方案市场,增长更为迅猛。2024年全球市场规模约为54.39百万美元,预计2031年达到351百万美元,期间年复合增长率高达30.6%。
ElevenLabs作为该领域的领头羊,业绩表现亮眼。公司首席执行官Mati Staniszewski透露,员工人数从一年前的77人增至331人。
年化经常性收入也从1亿美元迅速增长至2亿美元,预计在年底前将提升至3亿美元。
04 战略转型:ElevenLabs的生态扩张
获得英伟达投资之际,ElevenLabs正积极扩展其业务边界。2025年8月,这家总部位于伦敦与纽约的AI音频初创公司推出Eleven Music,正式进军完整AI音乐生成领域。
与竞争对手Suno、Udio不同,ElevenLabs已与多家重要权利方签署授权协议,包括独立音乐联盟Merlin,以及出版商Kobalt。
这种主动布局音乐版权的策略,与竞争对手形成鲜明对比。
目前Suno和/或Udio正因训练数据版权问题遭大型唱片公司起诉,而ElevenLabs却通过与版权方合作规避了类似风险。
此外,ElevenLabs的团队扩张速度惊人。过去一年,其英国团队从18人增至68人,美国团队从10人增至61人。
欧洲员工总数由25人扩至91人。公司在纽约、旧金山、华沙、班加罗尔、东京、伦敦均设办公室,全球化布局初具雏形。
05 地缘考量:美英科技联盟的强化
英伟达此次投资背后,还有着重要的地缘政治考量。此次投资恰逢美英两国在AI和量子计算领域签署420亿美元技术协议,旨在加强两国在尖端科技领域的合作与研究。
黄仁勋的英国之行恰逢美国总统特朗普对英国进行国事访问,美方企业承诺向英国科技领域投资1500亿英镑。
Staniszewski对此评论道:“上周的国事访问加深了两国AI合作,美国公司对英国科技生态大举注资。我们扎根英美,对未来再乐观不过。”
作为一家扎根英美两地的公司,ElevenLabs正好处于这两个科技强国的交汇点。
英伟达的投资,也可视为其20亿英镑对英国AI初创企业承诺的一部分。该公司还计划在英国投资高达110亿英镑建设“AI工厂”,部署120,000块GPU。
06 行业影响:AI语音竞争格局生变
英伟达的战略投资,无疑将改变AI语音领域的竞争格局。在ElevenLabs迅速崛起的同时,其他科技巨头也在积极布局。
例如,阿里巴巴Qwen团队近日推出其旗舰级多语言多音色文本转语音模型Qwen3-TTS-Flash。
该模型支持17种高保真音色,每种音色均可输出10种语言,还特别支持9种汉语方言。
不过,ElevenLabs凭借其技术优势,已在多个关键指标上取得领先。黄仁勋亲自“代言”就是一个明证。
在红杉资本的访谈中,Mati Staniszewski分享了公司能够在大型多模态模型环伺下突围而出的关键:“专注是护城河”。
他解释道,通过深度聚焦音频领域,在研究和产品上建立了超越通用模型的竞争优势。
AI语音领域正从单纯的技术竞争升级为生态系统竞争。英伟达的这笔战略投资,不仅为ElevenLabs提供了资金,更重要的是打通了其获取英伟达全栈资源的通道。
随着语音成为人机交互的核心界面,谁能掌握更自然、更具表现力的语音合成技术,谁就能在下一波AI浪潮中占据有利位置。
黄仁勋的眼光已经越过了芯片本身,投向了AI技术的实际应用场景与用户体验。
另外推荐三个基于微软AZURE服务的文字转语音网站
Azure官方服务虽功能强大,但配置流程复杂,且需绑定国际信用卡。以下是基于Azure技术栈的第三方平台,提供更便捷的接入方式:
平台类型 | 推荐地址 | 特点 |
---|---|---|
免费体验 | https://www.text-to-speech.cn | 每日2000字免费额度,支持晓晓、云希等热门语音试听 |
会员套餐 | http://new.text-to-speech.cn/tts | 会员每日20万字额度,覆盖多数创作需求 |
企业级方案 | https://ttspro.cn/tts | 积分制消费,10积分兑换50万字,支持高并发API调用 |
这些平台完整保留Azure TTS的高级功能(如情感合成、SSML控制),同时简化身份验证与计费流程,大幅降低使用门槛。
评论(0)