黄仁勋与ElevenLabs联合创始人Mati Staniszewski的会面视频中,一句“语音转文本只是技术,文本转语音则是艺术”点明了这位芯片巨头掌门人对AI语音价值的深刻理解。

“只要我的声音通过人工智能数字方式呈现,用的就是ElevenLabs平台。” 英伟达CEO黄仁勋在近期与ElevenLabs联合创始人Mati Staniszewski的会面中这样表示。

今年夏天,他刚刚使用ElevenLabs生成的AI声音,在Computex主题演讲中完成了英文与普通话的双语旁白。

2025年9月底,英伟达正式宣布对AI语音初创公司ElevenLabs进行战略投资。虽然投资金额未公开,但这一举动揭示了英伟达在AI语音领域的重要布局。


01 投资细节:战略布局的深层逻辑

ElevenLabs联合创始人兼CEO Mati Staniszewski在2025年9月27日通过LinkedIn公开了英伟达战略投资的消息。

他发布了一段与黄仁勋的会面视频,并写道:“很高兴分享——在Jensen的支持下,NVIDIA正在投资ElevenLabs。”

不同于常规的财务投资,英伟达此次举动有着明显的战略意义。黄仁勋在视频中对ElevenLabs团队表示:

“尽情用NVIDIA的一切资源。如果你们想去世界上某个地方去不了,告诉我;如果还有哪家公司你们没谈成合作,也告诉我——我们帮你们打通。”

这种全方位的支持承诺,远超普通投资关系。

ElevenLabs在2025年1月完成C轮融资1.8亿美元,估值33亿美元;而本月早些时候,公司以66亿美元估值发起1亿美元股份回购。

短短9个月内,估值翻倍,显示市场对AI语音领域充满信心。

02 技术协同:从硬件到语音的生态闭环

英伟达与ElevenLabs的合作关系并非一朝一夕。根据官方信息,ElevenLabs在“最早期的日子”就与英伟达有过合作。

黄仁勋一直是其技术的“长期粉丝”

技术层面,ElevenLabs“利用英伟达软件及DGX B200系统,开发可生成70+种语言、自然超真实语音的AI语音技术”。

其模型已广泛应用于“实时对话代理、本地化、叙事、为失语者提供无障碍工具,以及有声书配音、游戏角色动画等”多个领域。

黄仁勋精准指出了ElevenLabs技术的独特价值:“语音转文本只是技术,文本转语音则是艺术;把工艺融入产品、再与技术整合,你们正在规模化地做这件事。”

他进一步强调,ElevenLabs的文本转语音技术已超越单纯的技术层面,达到了“艺术”的高度,并能够传递情感和同理心

03 市场前景:快速增长的AI语音赛道

英伟达此次投资并非孤立事件,而是看中了AI语音赛道的巨大潜力。根据QYResearch的统计及预测,2024年全球文本转语音AI模型市场销售额达到了55.04亿美元

预计2031年将达到134.2亿美元,年复合增长率达15.3%(2025-2031)。

而在更细分的在线AI配音解决方案市场,增长更为迅猛。2024年全球市场规模约为54.39百万美元,预计2031年达到351百万美元,期间年复合增长率高达30.6%

ElevenLabs作为该领域的领头羊,业绩表现亮眼。公司首席执行官Mati Staniszewski透露,员工人数从一年前的77人增至331人。

年化经常性收入也从1亿美元迅速增长至2亿美元,预计在年底前将提升至3亿美元。

04 战略转型:ElevenLabs的生态扩张

获得英伟达投资之际,ElevenLabs正积极扩展其业务边界。2025年8月,这家总部位于伦敦与纽约的AI音频初创公司推出Eleven Music,正式进军完整AI音乐生成领域。

与竞争对手Suno、Udio不同,ElevenLabs已与多家重要权利方签署授权协议,包括独立音乐联盟Merlin,以及出版商Kobalt。

这种主动布局音乐版权的策略,与竞争对手形成鲜明对比。

目前Suno和/或Udio正因训练数据版权问题遭大型唱片公司起诉,而ElevenLabs却通过与版权方合作规避了类似风险。

此外,ElevenLabs的团队扩张速度惊人。过去一年,其英国团队从18人增至68人,美国团队从10人增至61人。

欧洲员工总数由25人扩至91人。公司在纽约、旧金山、华沙、班加罗尔、东京、伦敦均设办公室,全球化布局初具雏形。

05 地缘考量:美英科技联盟的强化

英伟达此次投资背后,还有着重要的地缘政治考量。此次投资恰逢美英两国在AI和量子计算领域签署420亿美元技术协议,旨在加强两国在尖端科技领域的合作与研究。

黄仁勋的英国之行恰逢美国总统特朗普对英国进行国事访问,美方企业承诺向英国科技领域投资1500亿英镑。

Staniszewski对此评论道:“上周的国事访问加深了两国AI合作,美国公司对英国科技生态大举注资。我们扎根英美,对未来再乐观不过。”

作为一家扎根英美两地的公司,ElevenLabs正好处于这两个科技强国的交汇点。

英伟达的投资,也可视为其20亿英镑对英国AI初创企业承诺的一部分。该公司还计划在英国投资高达110亿英镑建设“AI工厂”,部署120,000块GPU。

06 行业影响:AI语音竞争格局生变

英伟达的战略投资,无疑将改变AI语音领域的竞争格局。在ElevenLabs迅速崛起的同时,其他科技巨头也在积极布局。

例如,阿里巴巴Qwen团队近日推出其旗舰级多语言多音色文本转语音模型Qwen3-TTS-Flash

该模型支持17种高保真音色,每种音色均可输出10种语言,还特别支持9种汉语方言。

不过,ElevenLabs凭借其技术优势,已在多个关键指标上取得领先。黄仁勋亲自“代言”就是一个明证。

在红杉资本的访谈中,Mati Staniszewski分享了公司能够在大型多模态模型环伺下突围而出的关键:“专注是护城河”

他解释道,通过深度聚焦音频领域,在研究和产品上建立了超越通用模型的竞争优势。


AI语音领域正从单纯的技术竞争升级为生态系统竞争。英伟达的这笔战略投资,不仅为ElevenLabs提供了资金,更重要的是打通了其获取英伟达全栈资源的通道。

随着语音成为人机交互的核心界面,谁能掌握更自然、更具表现力的语音合成技术,谁就能在下一波AI浪潮中占据有利位置。

黄仁勋的眼光已经越过了芯片本身,投向了AI技术的实际应用场景与用户体验


另外推荐三个基于微软AZURE服务的文字转语音网站

Azure官方服务虽功能强大,但配置流程复杂,且需绑定国际信用卡。以下是基于Azure技术栈的第三方平台,提供更便捷的接入方式:

平台类型 推荐地址 特点
免费体验 https://www.text-to-speech.cn 每日2000字免费额度,支持晓晓、云希等热门语音试听
会员套餐 http://new.text-to-speech.cn/tts 会员每日20万字额度,覆盖多数创作需求
企业级方案 https://ttspro.cn/tts 积分制消费,10积分兑换50万字,支持高并发API调用

这些平台完整保留Azure TTS的高级功能(如情感合成、SSML控制),同时简化身份验证与计费流程,大幅降低使用门槛。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。