ElevenLabs是一家专注于人工智能和语音克隆技术的初创企业。该公司开发了AI工具,能够创建和编辑合成语音。他们的技术以高度精准地复制人类语音而著称,应用领域涵盖娱乐、媒体制作和有声读物等。
人工智能语音克隆初创企业ElevenLabs获得8000万美元融资,成为独角兽企业
ElevenLabs于2022年由前谷歌机器学习工程师Piotr Dabkowski和前Palantir部署策略师Mati Staniszewski共同创立,约一年前推出测试版。Staniszewski表示,他和Dabkowski在波兰长大,受到翻译不佳的美国电影的启发,决定创造语音克隆工具。如今,ElevenLabs最知名的是其基于浏览器的语音生成应用,该应用能够创建逼真的语音,并可调整语调、情感、节奏等关键声音特征。用户可以免费输入文本,由几种默认语音之一朗读该文本。付费用户可以上传语音样本,使用ElevenLabs的语音克隆技术制作新的风格。
ElevenLabs正在投资其语音生成技术的不同版本,以创建有声读物和配音电影和电视节目,以及为游戏和营销活动生成角色声音。去年,该公司推出了一款“语音到语音”工具,试图在自动去除背景噪音的同时,保留说话者的声音、韵律和语调,并在电影和电视节目的情况下,翻译并与源材料同步。在未来几周的路线图上是一个新的配音工作室工作流程,以及一款基于订阅的移动应用,该应用使用ElevenLabs的语音朗读网页和文本。
ElevenLabs的创新赢得了包括Paradox Interactive(其最近项目包括《城市:天际线》和《群星》)和《》在内的客户,以及其他出版、媒体和娱乐公司。Staniszewski声称,ElevenLab的用户已经生成了相当于100多年的音频,平台正在被财富500强公司中41%的员工使用。
论坛4chan使用ElevenLabs的工具分享模仿名人如艾玛·沃森的仇恨信息。《The Verge》的James Vincent能够利用ElevenLabs恶意克隆声音,生成包含暴力威胁、种族主义和反跨性别言论的样本。在Vox,记者Joseph Cox记录了生成足以愚弄银行验证系统的克隆声音。
作为回应,ElevenLabs试图根除多次违反其服务条款的用户,这些条款禁止滥用,并推出了一种检测其平台创建的语音的工具。今年,ElevenLabs计划改进检测工具,以标记其他语音生成AI模型的音频,并与未具名的“分销玩家”合作,使该工具在第三方平台上可用。
ElevenLabs还面临着来自声优的批评,他们声称公司未经他们同意使用了他们的语音样本,这些样本可能被用于推广他们不支持的内容或传播错误和虚假信息。在《Vice》的一篇文章中,受害者回忆了ElevenLabs是如何被用于针对他们的骚扰活动,例如使用克隆的声音分享演员的私人信息——他们的家庭地址。
还有一个问题是:像ElevenLabs这样的平台对声音表演行业构成的潜在威胁。
声音演员越来越多地被要求签署放弃他们的声音权利,以便客户可以使用AI生成的合成版本,这最终可能取代他们——有时没有相应的补偿。人们担心,尤其是便宜的、入门级的工作最终将被AI生成的声音所取代,而演员将无法追索。
一些平台正在试图找到平衡。本月早些时候,ElevenLabs的竞争对手Replica Studios与SAG-AFTRA签署了一项协议,创建并授权媒体艺术家工会成员的数字复制品。在一份新闻稿中,这些组织表示,该安排建立了“公平”和“道德”的条款和条件,以确保演员同意,并就新作品中使用数字声音双胞胎的谈判条款。
ElevenLabs的解决方案是一个声音市场。目前处于Alpha测试阶段,并计划在接下来的几周内更广泛地推出,市场允许用户创建一个声音,验证并分享它。当其他人使用一种声音时,原创者会得到补偿。Staniszewski说:“用户始终保留对其声音可用性和补偿条款的控制权。市场旨在迈向与现有行业实践协调的AI进步的一步,同时也为ElevenLabs平台带来多样化的声音集合。”
也许随着ElevenLabs——现在是资金最充裕的合成声音初创公司之一——试图击退如Papercup、Deepdub、ElevenLabs、Acapela、Respeecher和Voice.ai等新兴竞争对手以及亚马逊、微软和谷歌等大型科技公司的竞争,情况将来会发生变化。无论如何,ElevenLabs计划今年将其员工人数从40人增加到100人,打算在快速增长的合成声音市场上长期存在并引起轰动。电竞竞猜官网