人工智能使人类的语言像像素一样具有可塑性和可复制性。今天,一家名为Lyrebird的加拿大人工智能初创公司发布了它的第一款产品:一套算法,该公司声称只要听一分钟的音频样本就可以克隆任何人的声音。
几年前,这是不可能的,但是机器学习的分析能力已经被证明非常适合人类语言的特质。利用人工智能,像谷歌这样的公司已经能够创造出令人难以置信的逼真的合成语音,而Adobe则推出了自己的名为“VoCo项目”的原型软件,可以像Photoshop调整数字图像一样编辑人类语音。
不过,虽然项目VoCo需要至少20分钟的音频样本才能模拟语音,但Lyrebird将这一要求降低到了60秒。结果当然不是无法与人类的语言区分开来,但它们同样令人印象深刻,而且毫无疑问会随着时间的推移而改善。下面你可以听到唐纳德·特朗普、巴拉克·奥巴马和希拉里·克林顿讨论创业的声音:
Lyrebird说,它的算法还可以将情感注入到它创建的语音中,让客户发出愤怒、同情或压力过大的声音。Lyrebird说,产生的语音可以有广泛的用途,包括“阅读带有著名声音的有声读物、任何类型的连接设备、残疾人的语音合成、动画电影或视频游戏工作室。”生成声纹需要相当大的计算能力,但一旦完成,这篇演讲稿很容易编出来——Lyrebird可以在不到半秒钟的时间里造出一千个句子。
还有更麻烦的用途。我们已经知道,合成语音发生器可以欺骗用于验证身份的生物识别软件。而且,如果有足够的源材料,人工智能程序可以生成你喜欢的任何人的非常有说服力的假图片和视频。例如,2016年的这项研究使用3D地图来转换著名政治家的视频,包括乔治W。布什和普京,变成了工程师控制的实时“傀儡”。把这个和一个真实的语音合成器结合起来,你就可以在Facebook上看到唐纳德·特朗普(Donald Trump)宣布美国轰炸朝鲜的视频,在你意识到之前就传播开来了。也就是说,虽然Lyrebird确实给特朗普留下了很好的印象,但它的其他声音显然更机器人化:
Lyrebird意识到了这些问题,但其建议的修复方法远远不够。在公司网站的“道德”部分,利莱比德的创始人(三名来自蒙特勒大学的大学生éal)承认他们的技术“引发了重要的社会问题”,包括对法庭上使用的录音的真实性提出质疑他们写道:“这可能会产生危险的后果,比如误导外交官、欺诈,以及更普遍的说,盗取他人身份造成的任何其他问题。”。
他们的解决方案是公开发布这项技术,让它“对任何人都可用”。这样,他们说,损害会减轻,因为“每个人都会很快意识到这项技术的存在。”éLyrebird的bisson补充道:“这种情况与Photoshop相当。人们现在意识到照片是可以伪造的。我认为在未来,录音将变得越来越不可靠(作为证据)。”然而,德布尔说ébisson承认,尽管Photoshop现在已经广为人知,但在正确的背景下,人们仍然会爱上令人信服的假货。语音合成也是如此。
目前,Lyrebird技术公司仍在开发中,该公司不想讨论定价问题。但是德布尔ébisson说,已经有6000多人注册了早期访问其API,Lyrebird正在努力改进其算法,包括增加对法语等不同语言的支持。”这项技术将会实现,”德布尔说é比松。”如果不是我们,那就是别人。”
更新时间:美国东部时间4月25日下午12点30分:更新引自Lyrebird的Alexandre de Bré比松
...作站(DAW)。它是为现场表演和歌曲混音而设计的,但也可以用来录制音乐、控制舞台灯光、视觉效果(VFX)等等。 ...
...赫兹和210赫兹),但他们在不同的音量播放。较弱的声音可以单独听到,但较强的声音只有在同时播放时才能分辨出来。将一个频率覆盖到另一个相近频率的过程称为“掩蔽”。频率掩蔽在音频频谱的顶部和底部有效工作。 ...
...网页浏览器中的短样本。一旦导入到HYA-WAVE编辑器,音频可以在导出之前进行剪切和重新排序。许多效果也可以用来改变你的声音。 ...
...**音乐的免费软件。金钱买不到人才,而有才华的人往往可以充分利用免费工具。 ...
...音克隆。Descript使用了一个语音克隆引擎,它最初被称为Lyrebird,给人印象特别深刻。我们对质量感到震惊。听到你自己的声音说你知道你从来没有说过的话是令人不安的。 这段演讲绝对有机器人的特质,但随便一听,大多数人...
...,您可能会看到广告中的“环绕声”,但它并不总是像它声称的那样好,“真实”环绕声和“虚拟”环绕声之间有区别。让我们先来谈谈立体声耳机是如何工作的,以及不同类型的环绕声是如何改善它们的。 立体声耳机:只是...
你可以使用Audacity来重现一些非常常见和流行的效果,比如“倒带”和可怕的幽灵般的预回声。你所需要做的就是从相反的轨道开始。 “逆转”效应 查看下面的音频剪辑,听听反向效果是如何产生的。 [毛骨悚然.mp3] 不同的音...
...。 世嘉创世的主要声音芯片是一个成熟的调频合成器,可以控制在一个相当简单的方式,SNES是建立一个完全独立的音频子系统。它有一个声音芯片,就像一个采样器,读取一个游戏的代码,然后告诉一个8通道,16位处理器芯片...
...有麦克风,理论上可以提供更好的音频体验。此外,Korg声称NC-Q1s的ANC将在其他带有ANC的耳机会失真的嘈杂环境(比如俱乐部)中提供干净的音频。规格方面的NC-Q1有一个高达25kHz的频率响应,与一系列蓝牙编解码器兼容,让您进...
...一组专家本周在FTC的一个研讨会上表示,尽管音频伪造(可以诱使人们放弃敏感信息)是一个日益严重的问题,但这项技术也有一些好的合法用途。 联邦贸易委员会诉讼技术与分析部副主任劳拉·德玛蒂诺说:“人们...