有人能分辨出他们是假的吗？

假货意味着你不能相信你看到的一切。现在，假货可能意味着你不能再相信你的耳朵了。那真的是总统向加拿大宣战吗？真的是你爸爸在电话里问他的邮箱密码吗？...

假货意味着你不能相信你看到的一切。现在，假货可能意味着你不能再相信你的耳朵了。那真的是总统向加拿大宣战吗？真的是你爸爸在电话里问他的邮箱密码吗？

再加上另一个存在主义的担忧，我们的自大会不可避免地摧毁我们。在里根时代，唯一真正的技术风险是核生化战争的威胁。

在接下来的几年里，我们有机会痴迷于纳米技术的灰粘和全球流行病。现在，我们有深度伪造的人失去了对他们的肖像或声音的控制。

什么是假音频(an audio deepfake)？

我们中的大多数人都看过一个视频deepfake，在这个视频中，深度学习算法被用来用别人的相似性来代替一个人。最好的是令人不安的现实，现在轮到音频了。当一个“克隆”的声音可能与真人的声音无法区分时，就会产生一个假声音。

“这就像Photoshop中的语音，”simelike AI的首席执行官Zohaib Ahmed在谈到自己公司的语音克隆技术时说。

然而，糟糕的Photoshop工作很容易被揭穿。我们采访过的一家安全公司说，人们通常只猜测一个音频是真是假，准确率约为57%，不比掷硬币好多少。

此外，由于如此多的语音记录都是低质量的电话通话（或是在嘈杂的地方录制的），音频伪造品可能会变得更加难以辨别。音质越差，就越难发现声音不是真的。

但是为什么有人需要一个Photoshop来**声音呢？

令人信服的合成音频案例

实际上对合成音频的需求量很大。据艾哈迈德说，“投资回报率是非常直接的。”

在游戏方面尤其如此。在过去，演讲是游戏中不可能按需创作的一个组成部分。即使在实时呈现电影质量场景的交互式标题中，与非播放角色的语言交互也基本上是静态的。

不过，现在科技已经赶上了。制片厂有可能克隆演员的声音，并使用文本到语音引擎，使人物可以说任何实时。

在广告、技术和客户支持方面也有更传统的用途。在这里，一个声音，听起来真正的人和回应个人和上下文没有人的投入是什么重要的。

语音克隆公司也对医疗应用感到兴奋。当然，声音替代在医学上并不是什么新鲜事，斯蒂芬·霍金在1985年失去了自己的声音后，用了一种机器人合成的声音。然而，现代的声音克隆技术有着更好的前景。

2008年，合成语音公司CereProc在癌症夺走后，把他的声音还给了已故影评人罗杰·埃伯特。CereProc已经发布了一个网页，允许人们键入信息，然后将以前总统布什的声音发言。

CereProc的首席科学官马修·艾利特（Matthew Aylett）说：“埃伯特看到了这一点，就想，如果他们能模仿布什的声音，就应该能够模仿我的声音。”。然后，埃伯特要求公司创建一个替换语音，他们通过处理一个大型录音库来完成。

“这是第一次有人这样做，这是一个真正的成功，”艾利特说。

近年来，一些公司（包括谷类食品公司）与肌萎缩侧索硬化症协会合作开展了“Revoice项目”，为肌萎缩侧索硬化症患者提供合成语音。

合成音频的工作原理

语音克隆目前正处于发展阶段，许多公司正在开发工具。类似人工智能和描述有在线演示任何人都可以尝试免费。你只需录制屏幕上出现的短语，几分钟后，你的声音模型就被创建出来了。

你可以特别感谢人工智能，深度学习算法能够将录制的语音与文本进行匹配，从而理解组成你语音的成分音素。然后，它使用生成的语言构建块来近似它没有听到你说话的单词。

基本技术已经存在了一段时间，但正如艾利特指出的，它需要一些帮助。

“模仿声音有点像做糕点，”他说。“这有点难做，有各种各样的方法，你必须调整它的手来让它工作。”

开发人员需要大量的录音数据才能获得可通过的结果。几年前，闸门打开了。计算机视觉领域的研究证明是至关重要的。科学家们开发了生成性对抗网络（GAS），它可以首次根据现有数据进行推断和预测。

艾利特说：“我的模型现在可以把马变成斑马，而不是让电脑看到马的照片，然后说‘这是一匹马’。因此，语音合成技术的飞速发展得益于计算机视觉的学术研究

语音克隆的最大创新之一是，要创建语音，需要多少原始数据，就可以整体减少。过去，系统需要几十甚至数百小时的音频。然而，现在，只需几分钟的内容就可以产生有能力的声音。

关联：人工智能的问题：机器在学习东西，但不能理解它们

对不信任任何东西的恐惧

这项技术，连同核能，纳米技术，3D打印和CRISPR，是同时惊心动魄和可怕的。毕竟，新闻中已经有人被克隆语音欺骗的案例。2019，英国的一家公司声称它被一个音频假电话骗取了钱给罪犯。

你也不必走很远就能找到令人惊讶的令人信服的音频赝品。YouTube频道人声合成的特点是知名人士说一些他们从未说过的话，比如乔治·W·布什读了50美分的《在达人俱乐部》。这是当场的。

在YouTube的其他地方，你可以听到一群前总统，包括奥巴马、克林顿和里根，在说唱NWA。音乐和背景声音有助于掩盖一些明显的机器人故障，但即使在这种不完美的状态下，其潜力也是显而易见的。

我们在类似人工智能和描述工具上进行了实验，并创建了语音克隆。Descript使用了一个语音克隆引擎，它最初被称为Lyrebird，给人印象特别深刻。我们对质量感到震惊。听到你自己的声音说你知道你从来没有说过的话是令人不安的。

这段演讲绝对有机器人的特质，但随便一听，大多数人都不会有理由认为这是假的。

有人能分辨出他们是假的吗？

我们对人工智能有更高的期望。它为您提供了创建具有多种声音的对话以及改变对话的表达、情感和节奏的工具。然而，我们认为语音模型没有捕捉到我们使用的语音的本质特征。事实上，这不太可能愚弄任何人。

一位类似的人工智能代表告诉我们，“如果他们做得正确，大多数人都会被结果吓坏。”我们两次建立了一个语音模型，得到了类似的结果。所以，很明显，**一个语音克隆并不是一件容易的事，你可以用它来完成一次数字抢劫。

即便如此，Lyrebird（现在是Descript的一部分）的创始人Kundan Kumar认为我们已经通过了这个门槛。

库马尔说：“对于一小部分病例来说，它已经存在了。”。“如果我用合成音频来改变演讲中的几个词，它已经很好了，你很难知道改变了什么。”

有人能分辨出他们是假的吗？

我们也可以假设这项技术只会随着时间的推移变得更好。系统将需要更少的音频来创建模型，更快的处理器将能够实时构建模型。更聪明的人工智能将学习如何在没有范例的情况下，增加更令人信服的人类般的节奏和对演讲的强调。

这意味着，我们可能正逐渐接近轻松克隆语音的普及。

潘多拉魔盒的伦理

在这个领域工作的大多数公司似乎都准备以安全、负责的方式处理这项技术。例如，类似AI，其网站上有一个完整的“道德”部分，下面的节选令人鼓舞：

“我们通过严格的流程与公司合作，以确保他们克隆的声音可供他们使用，并获得声音演员的适当同意。”

有人能分辨出他们是假的吗？

同样，库马尔说，Lyrebird从一开始就担心滥用。这就是为什么现在，作为Descript的一部分，它只允许人们克隆自己的声音。事实上，“相似”和“描述”都要求人们实时记录样本，以防止非感官性的声音克隆。

令人振奋的是，主要的商业参与者已经实施了一些道德准则。然而，重要的是要记住，这些公司不是这项技术的把关人。现在已经有很多开源工具，但是没有规则。据Deeptrace威胁情报部门负责人亨利·阿杰德（Henry Ajder）说，滥用它也不需要高级编码知识。

Ajder说：“这一领域的许多进展都是通过GitHub等地的协作工作，利用以前发表的学术论文的开源实现实现的。”。“任何对编码有中等熟练程度的人都可以使用它。”

安全专家以前见过这一切

早在语音克隆成为可能之前，犯罪分子就曾试图通过电话偷钱，安全专家也一直待命检测和防范。安全公司Pindrop试图通过验证来电者是否是他或她声称是音频中的人来阻止银行欺诈。仅在2019年，Pindrop就声称已经分析了12亿次语音交互，防止了约4.7亿美元的欺诈企图。

在克隆语音之前，骗子尝试了其他一些技术。最简单的方法就是从其他地方打电话，告诉他有关这个标志的个人信息。

Pindop首席执行官VijayBalasubramaniyan说：“我们的声学签名允许我们确定一个电话实际上是来自尼日利亚Skype**，因为它的声音特性。”。“那么，我们可以比较一下，知道顾客在亚特兰大使用AT&T电话。”

一些罪犯还利用背景音来甩掉银行业务代表。

巴拉苏布拉曼尼扬说：“有一个骗子，我们称之为鸡人，他总是把公鸡放在幕后。”。“还有一位女士在后台用一个婴儿的哭声来说服呼叫中心的工作人员，‘嘿，我正经历一段艰难的时期’来获得同情。”

还有一些**罪犯会追查**的银行账户。

Balasubramaniyan解释说：“他们使用科技来提高声音的频率，听起来更**化。”。这些都是成功的，但“偶尔，软件会出错，听起来像阿尔文和花栗鼠。”

当然，语音克隆只是这场不断升级的战争中的最新发展。安全公司已经在至少一次钓鱼攻击中抓获了使用合成音频的欺诈者。

Balasubramaniyan说：“有了正确的目标，支出可能是巨大的。”。“所以，花时间创造一个合适的人的合成声音是有意义的。”

有人能分辨出声音是假的吗？

当谈到识别一个声音是否被伪造时，有好消息也有坏消息。糟糕的是，克隆人的声音一天比一天好。深度学习系统正变得越来越智能，并发出更真实的声音，而这些声音需要更少的音频来创建。

从奥巴马总统让任正非表态的片段中你可以看出，我们也已经到了这样一个地步：一个高保真、精心构建的声音模型对人的耳朵听起来非常有说服力。

声音片段越长，你越可能注意到有什么不对劲。不过，对于较短的剪辑，你可能不会注意到它是合成的，尤其是如果你没有理由质疑它的合法性的话。

声音质量越清晰，就越容易注意到音频的深层假信号。如果有人直接对着录音室质量的麦克风讲话，你就能仔细听。但是，在噪音很大的停车场，如果******质量差，或者手持设备上的通话，则很难评估。

好消息是，即使人类在区分真假方面有困难，计算机也没有同样的局限性。幸运的是，语音验证工具已经存在。Pindop有一个可以相互深入学习的系统。它使用这两种方法来发现音频样本是否是它应该是的人。然而，它还检查了一个人是否能发出样本中的所有声音。

根据音频的质量，每一秒的语音都包含8000-50000个可以分析的数据样本。

Balasubramaniyan解释说：“我们通常寻找的是人类进化对语言的限制。”。

例如，两个人声之间的间隔最小。这是因为你的嘴和声带中的肌肉可以很快地重新配置自己，所以在生理上不可能说得更快。

“当我们看到合成音频时，”巴拉苏布拉曼尼扬说，“我们有时会看到一些东西，然后说，‘这不可能是人类产生的，因为唯一能产生这种声音的人需要有一个7英尺长的脖子。”

还有一类声音叫做“擦音”。当你发f、s、v和z这样的字母时，空气通过你喉咙里的一个狭窄的管口时，擦音就形成了。对于深度学习系统来说，擦音特别难掌握，因为软件很难区分它们和噪音。

因此，至少就目前而言，语音克隆软件被一个事实绊倒了，那就是人类是一袋袋肉，通过身体上的小孔流动空气来说话。

Balasubramaniyan说：“我一直开玩笑说，深度假货是非常爱发牢骚的。他解释说，算法很难区分录音中单词的结尾和背景噪音。这就导致了许多语音模型的语音比人类要慢。

Balasubramaniyan说：“当一个算法经常看到这种情况发生时，从统计学上讲，它会更加确信是音频产生的，而不是人类产生的。”

simelike-AI也在使用simelikeyzer（GitHub上提供的一种开源深度学习工具）正面解决检测问题。它可以检测出假声并进行说话人验证。

这需要警惕

人们总是很难猜测未来会怎样，但这种技术几乎肯定只会变得更好。此外，任何人都可能成为受害者，而不仅仅是高调的个人，比如民选官员或银行CEO。

巴拉苏布拉曼尼扬预测说：“我认为我们正处于第一次音频泄露的边缘，人们的声音会被窃取。”。

不过，目前，音频假货的真实风险很低。已经有一些工具在检测合成视频方面做得相当好。

另外，大多数人不会有被攻击的危险。根据Ajder的说法，主要的商业参与者“正在为特定的客户开发定制的解决方案，而且大多数人都有相当好的道德准则来确定他们愿意与谁合作，不愿意与谁合作。”

然而，真正的威胁就在前方，正如阿杰德继续解释的那样：

“潘多拉的盒子将是人们把这项技术的开源实现拼凑成越来越用户友好、可访问的应用或服务，而这些应用或服务没有商业解决方案目前所具备的那种道德层面的审查。”

这可能是不可避免的，但是安全公司已经在他们的工具箱中加入了假音频检测。不过，保持安全需要警惕。

阿杰德说：“我们在其他安全地区也这样做过。“例如，许多组织花了大量时间试图了解下一个零日漏洞是什么。合成音频只是下一个前沿领域。”

相关报道：什么是假货，我应该担心吗？

发表于 2021-04-01 21:18
阅读 ( 145 )
分类：互联网

你可能感兴趣的文章

新的骗局显示了为什么你不应该点击电子邮件中的链接

...假的！虽然没有真正的危险，因为这是用于测试的目的，有人可以注册这个网站，并使用它来钓鱼用户期待看到苹果的网站。 ...

发布于 2021-03-14 22:29
阅读 ( 132 )

检查智能手机充电器是否安全使用的7种方法

...去你买它的零售商那里。他们需要知道他们的平台上是否有人在**货。如果它是通过第三方或拍卖网站，去一个人你得到了它，如果他们什么也不做，报告给主要零售商。 ...

发布于 2021-03-22 11:58
阅读 ( 205 )

如何识别骗子使用的7个网络假货

...样的，在阴暗的网站上留意那些完全虚假的评论（比如没有人真正使用过这个产品）。你经常会看到表扬或五星的评论，但没有列出上下文或名字。这通常是你在垃圾网站上的标志。 ...

发布于 2021-03-25 10:41
阅读 ( 216 )

psa：不要相信来电显示-它可能是假的

...诈骗呈上升趋势，而且经常通过来电显示欺骗来实现。当有人打电话给你时出现的那个名字和号码可能是假的，所以你不能完全信任它。来电显示更多的是一种方便的功能。如果有朋友、家人或公司打电话给你，你很容易在接...

发布于 2021-04-10 04:37
阅读 ( 161 )

匿名操作系统是假的，“包装在特洛伊木马中”说anonops推特帐户

...激发人们的信心，也不可能让除了最天真的用户以外的所有人都放心。很明显，这个组织有一些品牌问题，因为由于匿名，其他人很容易盗用你的品牌，而更广泛的协会（或者在匿名的情况下，军团）可能不支持。我们还不得...

发布于 2021-04-21 15:54
阅读 ( 125 )

facebook报告称，8.7%的用户帐户可能是假的

...Facebook每月活跃用户中约有4.8%是重复账户——Facebook认为有人用假名维护额外的用户资料。另外2.4%的人是被错误分类的账户——公司或宠物的个人资料还没有被转换成Facebook页面。还有1.5%的不良账户是由垃圾邮件发送者管理的。...

发布于 2021-04-23 15:27
阅读 ( 110 )

诺基亚新发布的pureview广告太棒了，可惜是假的

...访了一位诺基亚发言人，他同意PureView广告具有误导性。他们强调，“公司从未打算欺骗任何人”，只是为了证明光学稳像的好处。诺基亚表示，目前正在研究用脚注更新原始视频，以便清楚地看到这些图像是模拟的，而宣布该...

发布于 2021-04-24 01:31
阅读 ( 220 )

关于世界上最新（可能是假的）国家利伯兰的九个问题

...它太自由了还是因为它根本不存在。  这是第一次有人组成一个国家吗？ 一点也不接近。最相似的例子是Sealand，这是一个废弃的石油平台，位于英格兰海岸，1967年宣布独立。它从未被正式承认为一个国家，但它有自...

发布于 2021-04-29 14:33
阅读 ( 199 )

谁认定路易斯·汤姆林森的孩子是假的，为什么，他是吗？

...是英俊的消防员；当然，哈利·斯泰尔斯是个神通。每当有人问我“第五个”是谁时，“我都说路易是最老的，最像精灵的，而且一直在试验不同宽度的水平条纹。 去年夏天，当一个活泼的迈克尔·斯特拉汉促使汤姆林森在...

发布于 2021-05-04 04:13
阅读 ( 214 )

让我们数一数这个机器人是假的

...表明，有了一堆传感器，机器人就能跟踪你的家，检测到有人摔倒或试图闯入你的房子。现在，这些都是机器人可以告诉你的事情，但你所需要的只是一些传感器和一个应用程序。为什么要买一个机器人来告诉你有人闯入你的房...

发布于 2021-05-05 21:22
阅读 ( 123 )