我在短短的几个小时内学会了假唱(你也可以)

做假货有多容易,真的?在过去的几年里’新的方法和算法源源不断地出现,提供了越来越令人信服的人工智能生成的假货。你现在甚至可以在一些应用程序中进行基本的面部交换。但如何才能把你在网上找到的随机代码变成真假呢?从个人经验来看,你真的需要两样东西:时间和耐心。...

做假货有多容易,真的?在过去的几年里’新的方法和算法源源不断地出现,提供了越来越令人信服的人工智能生成的假货。你现在甚至可以在一些应用程序中进行基本的面部交换。但如何才能把你在网上找到的随机代码变成真假呢?从个人经验来看,你真的需要两样东西:时间和耐心。

007Ys3FFgy1gpo876uperj31v818tqji

尽管我写了很多年关于deepfakes的文章,但我只使用为我工作的预先打包的应用程序来**它们。但是,当我看到一个明显简单的方法,创造快速唇形同步深假在任何时间,我知道我必须尝试自己。

基本机制相当简单。你所需要的只是你的主题的一段视频和一段你想让他们跟随的音频片段。用代码把这两个东西混合在一起,嘿,普雷斯托,你有一个假的。(你可以说我没有什么技术背景,对吧?)最终的结果是这样一个视频女王唱歌皇后:

或者是一群唱着那首国际赞歌的电影角色,斯马什·茅斯的“全明星”:

或者特朗普模仿爱尔兰经典:

寻找算法

现在,这些视频不是旨在破坏民主和带来infopocalypse的邪恶假货。(如果正常的编辑也能做到这一点,谁还需要深度假货呢?)他们甚至没有那么有说服力,至少不需要额外的时间和努力。他们是愚蠢的和有趣的-这两个品质我很重视承诺浪费我的时间写一篇内容丰富,引人入胜的文章给我的雇主。

正如詹姆斯·凯莱赫(James Kelleher)在推特(Twitter)上指出的那样,他用来**视频的方法被一些人工智能研究人员在网上分享。有关描述他们的方法的论文(称为Wav2Lip)在几周前发布,同时还有一个供任何人尝试的公开演示。这个演示原本是可以自由访问的,但是现在你必须注册才能使用它。这部作品的作者之一,IIIT Hyderabad的K R Prajwal告诉the Verge这是为了阻止恶意使用,尽管他承认注册不会“阻止精通编程的严重犯罪者”

Prajwal说:“我们肯定承认人们对能够自由使用这些工具的关注,因此,我们强烈建议代码和网站的用户将视频清晰地呈现为合成视频。”。他和他的同事们注意到,这个程序也可以用于许多有益的目的,比如动画和将视频配音成新的语言。Prajwal补充说,他们希望这些代码的发布将“鼓励对能够有效打击滥用的系统进行卓有成效的研究”

尝试在线演示(但失败了)

我最初试着用这个在线演示**一个假货。我找到了我的目标(苹果CEO蒂姆·库克)的视频和一些音频供他模仿(我出于某种原因选择了吉姆·凯瑞)。我使用Quicktime的屏幕录制功能下载了视频片段,并使用一个名为Piezo的便捷应用程序下载了音频。然后我得到了两个文件,把它们**网站,然后等待。然后等待。最终,什么也没发生。

出于某种原因,演示不喜欢我的剪辑。我试着做新的,降低他们的决心,但没有什么不同。事实证明,这将是我深度伪装经历中的一个主题:随机出现的路障,我只是没有技术专长来分析。最后,我放弃了,向凯莱赫求助。他建议我重命名我的文件以删除任何空格。我这样做了,出于某种原因,这是有效的。我现在有了一段蒂姆·库克模仿吉姆·凯瑞为莱蒙妮·斯尼克的《一系列不幸事件》做屏幕测试的片段。这是可怕的-真的只是难以置信的逼真和幽默方面的伪劣-但个人成就都一样。

007Ys3FFgy1gpo878467hj310c0it0uh

转移到colab

为了改进这些结果,我想更直接地运行算法。为此,我转向作者的Github,在那里他们上传了底层代码。我将使用Google Colab来运行它:相当于googledocs的编码,它允许您在云中执行机器学习项目。同样,是最初的作者通过简单的步骤设计代码完成了所有的工作,但这并没有阻止我一次又一次地陷入挫折,就像小品鲍勃处理一个满是耙子的停车场。

为什么我不能授权Colab访问我的Google驱动器?(因为我登录了两个不同的Google帐户。)为什么Colab项目在我的驱动器文件夹中找不到神经网络的权重?(因为我下载的是Wav2Lip模型,而不是Wav2Lip+GAN版本。)为什么我上传的音频文件没有被程序识别?(因为我在文件名中拼错了“aduoi”)等等。

令人高兴的是,这个YouTube教程解决了我的许多问题,提醒我注意我犯下的一些更微妙的错误。其中包括为输入和模型创建两个单独的文件夹,分别标记为Wav2Lip和Wav2Lip。(注意“lip”上不同的大写字母——这让我大吃一惊)看了几次视频,花了几个小时解决问题,我终于有了一个工作模式。老实说,我本可以哭的,部分原因是我自己明显的无能。

最终结果

几次实验之后,我了解到了这个程序的一些怪癖(比如它很难处理那些不直截了当的面孔),并决定**我的“deepfake pièce de réresistance:Elon Musk”假唱,与Tim Curry在《指挥与征服:红色警报3》中的“太空”演讲同步。你可以在下面看到自己的结果。当然,这只是对现实和虚构之间的界限不断抹去的一小部分贡献,但至少它是我的:

我从这次经历中学到了什么?好吧,做假货确实容易,但不一定容易。尽管这些算法已经存在多年了,任何愿意花几个小时工作的人都可以使用,但如果你的目的至少是传播错误信息的话,用传统方法简单地编辑视频剪辑会更快,产生更令人信服的结果,这是真的。

另一方面,让我印象深刻的是这项技术传播的速度之快。这种特殊的唇同步算法Wav2Lip是由印度和英国大学附属的一个国际研究小组创建的。8月底,他们在网上分享了自己的作品,然后被推特和人工智能时事通讯(我在一个著名的名为Import AI的网站上看到了这篇文章)。研究人员使代码易于访问,甚至创建了一个公开的演示,在几个星期内,世界各地的人们已经开始用它进行实验,创造他们自己的deepfake来取乐,在我的例子中,是内容。在YouTube上搜索“Wav2Lip”,你会发现教程、演示和更多的仿冒例子。

  • 发表于 2021-04-17 20:33
  • 阅读 ( 173 )
  • 分类:互联网

你可能感兴趣的文章

假唱应用程序wombo展示了深奥假唱的混乱、充满迷因的潜力

...、深度假冒空间,我看到了做一些酷的事情的机会。”在短短几周内,Benkhin估计这个应用程序已经有200万次下载。 Wombo是免费的,易于使用。只需抓拍一张你的脸或者上传一张你的照片,然后按下一个按钮,就可以让你的照片...

  • 发布于 2021-04-16 01:58
  • 阅读 ( 222 )

本田展示uni cub:个人机动性与“uniracers”

...任何组合。日本国家新兴科学与创新博物馆的一名代表在短短10分钟的演示中带着这只Uni-Cub走过了它的步伐,通过在观众圈内反复向后循环,展示了该设备的紧凑转弯半径。这些动作看起来很难完成,但我们被告知,这真的很容...

  • 发布于 2021-04-22 19:16
  • 阅读 ( 87 )

通过苹果搜索结果泄露了带有lte、新款iPodtouch和iPodnano的iPhone5

...任何关于这些设备具体将发生什么变化的细节。我们将在短短的几个小时内确定发生了什么变化-请关注我们的现场博客,了解所有新闻。 最新消息:苹果的搜索结果也暗示了即将发布的iTunes11。 更新2:泄密不断-搜索结果显示LT...

  • 发布于 2021-04-24 02:47
  • 阅读 ( 127 )

莫斯伯格:谷歌的第一款手机是一流的

...被打造成纯谷歌安卓系统的最佳物理实例。
 我在去年和上周写过一篇文章,谈到为什么谷歌像苹果一样成为一家垂直整合的硬件**商是有意义的。我相信这是正确的举措。我相信这将动摇这个行业。但问题是:谷歌...

  • 发布于 2021-05-08 05:42
  • 阅读 ( 230 )

苹果公司同意为青少年最喜爱的假唱应用程序music.ly提供歌曲

...e所指出的,music.ly可能已经不再像以前那样受欢迎了:近几个月来,这个应用程序在iTunes上下滑了。毕竟,那些青少年可能变化无常。 更正美国东部时间4月28日上午7:30:澄清music.ly仍在与7digital合作,为该服务提供歌曲。这家英...

  • 发布于 2021-05-10 23:57
  • 阅读 ( 107 )

如何在灾难中生存,危机记者朱迪思马特洛夫

...道如何止血,这是一个非常非常简单的事情,学会如何在短短的几个小时内做到,你可以拯救生命,即使是在街上发生车祸…我只是强烈地感觉到,我们都需要提**虑最坏的情况,然后想想你将如何减轻或应付它,甚至防止它。...

  • 发布于 2021-05-12 13:06
  • 阅读 ( 168 )

把你的家分成几个部分,保持干净

...片混乱之中——直到我开始分区打扫。这个部门的想法是我在一个朋友从外地来和我住在一起的几个星期前想到的。我知道我需要把我的房间整理好,但我的工作日程加上我房间里的灰尘,这看起来像是一个不可能的任务,所以...

  • 发布于 2021-05-15 21:30
  • 阅读 ( 148 )

走进来,让您的全球入门预约提前几个月到来

...点点。例如,今年早些时候,当我从意大利回来的时候,我在旧金山通关整整一个半小时,我的男朋友因为全球入境而被关了。我和旧金山航空公司的机组人员一样排着队,排着零队等待,大约在我们降落20分钟后,我在安全区...

  • 发布于 2021-05-15 23:01
  • 阅读 ( 81 )

我如何使用3d打印设计我未来的公寓

...楚如何安排一切。通过对公寓和家具进行建模和3D打印,我在搬家前确定了布局以及要买什么家具。于是,我后来称之为“小镇”的名字诞生了。空间建模第一步是测量公寓里的一切——每个房间的尺寸,以及门、窗和暖气片的...

  • 发布于 2021-05-16 10:40
  • 阅读 ( 169 )

如何在旅途中完成工作

...并在你不在的时候优先考虑任何到期的事情。即使我知道我在旅途中有时间工作,我也会尽量提前完成我的最后期限,以防突然发生什么事。前置加载是我自己的解决方案,但并不完美。首先,你很容易把你的前负荷过大。我不...

  • 发布于 2021-05-16 19:48
  • 阅读 ( 94 )
过路打酱油
过路打酱油

0 篇文章

相关推荐