新的人工智能研究更容易制造出一个人讲话的假镜头

人工智能有时被忽视的一个方面就是它在制造难以与现实区分的假音频和视频方面有多么出色。Photoshop的出现让我们怀疑自己的眼睛,但是当我们不能依赖其他感官时会发生什么呢?...

人工智能有时被忽视的一个方面就是它在**难以与现实区分的假音频和视频方面有多么出色。Photoshop的出现让我们怀疑自己的眼睛,但是当我们不能依赖其他感官时会发生什么呢?

人工智能视听魔术的最新例子来自华盛顿大学,研究人员发明了一种新的工具,将音频文件转换成真实的嘴巴动作,然后将这些动作嫁接到现有的视频上。最终的结果是有人说了一些他们不知道的话(不管怎么说,现在还没有。)仅仅通过阅读了解它是一个令人困惑的过程,所以请看下面的视频:

你可以看到巴拉克奥巴马的两个并排剪辑。左边的一个是音频源,右边的一个来自完全不同的语音,研究人员用算法将新的口型移植到视频中。最终的视频并不完美(奥巴马的嘴部动作有点模糊——这是人工智能生成图像的一个常见问题),但总的来说,它相当有说服力。

研究人员说,他们把奥巴马作为这项工作的测试对象,因为前总统的高质量视频片段非常丰富,这使得训练神经网络更加容易。研究人员Ira Kemelmacher告诉Verge over email,需要17个小时的录像作为数据来跟踪和复制他的口腔运动,但在未来,这种训练限制可能会减少到一个小时。

支持这项工作的团队说,他们希望它能被用来改进Skype等视频聊天工具。用户可以收集自己讲话的录像,用来训练软件,然后当他们需要和某人交谈时,他们这边的视频将只使用他们的声音自动生成。这将有助于在某些情况下,某人的互联网连接是不稳定的,或者如果他们试图保存移动数据。

当然,还有人担心,像这样的工具可能会被用来产生误导性的视频片段,这种东西会给“假新闻”这个词带来一些真正的分量。把这样的工具和技术结合起来,只需几分钟的音频样本就能重现任何人的声音,这样的想法是可以原谅的未来是可怕的时期。类似的研究已经能够实时改变某人的面部表情;从几张照片中创建面部的三维模型;还有更多。

可以理解,华盛顿大学的研究小组热衷于远离这些用途,并明确表示,他们只在奥巴马的声音和视频上训练神经网络史蒂夫·塞茨教授在新闻发布会上说:“你不能把任何人的声音变成奥巴马的视频。”我们非常有意识地决定不走把别人的话放进别人嘴里的路。”)但理论上,这项技术可以用来将任何人的声音映射到任何人的脸上,如果这项技术普及开来,每个人都会如此谨慎吗?

您可以在下面查看神经网络运行的更详细视频:

  • 发表于 2021-05-29 01:33
  • 阅读 ( 49 )
  • 分类:互联网

你可能感兴趣的文章

dxomark分数对你的手机摄像头意味着什么?

... 兜售新的最高总分试图获得点击,实际上没有仔细看DxO审查,是误导。 ...

  • 发布于 2021-03-12 09:33
  • 阅读 ( 337 )

5谷歌像素相机软件功能你应该使用

... 在Pixel3上,谷歌推出了一个新的,聪明的摄像头功能,叫做TopShot。顾名思义,它可以让你选择一个比你点击的更好的镜头。 ...

  • 发布于 2021-03-21 10:41
  • 阅读 ( 219 )

假货的6大危害及识别方法

...是“深度学习”和“假”的组合,它使用机器学习算法和人工智能来创建真实而又合成的媒体。 ...

  • 发布于 2021-03-29 23:23
  • 阅读 ( 305 )

如何发现“深假”换脸视频

...pfake,任何有电脑的人都可以快速自动地完成。 在进一步研究之前,你需要知道深假的样子。看看下面的SFW视频,它是一个不同的名人脸交换的汇编,主要涉及Nic-Cage。 深度假冒软件使用机器学习。它首先是用目标脸训练的。...

  • 发布于 2021-04-06 19:35
  • 阅读 ( 152 )

microsoft powerpoint现在几乎可以在任何地方帮助您练习演示文稿—无需人工

...你需要练习什么。 随着可用性的扩大,该功能还有一些新的方法可以尝试让你的演示变得更好:它可以观察身体语言(你离镜头有多近,如果你在进行眼神交流或把东西放在面前),如果你在重复单词或说错话,它会警告你。...

  • 发布于 2021-04-16 03:43
  • 阅读 ( 207 )

电报上的假机器人使得制造假裸体的工作变得非常容易

...,自动处理支付,为其创造者创造收入。 DeepNude使用一种人工智能技术,即生成性对抗网络(generative敌对网络,简称GANs)生成假**,生成的图像质量参差不齐。大多数照片明显是假的,带有污渍或像素化的肉,但有些很容易被...

  • 发布于 2021-04-17 15:09
  • 阅读 ( 374 )

这是一个失败的欺诈企图中使用的假语音克隆听起来像什么

deepfakes的一个奇怪的应用——人工智能技术用于操纵视听内容——是audio deepfake骗局。黑客利用机器学习来克隆某人的语音,然后将语音克隆与社会工程技术结合起来,说服人们把钱转移到不该转移的地方。这种骗局在过去很成...

  • 发布于 2021-04-18 16:09
  • 阅读 ( 181 )

一位印度政治家利用人工智能将他的演讲翻译成其他语言,以吸引更多的选民

...击美国大选中的深度造假和错误信息,一名印度政客利用人工智能技术,让人觉得他说了他没说的话。在竞选视频的一个版本中,马诺吉·蒂瓦里用英语讲话;在捏造的版本中,他用印地语的一种方言Haryanvi“讲话”。 ...

  • 发布于 2021-04-20 05:33
  • 阅读 ( 229 )

研究人员制造了一种“speechjammer”枪,它能在几毫秒内将单词传回给说话者

日本研究人员利用相当简陋的工具,发明了一种无需物理干预就能有效切断人类语言的装置。“SpeechJammer”,就像它的名字一样,看起来更像是一个警官用来测量你的速度的东西,而不是它的实际用途。
 到底是怎...

  • 发布于 2021-04-21 13:00
  • 阅读 ( 97 )

科学家们开发出一种新材料,用钠制造更便宜的可充电电池

...为了让它工作,东京科学大学的研究小组不得不开发一种新的电极。为了**出能释放与锂电池同等多能量的钠电池,需要一种由全新材料制成的电极——这种电极是将三种氧化物塞进一个小球中,在高温下加热半天制成的。这个...

  • 发布于 2021-04-22 05:32
  • 阅读 ( 189 )
你怎么还要啊
你怎么还要啊

0 篇文章

相关推荐