来自机器学习实验室OpenAI的研究人员发现,他们最先进的计算机视觉系统可以被比钢笔和笔记本更复杂的工具所欺骗。如上图所示,简单地写下一个对象的名称并粘贴在另一个对象上就足以诱使软件误认它看到的内容。
“我们将这些攻击称为排版攻击,”OpenAI的研究人员在博客中写道。他们指出,这种攻击类似于欺骗商业机器视觉系统的“敌对图像”,但**起来要简单得多。
对抗性图像对于依赖机器视觉的系统来说是一个真正的危险。例如,研究人员已经证明,只要在路上贴上某些标签,他们就可以欺骗特斯拉自动驾驶汽车中的软件在没有警告的情况下改变车道。这种攻击对从医疗到军事的各种人工智能应用都是一种严重的威胁。
但至少在目前,这种特定攻击所带来的危险是不需要担心的。讨论中的OpenAI软件是一个名为CLIP的实验系统,没有部署在任何商业产品中。事实上,CLIP不寻常的机器学习体系结构的本质造成了这种攻击成功的弱点。
CLIP旨在探索人工智能系统如何在没有密切监督的情况下,通过对庞大的图像和文本对数据库进行训练,学会识别对象。在这个案例中,OpenAI使用了从互联网上刮下来的大约4亿个图像-文本对来**训练剪辑,这个剪辑于今年1月发布。
本月,OpenAI的研究人员发表了一篇新的论文,描述了他们是如何打开剪辑来查看它的性能的。他们发现了他们称之为“多模态神经元”的东西——机器学习网络中的单个组件,它们不仅对物体的图像做出反应,还对草图、卡通和相关文本做出反应。令人兴奋的原因之一是,它似乎反映了人脑对**的反应,人们观察到单个脑细胞对抽象概念而不是具体例子作出反应。OpenAI的研究表明,人工智能系统有可能像人类一样将这些知识内化。
在未来,这可能会导致更复杂的视觉系统,但目前,这种方法还处于起步阶段。尽管任何人都能告诉你苹果和一张写着“苹果”字样的纸之间的区别,但像CLIP这样的软件却不能。同样的能力,让程序在抽象的层次上链接文字和图像,造成了这种独特的弱点,OpenAI称之为“抽象谬误”
实验室给出的另一个例子是识别存钱罐的片段中的神经元。这个组件不仅响应小猪存钱罐的图片,还响应一串美元符号。在上面的例子中,这意味着如果你用“$$$”字符串覆盖一个链锯,你可以欺骗CLIP把它识别为一个存钱罐,就像它在你当地的硬件商店是半价一样。
研究人员还发现,CLIP的多模态神经元编码的正是你从互联网上获取数据时可能会发现的那种偏见。他们注意到“中东”的神经元也与恐怖主义有关,并发现了“一个为黑皮肤人和大猩猩都开火的神经元”。这复制了谷歌图像识别系统中一个臭名昭著的错误,该系统将黑人标记为大猩猩。这又是一个例子,说明了机器智能和人类智能有多么不同,为什么在我们把自己的生命托付给人工智能之前,必须先把机器智能分开来理解它的工作原理。
...第二天(CES 2018第1天报道),我们参观了索尼的展位。在最先进的电视屏幕、照相机、扬声器和耳机中,智能宠物狗爱宝是索尼展台上的亮点。不幸的是,它也是为数不多的项目尚未提供(日本以外)。 ...
CES2021的第一天已经过去了,第二天就有了大量的新设备,其中之一就是Razer的游戏笔记本电脑产品。 ...
...人物聊天。 最著名的人工智能文本生成器是OpenAI的GPT-3,该公司最近宣布,目前有“数万”名开发者在300多个不同的应用程序中使用GPT-3,每天产生45亿字。那是很多机器人的废话。这可能是OpenAI庆祝的一个任意里程...
...幕是一项近年来有了巨大改进的任务,微软的算法无疑是最先进的。除了集成到Word、Outlook和PowerPoint中,图像字幕AI还将作为一个独立的模型通过微软的云和AI平台Azure提供。
...zure Face)、亚马逊(Amazon)和中国科技巨头Megvii的Face++等最先进的人脸识别服务的较量中取得了100%的成功。 帮助创建福克斯软件的芝加哥大学计算机科学教授Ben Zhao告诉《边缘报》:“我们正在做的是,本质上像特洛伊木马一...
以减轻人工智能潜在危害为目标的非营利性研究实验室OpenAI宣布了其首个商业产品:一个AI文本生成系统,该机构此前警告说,该系统过于危险,无法共享。 去年2月,实验室发布了文本生成器GPT-2,OpenAI在文本生成方...
今天,Elon Musk和Sam Altman的OpenAI非营利组织发布了第一批开源代码,旨在让AI程序更智能、更多样化、更少杀伤力。名为“OpenAI-Gym”的新代码由一系列旨在测试和改进各种机器学习系统的“环境”组成。这些环境中的大多数都是...
...人工智能研究部门宣布与埃隆•马斯克支持的非营利组织OpenAI建立合作关系。作为交易的一部分,OpenAI将获得微软最新的虚拟机技术,用于进行大规模人工智能培训和模拟演习,而微软将在其Azure云平台上进行前沿研究。OpenAI由M...
...键字匹配检索文档,这在今天已经发生了。当Maluuba推动最先进的机器读写技术时,这只是我们可以想象的数百种场景之一。”
...:“这是一个应用程序库,设计得既快又小,但仍然支持最先进的技术。”我们认为这些新功能将有助于推动下一代设备上的语音处理、视觉搜索、增强现实、,此外,谷歌还宣布,未来某个时候将推出一款能让**芯片更好地进...