facebook是如何利用人工智能来打击covid-19错误信息和发现“可恨的模因”的

Facebook周一发布了一份新的报告，详细说明了它如何结合人工智能和人类事实核查员和版主来执行其社区标准。这份名为《社区标准执行报告》（Community Standards Enforcement report）的报告通常包含了前三到六个月的数据和调查结果，这次主要关注人工智能，而Facebook的进展更多地依赖于软件，而不是人，因为这项工作可能会给人类版主带来极大的损失。...

在COVID-19流感大流行期间，Facebook目前也更多地依赖于这项技术来帮助调节其平台，这使得Facebook无法使用通常的第三方调节公司，因为这些公司的员工不允许从家用电脑访问Facebook的敏感数据。Verge周二报道称，Facebook已经与现任和前任版主达成了一项价值5200万美元的集体诉讼，以补偿他们在工作期间产生的心理健康问题，特别是创伤后应激障碍。《边缘报》广泛报道了Facebook聘用来调节其平台的公司的工作条件。

Facebook表示，它在最新报告中汇编的数据并不包含任何更大的执行趋势，也不包含在其平台上的违规行为，因为该流行病在报告期内来得太晚。该公司负责诚信的副总裁盖伊·罗森（Guy Rosen）在博客中写道：“这份报告只包括到2020年3月的数据，因此它没有反映出我们在流感大流行期间所做改变的全部影响。”。“我们预计，我们将在下一份报告中看到这些变化的影响，甚至可能在以后的报告中看到，我们将对这些变化保持透明。”

考虑到世界现状，Facebook的报告确实包含了新的信息，说明该公司是如何利用其人工智能工具，专门打击冠状病毒相关的错误信息和其他形式的平台滥用，比如Facebook Marketplace上的哄抬价格。

该公司在一组研究科学家和软件工程师撰写的另一篇博客文章中称：“在4月份，我们在Facebook上发布了约5000万条与COVID-19相关的帖子，这些帖子是基于我们独立的事实调查合作伙伴发表的约7500篇文章。”今天出版。“自3月1日以来，我们已经删除了250多万份用于销售口罩、洗手液、表面消毒湿巾和COVID-19测试包的内容。但这些都是困难的挑战，我们的工具还远远不够完善。此外，这些挑战的对抗性意味着这项工作永远不会完成。”

Facebook表示，它的标签正在发挥作用：95%的时候，有人被警告某个内容含有错误信息，他会决定无论如何都不看。但事实证明，在其庞大的平台上生产这些标签是一项挑战。首先，Facebook发现，大量的错误信息和仇恨言论现在出现在图像和视频中，而不仅仅是文本或文章链接。

“我们发现，在全球范围内，Facebook上的仇恨言论有相当一部分出现在照片或视频中，”该公司在另一篇针对仇恨言论的博客文章中表示，该博客是关于其最近的适度调查结果和研究的。“与其他内容一样，仇恨言论也可以是多模态的：例如，模因可以使用文本和图像来攻击特定的人群。”

该公司承认，这对人工智能来说是一个更严峻的挑战。由于文字游戏和语言差异等复杂因素，人工智能培训的模型在解析模因图像或视频时不仅比较困难，而且还必须对软件进行培训，以便在该内容在Facebook上传播时找到重复的或只是稍加修改的版本。但这正是Facebook所说的，它通过所谓的SimSearchNet实现了这一目标。SimSearchNet是一项跨公司内多个部门的多年努力，旨在训练人工智能模型如何识别原始图像的副本和那些几乎重复的副本，以及文本行中可能有一个单词发生了变化。

“一旦独立的事实核查人员确定图像中含有关于冠状病毒的误导性或虚假声明，SimSearchNet作为我们端到端图像索引和匹配系统的一部分，能够识别几乎重复的匹配，以便我们可以应用警告标签，” 该公司表示。“这个系统在上传到Instagram和Facebook的每一张图片上运行，并检查特定任务的人类管理数据库。这就造成了每天数十亿张图像被检查，包括针对检测COVID-19错误信息的数据库。”

Facebook使用了一个误导性图像的例子，该图像模仿了一个广播新闻图片，上面有一行覆盖的文字，“COVID-19在厕纸中被发现”。该图像来自一个名为Now8News的已知虚假新闻贩子，该图片后来被Snopes和其他事实核查组织揭穿。但Facebook表示，它必须训练自己的人工智能来区分原始图像和修改后的图像，即“COVID-19在厕纸中找不到”

这样做的目的是帮助减少重复图像的传播，同时也不会无意中标记真实的帖子或那些不符合错误信息标准的帖子。这在Facebook上是一个大问题，许多出于政治动机的页面和组织，或者那些仅仅依靠党派愤怒来获取信息的人，都会拍下照片、截图和其他图片，并改变它们的含义。一个人工智能模型知道其中的区别，并且可以将一个标记为错误信息，另一个标记为真实信息，这是一个有意义的进步，特别是当它可以在未来对任何重复或接近重复的内容做同样的事，而不必在过程中套牢非冒犯性的图像。

该公司表示：“这些相似性系统要尽可能准确，这一点非常重要，因为一个错误可能意味着对实际上没有违反我们政策的内容采取行动。”。“这一点特别重要，因为事实核查人员发现的每一条错误信息，可能有数千或数百万份副本。使用人工智能检测这些匹配还可以让我们的事实核查合作伙伴专注于捕捉新的错误信息实例，而不是他们已经看到的内容几乎相同的变化。”

Facebook还使用了许多与冠状病毒相关内容相同的技术，改进了仇恨言论的节制。该公司表示：“人工智能现在主动检测我们删除的仇恨言论内容的88.8%，高于上一季度的80.2%。”。“2020年第一季度，我们对960万条违反仇恨言论政策的内容采取了行动——增加了390万条。”

Facebook能够更多地依赖人工智能，这要归功于它的模型在理解和解析文本方面的一些进步，无论是出现在帖子和附带的链接中，还是覆盖在图像或视频中。

“分享仇恨言论的人经常试图通过修改内容来逃避检测。这种敌对行为的范围从故意拼错单词或避免某些短语到修改图像和视频，”该公司说。“当我们改进我们的系统以应对这些挑战时，把它做好是至关重要的。错误地将内容归类为仇恨言论可能意味着阻止人们表达自己和与他人交往。”Facebook说，所谓的反言，或对仇恨言论的回应，尽管如此，但通常包含冒犯性内容的片段，是“特别具有挑战性的分类正确，因为它看起来很像仇恨演说本身。”

Facebook的最新报告包含了来自Instagram的更多数据，包括该平台删除了多少欺凌内容，以及有多少内容被上诉和恢复。它将图像匹配技术应用于寻找**和自伤的帖子，提高了Instagram内容在用户报告之前被删除的百分比。

2019年最后一个季度，Facebook删除了500万条内容，**和自伤执法力度也有所扩大— 是前几个月的两倍。一位发言人说，这一激增源于Facebook在10月和11月检测并删除了大量非常旧的内容，而到了2020年，随着Facebook将重点转向更新的内容，这一数字急剧下降。

Facebook称其新进展— 特别是去年11月宣布的一种称为XLM-R的神经网络— 正在帮助其自动调节系统更好地理解跨多种语言的文本。Facebook说XLM-R允许这样做“为了有效地训练更多数量级的数据和更长的时间，” 并将这种学习跨多种语言进行。

但Facebook表示，事实证明，模因是一种弹性很强、难以检测的仇恨言论传递机制，即使有了改进的工具。所以它建立了一个专门的“可恨的模因” 包含10000个示例的数据集，只有同时处理图像和文本并理解两者之间的关系，才能完全理解图像的含义。

一个例子是一个贫瘠的沙漠图像，上面覆盖着“看有多少人爱你”。Facebook称用自动化系统检测这一点的过程是多模式理解的，用这种复杂程度训练人工智能模型是其更前沿的适度研究的一部分。

“为了给研究人员提供一个有明确许可条款的数据集，我们对盖蒂图片公司的资产进行了许可。我们与训练有素的第三方注解者合作，创造出新的模因，类似于在社交媒体网站上分享的现有模因。“注释者使用盖蒂图片公司收集的股票图片来替换原始的视觉效果，同时仍然保留了语义内容。”

Facebook表示，它正在向研究人员提供数据集，以改进在线检测此类仇恨言论的技术。它还发起了一项挑战，为研究人员提供10万美元的奖金，让他们创建在数据集上训练的模型，能够成功解析这些更微妙的语言形式，而Facebook现在看到的是，它的系统正更主动地删除更明目张胆的仇恨内容。

美国东部时间5月12日下午3:55更新：增加了关于Facebook与第三方合同版主达成的5200万美元和解的信息。

发表于 2021-04-19 07:34
阅读 ( 191 )
分类：互联网

你可能感兴趣的文章

facebook现在正在使用人工智能来帮助防止自杀

Facebook正在加紧努力帮助有**念头的人。而社交网络正利用人工智能识别风险人群。虽然这确实涉及到一些隐私问题，但它每年都有助于挽救无数人的生命。这肯定是件好事。 ...

发布于 2021-03-12 07:20
阅读 ( 258 )

instagram推出新工具打击欺凌

...还推出了Instagram的家长指南，旨在帮助家长和孩子们理解如何劝阻不良行为。 ...

发布于 2021-03-20 05:36
阅读 ( 186 )

人工智能将如何对抗现代黑客和网络犯罪

...行为发生时，经济损失是惊人的。以下是人工智能（AI）如何被用来对付网络犯罪。 ...

发布于 2021-03-22 21:40
阅读 ( 178 )

这4个防病毒工具使用人工智能来保护你的系统

...解什么是人工智能杀毒软件，你需要了解传统杀毒软件是如何工作的。 ...

发布于 2021-03-24 02:54
阅读 ( 373 )

微软必应不久将使用人工智能来纠正你的打字错误

... 微软的目标是通过使用人工智能拼写器100来再次检查你的搜索词来解决这个问题。如果你在Google上搜索时输入了错误的内容，你会注意到搜索引擎给你的一点建议，以确保你在寻找正确的内容...

发布于 2021-03-26 17:34
阅读 ( 185 )

微软的待办事项应用程序现在使用人工智能来预测你的日程安排

... 这些建议是基于你如何使用应用程序和你过去的活动。例如，如果某项任务看起来很紧急，微软会督促你尽早完成。同样地，它将向您显示具有迫在眉睫的最后期限的任务，这样您就不会错...

发布于 2021-03-28 21:11
阅读 ( 181 )

twitter将为covid-19疫苗错误信息贴上标签，并实施打击系统

...账户被锁定和永久停职。这些新标签类似于Facebook的反错误信息横幅或Twitter在流感大流行初期就开始使用的标签。它们以文本的形式出现在误导性的推特下面，带有来自官方来源或推特规则的信息链接。Twitter计划最...

发布于 2021-04-15 23:30
阅读 ( 158 )

facebook现在将删除声称疫苗导致自闭症的帖子

Facebook正在扩大它将从今天开始从其平台上删除的与COVID-19、COVID-19疫苗和一般疫苗相关的虚假声明。该公司在去年12月开始删除被揭穿的COVID-19声明，并在客户当月与一个含有虚假信息的帖子互动时通知他们。但现在，有可能被...

发布于 2021-04-16 08:45
阅读 ( 179 )

去facebook上读一下这个关于covid-19疫苗战斗的故事吧

...个仍然阻碍进展的威胁——根本不愿意接种疫苗——以及Facebook上阻止疫苗的创造性努力，你应该去看看这份第53份报告。 Facebook已经采取措施打击与流感大流行相关的错误信息，消除了有关COVID-19疫苗的虚假说法，并...

发布于 2021-04-16 20:13
阅读 ( 150 )

facebook将消除covid-19疫苗的错误信息

在更新他们的COVID-19错误信息政策时，Facebook将开始删除关于COVID-19疫苗的虚假声明。最新消息发布之际，一种COVID-19疫苗已在英国获得授权，预计美国和世界各地也将很快获得其他授权。但一些专家表示，这些政策来得太晚，无...

发布于 2021-04-17 00:11
阅读 ( 160 )

facebook是如何利用人工智能来打击covid-19错误信息和发现“可恨的模因”的

你可能感兴趣的文章

相关推荐