人工智能经常因其延续社会偏见的倾向而受到批评,但它同样有能力与偏见作斗争。机器学习目前正被用来扫描科学研究和新闻报道,以识别维基百科上没有提到的杰出科学家。这些科学家中有许多是**,她们的遗漏在世界上最流行的百科全书中尤为明显,百科全书中82%的传记都是关于**的。
这项研究是由一家名为Primer的人工智能初创公司进行的,它展示了该公司在自然语言处理(NLP)方面的专业知识。这是一个具有挑战性但充满活力的人工智能子领域,其全部内容是理解和生成数字文本。维基百科经常被用作培训这类程序的来源,但Primer希望回馈给该网站。
Primer的科学总监约翰·博哈农在一篇博客文章中解释了该公司如何开发一种名为Quicksilver的工具(以科幻作家尼尔·斯蒂芬森的书中的“因为我们是书呆子”中的技术命名),以阅读约5亿份源文件,筛选出引用最多的数据,然后写一篇关于他们和他们的工作的基本草案。
例如,这里有一篇AI写的关于Teresa Woodruff的文章,这位科学家没有维基百科条目,但在2013年被《时代》杂志评为“最有影响力的人物”。她的工作包括为老鼠设计3D打印卵巢。
Teresa K Woodruff is a reproductive scientist at Northwestern University. [1] She specializes in gynaecology and obstetrics. [2] She is a member of the Women ’s Health Research Institute. [1] Woodruff is a reproductive scientist and director of the Women’s Health Research Institute at Northwestern University’s Feinberg School of Medicine in Chicago. [3] She coined the term “oncofertility” in 2006, and she’s been at the center of the movement ever since. [4] Five years later, she succeeded: on March 28, the team announced the birth of Evatar, a miniature scale female reproductive tract made of human and mouse tissues. [5] Widely recognized for her work, she holds 10 U.S. patents, and was named in 2013 to Time magazine’s “Most Influential Pers***” list. [6]
Primer说,这是一篇基本的文章,但它有说服力,来源明确,这是维基百科编辑撰写关于伍德拉夫的文章的完美起点。
到目前为止,这家初创公司已经确认了40000名“失踪”科学家,他们的覆盖范围与拥有维基百科文章的个人相似,并发表了100篇人工智能生成的摘要。它还参与了三个维基百科编辑活动,旨在提高**在科学领域的在线代表性(Editanth***是专家们互相教授创建和编辑维基百科文章的活动,通常是为了扩大其主题领域的覆盖面。)正如Bohannon所指出的,至少有一位被Primer的技术发现的人已经因此获得了一篇维基百科文章——加拿大机器人学家Joëlle Pineau。
伦敦帝国理工学院的物理学家杰西卡·韦德(Jessica Wade)撰写了Pineau的新作品,她向《连线》讲述了该系统的好处。”韦德说:“维基百科的偏见令人难以置信,**在科学界的代表性不足尤其糟糕。”使用Quicksilver,您不必四处寻找丢失的姓名,而且您可以很快获得大量来源丰富的信息。”
Primer说,它的技术建立在谷歌和其他研究人员过去的工作基础上,包括今年1月发表的一项研究,该研究还使用机器学习生成基本的维基百科文章。然而,该公司表示,其目标比这更实际。它不想把维基百科作为实验的试验平台,而是想为在线信息生态系统创建具有明显好处的工具。
为此,Quicksilver不只是发现被忽视的个人并生成条款草案。它还可以用来维护维基百科条目,并确定它们何时已经有一段时间没有更新了。该公司表示,数据科学家Aleksandr Kogan的维基百科条目就是一个很好的例子。Kogan在剑桥分析丑闻的核心开发了这个应用程序,他在今年3月创建了一个关于他的维基百科页面。Primer指出,对Kogan条目的编辑已于4月中旬停止(这意味着关于Kogan的更新,例如他也访问了Twitter数据的事实,尚未添加)。
当然,即使是这样的工具也可能受到偏见的影响。如果Primer Spot基于科学家在新闻报道中的表现而忽略了他们,那么它可能最终反映了科学媒体的兴趣。但Bohannon坚持认为,该公司的工具仍然可以作为人类主导过程的助手。
“最重要的公共信息来源的人工编辑可以通过机器学习得到支持,”他告诉《登记册》算法已经用于检测故意破坏行为和识别人口不足的物品。但这些机器可以做得更多。”
...6年亨利·贝克勒尔偶然发现,全世界都知道了它。此外,科学家居里夫人在1898年解释了这一概念,并因其工作获得了诺贝尔奖。我们把世界上发生的放射性称为天然放射性,而人类诱发的放射性称为人工放射性。 目录 1. 概述和...
... 一个类别列表(如未来社会、人工智能、机器人和机器等)使得浏览大量信息图变得很容易。记住,交通的未来将是你想象不到的,所以要做好准备,看看前方是什么。 ...
...更多关于存在的知识,我们还相信Linux(以及成千上万的科学家)不会创造出微型黑洞。 ...
...库,谷歌学者也是一个伟大的免费研究资源。你也可能会发现,为了理解或比较纯数据,沃尔夫拉马尔法是一个很好的选择,为您的初步研究。 ...
... 1812年晚些时候,英国科学家托马斯·杨提出了铝的概念。他认为它应该与钾、钠、镁、钙和锶相匹配。科学家们差不多在同一时间发现了它们。 ...
...文章,这是一个很好的开始。有一些应用程序和网站可以发现值得一读的维基百科文章。但更多的时候,你会在社交媒体上发现有人决定花一些时间寻找这样的文章,并在他们的feed上分享。这类人通常会在一段时间后感到无聊...
...击维基百科。谷歌举了玛丽·居里的例子——在搜索这位科学家时,知识图表会显示她的照片、出生和死亡日期,以及她的主要发现和教育的列表。它没有维基百科提供的深入信息,但是当你只是快速搜索一点信息的时候,它可...
...研究收集并分析了维基百科编辑过程中的信息。研究人员发现,编辑不是源源不断地进行,而是突发性的——一个人会进行编辑,然后其他人会根据第一个人的贡献进行讨论和修改。随着时间的推移,编辑战争往往会减缓某篇文...
Gamergate正在破坏维基百科。自今年8月以来,维基百科关于这一争议的文章一直存在分歧,其规模通常只限于不公正的战争和全球变暖。Gamergate的支持者已经“**”网站好几个月了,因为他们认为网站存在偏见,联合创始人吉米...
...短跑运动员到山羊鱼的一切。这些课程很有启发性,但我发现自己在一个小时后又回到了现实中,不知道我是如何进入最后一个项目的。Wikiverse可以帮助解决这个问题。该网站将维基百科的网页视为三维宇宙中的浮点数,将同一...