salesforce创建了一个算法，该算法使用机器学习自动总结文本

今年，人们预计会花大半天时间阅读电子邮件、文章或社交媒体上的帖子，而且情况只会变得更糟。为了帮助解决这个问题，Salesforce的研究人员开发了一种算法，根据MIT技术评论，该算法使用机器学习产生“令人惊讶的连贯和准确”的摘要。...

今年，人们预计会花大半天时间阅读电子邮件、文章或社交媒体上的帖子，而且情况只会变得更糟。为了帮助解决这个问题，Salesforce的研究人员开发了一种算法，根据MIT技术评论，该算法使用机器学习产生“令人惊讶的连贯和准确”的摘要。

自动摘要对于Salesforce来说将是一项特别有用的技术，Salesforce生产各种以****为中心的产品。该公司指出，由此产生的总结可以被销售或****代表用来快速消化电子邮件和信息，这将使他们能够花更多的时间专注于他们的客户。

为此，Salesforce正转向机器学习，以找到总结较长文本块的方法，并最终将其融入产品中。该公司宣布，它在自然语言处理方面取得了两项突破，引入了一种新的“上下文词生成模型”和一种“训练摘要模型的新方法”。这两项进步使研究人员能够自动生成准确可读的较长文本摘要。该公司去年收购了一家深度学习公司MetaMind，该公司是这项研究的幕后推手。

研究人员解释说，自动文本摘要有两种工作方式：提取或抽象。通过提取，计算机可以从文本中已有的措辞中提取，但这不是很灵活。抽象允许计算机引入新词，但系统必须充分理解原文，才能引入正确的词。

这就是深度学习神经网络发挥作用的地方。他们处理大量的句子和单词的例子，吐出每个短语的新表示法，这使得系统能够解释文本并引入自己的单词。研究人员让他们的模型回过头来看看文本，寻找额外的上下文。它还回顾了前面生成的示例，以确保它不会重复自身。

另一个突破是研究人员如何训练系统学习和自我完善。他们使用了两种方法：教师强迫和强化学习。强化学习是一种从动物如何学习中获得灵感的方法，它被用来教谷歌的深层次思维如何玩电子游戏。在这个例子中，模型被允许生成一个单词序列，然后用一个称为ROUGE（注册评估的面向回忆的替补）的自动评估度量对结果进行评分。该算法用更高的分数进行自我更新，从而在将来的总结中获得更好的结果。教师强迫是指根据既定的参考资料逐字打分，这样可以提供“非常不错的结果”，但不允许有太多的灵活性。

研究人员发现“胭脂优化的RL有助于提高回忆能力……单词级的学习监督确保了良好的语言流动性，使摘要更加连贯和可读。”针对这一系统，他们发现他们的联合模型得分高于其他方法，Salesforce的首席科学家Richard Socher，他注意到，他认为自己从未见过“任何（自然语言处理）任务有如此大的改进”

结果是相当惊人的：研究人员提供了几个例子，显示了原始文章，人类生成的摘要，以及由他们自己的模型生成的摘要，在每种情况下，摘要都比原始文本短得多，但包含了可读形式的要点。尽管取得了进展，但在这一领域仍有大量工作要做：麻省理工学院技术评论与西北大学教授克里斯蒂安·哈蒙德（Kristian Hammond）交谈时指出，这一进展“显示了单纯依赖统计机器学习的局限性”，但这是朝着正确方向迈出的一步。

发表于 2021-05-11 04:40
阅读 ( 90 )
分类：互联网

你可能感兴趣的文章

认知计算(cognitive computing)和机器学习(machine learning)的区别

...被称为监督学习和无监督学习。在监督学习中，我们训练一个模型，这样它就可以相应地预测未来的实例。标记的数据集有助于训练此模型。带标签的数据集由输入和相应的输出组成。在此基础上，系统可以预测新输入的输出。...

发布于 2020-10-18 10:57
阅读 ( 636 )

被监督的(supervised)和无监督机器学习(unsupervised machine learning)的区别

...类和回归算法。分类是对标记数据进行分类的过程。模型创建了分隔数据类别的边界。当向模型提供新数据时，它可以根据点所在的位置进行分类。K-最近邻（KNN）是一种分类模型。根据k值，决定类别。例如，当k为5时，如果某...

发布于 2020-10-19 03:49
阅读 ( 738 )

机器学习(machine learning)和人工智能(artificial intelligence)的区别

关键区别——机器学习与人工智能人工智能是一个宽泛的概念。自动驾驶汽车、智能家居就是人工智能的一些例子。一些国家在医药、**业、军事、农业和家庭等领域拥有智能机器人。机器学习是一种人工智能。机器学习和...

发布于 2020-10-19 20:24
阅读 ( 440 )

机器人如何学习阅读和思考

...收件箱和分类为高优先级的一些邮件。阅读人工智能对于创建有效的****聊天机器人至关重要。任何有文本的地方，都有研究自然语言处理的研究员。 ...

发布于 2021-03-16 12:24
阅读 ( 205 )

什么是机器学习算法？他们是这样工作的

...itter机器人最初是为了自动化品牌的****回复之类的事情而创建的。但这项技术现在是一个令人担忧的主要原因。事实上，研究估计，Twitter上多达4800万用户实际上是人工智能机器人。 ...

发布于 2021-03-23 07:51
阅读 ( 198 )

深入研究replika：我的人工智能朋友

... Replika最早的版本是由Eugenia Kuyda创建的一个简单的人工智能聊天机器人，用来取代她最亲密的朋友Roman Mazurenko的不幸去世所留下的空虚。通过将罗曼的短信输入一个神经网络来构建一个像他一样发短信的...

发布于 2021-03-28 12:58
阅读 ( 412 )

openai的文本生成系统gpt-3现在每天输出45亿字

...情绪和情绪”；Fable Studio正在使用该程序为虚拟现实体验创建对话；Algolia正在使用该程序改进其网络搜索产品，反过来，卖给其他顾客。所有这些对OpenAI（以及微软，它的Azure云计算平台支持OpenAI的技术）来说都是好消息，但...

发布于 2021-04-16 06:01
阅读 ( 260 )

一个机器学习工具能（也不能）告诉我们什么是人工智能偏见

...下，做这项工作的算法是StyleGAN，它是由NVIDIA的研究人员创建的。虽然您以前可能没有听说过StyleGAN，但您可能对它的工作很熟悉。它的算法负责**那些你可以在像Th这样的网站上看到的怪异逼真的人脸isPersonDoesNotExist.com；人脸非...

发布于 2021-04-19 04:02
阅读 ( 177 )

谷歌的算法向男性比女性更高的收入职位做广告

...和国际计算机科学研究所（ICSI）的研究人员表示，谷歌创建的广告定位算法可能会造成对互联网用户的歧视。一项使用名为AdFisher的定制软件模拟网络用户浏览活动的研究发现，在访问求职网站时，假**用户比假**用户更经常看...

发布于 2021-04-30 16:42
阅读 ( 213 )

人工智能在学习人类书写的东西时会发现种族和性别偏见

...所做的工作，利普顿说。在今天的研究中，Caliskan的团队创建了一个类似于内隐联想测试的测试，这在心理学中常用来衡量人们的偏见程度（尽管对它的准确性有一些争议）。在IAT中，受试者被呈现两个图像，比如说，一个白人...

发布于 2021-05-10 17:27
阅读 ( 245 )

salesforce创建了一个算法，该算法使用机器学习自动总结文本

你可能感兴趣的文章

相关推荐