salesforce创建了一个算法,该算法使用机器学习自动总结文本

今年,人们预计会花大半天时间阅读电子邮件、文章或社交媒体上的帖子,而且情况只会变得更糟。为了帮助解决这个问题,Salesforce的研究人员开发了一种算法,根据MIT技术评论,该算法使用机器学习产生“令人惊讶的连贯和准确”的摘要。...

今年,人们预计会花大半天时间阅读电子邮件、文章或社交媒体上的帖子,而且情况只会变得更糟。为了帮助解决这个问题,Salesforce的研究人员开发了一种算法,根据MIT技术评论,该算法使用机器学习产生“令人惊讶的连贯和准确”的摘要。

自动摘要对于Salesforce来说将是一项特别有用的技术,Salesforce生产各种以****为中心的产品。该公司指出,由此产生的总结可以被销售或****代表用来快速消化电子邮件和信息,这将使他们能够花更多的时间专注于他们的客户。

为此,Salesforce正转向机器学习,以找到总结较长文本块的方法,并最终将其融入产品中。该公司宣布,它在自然语言处理方面取得了两项突破,引入了一种新的“上下文词生成模型”和一种“训练摘要模型的新方法”。这两项进步使研究人员能够自动生成准确可读的较长文本摘要。该公司去年收购了一家深度学习公司MetaMind,该公司是这项研究的幕后推手。

研究人员解释说,自动文本摘要有两种工作方式:提取或抽象。通过提取,计算机可以从文本中已有的措辞中提取,但这不是很灵活。抽象允许计算机引入新词,但系统必须充分理解原文,才能引入正确的词。

这就是深度学习神经网络发挥作用的地方。他们处理大量的句子和单词的例子,吐出每个短语的新表示法,这使得系统能够解释文本并引入自己的单词。研究人员让他们的模型回过头来看看文本,寻找额外的上下文。它还回顾了前面生成的示例,以确保它不会重复自身。

另一个突破是研究人员如何训练系统学习和自我完善。他们使用了两种方法:教师强迫和强化学习。强化学习是一种从动物如何学习中获得灵感的方法,它被用来教谷歌的深层次思维如何玩电子游戏。在这个例子中,模型被允许生成一个单词序列,然后用一个称为ROUGE(注册评估的面向回忆的替补)的自动评估度量对结果进行评分。该算法用更高的分数进行自我更新,从而在将来的总结中获得更好的结果。教师强迫是指根据既定的参考资料逐字打分,这样可以提供“非常不错的结果”,但不允许有太多的灵活性。

研究人员发现“胭脂优化的RL有助于提高回忆能力……单词级的学习监督确保了良好的语言流动性,使摘要更加连贯和可读。”针对这一系统,他们发现他们的联合模型得分高于其他方法,Salesforce的首席科学家Richard Socher,他注意到,他认为自己从未见过“任何(自然语言处理)任务有如此大的改进”

结果是相当惊人的:研究人员提供了几个例子,显示了原始文章,人类生成的摘要,以及由他们自己的模型生成的摘要,在每种情况下,摘要都比原始文本短得多,但包含了可读形式的要点。尽管取得了进展,但在这一领域仍有大量工作要做:麻省理工学院技术评论与西北大学教授克里斯蒂安·哈蒙德(Kristian Hammond)交谈时指出,这一进展“显示了单纯依赖统计机器学习的局限性”,但这是朝着正确方向迈出的一步。

  • 发表于 2021-05-11 04:40
  • 阅读 ( 90 )
  • 分类:互联网

你可能感兴趣的文章

认知计算(cognitive computing)和机器学习(machine learning)的区别

...被称为监督学习和无监督学习。在监督学习中,我们训练一个模型,这样它就可以相应地预测未来的实例。标记的数据集有助于训练此模型。带标签的数据集由输入和相应的输出组成。在此基础上,系统可以预测新输入的输出。...

  • 发布于 2020-10-18 10:57
  • 阅读 ( 636 )

被监督的(supervised)和无监督机器学习(unsupervised machine learning)的区别

...类和回归算法。分类是对标记数据进行分类的过程。模型创建了分隔数据类别的边界。当向模型提供新数据时,它可以根据点所在的位置进行分类。K-最近邻(KNN)是一种分类模型。根据k值,决定类别。例如,当k为5时,如果某...

  • 发布于 2020-10-19 03:49
  • 阅读 ( 738 )

机器学习(machine learning)和人工智能(artificial intelligence)的区别

关键区别——机器学习与人工智能 人工智能是一个宽泛的概念。自动驾驶汽车、智能家居就是人工智能的一些例子。一些国家在医药、**业、军事、农业和家庭等领域拥有智能机器人。机器学习是一种人工智能。机器学习和...

  • 发布于 2020-10-19 20:24
  • 阅读 ( 440 )

机器人如何学习阅读和思考

...收件箱和分类为高优先级的一些邮件。阅读人工智能对于创建有效的****聊天机器人至关重要。任何有文本的地方,都有研究自然语言处理的研究员。 ...

  • 发布于 2021-03-16 12:24
  • 阅读 ( 205 )

什么是机器学习算法?他们是这样工作的

...itter机器人最初是为了自动化品牌的****回复之类的事情而创建的。但这项技术现在是一个令人担忧的主要原因。事实上,研究估计,Twitter上多达4800万用户实际上是人工智能机器人。 ...

  • 发布于 2021-03-23 07:51
  • 阅读 ( 198 )

深入研究replika:我的人工智能朋友

... Replika最早的版本是由Eugenia Kuyda创建的一个简单的人工智能聊天机器人,用来取代她最亲密的朋友Roman Mazurenko的不幸去世所留下的空虚。通过将罗曼的短信输入一个神经网络来构建一个像他一样发短信的...

  • 发布于 2021-03-28 12:58
  • 阅读 ( 412 )

openai的文本生成系统gpt-3现在每天输出45亿字

...情绪和情绪”;Fable Studio正在使用该程序为虚拟现实体验创建对话;Algolia正在使用该程序改进其网络搜索产品,反过来,卖给其他顾客。 所有这些对OpenAI(以及微软,它的Azure云计算平台支持OpenAI的技术)来说都是好消息,但...

  • 发布于 2021-04-16 06:01
  • 阅读 ( 260 )

一个机器学习工具能(也不能)告诉我们什么是人工智能偏见

...下,做这项工作的算法是StyleGAN,它是由NVIDIA的研究人员创建的。虽然您以前可能没有听说过StyleGAN,但您可能对它的工作很熟悉。它的算法负责**那些你可以在像Th这样的网站上看到的怪异逼真的人脸isPersonDoesNotExist.com;人脸非...

  • 发布于 2021-04-19 04:02
  • 阅读 ( 177 )

谷歌的算法向男性比女性更高的收入职位做广告

...和国际计算机科学研究所(ICSI)的研究人员表示,谷歌创建的广告定位算法可能会造成对互联网用户的歧视。一项使用名为AdFisher的定制软件模拟网络用户浏览活动的研究发现,在访问求职网站时,假**用户比假**用户更经常看...

  • 发布于 2021-04-30 16:42
  • 阅读 ( 213 )

人工智能在学习人类书写的东西时会发现种族和性别偏见

...所做的工作,利普顿说。 在今天的研究中,Caliskan的团队创建了一个类似于内隐联想测试的测试,这在心理学中常用来衡量人们的偏见程度(尽管对它的准确性有一些争议)。在IAT中,受试者被呈现两个图像,比如说,一个白人...

  • 发布于 2021-05-10 17:27
  • 阅读 ( 245 )
ksaavo610677
ksaavo610677

0 篇文章

相关推荐