谷歌转向reddit获取口音,以帮助提高语音识别能力

从Siri到Alexa,语音接口正变得越来越普遍,但尽管它们最近取得了很大的进步,但它们常常与人类语言的一个最基本的特征:口音作斗争。这个问题如此普遍,以至于计算机科学家已经发现了“机器声音”的存在,这是一种标准化的说话方式,有口音的人希望被理解。研究人员甚至警告说,存在一种“语言鸿沟”,即排斥口音与机器训练口音不同的人。...

从Siri到Alexa,语音接口正变得越来越普遍,但尽管它们最近取得了很大的进步,但它们常常与人类语言的一个最基本的特征:口音作斗争。这个问题如此普遍,以至于计算机科学家已经发现了“机器声音”的存在,这是一种标准化的说话方式,有口音的人希望被理解。研究人员甚至警告说,存在一种“语言鸿沟”,即排斥口音与机器训练口音不同的人。

007Ys3FFgy1gq94ieuloej31ko11sh1i

与建立在大数据集上的技术通常一样,问题从输入开始。如果你只训练你的界面使用一个狭窄的声音选择,那么它将不知道如何回应口音落在它的参考框架之外。Yik Yak的机器智能主管、语音识别专家Marsal Gavalda说,学术界从80年代就开始研究这个问题。

语音识别缺乏多样性的根源在于几十年前收集的数据集

“历史上,语音识别系统主要是从大学里收集的数据中训练出来的,而且主要是从学生群体中训练出来的,”加瓦尔达告诉《边缘报》(声音的多样性)反映了30年前的学生人数。”

例如,90年代初的一个叫做呼叫之家的项目给学生们提供了免费长途电话的学分。他们的通话将被记录、转录和注释,然后作为数据集**给研究团队和计算机科学家。”这是最容易收集这些样本的地方,”加瓦尔达说。他补充说,研究人员还收集了来自新闻广播公司的音频——但同样,这意味着只选择最中性的口音。

不过,有一个简单的方法可以解决这个问题:收集更多的数据。像谷歌这样的公司正是这样做的,因为他们的语音接口越来越成为他们软件和硬件的一部分,而互联网使这个收集变得非常简单。正如Quartz最初发现的那样,这家搜索巨头一直在使用第三方公司Appen,从网站用户那里收集各种口音的音频样本。

在/r/beermoney招聘

Appen的承包商已经在一些次级网站上发布,包括那些专门从事**工作的网站(/r/slavelabour,/r/WorkOnline,/r/beermoney等)以及各个城市/r/爱丁堡是最初发现样品请求的地方,大概是为了消除对服务不足的苏格兰口音的理解。

“我目前正在招聘为谷歌收集语音数据,”一个典型的请求写道它要求您使用Android来完成任务。这项任务是录制语音提示,比如“Indy now”,“Google what's The time.”每句话大约需要3-5秒。“**是付费的。”£27美元(35美元)可以录制2000个短语,而17岁以下的年轻人可以录制500个短语并获得收入£20 ($26). 阿彭和谷歌都不愿证实他们参与了这个项目,但一位得力的消息人士告诉《边缘报》,这家搜索巨头定期收集语音数据,以改善其服务——只是通常不那么显眼。

我们与一些完成任务的Redditor进行了交谈,并询问了他们在语音界面技术方面的经验。他们有来自英国和美国的地区口音,也有印度口音和中国口音的英语,大多数用户说他们在使用Siri和Alexa等技术方面有困难。所有人都说,他们都经历了同样的过程,被引导到一个移动网页上,那里有一个录音按钮可以点击,还有一些短语可以读出。

这些语音样本大多是写给谷歌的(开始是“OK Google”、“嘿,Google”等),但有些只是询问热门电视节目、玩具和视频游戏的名称(包括一些YouTube频道,如Sky Does Minecraft)。其他人则跨越了一系列典型的谷歌搜索,包括寻找菜谱(“如何做生日蛋糕”)、理解成语(“嘿,谷歌,冷脚”)、击败酒吧小测验(“按顺序排列的总统”),以及寻找完美的卡拉OK号码(“你会在我心中只是音乐”)。

“我需要用简单的词组来表达我的意思。”

一位受访者通过电子邮件告诉《边缘报》:“(我)来自中国,但我在美国生活了大约10年,所以我说的英语几乎可以理解。对我口音最贴切的描述应该是美国东北部,带有一丝新加坡新闻播音员的味道。然而,我现在确实需要为Siri和Google这样的应用程序清楚地表达并使用简单的短语。我真的不能用**‘交谈’。”

Appen收集了音频样本后,公司内部的语言学家会对这些样本进行注释,按照语法对较长的句子进行分解,并添加上下文信息(样本是否记录在**上?在里面?户外?)。该公司首席执行官马克•布拉扬(Mark Brayan)不愿对谷歌与谷歌的合作发表评论,但他告诉《边缘报》(Verge),谷歌从全球收集并注释(这一过程被称为“装饰”)音频样本,员工能够翻译大约130种语言。

布拉扬说,近年来,对该公司服务的需求大幅增长,特别是随着语音接口变得越来越普遍,用户对其期望也越来越高。”Brayan说:“要从95%的单词理解率提高到99%,识别器必须消化不常使用的单词,其中有数百万个。”。

公司经常要求特定词汇的音频样本

有时,公司必须**特定词汇的样本,例如,与运动或爱好有关的词汇。”“其中一个巨大的挑战是我们称之为命名实体识别,”布拉扬说这是品牌名称、产品名称、个人名称等等。“公司可以要求特定的口音,也可以只说他们希望在哪里推出产品,Appen就会发出相关的声音。”例如,如果你要在加拿大上市,你不仅需要法语,还需要带法语口音的加拿大英语。”

加瓦尔达说:“使用不发音的英语口音将是语音界面的一大进步。”你可能会说,大多数说英语的人甚至都不是以英语为母语的人。直到1993年国会通过一项法案,才将妇女和少数民族排除在如此重要的研究之外成为非法行为。”“如果你仔细想想,你正在开发一种药物,”他说,“因此,有理由让它对所有不同类型的人都同样有效。”

能够问Siri或Alexa问题显然没有获得有效的药物那么重要,但这一切都是一样的。值得庆幸的是,正如谷歌在Reddit上搜索口音所显示的那样,补救起来相对容易。只需收集音频样本,让机器学习系统处理它们。毕竟,电脑并没有真正的“听到”口音——只有它能识别的声音和它不能识别的声音。它只需要数据。

更正:这个故事的前一个版本说“Appen雇员”已经发布到Reddit。这是第三方承包商阿彭聘请谁这样做。我们对这个错误感到遗憾。

  • 发表于 2021-05-06 23:27
  • 阅读 ( 153 )
  • 分类:互联网

你可能感兴趣的文章

今天试着用谷歌语音输入这5个实际原因

...果您还不熟悉它,请查看我们的入门指南使用语音输入在谷歌文档。你将学到一切你需要知道的开始听写像一个专业人士。一旦你觉得舒服了,这里有一些有趣的使用案例,为你的生活中的语音输入。 ...

  • 发布于 2021-03-12 05:41
  • 阅读 ( 218 )

谷歌医生的语音输入:提高生产力的秘密武器

...。要检查是否是,请单击“三点”菜单,然后选择“关于谷歌Chrome的帮助”&gt。。。如果你落后了,它会自动更新。 ...

  • 发布于 2021-03-12 13:10
  • 阅读 ( 350 )

谷歌助手与苹果siri:哪种智能ai最好?

...,她经常被指责不能理解我们所说的话。更重要的是,在谷歌助手和亚马逊Alexa到来之后,Siri在回答我们的问题时似乎没有那么聪明。 ...

  • 发布于 2021-03-12 17:22
  • 阅读 ( 255 )

bixby voice能做的5件事(还有一件事它做不到)

... 就连谷歌也在最新的助手更新中朝着更具上下文意识的方向发展。 ...

  • 发布于 2021-03-13 03:17
  • 阅读 ( 249 )

6种方法识别卡在你脑海中的曲调

... 2试试谷歌搜索 ...

  • 发布于 2021-03-19 09:26
  • 阅读 ( 264 )

9个简单的补丁,当谷歌助手不工作

当你向谷歌求助时,谷歌助理会拒绝吗?这可能不是因为助理对你不满意,而是因为你的设备有问题。谷歌助手不在Android**或平板电脑上工作有很多原因。 ...

  • 发布于 2021-03-30 14:14
  • 阅读 ( 500 )

6个免费的在线工具,下载文本到语音作为mp3音频

...然后单击阅读收听。如果您满意,请单击“下载为MP3”以获取录音。 ...

  • 发布于 2021-03-30 20:10
  • 阅读 ( 446 )

如何(以及为什么)选择使用谷歌录音存储

谷歌为你节省了大量的网络活动,这并不神秘。然而,当你和谷歌服务通话时,公司不再保存录音。不过,如果你想改善体验,可以选择录音。 2020年8月,谷歌默认停止存储录音。如果您曾经使用您的语音与Google助手、Google搜...

  • 发布于 2021-04-01 19:25
  • 阅读 ( 204 )

如何训练siri、cortana和google更好地理解您的声音

...练功能,因此您可以帮助Cortana更好地理解您的声音。像谷歌一样,Cortana会上传你的语音活动并储存起来,帮助Cortana随着时间的推移学习你的语音,更好地理解你——这就是“语音、墨迹和打字”隐私设置所控制的。你可以禁用...

  • 发布于 2021-04-10 04:55
  • 阅读 ( 188 )

bbc在beta版发布了自己的beeb语音助手

...户数据拥有更多的控制权,而不是将其全部让给亚马逊和谷歌等大型科技公司,后者的Alexa和googleassistant占据了语音助理市场的绝大部分。《卫报》指出,广播公司内部担心,随着收听和收看习惯的改变,它有可能被落在后面。...

  • 发布于 2021-04-19 00:54
  • 阅读 ( 265 )
bgz43439
bgz43439

0 篇文章

相关推荐