mozilla正在众包语音识别,让人工智能为人们服务

数据对于构建伟大的人工智能至关重要,以至于该领域的研究人员将其与工业革命时期的煤炭进行了比较。那些拥有它的人会向前冲。不这样做的人会被扔在尘土里。在当前的人工智能热潮中,谁拥有它是显而易见的:像谷歌、Facebook和百度这样的科技巨头。...

数据对于构建伟大的人工智能至关重要,以至于该领域的研究人员将其与工业革命时期的煤炭进行了比较。那些拥有它的人会向前冲。不这样做的人会被扔在尘土里。在当前的人工智能热潮中,谁拥有它是显而易见的:像谷歌、Facebook和百度这样的科技巨头。

007Ys3FFgy1gqytwamsf8j61b60pumyg02

这是个令人担忧的消息。毕竟,这些公司中有许多在搜索和社交媒体等领域近乎垄断。他们的位置帮助他们收集数据,这有助于他们建立更好的人工智能,这有助于他们保持领先于竞争对手。对于企业本身来说,这是一个良性循环,但如果没有可行的竞争,企业可以——而且确实可以——滥用自己的主导地位。

现在,来自Mozilla(Firefox浏览器的非盈利创造者)的一个新项目正在试验一种替代数据垄断的方法,要求用户汇集信息,以推动开源人工智能计划。该公司的第一个项目叫做Common Voice,Mozilla要求志愿者捐赠声音样本,以构建一个开源的语音识别系统,就像Siri和Alexa的语音识别系统一样。

Mozilla负责新兴技术的副总裁肖恩·怀特(Sean White)告诉《边缘报》(the Verge),“目前,控制语音识别的能力可能只需要几只手就能实现,我们不想看到这一点。”。他说,为了获得数据,大公司“可以过滤所有进入的东西”,但对于其他公司来说,需要其他方法对我们来说,一个有趣的问题是,我们能这样做吗?这样创建数据的人也能从中受益。

目前,Mozilla只是在收集数据,但计划在年底前推出开源语音识别(它会进入火狐浏览器吗?怀特不愿透露,但补充说:“我们已经计划了一些实验(为此)”。目前,任何人都可以去公共语音网站,通过朗读例句“捐赠”自己的语音。他们还可以提供诸如年龄、地点、性别和口音等传记信息。怀特说,这些信息将有助于Mozilla在创建语音识别系统时避免偏见,并确保这项技术能够处理口音——这是谷歌和苹果仍在努力解决的问题。

007Ys3FFgy1gqytwbrnpkj60gq0d0gm702

隐私国际的研究员弗雷德里克·卡图纳(Frederike Kaltheuner)说,这些公司经常把人工智能作为搜集有价值个人数据的“借口”,告诉用户人工智能将使他们能够改进某些服务。她说,这可能是真的,但分享这些数据对整个社会的影响还不太清楚。”作为一个公民,你所需要的东西和符合公司利益的东西之间存在根本的利益冲突。

那么,像Common Voice这样的计划是如何吸引用户远离现有的——公认的便利服务的呢?毕竟,开源项目比互联网存在的时间更长,但除了少数例外,它们无法与商业产品竞争。他们根本不提供类似的服务。

对于Mozilla来说,答案就是个性化。毕竟,虽然人工智能系统在人口规模的数据集上训练后,对普通人来说已经足够好了,但当涉及到服务于较小群体或数据中没有代表的群体时,它们往往会失败(通常情况下,数据只是偏向于白人**,这是行业默认的。)

怀特说:“对于我们来说,要想在数据共享上取得成功,除了有一天意识到他们已经泄露了所有的个人数据之外,(用户)还必须有一个动机。”我们必须让他们的体验更好,因为他们参与其中。“在普通语音的情况下,怀特需要尽可能多的口音数据来提高这些人的语音识别能力。”我们希望这个系统能更好地为您服务,因为其中包括了您的一些数据。

提供个性化的数据交换是一个很好的建议,但对于那些反对数据垄断的人来说,这并不是一个银弹。首先,大公司可以向用户提供类似的服务Alexa不明白你的意思?阅读这个10分钟的脚本,我们将改进它的语音识别。”)或者他们可以花钱填补自己数据集的空白。例如,谷歌(Google)让第三方公司向带有口音的redditor付费,让他们录制自己的语音样本。

007Ys3FFgy1gqytwds830j615o0rsjyq02

怀特承认,公共语音项目并不能回答很多这样的问题,但他表示,Mozilla仍然致力于开放数据的核心事业。”这感觉像是一个真正的民主化活动,”他说。有很多组织都有这种精神。有一个机器学习社区Kaggle,它有大量用户贡献的数据集供人工智能科学家使用;elonmusk资助OpenAI,OpenAI的所有工作都是开源的;以及Healthcare.ai,它发布免费的医疗算法。他们中的一些人在销售自己的商业产品(如自动驾驶汽车初创公司Comma.AI)的同时,设法共享开源数据和研究成果。

尽管我们每天与之交互的人工智能系统都是建立在专有数据的基础上的,但是有很多研究人员和机构发布了一些有用的、甚至是最基本的、开源的替代方案。

不过,为了让这些项目更上一层楼,开源数据的支持者可能已经争取到了更高的权力来与科技巨头较量。深度学习公司Skymind的首席执行官克里斯•尼克尔森(Chris Nicholson)表示,“我们可能需要第三方介入——非**组织、**、小型私营企业联盟——并汇集他们的数据。”尼克尔森建议,共享医疗保健数据可以改善医疗成像技术,而驾驶员数据可以让自动驾驶汽车在路上更自然、更直观。他说,共享这些类型的数据集“具有明显的公共利益”

那么,献出你的声音,也许只是个开始。

  • 发表于 2021-05-29 05:04
  • 阅读 ( 109 )
  • 分类:互联网

你可能感兴趣的文章

如何设置和使用谷歌主页

...乐时,语音命令还可以暂停、继续、停止、跳过、告诉您正在播放的歌曲以及更改音量。通过连接Chromecast或Chromecast音频,在特定的扬声器或特定的电视上播放音乐也很容易。 ...

  • 发布于 2021-03-14 02:16
  • 阅读 ( 325 )

如何使用googletensorflow和raspberry-pi构建diy人工智能项目

机器学习是每个人都在谈论的话题。很容易看出原因。它是数据操作的未来,几乎已在所有现代业务环境中使用。但它能和树莓皮一起吃吗?Pi是否能够维持一个工作的神经网络?有了谷歌TensorFlow,它可以! ...

  • 发布于 2021-03-23 18:25
  • 阅读 ( 211 )

如何让任何应用程序在android上使用语音命令

... 智能**语音识别技术——比如Siri、Google助手和Cortana——当然可以让生活更轻松。你可以询问方向,执行搜索,并用你的声音发短信给你的朋友。 ...

  • 发布于 2021-03-25 23:02
  • 阅读 ( 279 )

voiceitt为家庭助理带来了以可访问性为中心的语音识别

以色列Voiceitt公司正在发布一款应用程序,为患有语言障碍的人提供智能家庭语音交互的便利。 ...

  • 发布于 2021-03-29 05:10
  • 阅读 ( 165 )

银行利用人工智能和机器学习更好地为您服务的8种方法

...在银行里可能不会被一个真正的机器人迎接,但我们看到人工智能在我们日常的银行世界中经常被使用。 ...

  • 发布于 2021-03-29 19:27
  • 阅读 ( 180 )

如何阻止公司听你的语音助理录音

...些最近的故事: 据彭博社2019年4月10日报道,亚马逊员工正在收听Alexa音频片段。报告说,全世界成千上万的工人都在倾听。 比利时公共广播公司VRT在2019年7月10日发表的一份报告中称,谷歌承包商听取了谷歌助理的一些片段。 ...

  • 发布于 2021-04-03 06:44
  • 阅读 ( 161 )

如何识别任何智能手机、pc或平板电脑上的歌曲

...如果启用了该功能,也可以只说“嘿,Siri”。比如说“正在播放什么歌曲?”?或者“说出那首歌的名字。”Siri会听这首歌并帮你辨认。 相关:学习如何使用Siri,一个方便的iPhone助手 Siri提供了一个“购买”按钮,可以让你...

  • 发布于 2021-04-07 18:42
  • 阅读 ( 210 )

微软以197亿美元收购人工智能语音技术公司nuance

微软将斥资197亿美元收购人工智能语音技术公司Nuance,以增强这家总部位于华盛顿的科技巨头Redmond在语音识别方面的实力,并使其在医疗保健市场(Nuance在医疗保健市场销售许多产品)上发挥更大的影响力。微软将以每股56美元...

  • 发布于 2021-04-15 21:36
  • 阅读 ( 146 )

mozilla需要你的帮助来修复糟糕的youtube推荐

...有害内容推荐频率的模式。 博伊德说:“我希望人们对人工智能和推荐系统如何影响他们的生活更感兴趣。”。“不一定要神秘,我们可以更清楚地知道你如何控制它。” 博伊德强调,用户隐私在整个过程中都受到保护。Mozilla...

  • 发布于 2021-04-17 22:15
  • 阅读 ( 141 )

voiceitt旨在帮助中风幸存者与智能家居对话

...设备进行通信。在CES上,以色列初创公司Voiceitt表示,它正在将其非标准语音识别程序整合到语音激活设备中。这项新技术可以让那些难以沟通的人直接使用这些系统。 “所有的指标都指向语音技术的持续发展,因此...

  • 发布于 2021-04-20 12:00
  • 阅读 ( 253 )
pn56672
pn56672

0 篇文章

相关推荐