soundhound的新语音搜索应用让siri和cortana看起来很慢

近十年前,SoundHound创始人Keyvan Mohajer向一群投资者提出了一个想法。他想制造一个系统,让人们随意地与电脑交谈,就像与另一个人交谈一样。这当然不是一个新的想法;1968年的《2001:太空漫游》的主角之一是一台健谈的电脑。但莫哈杰认为,这样的事情不再是科幻小说,可能会变得司空见惯。唯一的问题是什么?建造它可能需要10年。...

近十年前,SoundHound创始人Keyvan Mohajer向一群投资者提出了一个想法。他想**一个系统,让人们随意地与电脑交谈,就像与另一个人交谈一样。这当然不是一个新的想法;1968年的《2001:太空漫游》的主角之一是一台健谈的电脑。但莫哈杰认为,这样的事情不再是科幻小说,可能会变得司空见惯。唯一的问题是什么?建造它可能需要10年。

007Ys3FFgy1gq1fwlhprwj32zk200b2a

这就是SoundHound最初应该做的

投资者对这个想法很感兴趣,但对莫哈杰的时间表不感兴趣。他们说,“十年很长,你能给我看看三年后会发生什么吗?”他回忆道。于是,Midomi诞生了,这项服务可以让你哼唱一首歌来识别它。两年后的2009年,他推出了SoundHound,它对收音机或电视节目背景中听到的音乐也做了同样的处理。

现在,在向投资者推销了近十年之后,Mohajer最初的设想是以Hound的形式出现,Hound是一款语音搜索应用程序,可以处理极其复杂的问题,并以不可思议的速度吐出答案。现在,你必须在Hound应用程序中问这些问题,但公司希望能在任何地方都能得到这项技术——甚至是你的烤面包机。这可能永远不会发生,但公司的猎犬示范-这是相当脚本在我们的情况下-是惊人的,足以让我相信这是一种可能性。

莫哈杰是从一个zinger开始的“太空针所在国的首都人口是多少?”他轻快地问道。这是一个措辞奇怪的问题,但有意这样做,意在表明它能够很好地提取和处理所说的内容。在任何其他服务(甚至Wolfram Alpha)上问这个问题,你会得到相当于头部抓伤的数字效果。但在这里,一个机器人的声音立即回答说:“华盛顿特区的人口是601723。”那里有两个华盛顿州,它得到了正确的一个。在另一个测试中,他问:“从后天到2022年11月第二个星期四的前三天有多少天?”应用程序再次给出答案。

Hound感觉很像谷歌的语音搜索

搜索应用程序的功能和感觉几乎完全像谷歌的语音搜索,但似乎更快地识别单词和****。在我们的演示中,包含了几十个脚本式的问题,但也有一些即兴的问题,从莫哈杰嘴里说出的话几乎和他说的一样快地出现在屏幕上,猎犬会用比看上去可能更快的速度回答。

soundhound的新语音搜索应用让siri和cortana看起来很慢

Mohajer说,这种速度来自SoundHound将两种技术结合起来,这两种技术通常在竞争服务上是分离的。Hound在一个引擎中同时进行语音识别和自然语音理解,而竞争对手的服务则将它们分为不同的步骤,首先转录你的问题,然后推断你在问什么。也就是说,我们的测试也是在Wi-Fi上进行的,而且是在一个非常安静的房间里进行的,这使得我们无法判断Hound在现实世界中是否保持了这些速度。

这是一个没有个性的私人助理

不像Siri或Cortana,Hound没有个性。取而代之的是,它是一个无sass的机器人声音。另一个不同的方面是它从的来源的数量。从一开始,Hound将拥有大约50个域,或者它通过api绑定到的服务;比如货币转换器、新闻网站、航班状态信息和导航。莫哈杰说,计划是把这个数字提高到数百万Siri推出时有10个域名,三年后又有大约22个新域名,所以需要很长时间,”他说。

例如,通过Hound与Expedia的交易,您可以让Hound在西雅图为您找到一家每晚价格不到200美元的酒店,该酒店提供免费Wi-Fi、停车场和欧式早餐。当然,这和你在Expedia网站上得到的信息是一样的,但是在这里,你不需要点击一堆过滤器。它还与其他一些简单的工具相关联,比如抵押计算器(来自房地产网站Mohajer不愿透露)和基于语音的21点游戏,你可以用你的声音下注。

对于所有没有被挑选和分配给Hound的资源的东西,应用程序默认为微软的Bing。这意味着网络结果,包括视频和图像,都显示在一个集成的浏览器中。有时这很好,但在类似的工具如Siri和Cortana中,web结果表明系统无法满足您的要求。Mohajer认为,通过把人们踢到网络结果上,没有人会感到失望,尽管我认为如果这种情况发生得够多,你会完全停止使用这个应用程序,忘记它。我没能把Hound的边界推到我们的演示之外,一旦服务今天推出,用户就有机会这么做了。

它的设计初衷是要取代谷歌,但现在还不能

这就引出了Hound目前的一个弱点:它不能替代其他语音助手。开发人员将能够通过一个名为Houndify的开发平台将其集成到自己的应用程序和硬件创作中,Mohajer相信这一点将被广泛采用。

Mohajer说:“我们的愿景是,从数以百万计的**到消费类电子产品和汽车等数十亿种其他类型的设备,任何东西都可以拥有这种接口。”我们不可能成为一家为每个公司都建立这一平台的公司——我们需要让他们自己做到这一点。”

但在这之前,大多数人都会知道Hound的应用程序,它只能作为Android上的一个只受邀请的beta版启动,其次是iOS,它将作为一个独立的应用程序存在。这很像苹果收购Siri之前的第三方应用程序,也很像谷歌现在还在iOS上。这也意味着您需要有一个非常具体的理由在这两个平台上使用Hound而不是那些内置选项。

你还是得想办法用这个

值得注意的是,Hound的出现正值谷歌和苹果加紧努力,为人们在**上看到的东西添加上下文,通常使用语音界面,这几乎可以完全消除Hound对简单搜索的用处。上周,谷歌发布了Now-on-Tap,作为即将发布的Android M的一部分,这项功能将Now服务引入到了每个应用程序中,并为谷歌提供了一个令人难以置信的背景来解释你为什么要寻找某样东西。它希望它足够好,你甚至不需要离开一个应用程序来调出你可能搜索到的东西。据传苹果公司也在开发一个名为“主动”的功能,它试图将相关的应用程序和信息摆在用户面前,而用户不必一开始就搜索这些应用程序和信息。

如果应用程序开发人员将语音搜索构建到他们的应用程序中,或者SoundHound及其技术被其中一家大型公司抢购一空,那么必须找到并推出Hound的障碍可能会改变。同时,Mohajer相信,Hound的表现和经验足以让人们在问起他们多年来一直在用公司的音频识别应用做什么之前,多走一步推出它。

“仅仅因为更容易得到某样东西,还不足以让我做出选择。我不使用Siri作为食物,我使用Yelp,即使Siri使用Yelp数据,因为他们有更好的体验。他说:“我在iOS上使用谷歌地图,而不是苹果地图,尽管苹果地图的集成度更高。”我认为,如果你能提供更好的产品,人们就会使用它。”

  • 发表于 2021-04-30 07:57
  • 阅读 ( 198 )
  • 分类:互联网

你可能感兴趣的文章

谷歌助手与苹果siri:哪种智能ai最好?

... alexa、cortana或bixby呢? ...

  • 发布于 2021-03-12 17:22
  • 阅读 ( 247 )

制作语音命令应用程序的最佳列表

...过点击加号添加语音生成的待办事项列表条目。然后找到看起来像信封的“任务”图标。最后,用手指按住麦克风图标并开始讲话。说出所有必要的内容后,轻触蓝色复选标记。 ...

  • 发布于 2021-03-13 03:46
  • 阅读 ( 249 )

6种方法识别卡在你脑海中的曲调

... 你几乎肯定熟悉音乐识别应用程序,如Shazam和SoundHound。当你在你身边播放音乐时,他们会尽最大努力识别曲目,并为你提供歌曲的更多信息。好奇哪个音乐ID应用程序是最好的?看看我们对沙赞姆,猎犬和穆斯莫西马...

  • 发布于 2021-03-19 09:26
  • 阅读 ( 257 )

android的7个siri替代品:google assistant、cortana、alexa等

... 虽然Lyra应用程序看起来很基本,但这种体验与在线服务紧密相连。您需要创建一个帐户才能开始使用该应用程序。 ...

  • 发布于 2021-03-23 14:14
  • 阅读 ( 453 )

iphone语音命令的4种siri替代方案

... 微软宣布计划停止Cortana的移动应用程序,转而将该服务整合到微软365中。事实上,Cortana已经从澳大利亚、英国和许多其他国家的应用商店消失了。 ...

  • 发布于 2021-03-30 03:33
  • 阅读 ( 420 )

如何阻止所有语音助理存储您的语音

...能。它唯一能理解的就是它的叫醒词:Alexa,嘿Google,嘿Cortana,等等。 一旦它检测到wake单词,它就开始记录接下来的一切(从它认为听到wake单词的那一秒左右)。该设备将录音发送到公司服务器(Alexa、Google等)上,找出你所...

  • 发布于 2021-04-03 13:14
  • 阅读 ( 225 )

微软为什么不放弃cortana呢?

...。 跨设备的时间线、同步通知和“从哪里开始”等功能看起来就像Cortana在消费者(和企业)Windows PC上的未来。Microsoft甚至尝试将Windows search和Cortana分开,让您在PC上搜索文件而不受Cortana的妨碍。这一切都是为了提高生产力,而...

  • 发布于 2021-04-04 03:36
  • 阅读 ( 205 )

如何识别任何智能手机、pc或平板电脑上的歌曲

...网络浏览器的东西 Midomi.com网站是一个基于web的工具,由SoundHound(Shazam的竞争对手)提供。这是最接近Shazam的基于web的版本。 这个工具指导你“唱或哼”一首特定的歌,但你不必这样做。播放实际歌曲,让计算机的麦克风听到...

  • 发布于 2021-04-07 18:42
  • 阅读 ( 204 )

如何在Windows10中清除cortana的搜索历史记录

Windows10中的Cortana不仅仅是一个简单的搜索功能。它是一个类似iOS上的Siri或Android上的OK Google的个人助理。输入Cortana的信息存储在您的PC和Bing帐户中,因此结果可以定制给您。 相关:如何在Windows10上使用和配置Cortana Cortana可能很...

  • 发布于 2021-04-08 16:05
  • 阅读 ( 167 )

如何训练siri、cortana和google更好地理解您的声音

...完全一样。不同的人有不同的口音和发音方式,像Siri、Cortana和Google的语音搜索这样的计算机语音识别系统在理解每个声音方面不如实际的人类。训练你的语音助手,它会更好地理解你。 传统上,计算机化语音识别系统在理解你...

  • 发布于 2021-04-10 04:55
  • 阅读 ( 181 )
我加啊
我加啊

0 篇文章

相关推荐