2019-06-05 16:13:01
为什么Apple的Siri不如亚马逊Alexa和Google智能助理那么聪明

在任何时候,我们大多数人都在虚拟助手的听力范围内。他们在我们的口袋,我们的房子和我们的汽车。

无论您是使用Apple的Siri来提醒您预约,要求亚马逊的Alexa为您播放一首歌或咨询Google智能助理以获取当地天气预报,与这些非人类助手互动已经变得正常。

Siri于2011年加入iPhone,但基础技术实际上比您想象的要老。

第一台能够合成语音的机器是贝勒实验室80年前在1939年创建的。

1952年,贝尔实验室发明了一种机器,可以理解0到9的口号。两年后,1954年,一台IBM机器与乔治城的语言学家合作,将60个俄语句子翻译成英语。

1962年,IBM创建了Shoebox,它可以理解16个口语。到1976年,卡内基梅隆将这个数字增加到了一千多个。到20世纪80年代中期,机器可以理解成千上万的口语。

从那以后,科学家们开始将这些过程与人工智能相结合,人工智能是自20世纪50年代以来一直存在的领域。

因此,我们现在有像Alexa,Siri,Google智能助理和微软Cortana这样的东西能够在我们谈话时理解我们。

不同种类的AI

人工智能是计算机科学家能够使助手更容易使用的一个重要原因,但是当您听到人工智能时可能会想到的与他们的实际意义之间存在差异。

“有两种类型的AI,”密歇根州立大学计算机科学与工程教授Joyce Chai解释道。

“强大的AI主要涉及可以推理或可以像人类一样思考或行动的开发系统。然后另一种是弱A.I.这更侧重于特定任务。这还包括虚拟助手。我们距离强大的人工智能还很远。“

传统上,为了能够对某事做出决定,计算机需要一组由人预先定义的规则。通过利用机器学习(一种人工智能),计算机能够在查看大量数据后自行推断规则。

在这种情况下,他们可以通过观察人们如何交谈和互动来学习理解语言。这需要大量数据。

哥本哈根IT大学副教授Natalie Schluter解释说。

“主要的挑战是这些公司是以足够多样的形式获取足够的数据,以便能够为多个特定的人实际做某事。在实验室中创建一个能够理解您和您的产品可能会非常有趣。但当然有不同的方言,有不同的口音,有不同的声调。“

而且不只是数据量 - 数据类型也很重要。如果你的训练数据只来自旧金山的白人,你最终会得到一个能够理解一小群人的人工智能。

“他们有聪明的人在Apple工作,非常聪明的人在亚马逊工作,”Schluter说。 “但在某些时候,我们必须确保这些人干预数据,并确保他们接触到来自不同人群的适量数据。”

Siri为何落后

那么Siri为什么不总是理解你在寻找什么呢?

在某种程度上,它归结为与科学无关的事物,以及与不同公司如何运作的现实有关的一切。

“Siri的挑战之一是他们在早期过度承诺,交付不足所造成的负面形象,”联合创始人兼首席执行官SoundHound的Keyvan Mohajer表示,该公司提供与之竞争的虚拟助手。 Siri,以及其他公司使用的音乐识别技术和语音工具。

“他们面临的另一个挑战是,他们并没有像你期望的那样迅速增加知识基础。亚马逊从一些技能变成了数十万甚至数万。 Apple还没有真正构建开发者生态系统。“

Siri落后的另一个可能原因是Apple严格的隐私标准。虽然许多虚拟助手尽可能多地收集您的数据来训练他们的AI,但Apple一直在声称最小化和匿名化这种数据收集的重要性。虽然有人认为这导致了一个不那么有用的助手,但Apple坚决不同意。

苹果公司首席执行官蒂姆库克在2018年杜克大学的毕业演讲中说:“我们拒绝接受这样的借口,即充分利用技术意味着剥夺你的隐私权。”

除此之外,Apple是一家臭名昭着的秘密公司。

“人们在做什么,他们认为苹果公司真正重要的问题是什么?我们对此一无所知,“施伦特说。

“通常在亚马逊,谷歌,其他公司,微软,我们的研究人员,我们都在同一领域工作,我们去同一个会议。我们发布,我们一起合作。 Apple是一本完整的闭卷书。“

但看起来Apple似乎开始更认真地对待这些事情。去年,它聘请着名的计算机科学家John Giannandrea离开谷歌,成为机器学习和人工智能战略的高级副总裁。今年早些时候,它聘请了谷歌顶级人工智能研究人员之一伊恩·古德费罗担任机器学习总监。

Loup Ventures在2018年底完成的一项研究显示,Siri尚未领先,但却在竞争对手中获益。

此外,本周在Apple全球开发者大会上,它宣布更新Siri Shortcuts,它允许开发人员更好地集成Siri,以及更新Siri的文本到语音引擎,该引擎现在使用完全由软件生成的语音。

但是,如果想要让Siri更令人印象深刻,苹果仍然可以做些什么。

“Siri的第一个版本做了12件事,”Mojaher说,“但要真正有用,你需要做所有事情。这是关于覆盖范围和添加更多内容,并拥有一个架构,允许您添加内容并增加理解速度,而不是线性。“

他补充道,“我认为Apple可以做的最有希望的事情之一就是围绕Siri建立一个非常成功的开发者社区。我不认为有人在语音AI方面做得那么成功。“

猜您喜欢的其它内容