耳机正在万能化,是不是下一个“万能的手机”?

人工智能正在渗透进入我们的日常生活,手表、耳机、麦克风未来都将成为更“懂你”的随身产品,交互技术也越来越人性化。尤其是麦克风一体的耳机,似乎已无所不能。本文由钛媒体编译自新闻网站The Wired文章,大小标题由钛媒体所取:

【陈倩敏、梁敏仪 / 钛媒体编译】美国导演兼演员Larry David在他自传体剧集、那部神经兮兮的《消消气(Curb Your Enthusiasm)》中有这样一幕:

Larry坐在一家餐厅中,随着俗气的背景音乐响起,镜头转到一名坐在隔壁桌的男子,后者一个人坐着,却在叽叽喳喳地大声说话,提醒一个看不见的人说“儿童球鞋简直是全宇宙最糟糕的礼物了”。

然后好戏登台,镜头切换到这家伙头部的另一面,原来他带着无线蓝牙耳机。一旁的Larry受够了他的废话,也开始大声地自言自语,最后甚至跟隔壁桌那位男子开始互相比谁更大声,对着他们面前的空椅子各自大声地抱怨——真是无聊的家伙。

这一集在2007年播出。幸运的是,在这之后的一段时间里,蓝牙耳机带来的骚扰问题暂时消失了,因为取而代之的是一群盯着屏幕一声不吭的人(起码坐在这类人旁边会更轻松一点儿)。如今世界再次发生了变化:随着我们越来越依赖Siri、Google Now和Cortana,在这个充斥着虚拟助理、语音应用程序和平台的世界里,我们又开始对着电话说话了。不过,这一回的情况应该会比以前好的多。

至少到目前,我们还只有一个办法对着我们的这些小工具说话:点击按钮,把嘴巴对着电话下半部,还必须一字一句地说得清清楚楚——但大部分人都相信,这迟早会被淘汰掉。咱们的流行文化里早有不少例子了,比如电影《云端情人(Her)》的内嵌式耳机,《全面回忆(Total Recall)》中无处不在的荧幕,或者《星际迷航(Star Trek)》中的智能电脑,但大部分的焦点还是落在《Her》里的内嵌式耳机。

无论你走到哪里,总有一家公司在研究这种毫不显眼、舒服得能让人忘记还戴着耳机的无线耳机。

Bragi的Dash耳机可能是最常见的一款产品,不过市场上还有Pearbuds,OwnPhones,Motorola Hint,HearNotes,Earin buds,Truebuds,以及其他大大小小不同公司的无数产品。它们不光只是减去臃肿外壳的蓝牙耳机,还是能够随时利用数字技术进行声音输入与输出的方式。

耳机正在万能化,是不是下一个“万能的手机”?

Bragi Dash耳机。

Larry David并不是因为隔壁桌混蛋的耳机太难看、违反他的审美观而生气。他生气是因为,那家伙在大喊大叫,而对面根本没人。 “最重要的原则是,产品不应该成为烦人的东西,”负责高管商务礼仪培训的礼仪专家Diane Gottsman说。,“对着Siri说话就十分方便。”但也不需要因此一棍子打死所有耳机;幸运的是,现在对耳机说话已经比以前简单多了。

谁在让麦克风变的更聪明?

一方面,麦克风技术正在不断改进。长久以来,我们都在呼啸的大风或嘈杂的交通中对着电话大叫,又或者把电话举到嘴巴上方,就像多了两撇滑稽的胡子——都不过是为了电话另一边的人能听清。现在,我们的话筒已经变得更清晰、更强大、更出色,与之配套的软件也是如此。

在苹果九月份的发布会结束后,员工们在苹果电视的演示室中鼓励人们改掉以前的坏习惯,就是人们总习惯在跟Siri说话时把遥控器拿到嘴巴旁边才安心。事实上,只要放在旁边然后说话就可以了,因为现在有了噪声消除技术,也就是用软件就能隔离所有的背景噪音,因而更好地突出我们真正想听到的东西。手机的信息收集技术(例如高清语音)能使我们的声音听起来更清晰,而且新型的低功耗处理器能够确保手机一直在听你的话,而不会突然没电或当机。

高通最新的骁龙820处理器就使用了一种内置技术,能使手机用最低的耗能持续收集外部的语音输入,如今几乎所有旗舰手机中都安装了这个处理器。它的传感器音频(Sense Audio)软件可以通过背景声音来判断你的方位,并能有选择地屏蔽背景噪音。

英特尔的爱迪生芯片也能以类似原理工作,英特尔在今年早些时候还用了一种有趣的方式来演示。它与宝马合作,制作了一款头盔,你可以用简单的英语与一辆通过头盔连接的摩托车进行对话。你绝对想不到他们用的接口是什么——摩托车的发动机故障检查灯!英特尔还成功地让这辆智能摩托车跟你做自我介绍。此外,哪怕是在熙熙攘攘的公路上,它也能听懂回复你的话。

他们在英特尔总部的一个小会议室中向我展示那个头盔,还反复强调,那只是一个样品。的确,看看头盔那些裸露的电路或是无比复杂的设置就懂了。但是它也的确运作良好。当你对着那个改良过的灰色HJC头盔说:“你好,智能车。”然后,一个英国男性的声音就会回应:“你好。”接下来好戏来了。问问看“摩托车的状态”,然后你就会得到你的R1200GS几个重要指标的语音播报。询问“行程”时,你会得到燃料的确切余量。这辆车可以给你导航,在没有足够的燃料时把你带到加油站,甚至在你乱拐弯时给你警告。你再不需要盯着手机,甚至不需要抬头看仪表盘,因为一切都能通过两个耳机和嘴边的麦克风进行操作。

麦克风将继续变得更好、更简易、并更聪明。这就是摩尔定律。不过,它们只会按照已有的模式发展下去。与此同时,新技术却在迫使我们进行革新,使用更具时代意义的新方式来通过工具进行语音交流。其实无论新旧,这些技术都早有科学研究的根据作为支撑,只不过现在才开始慢慢在市场上露面。

“耳机行业目前价值20多亿美元,”纽约耳机制造商AfterShokz的首席执行官Bruce Borenstein这么说道,“然而大家都在走老路。”AfterShokz于四年前成立,当时Borenstein的一位朋友向他展示,如何能够利用震动使声音直接传递到耳蜗,而不用通过耳道。这就是所谓的骨传导,它已经存在了几十年并广泛应用于军事中。但Borenstein认为,这种技术也能推广到大众市场。

Aftershokz的耳机不需要戴在或插入耳朵中。你只需把耳机架在颧骨上,就在耳朵跟前。这意味着你在用骨头“听”到音乐的同时,还可以用耳朵听到周围的世界。 “我立马就知道,这是运动耳机的绝佳解决方案,” Borenstein说, “这特别适合户外活动的人群。”他早就看到过骑自行车的人一只耳朵插耳机而另一只不插,或者直接插上两只耳机,与周围世界隔绝,这都可能带来危险。

耳机正在万能化,是不是下一个“万能的手机”?

Aftershokz Trekz耳机能够让你同时聆听世界和音乐。不过,做好俯卧撑还是要靠自己哦。

在中国,Borenstein跟Bone Sonic的制造商达成了合作,因为Borenstein不喜欢这个听起来就像是牙刷的产品名,索性将它改名为Aftershokz,目标消费群体是运动员和户外活动爱好者。经过几次升级、以及对声音频谱的检修以后,产品音质变得十分出色,Aftershokz的销售也从此节节攀升。Borenstein现在整天戴着Aftershokz最新型号的耳机Bluez 2,而公司的新模型Trekz在众筹网站上Indiegogo募到了目标资金的八倍有多。

解放嘴巴的“默读”

骨传导可以帮助那些小工具更好地接收你的声音(因为振动耳机不像传统的耳机那样容易受到背景噪音的影响),让你能够更安全地整天戴着耳机。但是,我们仍然没有解决别人大声说话带来的问题,就像开头描述的情景一样。这就得依靠默读了。

想想看,当你读一本书时,你会发现自己一边阅读一边在做着嘴型,这就是默读——不出声地说话。你的神经和大脑处理话语的方式是完全一样的,你所需要做的只是改变所说话语的收集方式。

最能彰显上述特质的其中一个例子就是《安德的游戏》系列丛书。在书中,安德有一个叫做“宝石(The Jewel)”的设备,这是一个直接连接到他的颚骨的植入物。当他戴着“宝石”时,他可​​以通过移动嘴巴和舌头的肌肉与他的电脑进行对话,而无需发出任何声音。

这并不只是科幻小说里的情节,默读技术是真实存在的。

2004年,美国航空航天局进行了一项研究,他们发现了一个“在下巴下方和喉结两侧植入一些细小的、按钮般大小的感受器,它们就可以收集神经信号,将信号发送到一个处理器,然后通过计算机程序将其转换成文字。他们表示,研究目标是将默读通讯技术应用到“宇航服里,和一些嘈杂的地方(如机场控制塔中,以便捕捉空中交通管制员的命令),甚至用于传统的语音识别程序,以提高其准确性。 ”这样的话,也许以后就不用再大声对着电脑说话了。

这一切都还处于研究阶段,真正投入消费级应用还有待一段时间。大多数目前真实存在的类似设备,都需要用电线夹在你的脸上,让你看起来像参加科学实验一样。但很多研究人员和科学家都认为,这对于未来沟通方式具有重要意义。

回到咱们开始的话题上,McQuivey再次谈到电影《Her》。 “他们可以在其他人不知道谈话内容的情况下进行对话。”他指的是电影中的两位主角(一个是人,一个是人工智能)。 “我们会发展到那一天,当我们可以跟外部的实体进行一种本质上的内部对话时,我们就开始共同进化了。”他认为,我们将与机器合并、成为一体,我们个人的思想与计算机之间的界限奖变得模糊。

但是,在这个节点到来之前,我们的电脑还需要比现在多得多的线索,才能更准确地揣测我们正在做什么、说什么和想什么。不过这有希望在不远的将来实现。

在2014年1月的消费电子展CES上,也即是《Her》上映不到一个月后,英特尔的新设备组展示了一个名为Jarvis耳机的样机。一名名为“Larry”的男子在右耳上缠上耳机,约60秒内就做了三件事:完成一项预约,告诉同事知道他参加不了参加会议,并忽略了妻子的三条消息。

为了演示效果,这位Larry不断大声说话。但是其实他光是点头和摇头就能给Jarvis做出回应。Jarvis耳机采用运动传感器来读取肢体语言和简单手势,使交互速度更快。而随着英特尔的RealSense摄像头的面世,计算机将可以读取你说话时的情绪,从而做出更明智的决策。

这些研究者的梦想是实现多模式、多方式输入的对话,并给AI提供尽可能多的社会和情感线索,就像我们面对面聊天一样。然后,AI就不再是电脑那么简单了,它就会成为更高级的东西。

听起来有点可怕?可能吧。但与此同时,AI也更人性化了,不是吗?





易科技 » 耳机正在万能化,是不是下一个“万能的手机”?

赞 (0) 评论 (0) 分享 ()