哈曼次要为汽车市场、公共消费市场以及专业市场设想、出产和供给各类声响取消息文娱系统处理方案及软件办事。哈曼嵌入式声响事业部附属于哈曼四大营业群之一的消费类声响,次要为消费类企业用户供给全方位的声响处理方案,为B2B性质的部分。
可是一旦麦克风距离较远,收音情况就会遭到大量噪声、混音以至反射带来的干扰,导致对声音信号采集和提取的精确率大幅下降,从而影响语音识此外精确率。
哈曼的多种处理方案
谈及智能音箱,不得不提 Amazon Echo 和 Google Home 这两款产物,若是纯真从硬件层面来看,二者仿佛都没有什么可炫耀的本钱,独一分歧是 Amazon Echo 采用的是6+1环形麦克风阵列,而Google Home 只采用了2个麦克风阵列。
双麦、多麦,哪个更支流
第二种设置装备摆设为四麦语音处理方案。次要面向高端家用电子产物、企业级使用以及机械人,可支撑最远6米的高清远距离拾音需求。
麦克风阵列有很好的抑止噪声和语音加强的能力,又不需要麦克风时辰指向声源标的目的,所以它被越来越普遍地用到智能音箱甚至其他需要语音交互的场景下。
哈曼嵌入式声响事业部担任人刘苍松也暗示,“哈曼正在麦克风采畴有跨越60年的汗青,几十年前唱片音乐风行的时候,世界上一级的录音室都是哈曼的设备,哈曼现正在做智能语音麦克风阵列的手艺,是水到渠成天然而然的手艺堆集而做的一个产物。”
从近场识别到远场识别
工智能设备的耳朵和嘴巴
截至目前,SONIQUE? 近程语音识别处理方案曾经可以或许支撑开源的支流语音引擎集成,包罗亚马逊 Alexa 以及微软Cortana,并估计正在近期内取更多语音引擎厂商开展合做,列表中的名单包罗百度、科大讯飞、苹果 Siri,而且还正在持续添加。
智能语音帮手不是什么新颖的事物,但它的载体智能音箱成为智能家居的爆品不外是近两年的工作,这得益于两个方面,起首是人工智能的成长降生了现实的使用场景,其次则是声学识别、语音识别等手艺的逐步成熟。
哈曼的麦克风阵列担任了智能语音入口的性质,“至于人工智能若何思虑,天然言语理解、反馈等下一步的办事供给则是由那些互联网公司供给。”刘苍松暗示道。
但同时哈曼嵌入式声响事业部担任人刘苍松也注释道,“其实成本并不是纯真由麦克风的数量决定,现实单个麦克风的硬件成本很低,多麦克风阵列的难度正在于系统更复杂,需要破费大量时间正在材料、工艺、软件上去调教,是软硬件一体化的系统工程。”
对于目前的智能语音类产物来说,也不存正在哪个更支流的问题,而是更强调使用场景。“双麦克风阵列产物使用的场景相对简单,号令也不复杂,对成本要求低,好比电灯开关、窗帘开关,而雷同Echo如许的产物则是对识此外精确性要求高,但正在数量上都达不到双麦克的出货量”,刘苍松暗示。
消费级麦克风阵列的兴起伴跟着智能语音帮手的大范畴使用,最次要的变化其实是用户场景的迁徙,这也鞭策了麦克风阵列范畴从近场识别到远场识此外手艺,一旦远场语音交互成为支流,那将和触屏的体例发生实正的差。
HarmanKardon Invoke
哈曼嵌入式声响事业部担任人刘苍松向钛记者引见,“语音识别从近场识别到远场识别逾越的难度很是大,好比从识别声音的距离来看,从2米到3米距离提拔50%,可是成本可能添加了两倍,越往上越成几何级增加,是不成比例的,就像发烧音箱一样,10万的声响可能只比1万的声响音质提拔了一点点。”
对于正在这个范畴的定位,哈曼也同样十分清晰,刘苍松给钛记者举了一个十分抽象的例子,“哈曼的脚色就像是人工智能设备的耳朵和嘴巴,当你对智能音箱说‘我饿了’,这个声音会通过麦克风阵列进行降噪并收集,哈曼的处理方案担任收集用户的输入,次要是前端声音的采集和反馈时候声音的表达。”
方才过去的CES ASIA期间,哈曼发布了全新的近程语音识别处理方案 SONIQUE?,它将供给有别于保守手动输入的语音输入手艺,对准的恰是消费类语音电子产物对于麦克风阵列的需求。
双麦克和多麦克阵列的一个次要区别,是成歧。双麦克风阵列的 Google Home 售价129美元,采用的是6+1环形麦克风阵列 Amazon Echo售价为179.99美元,两者相差了50美金。
不外从手艺角度看,麦克风数量分歧导致它所具备的特征有所差别,也就降生了多种使用,哈曼嵌入式声响事业部担任人刘苍松暗示,按照特定的用户需求,SONIQUE? 可供给三种分歧的处理方案。
第三种为七麦语音处理方案。次要面向对机能要求高的企业级使用和机械人。通过搭配系列音效算法,七麦语音处理方案可支撑最远8米的高清远距离拾音需求。
哈曼嵌入式声响事业部副总裁兼总司理---刘苍松先生
第一种为双麦语音处理方案。次要面向以家用电子为从的消费类电子使用,能够矫捷地使用于消费类声响,电视机顶盒以及收集由器等设备,双麦设置装备摆设可支撑最远4米的高清远距离拾音需求。
无论是音箱仍是其他消费电子产物,凡是涉及到语音交互的环节,都离不开对声音的采集和提取,具体到智能音箱中,这是一种被称为“麦克风阵列”的手艺,同时几乎也是Amazon Echo 和 Google Home 此类产物独一涉及到硬件层面的立异。
但这个过程中不克不及忽略的是,语音识别率是正在云端测试获得的,因而这两个系统必需婚配正在一才能获得最好的结果,为此哈曼进行了很是普遍的合做。
“iPhone配备了号称目宿最好的麦克风,可是若是开扬声器从2米外去打德律风,根基上除了噪声什么也听不见”,哈曼嵌入式声响事业部担任人刘苍松认为,“当用户逐步从手机起头切换到雷同Echo等的时候,现实上麦克风的工做情况也变了。”
几年前,语音交互最典型的代表就是以苹果Siri为代表的智妙手机,正在这个相对简单且识别距离较近的场景,麦克风系统能够正在低噪声、无混响、距离声源很近的下获得合适语音识别需求的声音信号。
正在前不久的微软Build大会上,微软发布了取哈曼合做的智能音箱 Harman Kardon Invoke,做为对标亚马逊和谷歌的产物,Harman Kardon Invoke 同样能够实现播放音乐、办理日历和、设置提示、流量等功能,区别正在于 Harman Kardon Invoke 采用的是哈曼 SONIQUE? 七麦的处理方案。