降价格,减功耗,提性能,促量产,他家的语音 AI 芯片如何做到?
来源:深圳湾 | 作者:chipintelli | 发布时间 :2019-09-21 | 152 次浏览 | 分享到:
对着家里的空调、电灯、抽油烟机等家电设备说话,然后这些设备真的「开口」回应你,并且给你讲一堆冷笑话或者新闻和音乐播报——这尽管有点黑科技,但是大部分时候还是闲置用不上的无聊科技。

但对着这些家电设备发出「打开、关上、切换」这类简单的语音命令,不需要遥控器,这些设备就能响应你的指令,完成相应的动作——这种「上手」并不难,并且很快就能成为你习惯的一种和设备相处的方式。

这种事对于家电设备厂商来说,本来是一件可以提高产品溢价的好事,但是却因为成本太高而很难大规模的量产。

- 1 -

成本高,包括这样几个层次:

前期调研成本高,大抵上要把提供芯片、模组、语音、甚至声学的这些解决方案都了解和评估一遍,而并不是每家设备商都能配或者愿意配备这些人力。
采购成本高,不管是以软件 SDK 还是硬件模组的方式,拿到手七七八八的和需要集成起来的东西组合,再把成本平摊到单个设备里,算下来还是要贵不少,再将这些新增的成本转嫁给消费者,进而产品的竞争力就没那么大了。

边际成本高,你把空调的方案推给我,我就只能上空调的产线,等我决定了加湿器也想要语音控制的时候,还得另外采购不同的方案,这种分产线小批量的运作方式,实在很难让我把成本榨到最低。

市场讲求一分价钱一分货,对于方案商而言,要降价,卡就卡在性能和成本的平衡上。

“把所有我想要的语音控制功能都集成到单芯片里,不需要增加其他的元器件,不要有额外的功耗,不需要设备一直联网,还能随时调整甚至增加命令词,唤醒率和误唤醒率还要足够优秀,开发门槛也不要太高,并且,这个芯片的价格还要做到足够低......

这样的芯片在昨天启英泰伦的发布会上亮相了:

9 月 19 日,启英泰伦在深圳举办主题为「声无界·芯未来」的新品发布会,重磅发布了二代语音 AI 芯片 CI110X 系列(CI1102/CI1103)及启英泰伦语音 AI 开发平台。二代语音 AI 芯片 CI110X 系列集成了更丰富的功能、拥有更强大的性能、同时具备更低的成本和功耗。



价格更低,功耗更低,功能更丰富,集成度更高,简直是优点一箩筐。也难怪芯片刚一发布,就已经收获了超过 100 家 Alpha 客户和超过 100K pcs 的订单。

- 2 -

在展开对 CI110X 系列的介绍之前,我们先了解一下启英泰伦这家来自成都的芯片公司,以及他们的一代语音 AI 芯片。

启英泰伦早在 2015 年就开始入局语音 AI 市场,2016 年 9 月推出了全球首款人工智能语音识别芯片 CI1006,并于 2017 年 1 月实现量产。这是全球首款 DNN 处理器内核人工智能语音芯片,具备高 NN 算力、高识别率、远距识别、快速响应、超低功耗等特性。

虽然靠芯片设计起家,但启英泰伦的创始人何云鹏很早就看清了在设备端实现边缘计算的趋势,早在 2015 年就成立公司专门从事基于深度学习的语音识别芯片及配套算法引擎的研发。

在推出首款支持深度神经网络的人工智能语音芯片 CI1006 后,启英泰伦在算法研发上持续突破: 2016 年 12 月,本地中文语音训练引擎研发成功;2017 年 7 月,本地英文语音训练引擎研发成功;2018 年 5 月,麦克风阵列算法研发成功;2018 年 10 月,声纹识别、本地自学习研制成功;2019 年 3 月,TTS 上线。
可以说,这些努力,都是希望这颗在端上运行的芯片,性能更强大,功能更丰富,拥有更多的离在线智能。

基于这一芯片,启英泰伦又陆续推出了一系列的双麦、单麦方案,以及可以直接量产组装的模组。而成本也是从最初的 200 元的 AP 方案,一路降到了 35 元,一路助力启英泰伦在离在线语音产品市场,获得占有率第一的成绩。



- 3 -

我们再来看一下新发布的二代芯片。据何云鹏在发布会上的介绍:

CI110X 系列基于 NPU+MCU 架构设计,内置升级了的脑神经网络处理器 BNPU v2,并新增了语音加速传感器。CPU 主频也较上一代的 100 MHz 提升到了 160MHz。



同时,CI110X 系列还内置高性能低功耗 Audio Codec 模块和硬件音频处理模块,可以外接麦克风实现单芯片远场降噪和回声消除等功能。同时该芯片还集成多路 UART、I2C、SPI、PWM、GPIO 等外围控制接口,可以开发低成本的单芯片智能语音离线识别方案。

而通过内置的高速 UART 或 SDIO 接口对接 Wi-Fi、蓝牙等无线模块,实现离在线语音方案。基于 CI110X 系列芯片开发的产品,语音交互的基本功能可通过离线语音实现,而语音内容和服务则可以通过联网实现。

一代 CI1006 芯片具备本地大词汇量语音识别、降噪、AEC 的优点,二代 CI110X 系列芯片则在此基础上,集成了声纹识别、波束形成等更丰富的功能,同时应用了启英泰伦的新一代本地命令词自学习,同时支持本地和云端的无缝识别。

CI110X 系列芯片相较于一代在功耗上降低了近 2/3,最低功耗仅需 35mW。价格上,更是推出了低至 14.99 元的本地语音标准模块(单笔订单>500K)。

同时,启英泰伦也将芯片的应用领域,从最初擅长的家电、家居、照明等领域,扩展到音箱、玩具、穿戴设备、汽车等产品领域,并为开发者提供易上手的在线开发平台,和一整套线上和线下的技术支持。

凭借着完整的从芯片到算法的软硬件技术实力,启英泰伦希望用更具性价比和竞争力的芯片和解决方案,助力设备商快速实现智能化。

- 4 -

会后,我们和何云鹏进行了深入的沟通,请他帮我们论证「芯片商做算法」行不行以及如何行的问题。

“我很早的就意识到深度学习很重要,要把它做到芯片里。

那是在 2015 年以前,阿尔法狗还没有出现,边缘计算概念还没有流行的时候,何云鹏在某传统家电公司芯片部门任职。

“其实(我们)是市场倒逼做算法的。

启英泰伦一开始也希望能与算法公司展开合作,希望他们能开放代码,再定制封装到芯片里,但这并不像看起来那样简单,一些客观因素的限制,让这种软硬互补很难深入。启英泰伦不得不硬着头皮自己做算法。

“算法不是芯片商的优势,但如今算法成为了我们和其他芯片商竞争的优势。我们的芯片性能好稳定性高,但是价格刚开始有点高,这曾经是我们的劣势,但现在我们已经攻克了成本的难题,价格低也成为了我们的优势。



我们在会场里采访了几位与会者,他们有的是启英泰伦的芯片代理,有的是方案商,也有不少用了他们芯片的设备商。当问及二代芯片怎么样时,他们对于性价比一致点头,表达出「很期待」的神情。

“我的 70 岁的母亲从农村搬到城里,不会用我家里的遥控器。当我把家里的设备都换上启英泰伦的芯片支持的产品之后,她很容易的就学会用语音这样自然的方式,实现对家里设备的操控,而且,她讲的是四川方言。

启英泰伦有一个很朴实的企业愿景:Make AI Real、Make AI Everywhere、Make AI Simple。用中文翻译过来就是:让终端具备真智能、让智能终端真便宜、让智能应用真简单。而如果用四川话来阐释的话,我想可以大致提炼为:语音 AI 芯片,雄起!

我们希望这一愿景,能够通过产业链的共同努力,普惠到更多的人。