搜狗8月3日发布语音交互引擎“知音”,不仅“能听会说”,还具有“能理解会思考”的能力。搜狗CTO杨洪涛介绍,智能语音技术已经成功应用到搜狗的全线产品中,“知音”将在物联网、车联网、人工智能等各个方面得到应用,并布局到更多的终端入口。无独有偶,两天后微软发布了第四代微软“小冰”,包含实时情感决策对话引擎、多种新感官、中日英三种语言,对应不同领域的功能插件平台,展现了微软最新的人工智能技术。
随着需求不断扩大,以大数据、云计算、移动互联网等技术为支撑的智能语音产业迅速发展,语音技术厂商和IT巨头也大力布局人工智能领域,带动全球智能语音产业规模进一步提升。中国语音产业信息网日前发布的《2015中国智能语音产业发展白皮书》指出,2015年,全球智能语音产业规模达61.2亿美元,同比增34.2%。其中,中国智能语音产业规模达到40.3亿元,同比增41%,远高于全球语音产业增长速度。预计到2016年年底,中国语音产业规模将达到59亿元。
“中国智能语音产业发展迅速,呈现几大亮点,表现为产品更加准确、更懂消费者,产品载体变得更多。”赛迪顾问高级分析师向阳告诉《经济日报》记者,目前阿里的智能音箱、苹果的Siri语音助手等产品,语音识别准确度已达97%左右。在软件方面,智能语音客服发展较快,比如中国移动等推出了智能呼叫中心。在硬件方面,亚马逊推出了Echo智能音响,长虹发布了人工智能电视,科大讯飞则有整套语音交互解决方案。软硬件技术的提升,使得产品的载体更加丰富。
智能语音发挥的正是搜索引擎介入互联网的入口功能,随着识别技术的进步,用户的体验才更加便捷。比如,“知音”引擎解决了用户语速过快导致的吞音问题,将语音识别错误率下降了30%以上,语音识别速度提升了3倍。“知音”引擎还能支持多轮对话,处理更复杂的用户交互逻辑,提供更便捷的人性化服务。比如用户说“我要去首都机场”,它会问“是T1还是T2”;当用户确定航站楼后,它还会问“是出发还是接人”。
“大环境推动了我国智能语音产业迅速发展。”向阳分析说,在国外,谷歌等公司把发展智能语音作为商业计划来推进;在国内,智能硬件产品不断推广,智能语音产品嫁接起来更为便捷。此外,从政策上看,“互联网+”“人工智能”等战略的提出,带动了中国智能语音产业的迅速发展。从技术上看,大企业不断提高语音识别的准确度、优化产品性能,使得智能语音在车载信息服务系统、智能家居等领域的应用进一步深化。4G网络的普及、大数据和云计算的发展,也为智能语音应用提供了技术保障。
向阳也指出,智能语音产业仍面临很多瓶颈。从产品看,目前很多人只是把智能语音产品当作“玩具”。因为语音识别的准确度虽然上升了,但仍不稳定,尤其是记忆功能尚欠缺。此外,97%的识别率指的是普通话识别,如果加上方言,识别率会更低。从商业模式看,以微软的“小冰”为例,仍是纯研发试验模式,如果单纯做产品,用户可能不会买单。向阳建议,在商业模式方面,要探索和发展“入口经济”模式,和第三方产品进行搭载,留住用户,从而创造经济价值。在产品方面,则要提升性能和用户体验度,才能真正从产品走向产业。