“喵呜——”近日,记者来到北京远鉴信息技术有限公司位于北京西四环的办公区。许是听到了陌生人的脚步声,一只员工养的小猫率先迎了上来。这只名叫“小哼”的猫咪似乎有当“公司代言”的潜质——大胆、热情、友好,对声音极度敏感。
2014年,由中国科学院自动化所、清华大学等科研院所专业人员组成的远鉴技术团队敏锐觉察到,在人工智能赛道中,“声纹”是被严重低估的领域。他们立即闻“声”而动,开启了声纹技术产业化征程。
远鉴首席科学家郑榕是中国科学院自动化所的博士,从事声纹研究超过16年。和他接触,第一感觉是低调,但只要谈起声纹技术,他就会亢奋起来,眼睛里闪着光。
“声纹就是一个人声音的特征,反映其发声生理器官和说话习惯的特异性。无论一个人是不是在模仿别人说话,也无论他说的是普通话还是方言,只要其声道结构不发生本质变化,通过声纹就能准确识别其身份。”郑榕说。
“目前,国内声纹技术水平已经与国外并驾齐驱,在某些领域的应用水平甚至更高。其中一个重要原因就是国内数字经济、移动互联网发展迅猛,为声纹技术的锤炼完善提供了极为丰富的应用场景和海量数据。”郑榕说,声纹技术发展到现在,竞争的关键点已经转变为谁能开发出适用于细分场景的精准解决方案。
要领先于人,不仅需要闯劲,更需要韧劲。近年来,远鉴技术团队日复一日地开展试验攻关。他们将实际场景下的数据作为支持自身成长的“富矿”,不断开展深度学习,让声纹技术成为一把造福于民的“利器”。比如,某市公安部门就利用远鉴的声纹技术,抓获了超过100人的电信诈骗团伙,这也是国内首起主要利用声纹技术破获的大型案件。
经过连续多年的潜心钻研,远鉴逐渐在业界崭露头角,成为人工智能领域的“隐形冠军”。
不过,成为“隐形冠军”仅仅是一个新的起点。工作人员告诉记者,“跨信道”是声纹识别领域的一大难题,如果不能解决好这一难题,声纹技术的实际应用效果将大打折扣。
2018年,远鉴率先攻克了“跨信道”声纹比对这一业界难题。他们针对麦克风、固定电话、手机、APP等不同信道,成功实现高准确率比对,技术水平上了一个大台阶。
2019年,远鉴参加了中央网信办、工业和信息化部、公安部共同指导的“中国人工智能多媒体信息识别技术竞赛”,并从上百支参赛队伍中脱颖而出,获得声纹识别冠军,获评最高等级的A级单位。
目前,远鉴的声纹技术正在金融领域大放异彩。据远鉴公司有关负责人介绍,在招商银行信用卡中心举行的声纹技术选型评测中,远鉴在电话呼叫中心声纹评测和掌上生活APP声纹评测中均取得第一名的好成绩。在交通银行信用卡中心举办的呼叫中心声纹技术选型评测中,远鉴评测指标甚至超越了不少国际巨头。
据远鉴副总裁孙国锋介绍,除了在技术上领先外,远鉴还尤其擅长将人工智能技术与行业应用结合,特别是围绕网络空间治理、社会综合治理、民生服务等领域提供服务。如在社会公共安全领域,远鉴通过声纹识别和声纹大数据技术支持反电信诈骗、反恐、刑事案件侦破以及身份查询、核验等。
伴随着声纹技术商业化时代的到来,远鉴服务的行业和客户快速扩张,营收也呈倍速增长态势。“我们心中的远鉴是技术创新驱动型企业,我们要做一家拥有核心技术并且在国际舞台上有一定技术话语权的企业。”孙国锋说。