第15版:新知 上一版3  4下一版  
 
标题导航
返回经济网首页 | 版面导航 | 标题导航
   
上一版3  4下一版 2017年4月28日 星期 放大 缩小 默认
人工智能:
圆了走失27年孩子的寻亲梦
经济日报·中国经济网记者 佘 颖
▶ 因为担心养父母知道自己寻亲会有想法,付贵坚持不公开自己的幼年照和正面照。根据记者的观察,他和父亲比较像,尤其是眼睛部分。
本报记者 佘 颖摄
▼ 病床上的付贵与家人视频,这是27年来他们的第一次见面。
本报记者 佘 颖摄

如果仔细观察,4岁的付贵和10岁的付贵还是有点像:眼间距都很开,鼻梁不是很高,眼睛的形状也类似,只是4岁时脸圆润些,10岁时就变成了刀削一般的瓜子脸。

但在长达27年的时间里,从未有人发现,这个远在福建的男孩就是当初在重庆走失的付贵。

2009年,付贵将10岁时的照片上传到“宝贝回家”网站上,登记信息为“胡奎”,出生日期为1986年4月,失踪日期为1991年1月1日,失踪地点位于福建,没有引起一点关注。2017年1月,付贵的家人上传了那张4岁时的照片,登记姓名为“付贵”,出生年月为1984年11月16日,丢失日期为1990年10月16日,失踪地点位于重庆市石柱县大歇乡。上传信息的不一致以及长相的变化,导致工作人员并未发现这两张照片是同一个人。

直到今年3月,百度与“宝贝回家”合作,将人工智能的跨年龄人脸识别技术应用于寻找走失儿童。从首批2万多条寻亲图片数据中,人工智能初步筛选出30例疑似案例,付贵就在其中。

今年4月1日,DNA比对成功。仅仅一个月,分离27年的亲人终于找到了彼此。

靠一张模糊的童年照找到长大后的孩子

1990年,6岁的付贵被拐卖。那天,姑姑送付贵上学,路上还给他买了一盒爆米花,嘱咐他放学早点回家。但此后,付贵再也没有回来。

当时,不要说数码相机、拍照手机,连普通胶卷相机都没有普及。这个重庆石柱农村孩子家中只有一张他4岁时的照片。照片里,付贵还戴着一顶公安帽。除此以外,父亲付光发手里再没有其他照片。

这种情况在我国相当普遍,尤其是在儿童走失积案中。时隔多年,伤心的父母手里往往只有一张年代久远的童年照,甚至是婴儿照。这些照片多半是生活照,孩子可能是侧面、歪着头,人脸很小,光线也不一定明亮。

而孩子上传的照片呢?除了光线、姿态的变化,往往还多了一道变量——时间。幼年时期,孩子生长发育最快,短短几年间,就会发生迥然不同的变化,仅凭肉眼观察很难判断。工作人员此前未能发现付贵,也有这个原因。

现在,人工智能可以胜任这项任务。

在人工智能的分析过程中,原本光线、角度不同的两张人脸图片会被转化为便于识别的统一灰度图,并从面部提取一个个特征点,再换算成不同维度,并给每个维度配比上不同的权重。当两张照片进行对比时,会针对每个维度挨个对比,得出每个维度的相似度得分,再根据每个维度的权重比例,计算出总体的匹配度得分,给出两张脸的相似程度。

通过应用强化学习、深度学习方式,百度大脑自主学习了200万人的近2亿张照片,自主摸索出识别人脸的方法,并发现了人脸随年龄变化的规律。比如,人工智能会自主判断招风耳、高颧骨、朝天鼻,并意识到这些特征可能不会有太大改变。当然,由于这是人工智能自己摸索出来的规律,科学家们也不知道在“它”眼里,这些特征是不是招风耳、高颧骨、朝天鼻。

此前,百度大脑曾通过观察一位小女孩4岁时的照片,在20位少女中准确找到了长大成人后的她,时间跨度超过15年。而且,百度大脑还准确识别出了这是双胞胎中的妹妹,没有误认成姐姐,两者的差距在算法中不足万分之一。

有了这样的技术基础,针对“宝贝回家”平台的数据类型,IDL深度实验室的人脸团队运用大规模的跨年龄数据和亲子照数据进行了深度学习训练,并用训练好的模型进行跨年龄人脸照片比对。从2万张照片里筛选对比出4岁的付贵和10岁的付贵,除了计算量更大,几乎不存在其他障碍。

正在攻坚根据父母的照片来找孩子

一张4岁的照片,一张10岁的照片,帮助付贵找到了亲人。在寻亲的人群中,这算是很幸运的一种。

其他情况难度更大:有些父母没有孩子的童年照,只好上传自己的照片;有些孩子不知道自己是被拐卖的、走失的、抱养的,自然不会去寻亲,父母即使上传了照片,也无济于事;还有些父母因年事已高、消息闭塞,不知道还有宝贝寻亲、公安部打拐平台这样的寻亲网站,无法上传寻亲信息……

今年3月,百度团队与“宝贝回家”对接后发现,照片筛选对比的难度远比预估的要大。

“首先是数据量不小,要处理6万多条数据,其中还有许多无效照片,如部分人员去世、失踪、无法追寻等。”百度AI平台部产品经理杨抒含说,“此外,还有照片不规范的情况,如照片经过美化、照片中人物过多、比对年龄区间较大等,都给比对工作增加了难度”。

目前,杨抒含和“AI寻人”项目团队正在攻坚根据父母的照片来找孩子。这不仅有时间跨度,还涉及遗传学。

“父母长相和孩子长相的相似性是不确定的,基因的遗传分为显性和隐性。比方说,父母一方是大眼睛,那么孩子可能是大眼睛,也有可能是小眼睛;甚至还有基因突变的情况,孩子的某些特征是父母双方都不具备的,父母都是小眼睛,孩子却是大眼睛,给机器的干扰项要比有效信息项还多。”杨抒含表示,如何让机器排除干扰是目前的最大挑战。

同时,随着后天的生活状态、社会环境、个人经历的不同,先天的脸型也会发生较大变化。比如,孩子如果经常嚼口香糖,腮部肌肉就会发达,脸型会变。孩子在成长过程中,脸部也有可能受伤,伤愈后面部特征也有改变。也就是说,孩子可能会朝着一个完全未知的方向生长。

为提高识别成功率,百度团队反复尝试了各种策略。“例如,将出生日期前后浮动两三年锁定范围,再利用遗失地点等其他条件,把范围缩小,在小范围内做比对以提高成功率。”杨抒含记得,今年3月中旬,团队把第一批筛选出来的30组匹配分数较高的照片提交给了“宝贝回家”,其中有两组照片是高疑似的,其中一组就是付贵。

与救助站、治安、交通监控系统结合威力更大

“找了这么多年了,我都不抱希望了。”直到确认消息的前一天,付光发还是不敢相信。他短方脸,凸眉骨,大鼻子,颧骨突起,同样眼间距很开。

寻亲是一条满是辛酸泪的路。当年发觉儿子走失后,付光发立即报了警,并拉上邻里亲戚把周边能找的地方找了个遍。每每听到哪儿有丢失孩子的消息,家里人都跑过去,拿着照片核实,看是不是付贵。

寻亲是一项涉及千万家庭的大工程,不仅是寻找被拐卖的孩子,还包括被拐卖的妇女、失智老人。外出寻亲、发寻人启事,付贵家的寻亲手段也是所有寻亲家庭常用的,如果不能在第一时间找回亲人,后续努力往往石沉大海。

为提高救助效率,2017年1月,民政部引入百度的人脸识别技术,合作推出了百度寻人平台。截至今年3月,平台已对接民政部全国救助寻亲网27003名走失者数据。而且,民政部与地方救助站等多方机构协调,确保每一名被送到救助站的走失者,第一时间就能采集图像数据并上传数据库。由于救助站里的走失人员大都不记得自己的名字、住址等信息,运用人脸识别技术,可显著提升求助者找到亲人的几率。

在打拐过程中,公安机关也需要人工智能的介入。孩子被拐卖后,人贩子或收养家庭需要为其办理各种证件。此前,由于数据库没有与寻亲平台对接,人力有限,公安机关往往无法判断这是不是被拐卖的孩子。而遍布大街小巷的摄像头,如果能接入人脸识别平台,在不侵犯公民隐私的前提下,将极大提高寻人的成功率。

今年全国两会上,百度董事长李彦宏建议国务院办公厅牵头,协调公安部、民政部等“反对拐卖妇女儿童行动工作部际联席会议”的重要组成单位,统筹企业和社会力量,建立适用于搜寻走失儿童的人脸识别模型,建立覆盖全国的走失儿童数据库,将人脸识别技术与治安、交通监控系统相结合,利用人脸识别等大数据和人工智能技术,进一步提升儿童走失案件的侦破效率与破案率。

“目前,我们和百度已成功对比出30余对相似图像,均已交给警方。警方会对这些寻亲人进行DNA核实认证。”“宝贝回家”创始人张宝艳表示,希望能通过百度人工智能与大数据的帮助,帮助被拐儿童家庭在寻亲路上少走弯路,让更多被拐儿童早日与家人团圆。

下一篇 4 放大 缩小 默认