订阅高工机器人官方微信

订阅服务机器人官方微信

订阅人工智能官方微信

【年会演讲】灵至机器人苏剑波:无处不在的人脸识别

2017-01-02 18:06 高工机器人网 阅读:3973
分享到:

摘要2016年12月23日下午,灵至机器人董事长苏剑波在以中标智能冠名的2016高工机器人年会上,发表了以“无处不在的人脸识别:做个好人吧”为主题的演讲,从侧面来窥探其对人脸识别方面的技术和进展成果的分享。

关于恶意转载本网原创文章,故意删除高工机器人字眼的严正声明

  【文/黎先才】成立于2015年的上海灵至机器人科技有限公司(简称“灵至机器人”)是一家集社交娱乐、医疗和家用服务机器人的开发公司,经营范围包括机器人及相关技术的研发、销售,并提供相关技术咨询、技术服务、技术转让等,在多模式机器人识别和智能交互领域,拥有独特的技术优势。

  目前,灵至机器人的主打产品为“Mr. G”智能服务机器人,能为家庭提供安全、看护、娱乐等服务。未来,该司主要产品将集中于安防、消防、餐饮、社交娱乐、医疗和家庭服务等服务机器人领域。

  公开资料显示,灵至机器人董事长苏剑波在机器视觉、智能系统、多传感器信息融合和网络机器人等研究方向,主持过多项国家自然科学基金项目、国家"863"高技术研究发展计划和上海市教委项目。

  同时,其还获2015年第十七届国际工业博览会一等奖、教育部自然科学二等奖,获得发明专利20项,发表论文240余篇,培养博士研究生22名。

  2016年12月23日下午,灵至机器人董事长苏剑波在以中标智能冠名的2016高工机器人年会上,发表了以“无处不在的人脸识别:做个好人吧”为主题的演讲,从侧面来窥探其对人脸识别方面的技术和进展成果的分享。

1483351728397377.jpg

  以下为演讲实录:

  人脸识别从来不是一个独立领域

  苏剑波:在座有不少人脸识别的专家,尽管我也做了快30年,但今天个人更多的是希望能抛砖引玉,把我的一些成果进行汇报分享。

  我简单把人脸识别分成几个大的领域。人脸识别是模式识别的一个领域,四大识别领域包括人脸识别、语音识别、文字识别、虹膜识别,现在还有指纹、性别、步态、表情、病灶识别。

  凡是和东方文化,特别是中医、书法、围棋这些很相似的东西,我都非常愿意去做,我特别不愿意做天然存在最有解的东西,我就想做能够结合自己的一种个性的东西,或者体现个人自我能力、自我价值的东西去探寻。

  人脸检测是人脸识别的一个基础,原来人脸检测都是依附于人脸识别的,目的就是为了识别,所以人脸识别从来都不是一个独立的领域。

  后来,我通过自己的工作发现,人脸检测本身也是一个独立的研究领域,尽管很多时候是依附于人脸识别的,但是在很多应用下,比如说最简单的拥挤人群的人数统计,包括地铁或者集会,可能并不需要你认识谁是谁,但是需要检测这个场合中究竟有多少人,所以人脸检测慢慢成为了一个独立的领域。

  几何特征识别和统计特征识别

  苏剑波:如果把人脸检测作为人脸识别的附属领域,往往用什么样的特征来检测人脸,就隐含着用这个特征集合去检测人脸,这就造成一些不可预知的困难。

  如果把两者分开,作为两个领域来做,可能检测的时候就自然而然不会用同一套特征来做,就会给人脸识别带来不方便的东西。

  其中,检测的分类器包括boost  learning,这都是比较经典的,主要在不同的分类监测器中检测出人脸来。例如,人脸偏转度、侧面等等,多角度的人脸检测也曾经是人脸检测非常重要的研究方向。

  在检测完之后就是定位,此处说的定位更多是特征定位,我们更多是以几何特征为主,很简单的看看你的眼睛大小、眉毛长短、脸形、鼻子、嘴巴、耳朵,甚至包括有的人脸的长度和宽度比值,或者下巴的角度等等,都属于几何特征。

  实际上,眼在识别人的时候,并不仅仅是靠几何特征来识别的,更多的是靠统计特征识别。例如,大家所熟知的伽玛变换,依靠某种生理上的证据,能够证明人类在做人脸识别的是在做伽玛变换的,大家听起来匪夷所思,但是是有生理依据的。

  识别的核心问题也很简单,就是三大类,包括光照问题、遮挡包括物体遮挡和配饰物,在正常常规的条件下识别人脸,大家都能做。

  但是关键的是,在任何光照下,是否有物体的遮挡,只看到你半边脸或者有戴眼镜、口罩、帽子的情况下,是否也能够顺序识别出来?还有年龄的问题,随着年龄增长,人脸也有变化。

  还有双胞胎,究竟是用什么样的特征来表达,把他们区别看来,也是对人脸识别的挑战。

  特征融合是需要解决的问题

  苏剑波:我们的工作,就是为了寻找对各种变化比较鲁棒(注“健壮或强壮的意思”)的特征算子,给了一些基本的概念,例如光照,有各种各样的直方图均衡、同态滤波、高斯差分,差分以后,图象的变化就不是那样明显。

  还有特征提取,我们希望把这些融合起来做。几何特征可以融合,都是眉毛、眼睛的长度、都是长宽高,比较容易融合。

  而统计特征就是伽玛变换、三间技术等等,这种组合究竟怎么和几何特征进行融合?这也是我们想做的特征融合的事情。但是,不同空间的特征怎么融合,也是我们需要解决的问题。

  这个特征提取更多用在深度学习,如果特征提取得好,对人脸的模式,包括对表情、光照等等的变化有充分的描述度,用这类特征来进行人脸识别肯定是最方便、最简单,并不是说所有的特征中,人脸提取的特征越多越好,因为这样面对的问题就是计算效率会降低,速度也会降低。

  当一个人站在你的门锁前面,希望用人脸识别来开锁,结果识别10分钟也没有打开,你肯定没有耐心进一步把它实用化,而我们最大的问题是希望依靠最好的人物集合,把人和其他人区分开,对其他干扰有足够的鲁棒性,这就是人脸提取的特征问题。

  人脸识别的采集应用

  正交性和轻量化是很重要的表达,这里是基本的采集方法,原来都是平均划分,我们现在用智能划分,特征比较丰富的区域做更多的特征选择,特征不丰富的区域就算了。

  有的解决了问题,例如少样本问题。在和公安部合作的时候,他们说,你们要用这张照片就能够分析出犯人特征,并且犯人在任何光照、场景出现的时候,都能找出这个犯人来;

  还有迁移学习,可能这个犯人是20年前的照片,现在长什么样也不知道;还有3D人脸建模,不同角度、姿态、表情下的人脸识别。

  应用领域大家很清楚,我不强调了,还有相应的各算法、优缺点都有。应用领域、金融领域的人脸识别是重要的领域,这些都是授信体系,要和中国人民银行合作;还有安防领域,我们刚刚和公安部做的安防标准、还有通关等等问题,包括在监狱的应用都受到了他们的认可。我们还在这个基础上做手势引导、人脸识别等等,都有相关的应用了。

  这段话不是我说的,是我在给公安部讲课的时候听他们说,人脸识别技术可以应用于所有需要身份认证的场合,涉及人类生活的各个方面:你的任何行为都可以被掌控。所以,除了做一个好人,还有其他选择吗?

热门文章
  • 日排行
  • 周排行
  • 月排行
欢迎投稿

联系人:郑先生

Email:ly.zheng#gaogong123.com
发送邮件时用@替换#

电 话:0755-26981898-843