快年底了,我工作压力与效率的关系很大,上班效率下降,请问哈尔滨什么地方有心理医生?

本篇文章十分的长大概有2万7千芓左右。

人脸识别(Face Recognition)是一种依据人的面部特征(如统计或几何特征等)自动进行身份识别的一种生物识别技术,又称为面像识别、人像识别、楿貌识别、面孔识别、面部识别等通常我们所说的人脸识别是基于光学人脸图像的身份识别与验证的简称。

人脸识别利用摄像机或摄像頭采集含有人脸的图像或视频流并自动在图像中检测和跟踪人脸,进而对检测到的人脸图像进行一系列的相关应用操作技术上包括图潒采集、特征定位、身份的确认和查找等等。简单来说就是从照片中提取人脸中的特征,比如眉毛高度、嘴角等等再通过特征的对比輸出结果。

2、人脸识别的发展简史:

第一阶段(1950s—1980s)初级阶段:

人脸识别被当作一个一般性的模式识别问题主流技术基于人脸的几何结構特征。这集中体现在人们对于剪影(Profile)的研究上人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。人工神经网络也一喥曾经被研究人员用于人脸识别问题中较早从事 AFR 研究的研究人员除了布莱索(Bledsoe)外还有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。总體而言这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多也基本没有获得实际应用。

第二阶段(1990s)高潮阶段:

 这一阶段盡管时间相对短暂但人脸识别却发展迅速,不但出现了很多经典的方法例如Eigen Face, Fisher Face和弹性图匹配;并出现了若干商业化运作的人脸识别系统,比如最为著名的 Visionics(现为 Identix)的 FaceIt 系统 从技术方案上看, 2D人脸图像线性子空间判别分析、统计表观模型、统计模式识别方法是这一阶段内的主流技术

第三阶段(1990s末~现在)

人脸识别的研究不断深入,研究者开始关注面向真实条件的人脸识别问题主要包括以下四个方面的研究:1)提出不同的人脸空间模型,包括以线性判别分析为代表的线性建模方法以Kernel方法为代表的非线性建模方法和基于3D信息的3D人脸识别方法。2)深入分析和研究影响人脸识别的因素包括光照不变人脸识别、姿态不变人脸识别和表情不变人脸识别等。3)利用新的特征表示包括局部描述子(Gabor Face, LBP Face等)和深度学习方法。4)利用新的数据源例如基于视频的人脸识别和基于素描、近红外图像的人脸识别。

前瞻根据人脸識别行业发展现状;到2016年全球生物识别市场规模在/zizi7/article/details/(人脸识别特征脸算法文档)

贝尔胡米尔(Belhumeur)等提出的 Fisherface 人脸识别方法是这一时期的另┅重要成果。该方法 首先采用主成分分析(PCA)对图像表观特征进行降维在此基础上,采用线性判别分析(LDA)的方法 变换降维后的主成分鉯期获得“尽量大的类间散度和尽量小的类内散度”该方法目前仍然是主流的人脸 识别方法之一,产生了很多不同的变种比如零空间法、子空间判别模型、增强判别模型、直接的LDA 判 别方法以及近期的一些基于核学习的改进策略。

3)EGM(弹性图匹配)

其基本思想是用一个属性图来描述人脸:属性图的顶点代表面部关键特征点其属性为相应特征点处 的多分辨率、多方向局部特征——Gabor变换12特征,称为Jet;边的属性则为不同特征点之间的几何 关系对任意输入人脸图像,弹性图匹配通过一种优化搜索策略来定位预先定义的若干面部关键特征点 同時提取它们的Jet特征,得到输入图像的属性图最后通过计算其与已知人脸属性图的相似度来完成识 别过程。该方法的优点是既保留了面部嘚全局结构特征也对人脸的关键局部特征进行了建模。

4)基于几何特征的方法

几何特征可以是眼、鼻、嘴等的形状和它们之间的几何关系(如相互之间的距离)这些算法识别速 度快,需要的内存小但识别率较低。

5)基于神经网络的方法

神经网络的输入可以是降低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩等这类方法同样需要较多的样本进行训练,而在许多应用中样本数量是很囿限的。

心理学的研究表明人类在识别轮廓图(比如漫画)的速度和准确度上丝毫不比识别灰度图差。LHD是基于从人脸灰度图像中提取出來的线段图的它定义的是两个线段集之间的距离,与众不同的是LHD并不建立不同线段集之间线段的一一对应关系,因此它更能适应线段圖之间的微小变化实验结果表明,LHD在不同光照条件下和不同姿态情况下都有非常出色的表现但是它在大表情的情况下识别效果不好。

7)基于支持向量机(SVM) 的方法

近年来支持向量机是统计模式识别领域的一个新的热点,它试图使得学习机在经验风险和泛化能力上达到一种妥协从而提高学习机的性能。支持向量机主要解决的是一个2分类问题它的基本思想是试图把一个低维的线性不可分的问题转化成一个高维的线性可分的问题。通常的实验结果表明SVM有较好的识别率但是它需要大量的训练样本(每类300个),这在实际应用中往往是不现实的而且支持向量机训练时间长,方法实现复杂该函数的取法没有统一的理论。

1)结合三维信息:二维和三维信息融合使特征更加鲁棒 2)哆特征融合:单一特征难以应对复杂的光照和姿态变化 3)大规模人脸比对:面向海量数据的人脸比对与搜索 4)深度学习:在大数据条件下充分发挥深度神经网络强大的学习能力

1)Yale人脸数据库

8)JAFE表情数据库

10)MMI表情数据库

1)人脸检测中的关键指标:

例子:在摄像头某张抓拍图像Φ一共有100张人脸,算法检测出80张人脸其中75张是真实人脸,5 张是把路标误识为人脸

1、检测率:识别正确的人脸/图中所有的人脸。检测率越高代表检测模型效果越好。

2、误检率:识别错误的人脸/识别出来的人脸误检率越低,代表检测模型效果越好

3、漏检率:未识别絀来的人脸/图中所有的人脸。漏检率越低代表检测模型效果越好。

4、速度:从采集图像完成到人脸检测完成的时间时间约短,检测模型效果越好

2)人脸识别中的关键指标:

1000张样本图片里,共600张正样本相似度为

(3) 微软:2012年6月 微软亚洲研究院发布人脸检测算法,面部識别系统

(4)网易:2012年5月网易人脸识别系统全国公测,用于邮箱登陆

(5)百度:2012年12月 百度推出人脸识别基于图像的全网人脸搜索

(6)阿里:2015年11月,在推出支付宝刷脸认证付款

(7)腾讯:2012年下半年成立优图项目组

五、人脸识别(FR)的产品落地

1、FR技术产品的优势

人脸图像嘚采集不同于指纹、掌纹需要接触指掌纹专用采集设备,指掌纹的采集除了对设备有一定的磨损外也不卫生,容易引起被采集者的反感而人脸图像采集的设备是摄像头,无须接触

人脸照片的采集可使用摄像头自动拍照,无须工作人员干预也无须被采集者配合,只需鉯正常状态经过摄像头前即可

人脸是一个人出生之后暴露在外的生物特征,因此它的隐私性并不像指掌纹、虹膜那样强因此人脸的采集并不像指掌纹采集那样难以让人接受。

我们判断一个人是谁通过看这个人的脸就是最直观的方式,不像指掌纹、虹膜等需要相关领域專家才可以判别

从摄像头监控区域进行人脸的采集是非常快速的,因为它的非干预性和非接触性让人脸采集的时间大大缩短。

人脸采集前端设备——摄像头随处可见它不是专用设备,因此简单易操作

它的采集端完全可以采用现有视频监控系统的摄像设备,后端应用嘚扩展性决定了人脸识别可以应用在出入控制、黑名单监控、人脸照片搜索等多领域

1)人脸确认(1:1):

将某人面像与指定人员面像进行┅对一的比对,根据其相似程度来判断二者是否是同一人相似 程度一般以能否超过某一量化阀值为依据。简单的说就是A/B两张照片比对產生的计算数值是否达到要求。

快速的人脸识别比对移动支付认证、安全性身份核对、作为身份确认的一种新方式,比如考生身份确认、公司考勤确认、各种证件照和本人确认

产品在系统设计的逻辑上,需要先考虑调取已储存对象信息的先验条件通过界面/语音的提示,使得待认证者预先知道自己正处于被核对的过程中且已预先了解拟核对对象的身份。

(4)比对来源的三种主要方式:

1. 用户自传照片仳如支付宝的人脸比对,用户自传的照片最大的问题是照片质量的合格率太低拍照的光线、角度等因素会导致采集源的质量下降,不利於后期的大批量人脸特征码管理

2. 使用身份证读卡器,读取身份证上的照片遗憾的是这张照片2K的大小,不过也是目前用最多的源照片提取方式比较适合签到场合。

3. 使用公安部旗下NCIIC的人脸比对接口(注意不是网纹照片接口,这个接口已经不对外)使用的是直接的人脸仳对接口。

2)人脸辨认(1:N):

将某人面像与数据库中的多人的人脸进行比对并根据比对结果来鉴定此人身份,或找到其中最相似的人脸并按相似程度的大小输出检索结果。

人脸开门、人脸检索排查犯罪嫌疑人、失踪人口的全库搜寻、一人多证的重复排查等。

1、走失儿童的项目中去: 这一类系统的部署需要两个条件:A. BCD基本库(比如1000万人) B.强大的算法硬件

2、零售店中的刷脸支付长江需要用户预先输入全掱机号,确定用户身份再进行人脸识别将原本为1:N的问题转化为了1:1的问题。

1、1:N中的N能够支持多大

从一个班级百号人刷脸签到到一个公司芉号人的刷脸打卡,再到一个学校的几万人一个四线城市几十 万人,一个一线城市的几千万人难度是呈指数上升的。

目前各家公司的荿熟人脸识别应用能够支持几万到几百万人不等的应用场景而且还有一个错误率的概念。比如公司宣称千万分之一的错误率的情况下(1/),人脸通过率其实只有93%这是因为很难做到一定不发生错误,而且每个人都能识别通过(假如一家公司说自己能做到亿分之一的错誤率,通过率能做到98%以上多半是虚假宣传,在实际使用中是很难达到的)

在配合场景下:比如ATM机刷脸取款用户会自主配合,将人脸以┅个理想的角度通过识别

而在非配合应用场景下,比如监控视频下的人脸识别追踪违法犯罪分子的身份信息,情况就要困难得多这種情况下,用户脸部会发生角度偏大遮挡,光线不可控等问题

3、跨人种,跨年龄识别问题

研究发现在一个数据集上训练好的模型,想到迁移到另外一个人种上效果会出现较大程度的下降。另 外人脸随着年龄的变化带来的改变也给人脸识别带来不小的挑战。

要改善這样的问题一个必要条件是需要建立一个足够完备的跨人种,跨年龄的人脸数据库;在国内的话是 以汉族人为主,同时跨年龄的人脸數据库也比较难收集需要不短的时间跨度。

① 近来备受关注的刷脸支付很多时候都会要求用户输入全手机号,或手机号后四位以缩尛用户搜索库大 小,实际上这是比较影响体验的

② 西安一高校晨读刷脸签到,由于系统实际响应匹配时间过长导致学生排百米长队。

3)多人脸检索(N:N):

1:N同时作业就是N:N了同时相应多张照片检索需求。

(2)实际产品问题中:

1、在视频级N:N的校验中如果要提高通过率,佷多时候是采取降低准确率的方式降低算法队列数量;同样在一些比赛中为了降低误识率,大大提高了准确率所以算法在校验的过程Φ必须遵循至少一个固定标准,追求的是速度效率还是最高准确率

2、视频流的帧处理所用,对服务器的计算环境要求严苛目前的算法系统所支撑的输出率非常有限。

海量的人脸照片解析需要大量运算(目前很少看到在采集端直接解析的都是照片剪裁)海量的人脸照片傳输需要大量的带宽(常见的720布控摄像头抓取最小的人脸照片为20K)海量的人脸照片在后台检索需要耗费大量的运算(国内主流主机为例,朂多到24路摄像头

3、产品实战中的物理问题:

光照问题是机器视觉重的老问题在人脸识别中的表现尤为明显。由于人脸的3D结构光照投射絀的阴影,会加强或减弱原有的人脸特征

A、对其进行包括光照强度和方向、人脸反射属性的量化,面部阴影和照度分析等尝试建立数學模型,以利用这些光照模型在人脸图像预处理或者归一化阶段尽可能的补偿乃至消除其对识别性能的影响,将固有的人脸属性(反射率属性、3D表面形状属性)和光源、遮挡及高光等非人脸固有属性分离开来

B、基于光照子空间模型的任意光照图像生成算法,用于生成多個不同光照条件的训练样本然后利用具有良好的学习能力的人脸识别算法,如子空间法SVM等方法进行识别。

与光照问题类似姿态问题吔是目前人脸识别研究中需要解决的一个技术难点。姿态问题涉及头部在三维垂直坐标系中绕三个轴的旋转造成的面部变化其中垂直于圖像平面的两个方向的深度旋转会造成面部信息的部分缺失。针对姿态的研究相对比较的少目前多数的人脸识别算法主要针列正面、准囸而人脸图像,当发生俯仰或者左右侧而比较厉害的情况下人脸识别算法的识别率也将会急剧下降。面部幅度较大的哭、笑、愤怒等表凊变化同样影像着面部识别的准确率(2)解决思路:

是学习并记忆多种姿态特征,这对于多姿态人脸数据可以容易获取的情况比较实用其优点是算法与正面人脸识别统一,不需要额外的技术支持其缺点是存储需求大,姿态泛化能力不能确定不能用于基于单张照片的囚脸识别算法中等。

是基于单张视图生成多角度视图可以在只能获取用户单张照片的情况下合成该用户的多个学习样本,可以解决训练樣本较少的情况下的多姿态人脸识别问题从而改善识别性能。

是基于姿态不变特征的方法即寻求那些不随姿态的变化而变化的特征。Φ科院计算所的思路是采用基于统计的视觉模型将输入姿态图像校正为正面图像,从而可以在统一的姿态空间内作特征的提取和匹配

對于非配合情况下的人脸图像采集,遮挡问题是一个非常严重的问题特别是在监控环境下,往往彼监控对象都会带着眼镜帽子等饰物,使得被采集出来的人脸图像有可能不完整从而影响了后面的特征提取与识别,甚至会导致人脸检测算法的失效

随着年龄的变化,面蔀外观也在变化特别是对于青少年,这种变化更加的明显对于不同的年龄段,人脸识别算法的识别率也不同一个人从少年变成青年,变成老年他的容貌可能会发生比较大的变化,从而导致识别率的下降对于不同的年龄段,人脸识别算法的识别率也不同

不同个体の间的区别不大,所有的人脸的结构都相似甚至人脸器官的结构外形都很相似。这样的特点对于利用人脸进行定位是有利的但是对于利用人脸区分人类个体是不利的

人脸图像的来源可能多种多样,由于采集设备的不同得到的人脸图像质量也不一样,特别是对于那些低汾辨率、噪声大、质量差的人脸图像(如手机摄像头拍摄的人脸图片、远程监控拍摄的图片等)如何进行有效地人脸识别是个需要关注的问题同样的,对于高分辨图像对人脸识别算法的影响也需要进一步的研究

基于统计学习的人脸识别算法是目前人脸识别领域中的主流算法,但是统计学习方法需要大量的训练由于人脸图像在高维空间中的分布是一个不规则的流形分布,能得到的样本只是对人脸图像空间中嘚一个极小部分的采样如何解决小样本下的统计学习问题有待进一步的研究。

传统人脸识别方法如PCA、LDA等在小规模数据中可以很容易进行訓练学习但是对于海量数据,这些方法其训练过程难以进行甚至有可能崩溃。

随着人脸数据库规模的增长人脸算法的性能将呈现下降

非配合性人脸识别的情况下,运动导致面部图像模糊或摄像头对焦不正确都会严重影响面部识别的成功率在地铁、高速公路卡口、车站卡口、超市反扒、边检等安保和监控识别的使用中,这种困难明显突出;

伪造人脸图像进行识别的主流欺骗手段是建立一个三维模型戓者是一些表情的嫁接。随着人脸防伪技术的完善、3D面部识别技术、摄像头等智能计算视觉技术的引入伪造面部图像进行识别的成功率會大大降低。

需要的网络识别和系统的计算机识别可能会造成视频的丢帧和丢脸现象特别是监控人流量大的区域,由于网络传输的带宽問题和计算能力问题常常引起丢帧和丢脸问题。

13)摄像机的头像问题

摄像机很多技术参数影响视频图像的质量这些因素有感光器(CCD、CMOS)、感光器的大小、DSP的处理速度、内置图像处理芯片和镜头等,同时摄像机内置的一些设置参数也将影响质量如曝光时间、光圈、动态皛平衡等参数。

(1)一般来说数据标注部分可以有三个角色

1. 标注员:标注员负责标记数据。

2. 审核员:审核员负责审核被标记数据的质量

3. 管理员:管理人员、发放任务、统计工资。

只有在数据被审核员审核通过后这批数据才能够被算法同事利用。

1. 任务分配:假设标注员烸次标记的数据为一次任务则每次任务可由管理员分批发放记录,也可将整个流程做成“抢单式”的由后台直接分发。

2. 标记程序设计:需要考虑到如何提升效率比如快捷键的设置、边标记及边存等等功能都有利于提高标记效率。

3. 进度跟踪:程序对标注员、审核员的工莋分别进行跟踪可利用“规定截止日期”的方式淘汰怠惰的人。

4. 质量跟踪:通过计算标注人员的标注正确率和被审核通过率对人员标紸质量进行跟踪,可利用“末位淘汰”制提高标注人员质量

数据标记完成后,交由算法同学进行模型的训练期间发现的问题可与产品┅起商讨。训练过程中最好能可视化一些中间结果。一来可以检测代码实现是否有Bug二来也可以通过这些中间结果,来帮助自己更好的悝解这个算法的过程

测试同事(一般来说算法同事也会直接负责模型测试)将未被训练过的数据在新的模型下做测试。

如果没有后台设計测试结果只能由人工抽样计算,抽样计算繁琐且效率较低模型的效果,需要在精确率(识别为正确的样本数/识别出来的样本数)和召回率(识别为正确的样本数/所有样本中正确的数)中达到某一个平衡

测试同事需要关注特定领域内每个类别的指标,比如针对识别人臉的表情里面有喜怒哀乐等分类,每一个分类对应的指标都是不一样的测试同事需要将测试的结果完善地反馈给算法同事,算法同事財能找准模型效果欠缺的原因同时,测试同事将本次模型的指标结果反馈给产品由产品评估是否满足上线需求。

(2)测试集和测试需求说明(比如“图片包含人脸大小应超过96*96像素测试结果达到XX程度满足需求)

1. 经典人脸身份识别测试集LFW,共包含13233 张图片 5749 种不同身份;世界記录99.7%

2. CK+ (一个人脸表情数据集),包含固定表情和自发表情包含123个人的593个表情序列。每个序列的目标表情被FACS编码同时添加了已验证的凊感标签(生气、厌恶、害怕、快乐、悲伤、惊讶)。

(3)需要说明“有效距离左右角度,上下角度速度”等参数值(范围)

注:这囷“部署的灵活性”相关——由于不同客户不同场景的需求不同,所以技术方的人脸检测模块一般可以通过调整参数得到N种亚型,以适應不同应用场景(光照、角度、有效距离、速度) 下对运算量和有效检测距离的需求

(4)测试结果——欠拟合

1、定义:模型没有很好地捕捉箌数据特征,不能够很好地拟合数据

左图表示size与prize关系的数据中间的图就是出现欠拟合的模型,不能够很好地拟合数据如果在中间的图嘚模型后面再加一个二次项,就可以很好地拟合图中的数据了如右面的图所示。

1)添加其他特征项有时候我们模型出现欠拟合的时候昰因为特征项不够导致的,可以添加其他特征项来很好地解决例如,“组合”、“泛化”、“相关性”三类特征是特征添加的重要手段无论在什么场景,都可以照葫芦画瓢总会得到意想不到的效果。

2)添加多项式特征这个在机器学习算法里面用的很普遍,例如将线性模型通过添加二次项或者三次项使模型泛化能力更强例如上面的图片的例子。

3)减少正则化参数正则化的目的是用来防止过拟合的,但是现在模型出现了欠拟合则需要减少正则化参数。

4)尝试非线性模型比如核SVM 、决策树、DNN等模型。

(5)测试结果——过拟合

1、定义:模型把数据学习的太彻底以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据即不能正确嘚分类,模型泛化能力太差例如下面的例子。

上面左图表示size和prize的关系我们学习到的模型曲线如右图所示,虽然在训练的时候模型可以佷好地匹配数据但是很显然过度扭曲了曲线,不是真实的size与prize曲线

1)重新清洗数据,导致过拟合的一个原因也有可能是数据不纯导致的噪音太多影响到模型效果,如果出现了过拟合就需要我们重新清洗数据

2)增大数据的训练量,还有一个原因就是我们用于训练的数据量太小导致的训练数据占总数据的比例过小。

1)交叉检验通过交叉检验得到较优的模型参数;

2)特征选择,减少特征数或使用较少的特征组合对于按区间离散化的特征,增大划分的区间;

3)正则化常用的有 L1、L2 正则。而且 L1正则还可以自动进行特征选择;

4)如果有正则项则可鉯考虑增大正则项参数 lambda;

5)增加训练数据可以有限的避免过拟合;

6)Bagging ,将多个弱学习器Bagging 一下效果会好很多比如随机森林等.

5)标注流程中遇到的問题

(1)项目过程中的不确定性:

一般情况下,只要数据标注的规范清晰对规则的界定从一而终,标注工作的流程还是比较简单的

数據标注规范可能会在测试后根据结果情况进行调整,那么规则修改前后“数据标注的一致性”就出现了问题,会导致多次返工在时间囷人工成本上颇有影响。

1)如是分类性质的解析工作建议标注规则先从非常肯定的非黑即白开始;规则设定由简到繁,带有疑虑数据再叧外作记号随着规则一步步深入,可能会出现交叉影响此时就需要放弃一些低频问题的规则,余下的未标注的数据就根据新的规则标紸

2)如是多类规则同时进行的标注工作,需要把每类规则定得足够细致

1、如询问机器人会干什么的语料中出现,“你说你会干什么”可以理解为询问,也可能是嫌弃这两类应对的策略不同,有歧义所以不能把它归纳如询问类,需要把它从训练集里剔除

2、如人脸凊绪识别中,一个人在流眼泪有时可以理解为伤心落泪,有时可以理解为喜极而泣还有时可以理解为激动落泪,甚至是感动落泪等所以在看到此类照片时,不能简单的凭借惯性化思维将其归纳到悲伤一类中当人眼都很难判别清楚时,需要把它从训练集里剔除

1)某領域的人脸识别监测与身份确认

光照影响:过暗或过亮等非正常光照环境,会对模型的效果产生很大干扰在解决光照影响这个问题上,鈳以通过两种方式:

A. 在用户可以更换环境的前提下(比如银行刷脸取钱等)可语音/界面提示用户目前环境不理想(头歪、头发、眼镜等),建议进行正确的正脸取照

B. 在用户不能控制更换环境的情况下(比如人脸识别、车辆识别等摄像头固定的场景),只能通过调试硬件設施弥补这个问题

C. 晚上:由于摄像头在晚上会自动切换到黑夜场景(从图片上看就是从彩色切换为黑白),因此在晚上强光下(例如路燈照射)人脸就会过曝这时,我们可以通过强制设置摄像头环境为白天(图像为彩色)来避免而过暗的情况,从节省成本角度看可鉯在摄像头旁边增加一个光线发散、功率不高的灯来弥补。当然这两个问题也可以通过购买高质量的摄像头解决但这样做也意味着更高嘚成本。

D. 白天:白天也会出现光线过亮的情况这种情况可以考虑用滤光片等等。

用算法将图片进行处理可以将图片恢复得让人眼看清嘚程度。

2)某款人脸年龄识别产品

一款识别人脸年龄的产品对女性某个年龄阶段(25—35)的判断误差较大,经过发现是因为该年龄阶段囿以下特点:

A. 女性在这个年龄阶段面貌变化不是很大,有时人眼给出的判断误差都很离谱

B. 在这个年龄层次的女性注重打扮,化妆品很大程度上掩盖了其真实年龄有时30多的跟20岁没多大差别;C. 精装打扮的和素颜的差别不是很大。

1. 补充数据:针对该年龄层次的人脸图片数据做補充不仅补充正例(“XXX”应为多少岁),还应补充负例(“XXX”不应为多少岁)

2. 优化数据:修改大批以往的错误标注。

3. 数据总结:对化妝和不化妆的人脸图片进行分析以便调整算法参数。

1. 自拍:如女性群体一般都希望自拍时年龄的判别在心里预期中能越小越好,当在囷一群人自拍中可以适当的将主人公的年龄判别结果调低至达到用户心理满足感此时可适当降低算法的参照度。

2. 婚恋交友:在婚恋网站茭友过程中双方都希望知道彼此的真实年龄信息,此时运用人脸年龄识别可以分析双方的年龄、皮肤等物理信息为彼此提供参考此时嘚信息就不能以达到心理满足感为主了,应当追求准确度

(1)无法定位出人脸:

在背景出现多人或宠物时,相机有时并未能精确定位出目标用户而定位到背景图片中的人、宠物、身旁的其他人;有时屏幕一片漆黑;有时显示未检测出人脸。

界面提醒用户远离复杂背景戓美颜时最好屏幕中只出现一人,或给出方框图让用户自己手动选择主要定位区域进行AR美颜;屏幕一片漆黑时可提醒用户是否是光线太暗或是摄像头被障碍物遮挡等;

可对人脸关键点进行定位,计算目标用户与摄像头的距离或计算人脸在频幕的区域占比来确定目标用户(┅般几何距离近的、频幕区域占比较大的为美颜目标)结合活体检测来排除背景图片人物的干扰等。

光线太暗、运动、对焦等造成模糊(摄像头距离因素造成图像低频存在,高频流失等)

可提醒用户在光线较温和的区域进行美颜操作;或是擦除前置摄像头的障碍物;或攵字提示动作太快;或是更换高清前置摄像头;或提示对焦失败给与对焦框图让用户手动对焦等。

在美颜前可在后台中调取手机亮度调節功能用算法调节光线的亮暗程度以适应美颜所需的物理条件;用算法设法补齐高频部分从,而减少对照片的干扰

(3)人脸关键动作抓捕太慢:

在进行AR美颜搞怪时(如张嘴动作,屏幕出现音符、唾沫星子等)对动作抓捕太慢(半天才抓捕到张嘴动作)

文字提示不支持赽速移动或提示缓慢移动(如,亲!您的动作太快了奴家还未反应过来等)

人脸姿态估计、关键点定位来捕捉人脸动作。

(4)关键位置添加虚拟物品失败(如在嘴上叼烟、耳朵吊耳环、眼镜戴墨镜、脸显红晕)

文字/图片提醒用户摆正人脸位置

可利用算法对人脸关键区域進行分割并定位,来达到人脸精准定位添加虚拟物品

4)人脸开门和人脸检索

(1)人脸开门等跨网方案需要关注的因素

远程算法更新必然会慥成本地局域网功能暂时性无法使用因此远程算法更新的频率、时间、更新效果都需要产品在更新前精确评估。

2、增删改人脸数据与本哋数据的同步:

本地局域网和互联网是无法直接交互的因此用户在互联网一旦对人脸数据库进行增删改的操作,下发程序的稳定性和及時性都需要重点关注

本地存储空间的大小和GPU直接影响到本地识别的速度。服务器的稳定性影响到功能地正常使用

断电等外置情况意外凊况发生又被处理完善后,程序能自动恢复正常

(2)人脸检索等某一局域网方案需要关注的因素

除了算法识别需要消耗一定时间外,该局域网下的网速会影响到识别结果输出的速度

通过检索结果关联结构化数据。

在界面设置阈值功能从产品层面输入阈值后,改变相对應的结果输出

根据相似度排序或结构化数据排序内容地抉择

5)旷视科技官网产品体验(多图预警)

(1)年龄略有差距,自我估计+-5性别基本无误,头部状态略有误差人种误差在30-40%(样本量10,白种人和黄种人误差明显)情绪基本无误,眼镜种类识别有误差(商品识别的范疇)强光状态下表现不佳。

(2)逻辑错误:左眼(睁眼、普通眼镜)、右眼(墨镜);相似度大(下图为张一山和夏雨)的较难区分(雙胞胎估计很难区分)

(3)远距离检测较难:左图检测出一张右图检测出两张(估计10米开外检测不到)

(4)能够识别蜡像、海报等非真囚场景,因此在一些场合可欺骗摄像头如在金融领域里的身份识别,海关检查等关键性应用中将会有风险。

(5)佩戴的口罩无法检测絀人脸

(6)公司体验对比结果

 6、项目虚拟实战(以AR美颜APP为例过程为理论经验推理所得,自己并未实习)

人脸检测系统下有很多FR相关的應用,比如人脸属性识别(年龄、表情、性别、种族等)、人脸美颜/美妆、人脸聚类等等我们从AR美颜/美妆这一个例子着手,探索项目的具体流程

现在大多数美颜相机拍照后,都只有添加各种滤镜、加几个字、变白一点早已经不能满足广大女性群体对于美颜的需求;加仩如今年轻女性和男性的审美标准和猎奇心理都在发生改变,社交方式的趣味性也变得不同比如原来大家可能在空间、朋友圈、直播上看到美女帅哥都会觉得很吸睛,点赞粉丝直奔而来但随着快手和抖音的出现,可以发现不仅仅是俊男靓女的照片和视频能引起围观同樣的各种普通群众的搞怪合成视频或合成照片(虚拟的AR特效带来的各种浮夸造型)同样能吸引无数粉丝的追捧,让普通人也能享受被人膜拜的满足感而这些都需要用到人脸识别的相关技术。

(2)目标用户画像分析:

1、了解目标用户的主流群体:

学生(大学生、高中生、初Φ生)群体对月美颜美妆的心理需求、时尚人士的美妆需求、长相普通的人和长相突出的人对于美颜的心理需求等

2、了解用户的年龄组荿、地域分布对应美妆的特点。

3、不同收入群体(白领、金领、蓝领等)的美颜美妆需求关注点

(3)市场分析:美颜美妆的市场规模,產业链潜在的边际效应利益等。

详细的分析目前的用户需求针对不同群体,设计不同的产品解决方案包括市场的需求文档。

前期的囚脸图片收集、分发、标注总结文档(确定什么样的图片能要什么样的不能要),各种脸型(长的、宽的、圆的、前额凸出的、眼睛深陷的等等)的分类多少人完成眼睛美颜图片的分类等。

1、场景落地文档:如听歌时头上戴虚拟耳机叹气时嘴上叼烟,说话时唾沫星子等针对不同的人脸姿态场景研究可能的落地产品形式

2、产品的设计文档:如美颜APP的页面交互设计、导航设计、视觉呈现设计等;直播APP中嘚弹幕呈现设计、点赞分享按钮设计等。

3、产品开发流程文档:如PM先提交需求、可行性分析、立项、设计流程、开发流程算法搭建、模型训练、测试训练等一系列流程的步骤及跟进。

4、模型训练及测试文档:数据标注好后喂给算法,搭建人脸识别美颜的模型框架如前期用成千上万的照片训练机器的人脸关键点定位,让机器找准鼻子、眼睛、耳朵、嘴等位置等

(1)数据图片的采集:

在文档的指引下,從公开网站上爬取收集符合模型训练的人脸图片、或是运用公司的数据图片等

(2)数据图片的标注:

在标注规范文档的指引下,将图片汾发给标注团队进行数据的标注对一些模棱两可的图片,如图片中的人脸较模糊此时该照片是要还是不要,期间应与算法同事保持沟通有时暗的图片在算法的优化中能准确识别,这样增加实际情况的容错率(实际中较暗的人脸图像也能定位出关键部位)那么这张图爿则视为有效数据;有时较暗的图片经过算法之后并不能达到要求(及无法定位出人脸关键点),此时这照片则视为无效数据直接剔除;但是标注团队并不知道这张图片是有效还是无效,所以标注过程中算法同事也需间接参与进来。

在部分图片标注过程后交于算法同倳训练模型调节参数,期间将测试后的数据(精确率和召回率的计算来反映数据的标注结果)反馈给还在标注的人员,有时可能造成过擬合有时可能造成欠拟合等方便对数据进行重新操作

(1)产品立项后,每天的任务管理流程进度跟踪,产出时间管理开会反馈工作荿果等。

(2)软硬件端:在开发流程文档的指引下按照常规的软硬件跟踪开发。

人脸采集、人脸检测、图像的预处理(模糊的则用算法詓模糊等)、人脸特征提取、图像的匹配识别、AR虚拟等

3、算法与平台后台测试

4、模型识别时间、准确率、召回率测试

7、其他平台、硬件產品常规测试

6)项目优化:经过各种测试之后,针对反馈回来的数据进行产品的优化

如一张嘴就给你来根烟结果烟插到鼻子上了,这就奣显是没有定位到人脸关键点是数据的原因还是算法的原因,这些都要经过优化处理;经过种子用户测试后反馈得知这个点赞按钮操莋起来有点别扭,应该怎样怎样这时可能要与设计的同学讨论一下,该怎样优化产品的设计和体验

产品按照流程功能进行验收后上线。

(1)实验室效果和现实效果对比差距巨大

现如今的人脸识别技术在金融、安防等领域的应用实际上的效果要比实验室里的差很多,前陣子西安的某高校引入人脸识别晨读打卡由于反应速度太慢,到中午还排着很长的队可见实际生活中,由于各种物理因素(光照、角喥、对焦、人鱼摄像头的距离等)导致抓拍的图片质量比较差又经过网络传输到局域网/互联网进行对比(网络差的过程中,反应很慢)使得实际效果大打折扣。大多数情况下实际抓拍图像质量远低于训练图像质量。

(2)训练时的标准和实际应用的标准

大多数情况下實际应用的标准会远高于训练标准。例如人脸识别实验室的标准是通过正脸数据训练出模型,能识别正确人脸就可以而实际情况可能沒有正脸数据,对训练提出了更高的要求

(3)训练效果和现实效果

大多数情况下,实际效果会远低于训练效果现在市面上CV公司都是说洎己的训练效果在99%以上(无限接近于100%),但这不等于实际应用的效果就是99%工业上场景复杂的人脸应用(类似识别黑名单这种1:N的人脸比对)正确率在90%以上就已经是表现得很好的算法模型。

2)未来发展趋势的思考:

随着人工智能的火热和发展在全球信息化、云计算、大数据嘚背景下,生物识别技术的应用面会越来越大由以人脸识别为其中代表。以下几个发展趋势呈现:

人脸识别解决了日常生活中一个基本嘚身份识别问题今后,这总身份认证的结果会越来越多的和各行各业应用结合起来并通过互联网和物联网得以信息共享,简单来说就昰“身份识别+物联网”的发展趋势未来将十分普遍

(2)多生物识别模式融合趋势

人脸识别技术现如今的还达不到人类的预期体验,对于┅些安全性要求高的特殊行业应用如金融行业,人脸识别很容易被不法分子攻破漏洞进行身份造假因此需要多种生物特征识别技术的融合应用(如活体检测、虹膜识别等)以进一步提高身份识别的整体安全性。

未来的云技术也将大大给人脸识别的应用提供数据和计算力支持基于云技术的门禁控制可以同时管理成百上千的通道,加上物联网的普及用户对任何地方的门禁进行远程控制和管理,准确识别夲人将广泛应用到企业、学校、培训机构、大型商业场合、办公大楼的门禁解决方案。

1、现如今的人脸识别技术服务商都以将技术接叺第三方应用软件,或是搭载在智能终端上通过收取一定技术服务费来获取盈利。目前国内的第一梯队创业公司都在技术和数据上沉淀而是否盈利,盈利多少都还尚不明确

2、如在金融领域,人脸识别用于身份确认然而身份确认之后,就没你什么事你跟用户的关系呮在于,打开某款APP或某个终端场景(闸机)的钥匙打开之后,用户的所有行为都沉浸在APP中并没有给FR技术服务商带来其他的使用数据及鼡户行为信息;从根本上来看,用户只是用钥匙开了门而往往是门里面的东西(用户数据)才能带来商业价值。

(2)对比互联网和移动互联网

1、互联网时代早期有很多功能性的产品如早年间的QQ只有聊天的功能;360用户只是用它来给电脑杀杀毒;百度就是个即问即答的老师;搜狐、新浪也就是用来看看新闻而已。

2、移动互联网时代也有很多这样的产品滴滴帮用户叫个车;高德也就差不多是古代的指南针。

3、案例分析:众所周知上面举的例子不是互联网时代的高市值企业,就是移动互联网时代高融资率的企业

1)QQ后来用户数越来越多,QQ号荿网络身份的一个必不可少的身份属性之一用户大量的数据沉淀在其中,通过用户的使用行为信息小马哥知道了这么多人都用我的QQ,那赶紧搞个什么娱乐活动让有QQ号的人都来玩,于是就有了庞大的游戏帝国产业游戏里面又加上各种钻(什么粉钻、绿钻、紫钻、黑钻)对应的各种会员机制,QQ号又以其他的方式来获取用户的行为信息如QQ音乐(下歌要钱、换皮肤要钱)、腾讯视频(各种广告收入、会员充钱等)、QQ邮箱(会员高级功能)等,让人们越加沉浸在QQ帝国的生态圈中莫名其妙的就被吸走了很多钱。可能你会说我还可以用其他的吖但是好烦啊,这个也要注册那个也要注册,明明一个QQ号可以玩转所有没办法我就是这么懒,所以说懒人创造了这个世界的绝大多數科技产品

2)滴滴现如今估值几百亿美刀,投资人为何给一个只帮你叫车的公司如此高的估值我们知道滴滴打车比一般的直接叫车要便宜一点点(专车除外),那它的盈利点从而来投资人有看中了它的哪一点。其实不难理解滴滴之所以有如今的估值,正因为其几乎壟断了国内的打车市场大量的用户使用它,必然就会有用户的使用数据而这些数据便是变现的好东西,一旦整个生态搭建完毕未来滴滴就将这些数据用无人驾驶方面,一旦抢占了市场的制高点未来在行业链上就有绝对的议价能力。比如现在人们已经习惯了去一个陌苼地方就来一个滴滴打车,若滴滴突然涨价一公里涨几毛或一元,你用它还是不用;心理学表明人养成一个习惯之后,就会有惯性对于没有超出心理承受预期的东西(不是涨价涨得特别离谱),人们会一直保持这个习惯中的一些行为而不愿做出改变(也就是常说嘚人有一种惰性)。因此我想大多数人都会去接受因为可能你花时间自己打车也是需要很多成本的;用户基数比较大,那这个涨了几毛嘚就会带来不少的盈利空间(中国十几亿人口一人给我一毛钱,我都能成为亿万富翁了但对别人而言,一毛钱可能连袋辣条都买不到)这还只是一方面。

4、人脸识别作为一种技术并没有实际的产品承载点。以上分析中的种种产品你都能叫出来名字,是因为这些功能或是技术都有一个实际的产品承载点比如QQ用了即时通讯技术,头条背后的智能推荐用了机器学习相关技术但在我们心目中它不是以┅种技术停留在我们的心智空间里,它是一款实实在在的产品我们可以操作它,使用它无论是QQ还是滴滴、高德、今热头条、新浪等等,这些产品我们都能实实在在的接触到并且后续行为都在这个技术的承载点里(如即时通讯技术的产品承载点是QQ,机器学习技术的产品承载点是头条)那么用户的数据自然也就在产品承载点之中,这样我们才能应用数据来创造价值从而实现盈利。

5、人脸识别目前的阶段停留在大众视野里只是一种技术人们的潜意识里并没有建立起一个概念,那就是这个人脸识别到底是个什么东西我能操作它吗?它能给我带来什么呢而一旦人脸识别有一个产品承载点,让用户能实实在在的进行操作并有数据积累,才会有盈利的可能而人脸识别嘚产品承载点是什么,目前还都没有出现未来肯定会有,这也是未来的一大机会无论是什么,这个产品必然都能被用户实实在在的接觸到并且后续也都将在其中产生行为,后者是必要条件

一旦前面提到的产品承载点出现,FR技术必将大行其道随之而来的可能是信息咹全问题。

物联网时代之下万物互联,万物智能FR技术也必将融入到物联网之中,人们可能都不需要身份类的实物证件回家开门扫脸,外出开车门扫脸进公司扫脸,出去吃饭付钱扫脸当人脸成为你的虚拟证件时,一旦又不法公司、团体、个人泄露或是破解了你的人臉虚拟证件那么你的一切信息可能都暴露在他人面前,财产、房子、车子可能都有风险还有可能因为丢失人脸证件,将无法证明你自巳的身份就像你丢了身份证一样。可想而知信息安全的重要性未来估计会诞生一个虚拟身份信息系统,里面有每一个人的身份信息當第三方需要身份认证时,可接入系统等前阵子脸书因为社交信息泄露而惹上众怒引起公关麻烦。我想未来如果有一个公司专门负责用戶信息数据的监管我也不会觉得很奇怪的。

无论FR技术最终是以硬件还是软件方式出现在用户面前前提是用户能够实际的接触到,而不昰仿佛在云端不可触摸只有用户接触了,才能在心里产生出它是一款产品而不是一项技术的概念。如AR美颜就是实实在在可操作的产品

(2)连续使用性(高频性):

产品必须是用户能连续使用的,也就是所谓的高频性只有这样才能产生可利用的信息数据来变现。

产品偠能以一种功能的方式为用户解决生活中的某一类问题人脸除了身份认证(金融行业、安防门禁)、视觉欣赏(美颜美妆、整容)、社茭评判依据(婚恋网站)还能用来干什么呢?

结合互联网时代的发展我个人始终认为一款产品只有围绕用户提供服务,才有可能成就明煋产品从历史的角度来看,每一个王朝的兴衰更替都是以老百姓的意愿为转移有道是“水能载舟亦能覆舟”。产品亦是如此产品概念诞生到现在,每一款产品的兴衰也都是建立在用户的基础之上任何一款产品抛开用户之后都只能死亡,尽管目前FR大层面上应用在B端泹是未来成功的FR应用产品必然是诞生在C端。

 下面附上总结这篇系列文章的思路导图:

 下面是参考文档链接

我是护士上夜班上的植物神经紊乱了,现在又心理抑郁了我这种情况跟医院有关系吗医院有关系吗?

详细描述(遇到的问题、发生经过、想要得到怎样的帮助):

我昰护士上夜班上的植物神经紊乱了,现在又心理抑郁了请问我这种情况跟医院有关系吗,上班十年从未出现过这种情况

医学心理学(试题):情续\情感囷工作效率的关系是什么这是简答题,能否详细点多谢!... 医学心理学(试题):情续\情感和工作效率的关系是什么?
这是简答题能否详细点?多谢!

可选中1个或多个下面的关键词搜索相关资料。也可直接点“搜索资料”搜索整个问题

提示该问题下回答为网友贡献,仅供参考

你对这个回答的评价是?

我想你的情绪、情感是指动机强度动机强度与活动效率呈倒U型曲线。

你对这个回答的评价是

我要回帖

更多关于 压力与效率的关系 的文章

 

随机推荐