孟繁岐决定创业的两个方向,人脸识别和医疗AI,其中还是有缓急之分的。
人脸识别是一项已经应用了很久的技术,各方面都比较成熟,只是之前的方法比较传统落后。
一旦孟繁岐做出一些突破之后,可以很快切入进战场,展开收割,快速盈利。
而医疗AI还处于比较早期的阶段,其中最麻烦的问题是这些医疗数据与病人隐私方面的伦理问题。
在最最基层的数据问题上,就有不小的阻碍,各方面的手续章程繁琐。
虽然尚海公共卫生中心主动与自己联络了,不过这方面的事情恐怕不会推进得太快,需要徐徐图之。
应当先行着手处理的是人脸识别算法方面的事情,并且既然已经决定创业,自然要从商业的视角去考虑,而非是之前的学术角度。
孟繁岐了解这个时期最先进的人脸识别算法,比如脸书的DeepFace,原本是基于阿里克斯网络做特征提取,加入了分段仿射变换,使用了3D人脸建模来重现脸部特征,对齐面部要素。
脸书在14年的这个方法是深度学习时代人脸识别算法的奠基之作,影响力很强。
不过在孟繁岐看来,这个方法极其臃肿,参数多达上亿个,虽然在一個大型人类数据集LFW上性能为97.35%,接近人类水准。
但对孟繁岐来说,将这个性能继续提升到99.6%往上是十拿九稳的事情。
不过,从数据上可以明显看到,这个指标剩余的提升空间其实已经很小了,没法很显著地拉开差距。
从学术的角度去思考这个问题,自然是不要紧的,只要突破了世界纪录,自然就是值得发表的研究。
可在工业界,思维却不能这么简单。
性能相差无几的情况下,还有太多其他因素需要考虑进来。
比如速度快慢,商业用途,对速度都有硬指标的要求,这一点孟繁岐非常有信心;再比如算法的算子是否比较常见?有些复杂的学术操作,在商业使用的时候并不方便,硬件设备可能不支持,这点有可能会出问题。
其他诸如价格,使用难度,用户界面的美观程度,甚至于宣发的PPT做得唬不唬人,都很有可能成为外行人做出商业判断的依据之一。
因此,孟繁岐觉得在人脸这个已经被比较成熟的问题上,单纯只是自己这2个多点的技术突破只是较大的优势,还不足以建立起绝对的优势。
既然是创业的第一枪,不仅要成功,还必须大胜。
孟繁岐计划要在这个领域构建起足够强大的技术壁垒,至少要让其他所有的科技巨头们在大几个月,甚至接近一年多的时间内退避三舍。
现在的人脸识别太简单?老办法就能做到96-97?
哥们给你上点强度,看看你到底能不能受得住!
孟繁岐的策略基于他最先公开的一篇论文,生成式对抗技术之上。
他计划将基于残差网络的对抗式生成网络做一些针对性调整,并拿现在业界最大的几个人脸图像数据去训练它们。
其最终目的,就是为了生成看上去栩栩如生,实际上根本就不存在的人脸图像。
等到这个生成模型成功训练之后,孟繁岐便可以用它去对现在世面上的先进人脸识别算法发起针对性的挑战。
这些市面上的人脸算法,许多都基于传统的特征方式,就连刚刚孟繁岐回忆到的DeepFace都还没有发布。
原本,它们最多就只有94-95左右的水平,距离孟繁岐可以做到的99.6差了不少。
在这样的基础之上,它们还完全不具备辨别生成式虚假图像的能力。
孟繁岐可以随意地用各种虚假的人脸图片去欺骗这些算法,甚至可以针对某一些特定的面孔,去生成对应的人脸图像,并骗过基于这些算法的各种安检产品。
直接从安全性这个最根本的问题上彻底动摇对方的商用价值。
试想,既然现在市面上已经拥有这样任意生成虚构面孔的算法能力,而脸书的人脸识别技术竟然毫无对策,完全无法分辨。
这就带来了巨大的隐患,真假不辨,产品识别成功放行通过的,谁都不确定到底是什么鬼东西。
同时,这些产品的识别精确度,识别速度又都远远逊色于孟繁岐的技术产品。
在这样的情况之下,所有的甲方,尤其是注重安全性的政府机构,都会做出最为明智的选择。
而作为算法设计者的孟繁岐,当然非常清楚这样的生成策略会有什么问题和漏洞,生成出来的图像又有什么人类无法发现的规律。
孟繁岐的人脸识别算法,将会同时具有首次突破人类水平的精确度,数十倍于目前世界一流算法的检测速度,以及当下独一无二别无分号的伪造检测能力。
与此同时,对孟繁岐的新计划一无所知的脸书DeepFace团队,正在集体研究孟繁岐的论文和代码,完全不清楚自己将会遭遇什么。
“我们正在做的事情是首个将深度学习用于人脸识别的开创性工作,用到的数据规模也高达百万,如果这个时候替换掉如此多的算法组件,会不会耽误太久时间?”DeepFace四人组中,杨明是唯一的华国人,他对此稍微有所担忧。
“杨,现在孟的残差网络已经席卷了整个AI界,如果我们还是使用去年的8层网络,这真的可以称得上是首个将深度学习应用在人脸识别上的工作吗?”沃夫人如其名,工作上很有狼性。
在他看来,孟繁岐对深度学习的核心,网络结构本身已经做出了革命性的突破。
如果不采用这种新的技术,那么自己发布出去的文章又或者是代码,根本就只是昙花一现,几个月之后,一定到处都是基于孟繁岐残差技术的版本。
既然已经意识到了自己的不足,那就一定要修正,不能怕麻烦,也不能怕时间不够。
残差网络开源发布出来,就是几天前的事情,所有人都在同一条起跑线上。
没有什么可担忧的。
DeepFace团队已经在这个方向上努力了大半年,如今只是更换一些组件,迅速地将终版的实验迭代一下,这耽误不了太久。
这么久的技术积累,难道会别人随意赶超不成?
“杨,你不必担心,我们的主要步骤是检测->校正->再表达->分类验证,后面几个步骤都已经相当成熟了,只是现在有了更好的特征提取办法。”
泰戈曼也出言安慰杨明,他知道这个新加入脸书的小伙子急需一些成绩,“更换了方法之后,我们可以做得更好!”