对话山世光：AI需要傻瓜式的平台学AI到"蓝翔"

句子大全 2011-07-11 19:38:35

相关推荐

对话山世光：AI需要傻瓜式的平台学AI到蓝翔 | AI英雄 2018-01-12 10:17:23 网易智能

本文系网易智能工作室（公众号smartman163）出品，此篇为AI英雄人物第58期。

文 | 丁广胜

人物观点：

希望人工智能的研发可规模化，易于扩展，基于傻瓜式的AI研发平台，我们期望五到十年之后甚至高中学历的人都可以研发AI。那时候我们或许会开玩笑说：学AI，到蓝翔。

人工智能落地的商业模式，我个人认为其实现在没有人能看透，至少目前为止我个人的想象里，如果不结合应用场景，AI这个领域恐怕很难有机会可以发展出像BAT这样的大公司。——山世光

周末的中科院显得严肃安静，有不少研究员还在伏案潜心钻研。

虽然在北京银谷大厦和杭州滨江区都设有办公室，但已经双跨学术和工业两界一年的山世光仍然习惯在这里办公，他的办公室不大，桌子被一排排书籍环绕着。

他也逐渐习惯了自己的双重身份，既是中科院计算所的研究员，也是中科视拓的CTO，他认为工业界还是需要非常强的理论和方法作为支撑，所以对实验室依然非常倚重。

山世光有着超过20年的计算机视觉研究经验，在国内外刊物和学术会议上发表论文200余篇，论文被谷歌学术引用12000余次，研究成果获2005年度国家科技进步二等奖，2015年度国家自然科学二等奖等。

对于只是担任公司CTO的职位，他坦言，“我并没有全职出来创业，而是我的几个研究生毕业后全职创业，我更多是支持和辅助他们的角色。特别是公司CEO刘昕博士，他是冲在创业最前线的，实实在在地担负着首席执行官的角色”。

在山世光看来，研究员和创业的不同在于，做研究的时候往往会更关注新问题、新理论和新方法。很多时候是在寻找新的理论问题，即使是问题明确之后，也需要很长的时间去摸索，而且很多时候可能都不一定做成，今天解决1%，明天解决5%，经常是个渐进的过程，而且做成了也未必马上有用。而在工业界则首先需要理解用户的需求，考虑可以满足需求或者说马上可以落地的方法和技术。从学术界到工业界，更接近应用落地了。

他还希望让人工智能的研发可规模化和可扩展，利用技术服务平台为B端客户赋能。或许我们可以期待几年后，基于傻瓜式的AI开发平台，高中学历的人都可以研发AI，“那时候我们或许会开玩笑说：学AI，到蓝翔”山世光笑着说到。

此外，当网易智能问到如何看待AI领域的商业发展模式时，山世光表示，我个人觉得其实现在没有人能看透，至少到目前为止我个人的想象里，不结合应用场景，单纯的AI科技领域恐怕很难有机会可以发展成像BAT这样的大公司。

对于当前的行业现状，他建议不要“过度承诺”，不要在宣传的时候故意“隐藏前提条件”，政府、媒体的宣传不要让公众产生误解，比如人们看了AlphaGo，然后就说什么都可以解决了，这是泡沫风险，从投资的角度，还会导致资本杠杆的失衡。

以下根据山世光问答实录整理，网易智能（公众号Smartman163）做了不改动原意的删减：

应对AI人才稀缺打造新的技术发展模式

网易智能：作为一家非常年轻的公司，您如何定位自己和自己的团队？

山世光：目前我们在北京有30多人，杭州子公司有20多人，总共接近50人的规模。

现在公司大概在做三个层面的事情，首先，杭州子公司主要做直接落地的产品，直接面向客户，比如说一个单位，它要人脸闸机，人脸考勤、门禁和访客系统，我们会从硬件到软件提供全套解决方案。

第二个层面是北京团队的算法和技术服务，主要是to B，包括我们跟华为、平安科技、电信、移动等大客户的合作，主要形态是深度的技术服务的形式，相当于把技术和算法以SDK甚至源码的方式授权给B端的客户，他们又会拿着这些算法，再去开发针对某一个具体需求的业务系统。

第三个层面，也是我们和其他公司非常不同的一点，我们不满足于做项目制的技术服务，而是进一步往后端做to B的“技术服务”产品，或者说“赋能型”的产品。具体地说，我们开发了一个平台型的AI研发产品，可以为更多B端客户服务，特别是面向难以组建AI研发团队的中小微企业服务，我们把这个平台称之为SeeTaaS。

网易智能：深度学习的平台开发工具很多，那为什么还要做SeeTaaS？

山世光：打个比方，现在深度学习的开发，有点类似于照相领域，曾经的胶片时代，照相需要昂贵的专业相机、胶片、专业的相纸、相片冲印室，还需要一个懂曝光、对焦、取景的专业摄影师。这件事需要专业的基础设施才能做，需要专业人士才能照。对应到AI就是，只有所谓的AI算法工程师，深度学习算法工程师，才能够在TensorFlow，Caffe，MXNet等等这些专业的深度学习开发工具上，去生产用户需要的一个某种AI引擎。

而我们现在进入了读图看脸的时代，因为我们有了傻瓜相机有了更智能的拍照手机，按一个键你就可以拍一张照片，我认为这个变迁同样适用于AI引擎的开发，从只有专业人士可以AI技术，到越来越多非专业人士也可以开发AI技术的时代。但这需要一个新的平台，这种平台不能是像TensorFlow这样专业化的工具，而应该是一个更傻瓜式的AI开发工具，这就是我们为什么做SeeTaaS的原因。

不仅如此，做这个平台还有AI人才稀缺的考虑，专业的AI开发人员现在极度稀缺，直接表现就是AI人才奇贵，大多数公司要么找不到这样的人才，要么雇不起这样的人才。而另一个令人尴尬的现实是：AI应用落地的需求是非常碎片化的，现在还不存在一个包打天下的算法，很多看起来相似的需求背后的技术也有差异。更要命的是，往往是A需求需要A的数据，B需求需要B的数据，C需求需要C的数据，何况背后的AI算法还需要根据数据情况进行调整，所需要的时间动辄数月。需求千变万化，如果每个需求都分配几个AI专业人才去满足，必然导致公司成为人力成本极高的企业。我们希望能够把AI需求满足过程变得更加自动化，而不是说每一个需求来了之后，都是一推专业人士去做。

我们重视SeeTaaS业务还有一个重要原因，那就是数据的敏感性。因为法律的原因，很多企业客户对数据是非常敏感的。如果没有SeeTaaS，我们就只能派AI研发工程师到客户那里进行客户需要的AI引擎的开发，这就变成了一个非常繁重的研发模式。也就是说，针对很多需求，我们其实没有数据，而客户自己有数据却不能或不愿给我们。有了SeeTaaS，我们就可以提供给客户一个私有的SeeTaaS云平台，让客户自己放心的研发自己的AI。当然，也会有很多客户对数据不敏感，可以把数据共享出来，那当然更好，我们只需要为他们提供共有的SeeTaaS云服务就可以了。

AI将迎来规模化普及学AI到“蓝翔”

网易智能：您的目标是什么？想把公司打造成一家怎样的企业？

山世光：中科视拓的愿景我们用两句话概括，即“知人识面辨万物，开源赋能共发展”。前一句对应公司名字视拓中的“视”字，概括的是我们主攻的技术范畴，即以计算机视觉技术为主，特别关注图像或视频中人的识别，人的意图和情绪的感知，以及对其中万事万物的识别和理解。我们相信“会看的AI更智能”。

第二句话则概括了公司名字中的“拓”字，即我们期望不仅仅提供人脸识别、行人识别、车辆识别这样的计算机视觉技术，这个其实能做的人很多，我们更希望以更高效的方式与大量B端客户合作，让AI的研发可规模化和可扩展，即有更好的可拓展性。

我为什么强调现在AI技术的可扩展性不好？以让机器人自动检测小区里的垃圾为例，实际的需求是五花八门的，可能今天需要检测狗屎，明天则需要检测矿泉水瓶子，后天就是塑料袋或者烂白菜，你想想垃圾有多少种？

实际应用中可能会有数万种物体要去识别，如果每认一样物体，都要搜集大量样本数据的话，这是非常高的代价。所以，长期来说我们希望能够以一种可规模化、可扩展的方式去提供这种技术服务。未来五到十年，我们相信会有大量的劳动力进入AI研发市场，采用的就是傻瓜式的平台，或许到时候我们会开玩笑说：学AI，到蓝翔。

当然，短时间内寄希望于这样的平台解决所有问题也是不现实的。还需要针对不同的问题，开发全新的算法，特别需要解决现在深度学习不能解决的问题。这也是我还花费很大一部分精力从事前沿学术研究的原因。

此外，关于AI领域的发展模式，我个人觉得其实现在没有人能完全看透，至少目前为止我个人的想象里，如果不结合应用场景，AI这个领域恐怕很难有机会可以发展出像BAT这样的大公司。纵观国内外，做to B的大公司是非常少的。

网易智能：一年多以来，您有哪些创业感想？自己从研究员变为创业者，如何看待自己的这一转变？

山世光：必须强调的是我的身份是双重的，而且是学者为先，企业家在后。我们要实现的三个层次的使命中（第一个问题中提到的三个层次：产品落地、AI技术服务、SeeTaaS），第二层和第三层都需要非常强的理论和方法支撑，所以我在中科院计算所的实验室的支持是不可或缺的。

更重要的是，中科视拓的CEO并不是我，而是我去年毕业的博士刘昕，另外我还有几个毕业生也全职在公司工作。我在公司的身份是CTO，主要专注技术。特别值得强调的是，刘昕博士不仅仅懂技术，也懂商业和管理，他作为公司的CEO，是冲在创业最前线的，实实在在地担负着首席执行官的角色。

当然，这一年，因为更多的接触工业界和关注应用问题，我对技术落地的认知是有提高的。毕竟做基础研究时，很多时间是在寻找新的学术问题，即使是问题明确之后，也需要很长的时间去摸索，而且很多时候可能还不一定做成，今天解决1%，明天解决5%，经常是个渐进的过程。而在工业界则首先需要理解用户的需求，考虑可以满足需求或者说马上可以落地的方法和技术。从学术界到工业界，肯定要更重视可以应用落地的技术和方法了。

网易智能：中科视拓现在有什么最新进展，新的计划是什么？

山世光：大家对我们可能有误解，我们不只是一家人脸识别公司，我们以人脸识别为出发点，然后是在技术服务方面发力，特别会主推SeeTaaS服务，这是我们2018年的重点。

营收方面，中科视拓2017年已经有千万级的收入，明年计划是三倍以上的营收预期。规模方面，我们也需要招募更多的人才，希望到明年底的时候公司规模可以扩大一倍。当然，在大家都没有摸索的非常清楚的情况下，我们比较谨慎的控制着规模。

“没有绝对的安全，人脸识别支付也是如此”

网易智能：人脸识别领域是AI非常火的细分门类，国内有很多类似的公司深耕其中，都在持续发力，您如果面对竞争因素？

山世光：显然是有竞争的，人脸识别就是一个红海市场了，但从另外一个角度来讲，这个市场非常大，现在至少还有一定的时间窗口，每一个公司都有成长的空间。

整个人类社会其实就是以身份识别为基础的，如果一个社会每个人都不能知道对方是谁，这个社会是没法儿运行的。几乎所有的信任关系，所有的交换，所有的交易，全都要基于大家知道谁是谁这个条件。

网易智能：您如何看待目前人脸识别技术的发展？是否足够成熟？

山世光：人脸识别技术肯定会非常快速的在相对成熟的领域落地，现在最成熟的就是1:1的人脸认证，成熟度可能高达98%或者更高。

比如说iPhone X手机里面，它就是典型的1:1认证应用场景，其实也是人脸识别领域最容易的一个场景，这款手机的摄像头和普通摄像机是不一样的，它可以看到近红外图像和深度图。

近红外图就是它上面有一个近红外的光源，会发近红外光，因为是近红外，我们人眼是看不到的。还有一个是深度图，它测量的是摄像头离你脸上的每一个点的距离，这些信息综合起来进行人脸识别。

网易智能：您觉得人脸识别绝对安全吗？这些技术在安全领域会有哪些问题？

山世光：没有绝对的安全。例如，苹果官方表示iPhone X的FaceID错误率是百万分之一，但苹果也建议同卵双胞胎最好不要用FaceID。如果有人愿意花上足够的成本，也是可以攻破它的，已经有一些案例了。恶意攻击者虽然可以偷到一个人的手机，但有手机主人精确的面部信息的可能性并不大，所以其危害基本是可控的。

现在很多车站都开始应用人脸识别进站了。错误识别的风险当然也还是有的，但这个风险是极低的：因为拿别人的身份证冒充他刷脸，成功的概率可能只有千分之一。换句话说，不法分子得“偷”1000个人的身份证，试刷脸1000次才有一次可能成功，显然不会有人这么去做的。

相对不成熟的应用是黑名单人员的监控，即用大街上等各种公共场所的监控摄像头来识别犯罪嫌疑人，由于摄像角度、光线环境、伪装和老化等诸多因素，导致这种场景下人脸识别的难度比较大。当然，这方面技术的进步也是非常快的，越来越多的人脸识别系统已经开始在公安实战中发挥重要作用。

网易智能：您认为人工智能行业有泡沫吗？健康的行业环境应该是怎样的？会议邀请一个接着一个，您会感觉这个大环境浮躁吗？

山世光：从技术的角度来讲，所谓的泡沫就是“过度承诺”，所谓的过度承诺是你只能做到60%，你说成做到90%，或者是宣传的时候故意“隐藏必要的前提条件”，非技术人员可能过分解读你展示的数据。

此外，从政府、媒体、大众解读的角度，语言其实是不统一的，这种不统一可能会导致对技术的误解，特别是过度泛化，比如有些人看了AlphaGo之后，就说什么都可以解决了，这是有泡沫风险的。从投资人的角度讲，大家都看好AI，谁都不想落下，也可能会导致资本的杠杆作用失衡。

从人才价格的角度，如果说按照商业规律、经济规律的话，物以稀为贵，所以现在人才贵也正常。但从这些人才短期内可创造的价值的角度看，恐怕是有泡沫的，我个人判断会有回调的可能性。（完）

点击查看，往期内容一步直击！

注：《AI英雄》专访隶属网易智能工作室，每周围绕人工智能领域讲述一个人物故事，洞察技术趋势，捕捉行业机会，关注人的价值。转载请注明出处，违者必究！

阅读剩余内容

人脸搞笑的句子

对话山世光：AI需要傻瓜式的平台学AI到"蓝翔"

「Paradox」获 4000 万美元 B 轮融资对话式 AI 平台帮企业节省人力支出

「Paradox」获 4000 万美元 B 轮融资对话式 AI 平台帮企业节省人力支出

【独家】获数百万天使轮融资语义交互平台Dolphin.ai助力企业实现“对话即服务”

对话戴金权：英特尔如何构建软硬件协同统一的大数据分析+AI平台？

对话联影智能沈定刚周翔詹翊强：如何用 uAI 智能平台赋能13款 AI 产品？

指尖上的警民对话微信搭互动平台成破案新"利器"