句子大全

句子大全 > 句子大全

对话山世光:AI需要傻瓜式的平台 学AI到"蓝翔"

句子大全 2011-07-11 19:38:35
相关推荐

对话山世光:AI需要傻瓜式的平台 学AI到 蓝翔 | AI英雄 2018-01-12 10:17:23 网易智能

本文系网易智能工作室(公众号smartman163)出品,此篇为AI英雄人物第58期。

文 | 丁广胜

人物观点:

希望人工智能的研发可规模化,易于扩展,基于傻瓜式的AI研发平台,我们期望五到十年之后甚至高中学历的人都可以研发AI。那时候我们或许会开玩笑说:学AI,到蓝翔。

人工智能落地的商业模式,我个人认为其实现在没有人能看透,至少目前为止我个人的想象里,如果不结合应用场景,AI这个领域恐怕很难有机会可以发展出像BAT这样的大公司。——山世光

周末的中科院显得严肃安静,有不少研究员还在伏案潜心钻研。

虽然在北京银谷大厦和杭州滨江区都设有办公室,但已经双跨学术和工业两界一年的山世光仍然习惯在这里办公,他的办公室不大,桌子被一排排书籍环绕着。

他也逐渐习惯了自己的双重身份,既是中科院计算所的研究员,也是中科视拓的CTO,他认为工业界还是需要非常强的理论和方法作为支撑,所以对实验室依然非常倚重。

山世光有着超过20年的计算机视觉研究经验,在国内外刊物和学术会议上发表论文200余篇,论文被谷歌学术引用12000余次,研究成果获2005年度国家科技进步二等奖,2015年度国家自然科学二等奖等。

对于只是担任公司CTO的职位,他坦言,“我并没有全职出来创业,而是我的几个研究生毕业后全职创业,我更多是支持和辅助他们的角色。特别是公司CEO刘昕博士,他是冲在创业最前线的,实实在在地担负着首席执行官的角色”。

在山世光看来,研究员和创业的不同在于,做研究的时候往往会更关注新问题、新理论和新方法。很多时候是在寻找新的理论问题,即使是问题明确之后,也需要很长的时间去摸索,而且很多时候可能都不一定做成,今天解决1%,明天解决5%,经常是个渐进的过程,而且做成了也未必马上有用。而在工业界则首先需要理解用户的需求,考虑可以满足需求或者说马上可以落地的方法和技术。从学术界到工业界,更接近应用落地了。

他还希望让人工智能的研发可规模化和可扩展,利用技术服务平台为B端客户赋能。或许我们可以期待几年后,基于傻瓜式的AI开发平台,高中学历的人都可以研发AI,“那时候我们或许会开玩笑说:学AI,到蓝翔”山世光笑着说到。

此外,当网易智能问到如何看待AI领域的商业发展模式时,山世光表示,我个人觉得其实现在没有人能看透,至少到目前为止我个人的想象里,不结合应用场景,单纯的AI科技领域恐怕很难有机会可以发展成像BAT这样的大公司。

对于当前的行业现状,他建议不要“过度承诺”,不要在宣传的时候故意“隐藏前提条件”,政府、媒体的宣传不要让公众产生误解,比如人们看了AlphaGo,然后就说什么都可以解决了,这是泡沫风险,从投资的角度,还会导致资本杠杆的失衡。

以下根据山世光问答实录整理,网易智能(公众号Smartman163)做了不改动原意的删减:

应对AI人才稀缺 打造新的技术发展模式

网易智能:作为一家非常年轻的公司,您如何定位自己和自己的团队?

山世光:目前我们在北京有30多人,杭州子公司有20多人,总共接近50人的规模。

现在公司大概在做三个层面的事情,首先,杭州子公司主要做直接落地的产品,直接面向客户,比如说一个单位,它要人脸闸机,人脸考勤、门禁和访客系统,我们会从硬件到软件提供全套解决方案。

第二个层面是北京团队的算法和技术服务,主要是to B,包括我们跟华为、平安科技、电信、移动等大客户的合作,主要形态是深度的技术服务的形式,相当于把技术和算法以SDK甚至源码的方式授权给B端的客户,他们又会拿着这些算法,再去开发针对某一个具体需求的业务系统。

第三个层面,也是我们和其他公司非常不同的一点,我们不满足于做项目制的技术服务,而是进一步往后端做to B的“技术服务”产品,或者说“赋能型”的产品。具体地说,我们开发了一个平台型的AI研发产品,可以为更多B端客户服务,特别是面向难以组建AI研发团队的中小微企业服务,我们把这个平台称之为SeeTaaS。

网易智能:深度学习的平台开发工具很多,那为什么还要做SeeTaaS?

山世光:打个比方,现在深度学习的开发,有点类似于照相领域,曾经的胶片时代,照相需要昂贵的专业相机、胶片、专业的相纸、相片冲印室,还需要一个懂曝光、对焦、取景的专业摄影师。这件事需要专业的基础设施才能做,需要专业人士才能照。对应到AI就是,只有所谓的AI算法工程师,深度学习算法工程师,才能够在TensorFlow,Caffe,MXNet等等这些专业的深度学习开发工具上,去生产用户需要的一个某种AI引擎。

而我们现在进入了读图看脸的时代,因为我们有了傻瓜相机有了更智能的拍照手机,按一个键你就可以拍一张照片,我认为这个变迁同样适用于AI引擎的开发,从只有专业人士可以AI技术,到越来越多非专业人士也可以开发AI技术的时代。但这需要一个新的平台,这种平台不能是像TensorFlow这样专业化的工具,而应该是一个更傻瓜式的AI开发工具,这就是我们为什么做SeeTaaS的原因。

不仅如此,做这个平台还有AI人才稀缺的考虑,专业的AI开发人员现在极度稀缺,直接表现就是AI人才奇贵,大多数公司要么找不到这样的人才,要么雇不起这样的人才。而另一个令人尴尬的现实是:AI应用落地的需求是非常碎片化的,现在还不存在一个包打天下的算法,很多看起来相似的需求背后的技术也有差异。更要命的是,往往是A需求需要A的数据,B需求需要B的数据,C需求需要C的数据,何况背后的AI算法还需要根据数据情况进行调整,所需要的时间动辄数月。需求千变万化,如果每个需求都分配几个AI专业人才去满足,必然导致公司成为人力成本极高的企业。我们希望能够把AI需求满足过程变得更加自动化,而不是说每一个需求来了之后,都是一推专业人士去做。

我们重视SeeTaaS业务还有一个重要原因,那就是数据的敏感性。因为法律的原因,很多企业客户对数据是非常敏感的。如果没有SeeTaaS,我们就只能派AI研发工程师到客户那里进行客户需要的AI引擎的开发,这就变成了一个非常繁重的研发模式。也就是说,针对很多需求,我们其实没有数据,而客户自己有数据却不能或不愿给我们。有了SeeTaaS,我们就可以提供给客户一个私有的SeeTaaS云平台,让客户自己放心的研发自己的AI。当然,也会有很多客户对数据不敏感,可以把数据共享出来,那当然更好,我们只需要为他们提供共有的SeeTaaS云服务就可以了。

AI将迎来规模化普及 学AI到“蓝翔”

网易智能:您的目标是什么?想把公司打造成一家怎样的企业?

山世光:中科视拓的愿景我们用两句话概括,即“知人识面辨万物,开源赋能共发展”。前一句对应公司名字视拓中的“视”字,概括的是我们主攻的技术范畴,即以计算机视觉技术为主,特别关注图像或视频中人的识别,人的意图和情绪的感知,以及对其中万事万物的识别和理解。我们相信“会看的AI更智能”。

第二句话则概括了公司名字中的“拓”字,即我们期望不仅仅提供人脸识别、行人识别、车辆识别这样的计算机视觉技术,这个其实能做的人很多,我们更希望以更高效的方式与大量B端客户合作,让AI的研发可规模化和可扩展,即有更好的可拓展性。

我为什么强调现在AI技术的可扩展性不好?以让机器人自动检测小区里的垃圾为例,实际的需求是五花八门的,可能今天需要检测狗屎,明天则需要检测矿泉水瓶子,后天就是塑料袋或者烂白菜,你想想垃圾有多少种?

实际应用中可能会有数万种物体要去识别,如果每认一样物体,都要搜集大量样本数据的话,这是非常高的代价。所以,长期来说我们希望能够以一种可规模化、可扩展的方式去提供这种技术服务。未来五到十年,我们相信会有大量的劳动力进入AI研发市场,采用的就是傻瓜式的平台,或许到时候我们会开玩笑说:学AI,到蓝翔。

当然,短时间内寄希望于这样的平台解决所有问题也是不现实的。还需要针对不同的问题,开发全新的算法,特别需要解决现在深度学习不能解决的问题。这也是我还花费很大一部分精力从事前沿学术研究的原因。

此外,关于AI领域的发展模式,我个人觉得其实现在没有人能完全看透,至少目前为止我个人的想象里,如果不结合应用场景,AI这个领域恐怕很难有机会可以发展出像BAT这样的大公司。纵观国内外,做to B的大公司是非常少的。

网易智能:一年多以来,您有哪些创业感想?自己从研究员变为创业者,如何看待自己的这一转变?

山世光:必须强调的是我的身份是双重的,而且是学者为先,企业家在后。我们要实现的三个层次的使命中(第一个问题中提到的三个层次:产品落地、AI技术服务、SeeTaaS),第二层和第三层都需要非常强的理论和方法支撑,所以我在中科院计算所的实验室的支持是不可或缺的。

更重要的是,中科视拓的CEO并不是我,而是我去年毕业的博士刘昕,另外我还有几个毕业生也全职在公司工作。我在公司的身份是CTO,主要专注技术。特别值得强调的是,刘昕博士不仅仅懂技术,也懂商业和管理,他作为公司的CEO,是冲在创业最前线的,实实在在地担负着首席执行官的角色。

当然,这一年,因为更多的接触工业界和关注应用问题,我对技术落地的认知是有提高的。毕竟做基础研究时,很多时间是在寻找新的学术问题,即使是问题明确之后,也需要很长的时间去摸索,而且很多时候可能还不一定做成,今天解决1%,明天解决5%,经常是个渐进的过程。而在工业界则首先需要理解用户的需求,考虑可以满足需求或者说马上可以落地的方法和技术。从学术界到工业界,肯定要更重视可以应用落地的技术和方法了。

网易智能:中科视拓现在有什么最新进展,新的计划是什么?

山世光:大家对我们可能有误解,我们不只是一家人脸识别公司,我们以人脸识别为出发点,然后是在技术服务方面发力,特别会主推SeeTaaS服务,这是我们2018年的重点。

营收方面,中科视拓2017年已经有千万级的收入,明年计划是三倍以上的营收预期。规模方面,我们也需要招募更多的人才,希望到明年底的时候公司规模可以扩大一倍。当然,在大家都没有摸索的非常清楚的情况下,我们比较谨慎的控制着规模。

“没有绝对的安全,人脸识别支付也是如此”

网易智能:人脸识别领域是AI非常火的细分门类,国内有很多类似的公司深耕其中,都在持续发力,您如果面对竞争因素?

山世光:显然是有竞争的,人脸识别就是一个红海市场了,但从另外一个角度来讲,这个市场非常大,现在至少还有一定的时间窗口,每一个公司都有成长的空间。

整个人类社会其实就是以身份识别为基础的,如果一个社会每个人都不能知道对方是谁,这个社会是没法儿运行的。几乎所有的信任关系,所有的交换,所有的交易,全都要基于大家知道谁是谁这个条件。

网易智能:您如何看待目前人脸识别技术的发展?是否足够成熟?

山世光:人脸识别技术肯定会非常快速的在相对成熟的领域落地,现在最成熟的就是1:1的人脸认证,成熟度可能高达98%或者更高。

比如说iPhone X手机里面,它就是典型的1:1认证应用场景,其实也是人脸识别领域最容易的一个场景,这款手机的摄像头和普通摄像机是不一样的,它可以看到近红外图像和深度图。

近红外图就是它上面有一个近红外的光源,会发近红外光,因为是近红外,我们人眼是看不到的。还有一个是深度图,它测量的是摄像头离你脸上的每一个点的距离,这些信息综合起来进行人脸识别。

网易智能:您觉得人脸识别绝对安全吗?这些技术在安全领域会有哪些问题?

山世光:没有绝对的安全。例如,苹果官方表示iPhone X的FaceID错误率是百万分之一,但苹果也建议同卵双胞胎最好不要用FaceID。如果有人愿意花上足够的成本,也是可以攻破它的,已经有一些案例了。恶意攻击者虽然可以偷到一个人的手机,但有手机主人精确的面部信息的可能性并不大,所以其危害基本是可控的。

现在很多车站都开始应用人脸识别进站了。错误识别的风险当然也还是有的,但这个风险是极低的:因为拿别人的身份证冒充他刷脸,成功的概率可能只有千分之一。换句话说,不法分子得“偷”1000个人的身份证,试刷脸1000次才有一次可能成功,显然不会有人这么去做的。

相对不成熟的应用是黑名单人员的监控,即用大街上等各种公共场所的监控摄像头来识别犯罪嫌疑人,由于摄像角度、光线环境、伪装和老化等诸多因素,导致这种场景下人脸识别的难度比较大。当然,这方面技术的进步也是非常快的,越来越多的人脸识别系统已经开始在公安实战中发挥重要作用。

网易智能:您认为人工智能行业有泡沫吗?健康的行业环境应该是怎样的?会议邀请一个接着一个,您会感觉这个大环境浮躁吗?

山世光:从技术的角度来讲,所谓的泡沫就是“过度承诺”,所谓的过度承诺是你只能做到60%,你说成做到90%,或者是宣传的时候故意“隐藏必要的前提条件”,非技术人员可能过分解读你展示的数据。

此外,从政府、媒体、大众解读的角度,语言其实是不统一的,这种不统一可能会导致对技术的误解,特别是过度泛化,比如有些人看了AlphaGo之后,就说什么都可以解决了,这是有泡沫风险的。从投资人的角度讲,大家都看好AI,谁都不想落下,也可能会导致资本的杠杆作用失衡。

从人才价格的角度,如果说按照商业规律、经济规律的话,物以稀为贵,所以现在人才贵也正常。但从这些人才短期内可创造的价值的角度看,恐怕是有泡沫的,我个人判断会有回调的可能性。(完)

点击查看,往期内容一步直击!

注:《AI英雄》专访隶属网易智能工作室,每周围绕人工智能领域讲述一个人物故事,洞察技术趋势,捕捉行业机会,关注人的价值。转载请注明出处,违者必究!

阅读剩余内容
网友评论
相关内容
拓展阅读
最近更新