作者背景:
赵勇的履历很酷。复旦大学电子系硕士,美国布朗大学计算机工程系博士,2010年起,供职谷歌总部研究院任资深研究员,是谷歌眼镜最早期的核心研发人员。其主攻方向是计算机视觉,即探索计算机无限接近人的感知能力。
2013年4月,赵勇作为联合创始人创立格灵深瞳,担任首席技术官,带领一拨出身哈佛、斯坦福、普林斯顿的技术学霸,研发“深瞳无人安防监控系统”,能对人物动作、运动轨迹进行实时跟踪和检测,对危险提前预警。
“解决交通拥堵离不开感知技术”
赵勇在2015演讲
问:我们每次说到人工智能就好像就是指机器人,但它其实是不是一个比较宽泛的概念?
赵勇:对,如果你把机器人类比成人的话,因为它是一个系统,有头、有眼睛、有嘴巴、有肢体。机器人也是一样,它可能有感知的部分、有表达的部分、有运动的部分,所以机器人并不是等同于人工智能。
人工智能是什么呢?它有一些底层的模块,有一些高层的模块,最底层的模块实际上就是感知,你听到了什么,看到了什么,在这个感知的基础上有更高级的思维和推理模块,比如说决策、想象、创造,还有情感这些,所以智能讲得更多的其实是思维领域的事情。我们为什么老把它们两者结合在一起呢?是因为整个机器人的Industry实际上是被卡在智能这一块的,它的胳膊腿已经不错了,自动控制已经挺好了,问题是,它的脑子里面能够想什么?能够推理什么?它的意识是什么?这个是现在整个机器人行业的瓶颈。
问:格灵深瞳的客户主要集中在哪些领域?
赵勇:我们公司在研发两类产品,一类产品很快就要推向市场了,是和安防监控有关的,主要的客户,比如说银行。所有的安防客户都有这样的问题,他们有很多的摄像头,但是这些数据是无法去感知的,没人去看它。我们有一些客户有几万个摄像头,但是他们只有十几个人去看。那么在这种情况下,我们就希望能够推出一种新的产品,用所谓人工智能去看这些摄像头里面的画面,根据他们感知的结果形成一个产品,比如说当危险发生的时候它会提醒你。
有一些客户跟安全是无关的,比如说把这些东西部署在商场里面,当人们在商场里面购物的时候,他们购物的行为就会被看到,被自动统计成数据,这些数据能够帮助我们的客户去做一些决策。这个技术是对人的行为的感知能力。所以其实互联网的目的并不是万物互联,而是使整个世界获得整体的感知能力、判断能力、决策能力。
第二部分是我们在汽车、道路,跟交通相关的,也有一些技术投入。我们希望汽车能够看见路面和其他的车辆,然后做一些自动的反应。
问:类似无人驾驶汽车?
赵勇:无人驾驶汽车将是这种技术未来直接的体现,但是这有一个过程,我们暂时没有做无人驾驶,我们在做辅助驾驶。同时我们也会把这种技术赋予道路,道路上也装了我们的感知技术,所以道路也知道在这个路上发生了一些什么事情。这里面有很多应用,比如说交通调查、拥堵的预测、应急情况的处理等。有一天当道路和汽车可以对话的时候,道路就会把它看到的东西告诉汽车,这样就会有很多有趣的应用,包括使得交通安全的事故进一步降低。
▲奔驰无人驾驶汽车舱 图源网络
我举一个例子,这两天有一个很著名的车祸,在南京有一辆宝马高速闯了红灯,他撞到了一辆左转的马自达,结果就杀死两个人。这个马自达其实是没有犯错的,他是绿灯,他左转了,他无论如何也看不见这个要闯红灯的宝马,因为他的方向是来自折线,直线看不到的地方。
但是如果这个道路提前就看到了,说有一辆车非常快速地从远处开过来,看起来它要闯红灯了,如果它可以及时地发警报给周围所有的车,那么每一辆车都可以选择一个方式绕开,即使你是绿灯,你赶快刹车,或者你赶快离开这个地方。
这样的事故每天都在发生,在中国的路面上,80%以上致人死亡的交通事故是发生在十字路口的,可是十字路口是一个人们只能看到前方,看不到侧面的地方。我们的技术也会从这种角度来帮助道路变得更安全。
问:通过对方开车的速度来感知路况吗?
赵勇:它的速度、位置、距离、加速度,还有它的车型、车款、车牌号码,甚至还有更多的属性。如果有一个传感技术能够把道路上的每一辆汽车的信息实时地收集起来,并且每一个节点都能够汇报到一个大的网络上,这个东西就是在道路上的“互联网”。
问:这是不是能成为未来解决交通拥堵一种有效方式?
赵勇:交通拥堵的解决有很多方式,但是我认为无论是哪种方式都离不开感知技术,比如说道路本身会有更好的观测能力,它会给管理者提供一些决策,使得他们在指挥和疏导交通的时候有更好的方法,比如说当要发生事故的时候他们可能第一时间知道,如果他们第一时间能够把这个事故处理好,这个道路就会更快畅通。第二个,整个城市的流量怎么去分配怎么疏导。同样汽车也是一样,如果汽车有感知能力,他的驾驶就变得很有效。其实这个未来是可以大大改善交通拥堵的。
问:在你看来目前最前沿的人工智能的技术已经发展到什么程度了?
赵勇:这方面我想在全世界只有美国和中国这两个国家最先出现。我倒不觉得哪个国家更领先,我们这个行业的整体还没有到一个很夸张的程度。最近大家有一些讨论,把人工智能提到了一个非常科幻的水准去讨论,说它会不会毁灭人类。我觉得对我们这种研究这个行业的人来说觉得挺离谱的,我们基本上还在茹毛饮血的原始阶段,但是他们把我们想得太夸张了。
问:现在有的科技公司利用人工智能炒股,属于感知还是推理模块呢?
赵勇:炒股的问题很简单,股票的数据在网络上都已经有了,所以它可以做决策。但是它只能在这种专业的领域里面去做事情。
美国有一个公司叫D.E.Shaw Group,80年代末就开始用机器人做高频交易,结果一下子赚了非常多的钱,现在这个公司也非常有影响力。其实今天所有的投资公司都有这种手段,只不过是谁的性能再好一些。
问:国内现在从事人工智能的一些企业或机构,做得比较前沿的有哪些?
赵勇:研究所我不好说,因为很多大学都在研究相关的东西,人工智能比如说感知领域的,语音、图像、自然语言识别三大类。在感知以上的部分可能还有决策论,像今天我看到了请王飞跃老师,他是这方面的专家。决策论在几十年前就开始研究了,只要这个决策不是基于自然信号,比如说声音、图像和自然语言都好做,比如像炒股、交通控制。如果你已经有交通数据了也可以做。但是真正能够把决策论和真实数据结合起来,这样的事情现在还没有大规模发生。我认为在未来十年一定会发生,百分之百会发生。
企业的话像大企业有几个公司做得不错,百度过去三年投入比较多,我听说腾讯也有一些投入,因为腾讯现在有大量的服务,牵扯到大量的信息,比如说他们的微信账户上,是不是有人通过它去做恐怖主义的事情,要去检测。比如说阿里巴巴有很多交易数据,他能检测到这里面谁是卖假货的,有谁是在跑单的,做虚假交易的。他们就需要人工智能技术去做。但是这些都是非常专域的人工智能。
广谱的人工智能其实就是自然信号的处理,有一天如果我们说人工智能会产生一个机器人,近距离地的为人服务,无论它是什么形态,有胳膊有腿的还是只有轮子的,你必须处理刚才说的语音、声音、自然语言,这是一些大企业在做的。小企业在过去两年,我们就算其中之一吧,也有一批像我们这样的公司在做不同的领域的探索。
问:我记得您在一个论坛上提到每一次新技术的革新必然会带来一些道德层面的问题。中间您也提到无人驾驶汽车,比如说它避免一起交通事故,救了很多的人,可是突然不小心杀死了一个人,这会造成怎样的社会舆论?
赵勇:每一个新技术的出现,一方面为你服务,一方面它提供了一种可能性,使得作恶变得容易,都会引起道德上的思考和冲突。人工智能也是一样,从这一点来讲它不比任何之前的技术突破有什么差异,这里面一定会有很多新的现象出现。
比如谷歌,它的自动驾驶汽车,过去的几年出了12起事故,而且每起事故都是对方造成的,但是这件事情在美国就引起了轩然大波。因为社会对它很紧张,就会把它放到显微镜底下来看一看。
问:拷问它的理由是什么呢?
赵勇:虽然谷歌一向标榜说这个更安全,但是用户可能会怀疑它是不是在撒谎,它是不是在隐瞒某些东西。如果我们贸然地接受了这种技术,并大规模推广的话,是不是有一天我们会失去驾驶的自由,第二,如果谷歌所有的自动驾驶汽车都联合起来为它服务,去杀人,或者撞别人的车。有一些极端的人就会想这些问题。
问:现在无人驾驶汽车推广情况如何呢?
赵勇:首先还没有推广,但是谷歌会是全世界第一个真正推广这个技术的公司。
问:您说的这个引起争议是现在吗?
赵勇:就是现在。我上周去美国出差,打开电视,媒体都在播报说民众组成一个委员会,要求国会立法批准强迫谷歌release(公开)他们出事故的记录,因为根据美国的《保险法》,公众是不能够随便调阅保险公司的事故数据的。但谷歌不愿意公开,因为它觉得这样会困扰那些事故中的人。本来人家只是追了一下尾,很可能有人看见了,说这是谷歌的车,掏出手机自拍一下,它把我撞上了。这只是一个个人行为,现在全国要调查他,结果就可能把他推到媒体上去了,说不定第二天推开窗户门口全是转播车。所以谷歌不愿意做这个事,但最后还是公开了,只是它把名字的信息给隐匿了,把事故记录全公开了。但媒体又说,说不定谷歌在作假,说不定谷歌贿赂了这些人。我一定要见到这些人去采访他。那这样就很困难。
问:比如未来五年,或者十年,人工智能对人的生活会有什么改善吗?比如说治愈疾病、做家务机器人。
赵勇:有很多改善。现在机器人已经进入医疗领域了,有一些手术现在机器人比人做得好得多。你可以去关注一个公司叫达芬奇,是一个美国的公司,它有一套机器人手术系统,做一些小创伤的手术,或者它可以在跳动的心脏上给心脏动手术,这样的事情以后一定会替代掉人。
在物流领域里面,比如像亚马逊他们的大型物流仓库里面有很多都是机器人在管理。
家庭方面,有很多创业公司在做家庭机器人,最简单的扫地可以扫得很好。但扫地机器人是比较低端的,高端点的机器人会为你洗盘子、洗碗、铺床。美国有一个酒店用机器人给客人送早餐。
但我认为可能影响最大的还是感知机器人。它一开始不会以人的形状出现,我们有很多业务需要感知,我觉得在未来,安防监控像金融领域、汽车领域会更早地看到大规模的人工智能的应用。还有日常人们用的手机或者移动通讯设备语音交互,自然语言识别,这已经用得很广了。
问:会不会有一天机器人真的会坐在对面跟我们聊人生?
赵勇:有意思的是其实有一些技术已经存在了,有一些机器人可以坐在对面跟你聊天,甚至这个聊天的内容也非常有意思。但是这个并不是说它具有了意识和情感,而是一些间接的方法,比如说统计的方法。
比如你问一个问题,人生的意义是什么?有可能它会选择一句回答说,哦,这个问题太难了,咱们换个话题吧。但这并不是说它通过推理做出这个判断。它可能通过某种统计的方法,它认为这个回答是合适的。当情况变得更加复杂的时候,你会发现这是说着玩玩的。所以现在我们并不能做出一个真正的语言机器人,你可以跟它长时间地聊人生。
问:霍金认为人工智能的发展会给人类带来威胁,根据您前面所说,您是不同意的,是吗?
赵勇:我肯定是不同意的,而且他们自己后来也出来澄清了。比尔·盖茨也发表过相应的担心,但是他们的担心是非常Long-term的,我觉得我们现在离那一步还比较远,但有这些担心是合理的,当一个系统能力特别强的时候,它至少给少部分人赋予了非常强的能力。
但我仍然不认为人工智能本身会直接跟人类作对,因为他们是没有动机性的。他们动机要有的话一定是来自他们的主人,所以他们会使得有一些人如果想作乱作恶的话,他们能力比以前大大增强。也就是说万一这些系统落入恐怖主义分子的手中,他们破坏的能力,他们非对称的破坏能力会进一步加强。
问:您觉得人工智能从感知层面到有意识甚至情感的层面,这个瓶颈有可能突破吗?
赵勇:是有可能的,但这个根本就不是必要的。我们可能会造一个机器人会开车、削土豆,或者动手术。但是我们为什么要造一个机器人,它有很强的理解能力,能够看懂东西,能够听懂话,还要赋予它情感智慧,还要教会它去爱谁,恨谁。可能有一些疯子想去造这个东西。
当我们讨论这个问题的时候仿佛又陷入了一个误区,觉得这个东西非常容易,其实非常非常难。
问:您现在做人工智能这一块有没有第四次科技革命的关口的感觉?
赵勇:我们从来不想第四次科技革命。我想如果我们把感知技术做到特别好,把它普及了,让这个世界互联起来,人与机器、机器与机器,形成一个互联的关系、平行的世界,肯定会有很多聪明的人会把他们的商业模式放上来做某些事情,到时候可能会出现机器人推销员、机器人洗车员、机器人订外卖,到时候会发生什么新的商业模式,对人们的生活有什么样的影响,这个是无法想象的。
问:您刚才描述的图景是您对未来的一个想象,抵达它大概需要多少年呢?
赵勇:我觉得20年。
本文系腾讯思享会独家稿件