《面向智能和安全的深度学习》报告摘要:
- 现在360有两个核心点:一个是智能,一个是安全。对不同的安全和智能产品,以前在算法上的要求或者机器学习的需求量是非常大的,但是以前的研究,大家可以发现对于不同的产品或者说不同的服务,它所需要的机器学习算法是完全不一样的。这些年深度学习的发展使得不同的产品或者不同的服务对于机器学习算法的需求开始趋同,也就是开始趋向于深度学习。
- 360人工智能研究院早期的基本目的:希望能建立一个统一的深度学习的生态系统。我们希望把这些算法,根据不同的产品和服务的数据进行关联,训练出他们所需要的深度学习模型,去帮助这些产品提升性能,同时有可能提供新的功能。
- 有两点是非常重要的。一方面我们需要有一个可扩展的平台,可以使用多卡,根据具体的需求,我们可以使用不同量的CPU和GPU,以及不同的机器来做。另外一方面对于深度学习来说更加重要的是,你这个平台应该是非常灵活的,因为有时候有大数据的要求,数据并行、模型并行,有可能数据和模型同时并行。对于不同的算法,对于深度学习来讲使用的模型也是不一样的,有可能有其他新模型的出现。比如说你在这个平台上应该有一种机制,可以适应不同产品的需求。在这个平台的基础上,我们开始做各种各样算法的研发。在我看来核心算法的研发有两个关键点,第一个关键点需要有像大脑一样的模型。比如说你可以更好的模仿大脑里面的神经元方式,做到complex-cell-like功能。另外一方面,有可能你的网络结构里面,并不只是前向传播的过程,可以让模型的结构更加像人的大脑,具有反馈机制。
- 第二个层面,我们并不需要所有的应用标注大量的数据,然后再去学一个模型。我们希望有两个层面的,你只需要标少量的数据,充分利用互联网上海量无标注的数据,它可以逐步的增强。另一方面,当这个模型学出来以后,当它具体放到产品上,我们希望它有一种自主学习的功能。打个比方,比如说有一个机器人要到你们家里面去,它的一个基本功能是能识别你家里面的人。但是你不能期望这个机器人能在所有的环境、所有的家庭里面一开始就工作的很好。但是当把机器人放到家里面,它可以根据能检测或识别到的人脸通过时序关联性扩展自己的检测或认知能力,然后它慢慢的就可以有更好的识别功能,慢慢在家里面会真正成为你的助手。有了这些算法之后,它就可以开始跟不同的业务的具体数据进行对接,训练不同模型来支撑不同的产品。
- 我觉得作为完整的生态系统,除了工业界的努力之外,其实还有非常关键的一点。学术界有独特的想法,但是往往缺少大量的数据,以及有效的计算机资源。从工业角度来讲,因为产品的deadline,我们并没有太多的时间及其深入地研究算法,这样跟学术界融合是非常重要的,只有这样才是完整的生态系统。我把他当做一种活水之源,只有这样作为一个研究院才能最佳地向前发展。