夏粉是百度研究院大数据实验室高级科学家,曾任百度网盟大数据学习技术负责人,主要研究领域包括大规模机器学习、广告和推荐技术、排序学习等。十年以上机器学习研究经验,曾在机器学习顶级会议杂志ICML, NIPS等发表多篇文章。
演讲: 大规模机器学习技术
随着数据采集技术的飞速发展以及数据源的日益丰富,数据规模已经爆炸性增长。作为人工智能研究领域中一个重要的方向,机器学习是公认的处理和学习这些数据的最有效手段之一。
面向大数据量的机器学习,通常需要做分布式的算法,来容纳上亿特征和数据。本报告将向大家分享了大规模机器学习和数据挖掘方面的话题和研发成果, 将以广告大数据上的点击率预估,介绍大规模机器学习与传统机器学习问题的区别,大规模机器学习面临的问题,大规模机器学习的过程,并介绍最新的大规模机器学习技术。