硕士研究生毕业于清华大学计算机系。在搜狗从事搜索广告相关策略研究多年,主导完成了搜狗搜索广告展现核心策略系统的搭建,见证并主要参与了搜狗商业产品从无到有、从有到强的过程。目前在搜狗负责PC搜索广告展示研究的工作,承担着搜狗最大变现产品线PC搜索产品线的主要策略技术支持,职责包括广告召回和相关性计算、点击率预估、个性化策略以及搜索竞价机制设计等相关工作。对于互联网营销,尤其是搜索引擎广告中涉及的相关核心技术有较深的理解。在文本相关性、自然语言处理以及大规模数据挖掘和机器学习算法设计和实现方面,尤其是在实际系统的工程实践中算法的应用和调优有着丰富的经验。
演讲: 计算广告技术之大数据下的短文本相关性计算
在计算广告系统中,尤其是搜索广告系统中,每次广告的展示都会涉及到用户、客户以及媒体三个实体间利益的平衡。虽然这三者利益的表述和评价在形式上会有很大的区别,甚至从表面上看还会存在一定的矛盾,但是从基础上来看,三者的利益最终在相关性上达成了一致。相关性高的展示不仅可以提升用户的搜索和浏览体验,而且也会提高客户广告的转化效果ROI,进而推动媒体、搜索引擎广告收益的提升。在广告系统相关性中,最核心的问题就是查询和关键词的语义相关性计算。然而,受到计算文本过短、文字歧义较大、长尾问题过多、准确率和覆盖率要求过高等因素的制约,用户查询词和广告之间相关性计算问题对于从业的算法设计人员来说始终是一个巨大的挑战。本报告就搜狗搜索广告团队实际经验,对广告系统中短文本相关性的常用计算方法以及在广告系统中的具体应用进行分享和探讨。
听众受益:
1.了解搜索广告中短文本相关性的计算算法。
2. 了解实际系统中算法调优相关经验。
3. 探讨广告系统中文本之外的影响相关性因素。