网络社交媒体的情感认知与计算
清华大学电子工程系 清华大学信息科学技术国家实验室 黄永峰
情感计算的概念
情感计算(affectivecomputing)的概念是在1997年由MIT媒体实验室Picard教授提出,她指出情感计算是与情感相关,来源于情感或能够对情感施加影响的计算。情感计算:情感识别、情感表示、情感建模、情感交互等四个方面。
情感计算的概念
语言是人类思维直接现实、思想的传播载体、情感的表达媒介,因此也是情感计算的重要对象。
Plutchik’s 情绪心理模型 情绪3维度模型:强度、两极性和相似性
网络媒体的情感倾向性计算概念
利用自然语言处理、文本分析和计算语言学的方法从文本中分析人们的观点、情感、评价、态度和情绪等信息,也称观点挖掘(Opinion Mining)。
网络社交媒体的大数据特征
由Web2.0平台产生,一般在200个字符以内的网络文本。
- 微博博文:新浪微博和Twitter博文
- 社交网络:人人网和Facebook状态消息
- 即时通信:QQ和微信消息
- 网络评论:京东和携程评论
网络社交媒体是一种典型的网络大数据
- 大量(Volume)
- 快速(Velocity)
- 多样(Variety)
- 不确定(Veracity)
网络社交媒体的大数据特征
腾讯每日同时在线QQ用户1.6亿,每天300G存储量。新浪微博每天有数十亿访问需求。高峰期每秒要接受100万以上响应请求。
数据更新快
- 新浪微博每秒发帖量在2500条以上
- Twitter每秒发帖量甚至达到过14300条
多样性
不确定性
- 噪声更多,网络非正式语言
- 社交话题的多样性
- 情感分析的话题依赖性
- 句子的情感不确定性
- 上下文语境的多样性
- 情感分析的上下文依赖性
网络社交媒体中蕴含情感信息
网络社交媒体中蕴含丰富的网络用户情感信息,已成为国家和企业了解网民情感和观点的最佳资源。
网络媒体情感计算的应用价值
典型的应用案例
印第安纳大学学者利用Google提供的心情分析工具,从用户970万条留言,预测道琼斯工业指数,准确率达到87%。沃尔玛基于每月4500万网络购物数据并结合在社交网络上挖掘出的对产品的大众评论,开发机器学习语义搜索引擎“北极星”,使得在线购物者增加10%~15%,增加销售十多亿美元。华尔街“德温特资本市场”公司分析全球3.4亿微博账户留言,判断民众情绪,人们高兴时会买股票,而焦虑时会抛售股票,依此决定公司股票的买入或卖出。该公司今年第一季度获得7%的收益率。
网络媒体情感计算的学术意义
情感计算对相关学科的促进
网络媒体情感计算的今天
网络媒体独特的特点给传统文本情感计算方法的精准度带来了巨大的挑战
情感词的语义不确定性
面临挑战
基于知识库方法
网络语料库
基于中文语素方法
我们的研究方案
准确、高效、智能的网络文本情感分析方法
社交上下文约束下的网络文本情感计算
- 网络社交文本存在于丰富的社交上下文之中
- 网络文本长度短,信息不完整
- 社交上下文信息可以有效降低短文本的情感不确定性
研究思路
联合网络社交文本的情感得分和社交上下文约束来最终确定文本的情感极性。
情感一致性[Abelson’83]
- 用户在一段时间内对同一话题的观点较为一致
情绪传播
- 情绪会沿着关系网络传播给其他人
- 网络社区内部的观点较为统一
模型
- 目标函数:社交文本最终情感极性与原极性尽量接近
- 约束条件:社交上下文,情感一致性和情绪传播
实验结果
特定社交话题下的网络短文本情感分析
情感分析具有话题依赖性
- 工资上涨v.s. 洪水上涨
- CPU跑得快v.s. 电池耗得快
社交话题内部的语义和情感较为统一
从海量无标注数据中提取话题特定情感知识
- 词的情感极性知识
- 词与词的情感相似度知识
将话题特定情感知识融入到标注数据的模型训练中
特定社交话题下的网络短文本情感分析
数学模型
实验结果
Personalized MicroblogSentiment Classification via Multi-Task Learning
研究背景:解决网络情感分析的用户个性化依赖问题
- 不同的人倾向于使用不同的词去表述内心情感
- 同一个词或短语被不同的人使用可能具有不同的情感极性
基本思路:个性化的微博情感分类
- 为每个网络用户训练一个个性化的情感分类器
- 通过对网络用户间的情感共性和特性进行建模并协同训练来降低对于标注数据的依赖程度
- 通过挖掘微博用户间社交关系信息,优化个性化情感分类器的学习
全局情感模型,个性化情感模型
应用与实践
认知情景下情感计算的明天
认知情景下的网络社交媒体的情感计算
情绪的认知与计算
- 以大数据形态反映的网络社交媒体数据是带毛的、鲜活的、有情感的原生态数据,体现了认知过程中在语境、语构、语用和语义方面的不确定性,这正是大数据的魅力所在。
- 通过自然语言理解,是否挖掘出影响情绪认知的4要素,以此支撑情感计算呢?
情感计算与认知的关系
计算只是感知情感,认知才能预测情感
网络媒体情感认知理论研究