数据集

名称 格式 链接 提取码
2014data.zip
zip
yc6i

数据描述

评测数据来自新浪微博,对于输入的整条微博,任务要求判断出该微博是否包含情绪。对包含情绪的微博,要求判别其情绪分类输出为 anger 愤怒、disgust 厌恶、fear 恐惧、happiness 高兴、like 喜好、sadness 悲伤、surprise 惊讶。需要注意的是,一条微博中可能包含多个个体的不同情绪,每条微博都需要提交两种主导情绪。数据格式为 xml 格式,编码为 Unicode(utf-16)。有关该任务和数据集详细描述请见NLPCC 2014 Shared Task:http://tcci.ccf.org.cn/conference/2014/pages/page04_eva.html。该数据集已合并并入情感分类数据集:https://biendata.com/ccf_tcci2018/datasets/emotion/

数据提供

提供方:徐睿峰(哈工大深圳研究生院)

主页地址:http://www.hitsz.edu.cn/teacher/view/id-492.html

联系方式:xuruifeng@hit.edu.cn