数据集
名称 | 格式 | 链接 | 提取码 |
---|---|---|---|
2013data.zip
|
zip
|
px8r
|
数据描述
对于输入的整条微博,任务要求判断出该微博是否包含情绪。对包含情绪的微博,要求判别其情绪分类输出为 anger 愤怒、disgust 厌恶、fear 恐惧、happiness 高兴、like 喜好、sadness 悲伤、surprise 惊讶中的一种,即单分类输出。需要注意的是,一条微博中可能包含多个个体的不同情绪,情绪分类应以博主的主要情绪为准。评测数据来自新浪微博,评测数据全集共约 40000 条微博。数据采用 xml 格式,已经预先切分好句子。数据格式为 xml 格式,编码为 Unicode(utf-16)。有关该任务和数据集详细描述请见NLPCC 2013 Shared Task:http://tcci.ccf.org.cn/conference/2013/pages/page04_eva.html。该数据集已合并并入情感分类数据集:https://biendata.com/ccf_tcci2018/datasets/emotion/
数据提供
提供方:徐睿峰(哈工大深圳研究生院)、李寿山(苏州大学)
主页地址:http://www.hitsz.edu.cn/teacher/view/id-492.html http://nlp.suda.edu.cn/~lishoushan/index-cn.html
联系方式:xuruifeng@hit.edu.cn ,lishoushan@suda.edu.cn
评测结果报告:http://tcci.ccf.org.cn/conference/2013/dldoc/evres02.pdf