情感词汇本体库说明文档

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

中文情感词汇本体说明文档V1.01.介绍中文情感词汇本体库是大连理工大学信息检索研究室在林鸿飞教授的指导下经过全体教研室成员的努力整理和标注的一个中文本体资源。该资源从不同角度描述一个中文词汇或者短语,包括词语词性种类、情感类别、情感强度及极性等信息。中文情感词汇本体的情感分类体系是在国外比较有影响的Ekman的6大类情感分类体系的基础上构建的。在Ekman的基础上,词汇本体加入情感类别“好”对褒义情感进行了更细致的划分。最终词汇本体中的情感共分为7大类21小类。构造该资源的宗旨是在情感计算领域,为中文文本情感分析和倾向性分析提供一个便捷可靠的辅助手段。中文情感词汇本体可以用于解决多类别情感分类的问题,同时也可以用于解决一般的倾向性分析的问题。2.本体格式介绍情感词汇本体中,一般的格式为。表1情感词汇本体格式举例词语词性种类词义数词义序号情感分类强度极性辅助情感分类强度极性无所畏惧idiom11PH71手头紧idiom11NE70周到adj11PH51言过其实idiom11NN52其中,一个情感词可能对应多个情感,情感分类用于刻画情感词的主要情感分类,辅助情感为该情感词在具有主要情感分类的同时含有的其他情感分类。3.情感分类及情感强度情感分类按照论文《情感词汇本体的构造》所述,情感分为7大类21小类。情感强度分为1,3,5,7,9五档,9表示强度最大,1为强度最小。情感分类如表2所示:表2情感分类编号情感大类情感类例词1乐快乐(PA)喜悦、欢喜、笑眯眯、欢天喜地2安心(PE)踏实、宽心、定心丸、问心无愧3好尊敬(PD)恭敬、敬爱、毕恭毕敬、肃然起敬4赞扬(PH)英俊、优秀、通情达理、实事求是5相信(PG)信任、信赖、可靠、毋庸置疑6喜爱(PB)倾慕、宝贝、一见钟情、爱不释手7祝愿(PK)渴望、保佑、福寿绵长、万寿无疆8怒愤怒(NA)气愤、恼火、大发雷霆、七窍生烟9哀悲伤(NB)忧伤、悲苦、心如刀割、悲痛欲绝10失望(NJ)憾事、绝望、灰心丧气、心灰意冷11疚(NH)内疚、忏悔、过意不去、问心有愧12思(PF)思念、相思、牵肠挂肚、朝思暮想13惧慌(NI)慌张、心慌、不知所措、手忙脚乱14恐惧(NC)胆怯、害怕、担惊受怕、胆颤心惊15羞(NG)害羞、害臊、面红耳赤、无地自容16恶烦闷(NE)憋闷、烦躁、心烦意乱、自寻烦恼17憎恶(ND)反感、可耻、恨之入骨、深恶痛绝18贬责(NN)呆板、虚荣、杂乱无章、心狠手辣19妒忌(NK)眼红、吃醋、醋坛子、嫉贤妒能20怀疑(NL)多心、生疑、将信将疑、疑神疑鬼21惊惊奇(PC)奇怪、奇迹、大吃一惊、瞠目结舌4.词性种类情感词汇本体中的词性种类一共分为7类,分别是名词(noun),动词(verb),形容词(adj),副词(adv),网络词语(nw),成语(idiom),介词短语(prep)。5.极性标注每个词在每一类情感下都对应了一个极性。其中,0代表中性,1代表褒义,2代表贬义,3代表兼有褒贬两性。注:褒贬标注时,通过词本身和情感共同确定,所以有些情感在一些词中可能极性1,而其他的词中有可能极性为0。6.存储格式及规模中文情感本体以excel的格式进行存储,共含有情感词共计27466个,文件大小为1.22M。

1 / 2
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功