挖掘产品信息的变异表达

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

重庆科技学院本科生毕业设计中文摘要I摘要用户在表达情感时,有时会对多个特征表示出相同的情感,如对一个产品的不同部件都表示认同或者对一个部件发出多种情感态度,这些变异的表达在通用的挖掘方法中无法获得,但这些表达又是极其重要的,因为这些表达是用户经常使用的。中文评论特征与情感的变异表达分析中,通过已经获得的产品特征词和情感词,把在一个情感词后而在另一个情感词前的所有特征都可以挖掘出来,这些特征就是用户所关注的内容并且是通过同一个情感词进行修饰的。本文采用半监督学习方法对产品评论中的产品特征和情感词同时进行抽取,保留了产品特征与情感词的对应关系,并通过获取的产品特征词和多情感词对评论中的多特征和多情感的情况进行了处理。关键词:监督学习变异表达挖掘方法重庆科技学院本科生毕业设计英文摘要IIAbstracttheUsersintheexpressionofemotion,sometimesformultiplefeaturesshowedthesameemotions,suchasaproductofthedifferentpartsofacomponenttoagreeoremotionalattitude,avarietyofthesemutationsinthegeneralexpressionoftheminingmethod,buttheexpressionisveryimportant,becausetheyareoftenusebyuser.Chinesecharacteristicsandthevariationofemotionalcommentsexpressanalysis,theproducthasobtainedthroughinformationandemotionalwordsinanemotionalwords,afteranotheremotionalwordsinallcandigoutthesefeaturesisconcernedcontentandcustomersthroughthesameemotionalwordismodified.Basedonasemi-supervisedlearningmethodofproductreviewsproductcharacteristicandemotionalwordsimultaneouslyextracting,retainedproductfeaturesandemotionalwords,andthroughthecorrespondingrelationofproductinformationandmoreemotionalwordstocommentonthefeaturesandmoreemotionalsituations.Keywords:learningsupervision;variationexpress;miningmethod重庆科技学院本科生毕业设计目录目录中文摘要........................................................................................................................I英文摘要.......................................................................................................................II1绪论............................................................................................................................11.1研究背景................................................................................................................11.2国内外现状...........................................................................................................11.3产品评论文本与普通文本之间的区别................................................................21.4系统开发平台介绍................................................................................................31.5评论语料库使用的现状........................................................................................31.6产品评论获取技术及应前景................................................................................41.7评论挖掘方法介绍................................................................................................41.8本文的主要工作及目的........................................................................................52挖掘产品特征和情感的变异表达详细设计.............................................................72.1问题的提出及相关研究........................................................................................72.2从产品评论中进行特征和情感变异表达挖掘的基本思路................................92.3线性模型及在特征与情感的变异表达挖掘中的应用......................................102.4Bootstrapping半监督学习方法.........................................................................132.5评论中的多特征识别算法..................................................................................172.6评论中多情感识别算法......................................................................................192.7Bootstrapping半监督学习方法的利弊分析.....................................................212.8本章小结..............................................................................................................223系统测试..................................................................................................................233.1程序运行测试......................................................................................................233.2可能遇到的技术困难..........................................................................................243.3测试小结..............................................................................................................24总结..............................................................................................................................25参考文献......................................................................................................................27致谢..............................................................................................................................29重庆科技学院本科生毕业设计1绪论11绪论1.1研究背景随着Internet的飞速发展,庞大的Web资源日益演变为人们获得知识与信息的重要来源。与此同时,由于Web资源的迅速膨胀以及Web信息的分散性与随意性,用户很难通过便捷的方式快速准确地从Web上获取所需的信,每天必须花上大量的时间与精力到各个网站上去浏览并挑出有效的信息。因此,如何快速有效地对Web信息进行分类和索引以提供面向用户的快速检索访问成为一项重要的研究课题。对网络上的产品评论进行挖掘主要是使用现有的文本挖掘技术,文本挖掘(TextMining)是数据挖掘的一个研究分支[3],用于基于文本信息的知识发现。数据挖掘是揭示存储在数据库中的结构化数据的数值属性之间的关系,而文本挖掘则是分析和发现大量非结构化文本中的关系,研究的关键在于文本内容的量化表征。文本挖掘利用智能算法,结合文字处理技术,如文本切分、词性标注、句法分析、浅层语义分析等,对大量的非结构化文本(如文档、电子表格、客户电子邮件、问题查询、网页等)进行分析,抽取文本特征,将文本数据转化为能描述文本内容的结构化或半结构化数据。然后利用聚类、分类技术和关联分析等数据挖掘技术,形成具有一定结构文本,并根据该结构发现新的概念和相应的关系,获取有用的知识和信息。文本挖掘的早期研究是信息检索,包括了基于关键字检索和全文检索,这些技术仍然广泛应用于网络文本的搜索。现今的搜索引擎在资讯搜索上是相当有效的,但是在数据的统一上就显得相对不足,我们只能要求搜索引擎找到我们想要的信息,但是它无法帮我们整理也无法帮我们找出重点,在产品信息比较方面也是如此,因此如何将各种产品的信息和评论统一并进行比较对于消费者来说是一项很有意义的研究。Web文本挖掘则可以对Web上大量文档集合的内容进行总结、分类、聚类、关联分析,从而抽取出关键信息,用简洁的形式对文档内容进行摘要或解释,用户不需要浏览全文就可以了解文档或文档集合的总体内容。随着各种产品信息纷纷发布在网页上,消费者可以更加便捷地获取各种产品的信息。同时产品使用者也纷纷发表使用评论,这样就又便于

1 / 33
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功