数据挖掘技术在专利信息分析与预测中的应用研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

武汉理工大学硕士学位论文数据挖掘技术在专利信息分析与预测中的应用研究姓名:杨铭申请学位级别:硕士专业:机械电子工程指导教师:李刚炎;舒正荣20060501数据挖掘技术在专利信息分析与预测中的应用研究作者:杨铭学位授予单位:武汉理工大学参考文献(51条)1.谢榕数据挖掘与决策支持系统[期刊论文]-计算机系统应用1999(8)2.郑宏珍.柳明欣数据挖掘及其工具的选择1999(10)3.石冰.郑燕峰信息检索中的数据挖掘技术1999(zk)4.刘桂霞.崔永铎.高平和关于数据挖掘的研究2000(03)5.RichardJRoiger.MichaelWGeatz数据挖掘教程20036.刘晓东.刘大有数据挖掘专利综述[期刊论文]-电子学报2003(z1)7.岳宗全从专利文献看磁悬浮列车技术2003(02)8.吴泉洲如何解析专利族2004(04)9.赵黎明.李海霞.韩宇基于数据挖掘的专利引文研究与知识发现[期刊论文]-预测2002(6)10.陈戟剑专利文献中的专利战略指数初探2004(04)11.吴泉洲如何做出口产品专利检索及分析2003(03)12.陈卫明德温特分析软件2004(03)13.方建国文本挖掘在专利分析中的应用2004(01)14.冯小青企业知识产权200115.魏衍亮企业专利情报战略初探[期刊论文]-中国科技产业2004(7)16.孙英云基于数据挖掘的短期负荷研究200417.杨叔子.吴雅时间序列分析的工程应用199118.PapalexopoulosAD.HesterbergTCAregression-basedapproachtoshort-termsystermloadforecasting2001(03)19.尚岳全.孙红月.赵福生滑坡变形动态的自回归模型分析[期刊论文]-岩土工程学报2000(5)20.江朝晖.杨连贺数据挖掘在人工神经网的应用[期刊论文]-电脑开发与应用2005(1)21.陈永忠我国股市非线性时间序列分析[学位论文]博士200422.华琇.陈继红基于RBF神经网络的销售预测模型的研究与应用[期刊论文]-南通工学院学报(自然科学版)2004(4)23.陈平.漆文邦.何富刚BP神经网络算法在年电力负荷预测中的应用[期刊论文]-四川水利2005(1)24.赵成晋文本数据挖掘在信息监控中的应用研究200525.薛为民.陆玉昌文本挖掘技术研究[期刊论文]-北京联合大学学报(自然科学版)2005(4)26.WLam.CYHoUsingageneralizedinstancesetforautomatictextcategorization199827.BMasand.GLino.DWaltzClassifyingnewsstoriesusingmemorybasedreasoning199228.YYangExpertnetwork.Effectiveandefficientlearningfromhumandecisionsintextcategorizationandretrieval199429.YYangAnevaluationofstatisticalapproachestotextcategorization1999(1-2)30.YYang.JPPedersenAcomparativestudyonfeatureselectionintextcategorization199731.VVapnicTheNatureofStatisticalLearningTheory199532.左继宏.胡树华基于灰色GM(1,1)模型预测GDP及人均GDP2005(05)33.刘宪峰.南灵.石志恒灰色模型在西安住宅市场预测中的应用及市场分析2005(03)34.飞思科技产品研发中心神经网络理论与MATLAB7实现200535.董长虹Matlab神经网络与应用200536.王彤承数据挖掘在电力营销决策支持系统中的研究与应用[学位论文]硕士200337.尹泽明.丁春利精通MATLAB6200238.董德存.张树京用于AR参数估计的一种神经网络新方法1994(01)39.孙英慧基于向量空间模型的数据挖掘技术的研究[学位论文]硕士200540.李智辉.芦苇WEB文本主题挖掘技术研究2005(11)41.张宁.贾自艳.史忠植使用KNN算法的文本分类[期刊论文]-计算机工程2005(8)42.SarawagiSiddiffInformativesummarizationofdifferencesinmultidimensionalaggregates2001(04)43.ImielinskiT.AVirmaniMSQL:aquerylanguagefordatabasemining1999(04)44.JPei.JHan.HLu.S.Nishio,S.Tang,D,YangH-Mine:Hyper-StructureMiningofFrequentPatternsinLargeDatabases200145.许瑛美国专利商标局的现有技术检索的前景2004(03)46.万安华.王绵森.毛卫华数据挖掘技术的理论及应用[期刊论文]-大学数学2004(6)47.JHan.MKamberDataMiningConceptsandTechniques200048.GPsaila.PLLanziHierarchy-basedMiningofAssociationRulesinDataWarehouses200049.金中仁.陈振宇知识管理与文献信息数据挖掘[期刊论文]-情报杂志2004(12)50.WangYe.HuangShangtengAprioriandN-gramBasedChineseTextFeatureExtractionMethod2004(04)51.SUNJian-hua.JINHai.CHENHao.HANZong-FenMA-IDS:ADistributedIntrusionDetectionSystemBasedonDataMining[期刊论文]-武汉大学学报(英文版)2005(1)相似文献(10条)1.会议论文吕琳.朱东华.刘玉琴面向通信技术领域的中美专利情报对比分析2008以通信技术领域的中美专利数据为基本数据源,利用数理统计原理,集成数据挖掘、技术组(群)智能识别、技术组(群)的关联模型和关联关系表达技术等当今的信息前沿技术与管理方法,结合传统的统计学文献计量学、科学计量学理论,开展大型异构数据库环境下对中美专利情报的对比研究,并以可视化的图表展示分析结果,为政府和企业把握通信技术领域国内外的研究现状及动态提供决策支持。2.学位论文钱海峰文本挖掘在专利分析中的应用研究2008专利文献数据作为人类科学技术发展的缩影,是世界上最大的技术信息源。有效地分析这些专利数据文献,进一步发现其中蕴含的知识,对指导各个生产科研单位的生产和科技创新具有十分重要的意义。数据挖掘技术中的文本挖掘在专利文献分析领域有着广泛的应用前景。论文工作结合专利数据文献特征,对文本挖掘技术在专利文献定性分析中的应用进行探讨和研究:首先,为了提取专利文献的关键特征,本文结合专利文献数据的特点,提出一种基于文本聚类的无监督特征选择算法UFSC对专利内容进行分析。实验表明,由于考虑了特征的类区分力,UFSC能更好的选择出文本中的关键特征;然后,针对如何计算专利类别间的关联度的问题,给出一种对专利类别间关联度量化的方法。该算法首先通过有监督的特征选择方法提取每个专利类的3.期刊论文钱增瑾.辛燕.鞠时光.QIANZeng-jin.XINYan.JUShi-guang基于中药专利数据集的关联规则发现算法-计算机应用研究2007,24(7)指出关联规则在中药数据分析中的难点,据此提出了一种改进的Apriori算法--Apriori+算法;最后,以治疗感冒的中药专利数据集为测试数据,进一步验证算法的有效性和实用性.结果表明,此算法能够有效地从治疗感冒的专利数据库中发现布尔型与数值型关联规则,为开发新的感冒中药提供配伍依据.4.学位论文杨春亮基于模糊逻辑的专利数据层次分类研究2008随着经济全球化的日益深入和知识经济的发展,知识产权,尤其是专利,引起了国家、地区和产业界的高度重视,拥有核心技术专利已成为企业市场竞争的战略制高点。专利数据含有大量有用信息,表明技术发展方向和趋势,对企业技术研发策略的制定有重要参考价值。但目前的专利数据分析技术普遍存在着效率低下,周期过长等弊端。专利申请量的激增一方面增加了对快速、自动专利分析的迫切需求,另一方面又为基于数据挖掘技术的专利文本挖掘方法准备了充分的资源,因此计算机辅助专利分析成为了大势所趋。目前专利数据人工分类普遍存在着效率低下,错误过多等弊端;在实际专利文本分类中,一篇专利文献可以属于不同的类别,在这方面与一般文本分类方法是不同的;现有的专利文本分类大多都采用了传统的文本分类算法,没有考虑到专利数据所涉及到多个学科领域,同族专利的相似度比较大等问题。基于以上的考虑,本文着重研究了专利文本挖掘中的自动分类问题。首先详细的说明了专利数据的信息特征以及国际IPC分类的概况,并根据专利数据的特点,提出了针对于专利数据的特征提取方法,在提到的特征提取方法当中,引入了位置权重,使得专利文本向量表示更加准确;其次,在第四章当中概述了一般文本分类算法,并延伸出了专利自动文本分类算法。基于考虑到对专利分析时要对专利数据作深层次的细分,以及在研究同族专利时候,会有一些关于交叉学科的专利归属于不只一个类别当中。我们提出了基于模糊逻辑的专利数据层次分类算法,详细的算法在第五章当中做了比较详细的描述;最后,我们构建了一个类层次结构模型,采用查准率和查全率作为分类结果的评价指标,对170组专利数据进行仿真试验,在第一,二层次上的都达到了比较理想的分类效果,在第三层次上的分类效果一般,还需要新的改进。5.会议论文吕琳.朱东华.刘玉琴面向数据仓库的数据预处理研究综述2007从定义、任务、内容、方法、算法等多角度,对数据预处理技术进行了全方位的探讨,强调了其对于构建数据仓库的重要性和必要性。通过建立美国专利数据挖掘系统,设计出数据预处理的通用框架.最后总结了数据预处理未来的研究方向。6.学位论文蒋健安面向专利文献数据的文本分类若干关键技术研究2008在当今全球化经济的时代,专利技术已成为国家或地区竞争力的核心,专利知识产权越来越受到企业的重视。随着企业竞争越来越激烈,企业用于专利开发的力度不断加大。因此,近年来的专利申请量迅速增大,但是目前专利分类的方法是采用传统的手工分类方法,这种分类方法效率低下,存在许多弊端。专利申请量的激增一方面增加了对快速、自动文本分类的迫切需求,另一方面又为数据挖掘技术的文本分类方法准备了充分的资源。因此,计算机辅助专利分类成为大势之所趋。中文文本分类技术已趋成熟,在相关领域有着很好的应用,这为专利自动分类系统的实现提供了有力的技术支持。虽然该技术目前还没有实际应用在专利信息上,但是专利信息与其他文本信息有着很多相同的特点,而且更加具有类别的可分性,因此本文提出了将该技术应用在专利文本上的新应用。本文介绍并分析了文本分类的若干关键技术。结合专利数据的特点提出了一种基于后缀数组的领域词汇抽取方法,并在此基础上利用词典和统计相结合的方法来进行中文分词。本文基于向量空间模型,将文本表示为以特征项权重为项的向量集合,并在权重计算公式中加入了位置信息,使得计算出的特征项权重能够更好地表示文本内容。对于文本分类算法,在结合分类准确度最好的分类算法KNN算法和分类速度最快的分类算法Rocchio算法的基础上,设计了一个层次分类算法,并给出了面向专利文献数据的文本自动分类系统的框架模型。实验表明,该系统具有较好的分类精度与效率。7.期刊论文顾震宇.卞志昕.路炜.肖沪卫应用领域专利地图的方法及实证研究-情报杂志2009,28(9)应用领域专利地图制作中,由于应用领域往往没有合适的分类,或者即使有专用分类也不全面,同时较

1 / 65
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功