协同过滤技术在高校图书馆学术资源个性化推荐服务中的应用研究5000

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

协同过滤技术在高校图书馆学术资源个性化推荐服务中的应用研究【摘要】现今的信息化时代,纸质文献由于传播范围受限,阅读人群固定,已经不能满足更多人对于最新信息的需求,以电子期刊和在线文档的形式在网络上传播可以满足科研人员对于最新信息的需求。由于网络上的信息过于庞杂,在数以万计的资料中准确找到与自己研究方向相关的信息变得十分困难,因此如何利用现在的网络资源和计算机技术准确定位所需信息就显得尤为重要。本文主要介绍了协同过滤技术在高校图书馆个性化服务的设计和应用。【关键词】数字图书馆;协同过滤;图书推荐随着Internet的飞速发展,电子商务等行业应运而生,各大网站为了在新时代抓住用户的需求,纷纷将Agent技术、Web数据挖掘技术应用到为了每个客户的个性化推荐系统中。个性化服务充分利用各种资源优势,以以人为本的理念获得了客户的认可。因此,在教育、科研等领域也纷纷引入了个性化服务理念和技术,由于高校图书馆的藏书和读者比较专业,专业文献的出版增速还在提高,专业之间经常出现交叉融合,在这样大的库藏中,读者自行找到自己需要的读物是一件相对繁琐的事情,如果能够在图书馆现有的计算机自动化处理系统和数据库技术上构建一个推荐系统,根据读者之前的借阅信息进行分析汇总,发现读者的阅读兴趣,向读者推荐相似种类的读物可以达到完善图书馆服务,了解读者需求的目的。1协同过滤技术应用于高校图书馆学术资源个性化推荐服务的必要性1.1协同过滤技术的简介关联规则技术主要作用是在大量的数据中发现项集之间的相关联系,协同过滤挖掘则是对具有相似兴趣的用户或是具有相似属性的物品的相关推荐。在日常生活中,我们在打算购入一类书的时候,我们通常会询问周边的同事、朋友最近有没有看过相同类别的书,并请求推荐,或者到网上了解这类图书的最新资讯,在这一系列综合分析过后,我们多半会选择接受平时跟我们兴趣爱好相似的人的建议。这个过程基本可以称作协同过滤的核心思想。协同过滤就是利用集体智慧的典型方法,扩展来讲就是利用具有相似的兴趣爱好、拥有共同的经验的群体的喜好向系统使用者推荐可能感兴趣的资讯,系统使用者通过合作机制回应系统推荐的资讯,系统记录下来从而达到过滤的目的,进而对其他人筛选资讯起到优化的作用。协同过滤的思想就是把跟你爱好相近的人喜欢的但是你还没有接触过的资讯推荐给你,根据你曾经使用过的物品挑选类似性质的物品推荐给你。1.2高效图书馆的现状第一,实现全文检索在内的低级信息化。检索操作要求用户给出能够表示自己需求的信息的查询关键词,因此检索出来的文献质量直接取决于用户给出的检索关键词,如果用户对于自己的借阅需求不能简洁、准确的定位的话,就不能快速的找出符合要求的文献。所以大部分检索系统所具备的高级检索功能在方便一部分人群的时候,同时将另一部分人拒之门外。第二,图书数据包含的元素稀少,全文检索功能适用范围很有限。图书数据一般包含图书书名、作者、出版社等基本信息,并不包含读者希望了解的图书内容,甚至也没有图书简介。这样的话有很多优秀的图书就会因为图书名字的原因不能被很多读者检索到。有本书叫做《菜鸟啃Excel》,这本书主要教授初入门者如何进行数据分析,图书的书名并没有提到“数据分析”,在图书数据中就没有“数据分析”一项,高校图书馆又相对封闭并没有可供参考的第三方数据和相似网页链接中的锚文字可以补充有关的元信息,所以这本书不能被提交“数据分析”检索词的用户检索到,白白流失了很多读者。第三,高校图书馆主要都是专业类的藏书,并且用户间的专业差异比较大,导致了高校图书馆有很多专业书籍不会被经常借阅。据统计,本文实验的图书馆藏书近200万册,其中唯一图书超过45万册,但是其中被借阅过至少一次的仅仅占了47.51%,剩下超过一半的书籍并没有被借阅过,这一数据足以证明图书馆的书籍并不能实际意义上的满足用户的需求,目前的图书馆系统不能密切联系专业用户和专业图书,并没有借阅过得书籍对于公共资源来说是一种巨大的浪费,不利于知识的传播和发扬。1.3协同过滤技术的原理协同过滤的实现算法主要分为:基于模型和基于内存的协同过滤算法。协同过滤推荐算法基于内存的协同过滤基于模型的协同过滤基于用户的协同过滤基于项目的协同过滤聚类协同过滤贝叶斯网络推荐机器学习分类关联规则协同过滤实现协同过滤的步骤如下:1.收集用户偏好。用户的偏好可以分为显性和隐形收集,显性收集方式主要包括评分、评论、投票,隐形收集方式主要有购买和查看。在实际运用中,我们收集用户的行为通常有多种。在得到用户的数据之后,首先要对收集到的数据进行预处理,预处理之后,按照不同应用的行为分析方法,得到每个用户偏好的二维矩阵,其中一维是用户列表,另一维是物品列表,得到的值是用户对物品的偏好。2.寻找类似的用户或物品,找到最近的邻居。根据以下三种算法寻找距离最短的用户,基于相关系数的相似度,基于预先相似度和基于调整余弦相似度。1.3.1基于用户的协同过滤基于用户的协同过滤的核心思想是首先以用户对物品的偏好程度为基础找到相邻的邻居用户,之后在邻居偏好但是当前用户没有购买过的物品推荐给当前用户。其原理是把一个用户对所有物品的偏好作为一个向量,对各个用户之间的相似度进行精密计算,找到E邻居,分析邻居们的相似程度和购买过的物品,对当前用户可能感兴趣但是没有购买过的物品进行推测,总结出一个物品推荐表给用户。原理如下图:用户物品abcd张三√√√李四√王五√√〇(注:√表示用户购买过该物品。〇表示推荐用户购买该物品。)基于用户的协同过滤算法有以下三个算法:首先,建立用户模型。其次,寻找最近邻居。最后,生成推荐物品。1.3.2基于项目协同过滤基于物品协同过滤的原理与基于用户的协同过滤接近,不同的地方在于不再是从用户自身的角度而是从用户对物品的偏好找到相似的物品,再之后根据用户的购物历史,向用户推荐相似的物品。其本身就是假设用户在正常情况下会喜欢自己曾经购买过的类似的物品。这比如是,在购物网站,用户购买了一部手机,网站就会根据这个向用户推荐同品牌型号的耳机或手机壳。用户如果曾经购买了一个明星的周边产品,网站也会推荐相类似的周边产品给用户。原理如下表所示:用户物品abc张三√√李四√√√王五√〇(注:√表示用户购买过该物品。〇表示推荐用户购买该物品。)2系统需要满足的功能2.1热门图书推荐图书的推荐可以分为两种情况。第一,没有登陆的用户。针对没有登陆的用户,没法获取用户的数据信息,因此将当前系统借阅程度较高的较热门书籍推荐给这部分用户。第二,已经登陆的用户。对于已经登陆的用户,系统可以在数据库中了解到用户的年级及专业情况,针对用户的专业向用户推荐跟用户专业相关的可能感兴趣的专业书籍。根据登录用户的学院和借阅书籍的信息,可以统计出该学院借阅程度较高的书籍作为热门推荐列表。2.2图书搜索虽然新系统的主打功能是推荐功能,但是同时也具备了传统搜索系统的最基本的功能——搜索功能。搜索功能可以在用户使用新系统的时候,也能够快捷的进行图书搜索。查看到图书信息之后,用户可以登录数字图书馆系统进行借阅。2.3借阅历史查询使用系统的用户在使用系统的时候除了系统推荐和图书搜索,还能在自己的系统信息中看到自己的借阅历史情况。2.4图书推荐图书推荐功能是推荐系统的最主要的功能之一。利用上文中提到的基于用户的协同推荐法和基于项目的协同推荐法,完成在高校图书馆中的图书推荐功能,向用户推荐可能喜欢的图书。2.5借过该书的人也喜欢的图书推荐系统推出了“借过该书的人也喜欢的图书”的功能,这个功能是统计借阅过这些图书的用户还借阅过得书籍中节约率比较高的那部分,推荐给用户。2.6新书推荐当图书馆新增图书的时候,系统会在公告中通知用户。在公告中通知用户新增书籍的简洁让用户更好地了解新书,让新增的书籍更容易被借阅,达到了知识传播的效果。3基于协同过滤技术的高校图书馆学术资源个性化推荐服务系统的总体设计3.1整体功能需求分析如下图所示,系统功能可以划分为两部分,前台展示和后台管理。前台展示的职能有,推荐新书、热门借阅书籍、个性化推荐书籍、通知公告及网上调研。后台管理的职能有,图书管理、读者管理、公告管理、投票管理及参数设置。前台和后台的职能是相互联系的。图书推荐系统后台管理前台展示图书管理读者管理公告管理投票管理参数设置网上查询通知公告个性化推荐借阅排行馆员推荐新书推荐管理员读者3.1.1前台的功能1.新书推荐:新书推荐功能旨在于将图书馆近期购入的、收到的新书向读者介绍,读者可以通过该功能知道此书的梗概,在不能够根据读者信息为读者提供个性化推荐书籍的时候,新书推荐功能也是一种基本的推荐方法,在推荐系统只要点开书籍的链接就能够详细了解该书的具体信息。2.馆员推荐:馆员推荐功能是在不能向读者提供个性化推荐服务的时候,推荐系统会向读者推荐图书馆馆员推荐的书籍,这些书籍是每个学院的老师根据学校专业和学生的具体情况做出的针对性推荐,这些书籍据大部分都能够针对学生的专业起到提升本专业技能的作用。3.借阅排行:借阅排行职能是根据最近一段时间内的,学生图书借阅数量的排行,挑选出近期较为热门的书籍,这些书籍比较符合大众的口味,能够对个性化推荐起到较大的补充作用。4.通知公告:通知主要发布了图书馆的通知和公告,如:新书到馆、图书展览、节假日期间图书馆的开闭馆时间、近期举办的学术报告和会议、一些紧急通知和临时公告。5.网上调查:网上调查作为图书馆了解读者对信息需求的手段,以读者的阅读兴趣为基础,能够更大程度上的帮助读者购买书籍、向读者推荐书籍和开展相关的活动,为保证投票的客观和公平,系统只允许每位读者投一次票,不能重复投票。投票结束之后,通过系统的统计可以得知多少人参加了投票,每类书所占的比率是多少。3.1.2后台管理需求分析推荐系统的后台管理的职能有图书管理、用户管理、公告管理及投票管理,系统后台管理还能够更新相关信息,具体如下图:后台管理图书管理用户管理投票管理公告管理冻结解冻添加删除更新查看1.图书管理:在创建图书资料库的时候,第一步,把所有的图书信息运用自动或手动方式添加到推荐系统,需要添加的信息如下:图书ISBN号、索书号、书名、出版社、登录号、作者、出版日期及价格等。后台管理系统可以为图书信息进行添加、修改、删除,并且可以设置推荐图书的数目,编著是不是新书等。2.用户管理:在用户管理界面能够查看到所有作者的读者包括真实姓名、居住地址、电话及邮箱在内的全部个人信息,想要查询读者信息非常便捷,只要点击某一读者的卡号的超链接就能看到读者的全部信息。在用户管理界面可以对违反了借书规定的读者信息采取冻结措施,是其无法登录系统。同样的,在用户管理系统也能对被冻结的账户进行解冻,但是不能添加、修改和删除。虽然系统能够查看用户信息,但是用户自己设置的密码在用户管理系统是不能被查看的,是绝对保密的。3.公告管理:公告管理职能是添加或者删除公告,但是已经发布的公告信息不能修改只能删除。4.投票管理:投票管理主要职能是添加及删除投票项目,管理人员在决定购买某类图书的时候,可以在推荐系统对这类书籍设置一个投票项目,调查一下是否符合大众的品味,为购买图书提供参考性建议。5.参数设计:参数设计可以为推荐系统的参数进行配置。相似性阙值仅是通过该职能实现的,其作用是限制成为项目或用户的邻居的条件,只要超过设定的阙值才能被认定是相近的项目或邻居,这样的设置可以区分项目或用户,这样能够限制产生的邻居的数量。3.2系统流程读者登录系统需要进行身份识别,就是使用自己的学号和系统初始密码登录系统。在首次登录系统之后,读者需要自行修改成自定义密码以保证账号安全性。不属于推荐系统的用户无法进入系统使用。用户被划分为普通用户和管理员两类,普通读者可以在推荐系统内修改个人信息,查看推荐图书,个人历史借阅记录。在图书推荐一栏可以看到新书推荐、借阅排行榜、馆员推荐以及个性化推荐。管理员登录系统后能够管理图书信息、读者信息及通知公告,为了实现最好的推荐效果,管理员还会对数据挖掘参数进行适当的调整。系统首页的使用说明及操作链接能够保证读者顺利、安全的完成操作,使用完系统之后为保证个人账号

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功