基于智能过滤的数字图书馆个性化信息服务研究摘要:文章介绍了将智能过滤技术应用于数字图书馆个性化信息服务中的必要性。分析了智能过滤技术在数字图书馆个性化信息服务系统应用中所需要解决的关键技术。提出了基于智能过滤的数字图书馆个性化信息服务系统的总体架构。最后从个性化智能推送服务、个性化定制服务、智能代理服务、专业化信息智能定题服务等方面分析了其个性化信息服务的创新。关键词:智能过滤;数字化图书馆;个性化;信息服务伴随着互联网技术的飞速发展,图书馆领域也发生了翻天覆地的变革,并从多方面影响了图书馆信息资源的存在和组织形式。数字图书馆传统的信息开发和服务模式,在当前信息资源加工和存储方式改变的大背景下,面临信息超载、信息重复建设等问题,很难满足综合集成多种资源服务的需求。数字图书馆需要引入先进信息处理技术,以更为智能、高效的方式提升信息资源处理、组织加工、存储和传递效率。智能过滤就是为解决信息过载等问题提出的,将互联网技术与人工智能相结合的信息过滤技术。本文所研究的基于智能过滤数字图书馆个性化信息服务系统,属于智能过滤、信息处理等领域的内容,也是人工智能领域中研究的热点话题,而且也是数字化图书馆个性化服务系统研究的热点之一。1将智能过滤技术应用于数字图书馆个性化信息服务中的必要性1.1智能分析用户个性化信息需求数字时代的到来使人们时常迷失在信息的海洋中,在这种背景下萌生了各种各样的智能过滤技术,不同的搜索技术要么偏重于类别的搜索,要么用于商业领域,要么特别注重知识的获取和呈现。智能过滤技术是结合人工智能与互联网技术,通过信息资源的迅速定位与识别,基于用户的信息行为、个人爱好等基本数据,集成语义识别、信息检索以及信息过滤等多种功能的综合性信息处理技术。智能过滤是一种更加高效的信息搜索与加工技术,它根据用户的实际情况和操作行为,对用户的信息需求进行判断,进而达到对用户需求资源进行智能搜索和筛选的目的。该技术的应用在满足用户的个性化信息需求的同时,也提高了个性化信息服务系统的效率,并且提高了信息服务系统的智能化程度。1.2基于智能分类的个性化信息推送服务需求目前个性化信息服务系统需要用户手动逐级选择所需要的信息类别,然后向系统提交这些选择来显示相对应的信息[1]。该服务方式在效率低下的同时还会加重系统的负担,网络时代服务系统同时在线的人数可能不计其数,一旦大家同时选择提交需求,信息服务系统就有崩溃的危险。智能过滤技术通过对用户需求信息的智能获取和分析进而把用户所需要的信息资源分类显示在页面上。某些用户只是为了解决一些实际问题而到图书馆找资源,对于自己想要的信息并不明确,面对这种情况,智能过滤系统通过用户的操作行为分析用户的真实需求,进而根据这些需求主动为用户推送符合用户需求的信息资源。1.3智能代理服务的应用需求智能过滤技术的应用可以构建智能代理服务系统,通过该系统数字图书馆可以在掌握已有用户信息的基础上,根据用户原有的操作行为,在用户没有明确指定任务的情况下代替用户进行相应的操作。该系统通过比较用户在相关页面的停留时间、访问次数和访问顺序等方面,集成、分析与获取用户的行为习惯和使用偏好数据。这种信息智能代理服务系统的应用,将极大提升数字图书馆的个性化信息服务能力[2]。2数字图书馆信息服务中应用智能过滤技术需要解决的问题2.1个性化信息智能获取服务个性化信息的智能获取方式有两种:[3]一种是静态获取方式,另一种是动态智能获取。前者是从图书馆服务系统根据读者首次使用图书馆个性化信息服务系统注册账号时填写的个人基本信息包括学历、专业和爱好等信息来对读者的个性化需求做初步推测。而后者是通过对用户的日常操作行为做跟踪记录并进一步推测用户的个性化信息需求,同时在此基础上建立或更新用户个性化信息需求库。此外,系统对用户的跟踪方法也分为两种,一种显示跟踪,另一种隐式跟踪。前者是系统根据用户反馈的信息即从图书馆服务系统中存储的读者个人基础信息,主要包括学历、专业和爱好等读者注册时填写的基本信息主动推荐信息资源,这种跟踪方式需要用户的参与。后者是通过用户浏览的页面、查询的内容等信息来推测用户的真实需求,该跟踪方式促进了服务系统效率和智能化程度的提高。2.2个性化信息智能筛选服务个性化信息的智能筛选系统通过首先对用户信息进行筛选并建立用户兴趣知识库,接着进一步根据用户的操作行为来筛选个性化信息并在此基础上更新用户的兴趣知识库。[4]该系统是在所掌握的用户信息的基础上对信息服务系统内数字化网络信息再次进行智能筛选。当前网络背景下数字图书馆信息资源具有的易变性、重复性和海量性决定了需要时刻筛选和更新兴趣知识库。信息资源的这些特性决定了用户个性化信息的筛选实属不易。在茫茫信息资源中找到用户所需信息而且还要把这些信息条理的主动推荐给用户绝非易事。而且这些海量信息存在重复建设与动态更新问题,这就给信息的筛选增加了难度。2.3用户行为数据模型的构建当前我国部分数字图书馆构建了个性化信息服务系统,但是其服务功能并不完善。究其原因与当前绝大多数的数字图书馆服务系统无法有效应用先进信息处理技术,不能全面掌握用户需求信息有关。对于用户而言这样的信息服务是别动的,有关用户需求模型的构建缺乏规范,也无法深入获取个性化信息需求。个性化信息服务需要结合用户的日常行为,可以利用智能过滤技术构建用户行为数据模型,以帮助数字图书馆收集用户行为数据。在搜集用户行为数据过程中,需要单独为每一个用户建立描述性文件,其内容包含用户的个人信息、兴趣爱好以及行为特征等。描述性文件的具体形式天壤之别,但是其类型具有相似性,重点分为用户兴趣的描述以及基于用户行为的描述两个方面,具有逐级递进、逻辑性强的特点,多以层次结构较强的形式进行数据描述。基于用户行为为主的描述性文件通常以浏览化的形式来表示,具有导入方便和查看清晰的特点。用户行为数据模型的应用,可以深入了解用户的需求信息,提升个性化信息服务效率[5]。本文基于智能过滤的数字图书馆个性化信息服务系统的构建,就是以“用户行为数据模型”为导向,利用智能过滤技术来获取并分析用户个性化的信息需求,并在此基础上智能筛选与匹配信息资源。同时利用信息服务系统的自学能力,在逐渐更新完善知识库的前提下,进一步提高数字图书馆的智能服务水平。3.基于智能过滤的数字图书馆个性化信息服务系统的构建数字图书馆引入智能过滤技术的目的,就是利用信息资源与用户描述信息的匹配,将用户感兴趣的内容以友好的方式迅速推荐给用户[6]。基于智能过滤技术的数字图书馆个性化信息服务系统的构建,就是以内在智能信息过滤机制,减少用户检索与筛选信息的时间,最大限度地为用户提供个性化服务。3.1基于智能过滤的个性化信息服务系统的模型设计本文所研究的个性化信息服务系统采用服务器模式架构组成,如图1所示。整个框架被分成三层:客户层、信息处理层和后台管理层。客户层主要作用是为用户提供信息资源浏览、基本信息输入等基础功能;信息处理层由用户个性化信息的智能获取及分析、个性化信息的智能分类及主动推送和个性化信息的智能代理三大功能来支撑;后台管理层则主要功能是存储和管理系统数据信息。基于智能过滤的数字图书馆个性化信息服务系统在三层结构体系的基础上进行模块划分,采用模块化的设计方案,分为用户登录、信息搜索、信息展示等功能模块。图1数字图书馆个性化信息服务系统主体结构客户层模块主要用于实现数字图书馆收集用户行为数据的目地[7]。为了跟踪用户的数据为用户建立单独的描述性文件,该文件内容包含用户的个人基本信息、用户特征和用户数据等方面。中间层主要依靠智能过滤技术来实现对用户需求的智能代理。后台数据库主要依靠大数据挖掘、算法的自动发现、语义网技术等智能技术智能分析用户数据并进行进一步的拓展和延伸,达到支持用户决策和查询并进一步提升用户满意度。个性化信息服务系统的模块化设计将使数字图书馆个性化服务更加的精确和有效。3.2基于智能过滤的个性化信息服务系统的功能设计基于智能过滤数字图书馆个性化信息服务系统是以“智能化”为设计理念,与原来的系统有很大的差别,能充分满足用户的个性化信息需求。本系统的核心个性化信息服务系统用户登录模块信息检索模块信息展示模块信息智能获取信息智能过滤信息智能分类用户数据库系统数据库兴趣知识库客户层信息处理层后台管理层是“用户个性化信息需求库”,既根据用户的基本信息需求为用户推送信息资源,又根据对用户所掌握的信息为用户智能选取、筛选、分类网络化信息资源并进行主动推送。主要具有如下功能:①个性化信息的智能定制。系统根据用户基本信息自动定制的信息资源,用户可以根据自身实际需求来决定是否接受,该功能是以个人的主动选择为前提;②个性化信息的智能搜索。主动为用户进行相关信息资源搜索与推送基于系统根据用户基本信息和操作行为来实现,该功能属于主动推送;③用户基本信息管理。该功能中读者注册时可以填写自己的基本信息,这些基本信息也可以随时更改;④个性化页面的设置。读者如果想设置具有专属于自己个性化的页面可以根据爱好对页面进行版式和色调的调整来达到目地。3.3基于智能过滤的个性化信息服务系统的工作流程智能过滤技术拥有高度的智能化功能,以及突出的个性化服务优势,能在很大程度上提升数字图书馆的个性化服务的效率。智能过滤的工作机制是在定制信息加工、兴趣识别、智能过滤指令组织、访问登记等方式,智能过滤冗余、错误以及不必要的信息资源,极大发挥数据挖掘和知识发现的作用。构建基于智能过滤的数字图书馆个性化服务系统,不仅集成了智能搜索引擎系统的优势,而且还极大提高了系统的工作效率,加速了业务流程的运行,能够为用户提供更快速、准确、主动的个性化服务,其工作流程如下图2。用户通过登录页面进入数字图书馆后,可以利用搜索引擎寻找信息资源,也可以在定制页面进行个性化信息定制。系统会根据需求调取动态信息资源库中的信息,将其推送至智能过滤模块进行信息过滤,并从中抽取出与用户需求高度匹配的信息资源,在对这些信息进行重新标引制作用户文档,然后将个性化信息推送至用户页面。图2基于智能过滤的个性化信息服务系统的工作流程用户登陆数字图书馆信息检索提问搜索信息智能过滤信息定制页面动态信息资源库个性化信息推送4.基于智能过滤的数字图书馆个性化信息服务模式的创新4.1个性化智能推送服务信息智能推送服务是一种计算机分布技术,它能依据读者意图推测并自动把相应的数据信息推送给读者。传统的服务器模式是基于双向配合的信息传递方式,依靠用户积极提出请求然后服务器做出响应。然而推送技术在不论客户端有没有提出申请都发送相关信息,比如发送电子邮件。推送通常依靠用户之前的日常习惯与爱好,实时将相关信息发送给用户。推送技术实现的相关服务功能在数字图书馆个性化信息服务中至关重要。该服务服务功能可以根据用户的图书浏览方式以及已经阅读的图书信息推荐相关资源,这样做的好处是便于给用户发掘自己不明确但又实际有效的图书信息。[8]个性化智能推送服务在数字图书馆个性化服务中主要采用RSS技术来提供信息订阅与推送服务。推送类容以新闻和公告信息居多,新书通报、期刊目录信息、商业数据库专题栏目、个人借阅信息和信息聚合服务的RSS紧随其后。图书馆通过RSS输出,有助于用户在第一时间获取网站内容的更新动态。4.2个性化定制服务个性化信息智能定制服务是指用户在数字化网络资源中根据自己实际需求而选择信息的服务系统功能。该服务通过推测用户意愿,主动提供一套信息系统的服务给用户。用户也可以对该系统的相关参数和信息进行调整根据自己的实际需求。当前,国内的知名度较高的大学的图书馆信息服务系统已经完成了智能定制功能的实现。比如清华大学图书馆、上海师范大学图书馆通过开发基于分析读者的知识结构以及整合馆藏数字资源和网络资源的智能定制系统,为用户提供了多元的个性化服务方式。4.3智能代理服务智能代理的服务模式基于智能化检索,该系统的智能处理依靠信息系统共享平台和智能信息系统来共同创建来完成。该服务方式属于主动推荐,与上面一种被动的依据用户定制服务信息推送有所不同。该系统运用智能的方式主动搜集海量用户信息,其中包括个人基本情况、专