网络信息资源个性化服务及成功案例

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

网络信息资源的个性化服务及成功案例目录网络信息资源个性化服务网络信息资源个性化服务方式网络信息资源个性化服务实现过程数字图书馆个性化信息服务方式数字图书馆个性化信息服务经典案例案例介绍1.1网络信息资源开展个性化服务的必要性2006.12——2010.6中国网站规模变化个性化服务1.2网络信息资源个性化服务定义•个性化信息服务就是基于信息用户的信息使用行为、习惯、偏好和特点,向用户提供满足其各种个性化需求的一种服务.个性化信息:是反映个性化特征的一切信息,同时还包括个体特定的信息需求组合。1.2网络信息资源个性化服务的特点用户提出现有的需求——提供用户所需要的信息研究用户个性、习惯、知识结构、信息需求……——预测和搜集用户可能感兴趣的信息——提供信息、激活用户的潜在信息需求1.2网络信息资源个性化服务的特点服务方式的针对性服务内容的针对性1.2网络信息资源个性化服务的特点最大程度地了解用户对信息的明确需求与潜在需求、当前需求与长远需求个性化信息服务适应动态变化的个性需求1.2网络信息资源个性化服务的特点用户满意是个性化信息服务的出发点和归宿点,面向用户的个性化信息服务提高了信息需求的满足度,速度更快、容量更大。查全率和查准率得到很大的提高,个性化信息服务对网络信息资源进行自动化处理,使用户的需求能够得到高效、准确、及时的反馈。2网络信息资源个性化服务方式分类定制是指信息用户可以按照自己的目的和需求,在某一特定系统功能服务形式中,自己设定信息的资源类型、表现形式、选择特定的系统服务功能等。通过分类定制,用户每次登录网站时,只要键入自己的用户名和密码,服务器根据用户信息数据库将查询结果主动推送给信息用户,并利用动态网页生成用户定制的动态页面。RSS订阅2网络信息资源个性化服务方式智能代理技术很好的解决了用户无法贴切、完全地表达出自己的爱好、兴趣和需求的问题。它是一种能够完成委托任务的智能计算机系统,能模仿人的行为执行一定的任务,不需要或很少需要用户的干预和指导。智能化代理通过跟踪用户在信息空间中的活动,自动捕捉用户的兴趣、爱好,主动搜索可能引起用户兴趣的信息并提供给用户。2网络信息资源个性化服务方式协调过滤服务主要是把用户的偏好与其他用户的偏好进行比较,建立偏好群体的描述,然后假定这个特定用户与这个同偏好群体的需求相同,对其需求内容进行推荐。2网络信息资源个性化服务方式垂直门户是和综合性及水平门户相对应的概念,它通过汇聚网上某一特定专题信息资源,并对其进行挖掘和加工,以满足用户基于专业的深入的信息需求。系统帮助用户修改检索提问式,如当用户输入一个检索词,系统就会将检索词与内部词表中相关词进行比较,并在界面上显示各种与该词有逻辑关联性的词组,以供用户选择。通过帮助用户选择更接近自己检索目标的检索词来提高信息查询效率。2网络信息资源个性化服务方式信息呼叫中心主要利用电话、传真等方式来服务客户,处理简单的呼叫流程。信息呼叫中心引入客户关系管理,建立客户数据库,对信息进行分析、处理、采集和挖掘,使呼叫中心可以得到每个客户的详细信息,由此为客户提供一对一的个性化服务。2网络信息资源个性化服务方式3网络信息资源个性化服务实现过程1.用户描述文件的表达与更新2.资源描述文件的表达3.个性化推荐4.个性化服务体系结构3.1用户描述文件的表达与更新收集用户描述文件前应考虑问题:①有没有现成的标准?②收集什么数据?收集的数据用于什么目的?③如何收集数据?根据什么信息源来收集?④收集的数据如何组织?⑤用户信息能否自适应地更新?调查显示•80%的用户愿意向Web站点提供自己的姓名、性别、年龄、教育背景和兴趣,但大多数用户不愿意提供私有、敏感的信息,比如个人收入和信用卡号等•28%的用户愿意Web站点向其他Web站点共享自己的信息3.1用户描述文件的表达与更新可以表示为用户浏览模式或访问模式可以表示为加权矢量模型、类型层次结构模型、加权语义网模型、书签和目录结构等3.1用户描述文件的表达与更新用户注册基本信息系统隐式收集用户信息用户描述文件一系统自适应修改(显示跟踪、隐式跟踪)用户修改用户描述文件……3.1用户描述文件的表达与更新系统可以要求用户反馈自己对推荐资源的喜好程度。一般情况下,这种做法很难收到实效,因为很少有用户向系统主动表达自己的喜好。•行为跟踪.用户行为可以表现为查询、浏览页面和文章、标记书签、反馈信息、点击鼠标、拖动滚动条、前进、后退等等。文献的研究表明,用户查询、访问页面、标记书签能有效揭示用户的兴趣.•日志挖掘,利用Web日志可以获得页面的点击次数、页面停留时间和页面访问顺序等信息。通过分析Web日志可以获得相关页面、相似用户群体和用户访问模式等信息3.1用户描述文件的表达与更新②将用维变量构建数据立方体(URL、资源类型、大小、时间……)①首先清除日志中无关的信息,将有效数据存放到数据库中③进行在线分析处理,通过对数据立方体的切块和切片,分析用户在不同域的分布情况,分析用户对资源的使用情况等等.④利用各种数据挖掘方法来预测、分类和发现有意义的关系3.2资源文件的表达基于内容的方法是从资源本身抽取信息来表示资源,使用最广泛的方法是用加权关键词矢量.对文档来说,关键的问题是特征选取,特征选取要达到两个目标:一是选取最好的词;二是选取的词最少.要抽取特征词条,需要对文档进行词的切分,在切分的同时,利用停用词列表(stopword)从文档特征集中除去停用词,在完成词切分后,接着除去文档集中出现次数过少和过多的词.经过这些处理后,特征数目一般还很大,还需对特征进行进一步的选取,以降低特征的维数.在完成文档特征的选取后,还得计算每个特征的权值,使用最广泛的是TFIDF方法,对某一特征,TF(termfrequency)表示该特征在文档中出现的次数,IDF(inversedocumentfrequency)表示log(所有文档数/包含该特征的文档数).矢量模型的代价是比较大的,有时为了加快处理速度,可以只考虑TF一项,3.2资源文件的表达基于分类的方法是利用类别来表示资源,对文档资源进行分类有利于将文档推荐给对该类文档感兴趣的用户.文本分类方法有多种,比如:朴素贝叶斯(Naïe-Bayes),k最近邻方法(KNN)和支持向量机(SVM)等。资源的类别可以预先定义,也可以利用聚类技术自动产生。许多研究表明:聚类的精度非常依赖于文档的数量,而且由自动聚类产生的类型可能对用户来说是毫无意义的,因此可以先使用手工选定的类型来分类文档,在没有对应的候选类型或需要进一步划分某类型时,才使用聚类产生的类型。3.3个性化推荐规则可以由用户定制,也可以利用基于关联规则的挖掘技术来发现,利用规则来推荐信息依赖于规则的质量和数量,基于规则的技术其缺点是随着规则的数量增多,系统将变得越来越难以管理.一个规则本质上是一个If-Then语句。为了利用规则来推荐资源,用户描述文件和资源描述文件需用相同的关键词集合来进行描述.基于内容过滤的技术是通过比较资源与用户描述文件来推荐资源,它的关键问题是相似度计算,对于矢量空间模型来说,通常采用的方法是余弦度量。如果用户的描述文件没有正确描述用户的兴趣和行为,那么该方法推荐的数据可能和用户真正的兴趣根本不相关。优点:是简单、有效缺点:难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。3.3个性化推荐3.3个性化推荐3.4个性化服务体系结构优点是可以避免用户描述文件的传输,除了支持基于内容的过滤,还可以支持协作过滤缺点是用户描述文件不能在不同的Web应用之间共享Syskill,Letizia,GroupLens优点是用户描述文件可以在不同的应用之间共享缺点是只能进行基于内容的过滤优点是不仅可以支持基于内容的过滤和协作过滤,还支持用户描述文件在不同Web应用之间的共享缺点是可能需要传输用户描述文件.3.4个性化服务体系结构案例一个性化服务系统ILOG案例二个性化服务系统PersonalWebWatcher案例三个性化服务系统GroupLens案例四第一,信息量大,需要对海量信息进行搜索、存储和智能管理。文字信息,从1948年以来新华社播发的所有中文电讯稿3000余万篇,每天新增各种精选稿件10000多篇。200多万张图片涉及国内外政治、经济、文化、体育、教育及风土人情等,而且每日增加1600多张。国内外多个领域,集新闻性与艺术性于一体的图表近万张,每天递增最新的国内国际图表新闻10多张。音、视频信息近万小时。第二,信息形式多,需要提供统一、跨媒体检索。不但包括文字、图片、图表和视频等多种形式的信息资源,而且涵盖了中文、英文、法文、西文、俄文等10多种语言信息资源。第三,服务人群多,需提供个性化服务。新华社多媒体数据库搜索引擎不仅面向内部用户,还面向许多类型外部用户,例如为媒体用户提供大量丰富、前沿、精彩的各类新闻,作为编写稿件的权威参考等。新华社多媒体数据库特点:案例五:QQ空间的RSS订阅方式一:直接输入订阅网址方式二:通过推荐订阅方式四:通过好友推荐方式三:通过热文排行案例五:QQ空间的RSS订阅案例六:Page45数字图书馆个性化信息服务信息个性化服务个性化个性化信息服务数字图书馆拥有海量的信息,而用户要在如此海量的信息中挖掘出有用的或自己感兴趣的资料非常困难。因此,用户获得信息的主要障碍已转变为选择上的障碍。这种用户需求的转变催生了个性化信息服务的提出。Page46国内外数字图书馆个性化信息服务现状Page471数字图书馆个性化信息服务1.1个性化内容定制服务个性化内容定制服务主要指用户根据自己的需求和目的,向某一特定的系统提交自己的检索界面、偏好资源、系统服务等信息。它通过获取用户个性化信息,为用户提供更为准确满意的信息服务,因而成为了数字图书馆个性化信息服务的最主要方式。1•用户注册,并把定制信息提交给数据库2•系统自动跟踪用户行为,分析其偏好并将信息存入用户信息数据库3•系统处理用户信息,提供符合用户需求的信息4•用户反馈,系统根据反馈信息修改用户信息数据库内容Page481.1.1个性化内容定制服务范例人大个性化信息服务系统MyLibrary@NCStatc系统MyLibrary@Concll系统ILAS系统下的“我的图书馆”子系统MyLibrary@HUST系统Page491.1.2个性化内容定制服务范例(深圳图书馆)深圳图书馆的ILAS系统Page501.2个性化信息推送服务推送技术通过自动传送信息给用户,来减少用于网络上搜索的时间。它根据用户的兴趣来搜索、过滤信息,并将其定期推给用户,帮助用户高效率地发掘有价值的信息。推送服务信息定题最新资料快报智能化推荐Page511.2.1最新资料快报通过推送技术开展最新资料快报服务,也就是信息服务机构在动态收集用户信息行为或用户定制基础上,建立用户信息需求模型,及时将符合用户兴趣的最新资料推送给用户。中国科学院上海文献情报中心图书馆目次信息推送系统新书信息推送系统带有分类选择功能的新书信息推送系统Page521.2.1最新资料快报(UnCover数据库)Page531.2.2信息定题信息定题服务是利用网络推送技术,信息服务机构可为特约信息需求用户群体长期或定期推送定向式、跟踪式的专题信息服务。Page541.2.3智能化推荐智能化推荐服务不仅能根据用户的特征提供具有针对性的信息,还能通过对用户专业特征、研究兴趣的智能分析而主动向用户推荐其可能需要的信息。经典范例美国卡罗来纳大学图书馆的ilumine系统中国人民大学的“数字图书馆个性化推荐系统”Page551.2.3智能化推荐范例(中国人民大学图书馆)Page561.2.4个性化信息推送服务的方式频道式邮件式信息推送Page571.3个性化信息咨询服务个性化信息咨询是一种以人力资源为媒介、以因特网为基础而提供的信息服务。咨询的方式可通过提供多层次的咨询服务接口,实现用户与虚拟咨询员的在线或离线讨论。通过填写系统

1 / 81
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功