个性化是互联网的未来趋势现在,一个新的风潮即将到来,将再次改变互联网:个性化革命。今天,我们生活在一个不断被信息淹没的世界。每天twitter上发出的信息超过90MB,每分钟有34小时长的视频传到YouTube上,每个Facebook用户平均拥有130个好友并且在一直增加,还有搜索结果中洪水般的内容以及传统网站上每天成千上万的文章,而这些内容很少与我们个人有关系。信息的蔓延扩散并不是个新现象。互联网的信噪比是随着信息组织技术与信息产生、传播技术之间的战争波动的。他们的网络:互联网初期在互联网出现初期,信息内容都是由专业人士创建和组织的。起初,信息只会出现在像AOL这种专业网站上。随着互联网的开放,Yahoo!很出色地创建了开放式网络雅虎目录。但是即便有开放目录、像Google这样的搜索引擎公司不断地提供更好的方法去获取我们感兴趣的内容,信息过载仍然在无可避免地发生。通过了解网站之间相互链接的规则,Google推出了一门新的科学来从问题本身寻求解决方案。这个方案现在表现的非常好,几乎每个网站都在被SEO得趋向框架内的规范。我们的网络:当今时代2003年,由MySpace和YouTube带来的用户提供内容冲击了主流的互联网玩法,同时网络上的信息量开始急剧增加。“现在每两天我们创建的信息几乎相当于2003年一年的那么多”,Google首席执行官EricSchmidt说。搜索引擎的目的不是为了有效组织社会化和实时数据。因此像Facebook和Twitter这样的创新公司创建了社会化过滤器,通过授权给我们的朋友和信任的人来替我们组织信息。这个新过滤器让我们更多、更好我们不曾预想过的信息。读到这里的大部分人应该都是社会化技术的狂热用户。跟我一样,你可能正在开始体验到你的社会化信息流中的信息过载。有很多高质量的信息,但它变得越来越难被找到。专业点说,信噪比正在下降。越来越多的人变得更加热衷于社会化和事实网络也会让问题变得更糟糕。你们的网络:未来想象一下,一上网看到的网页、应用或是获得的经验都是正合你意的个性化信息,你会有什么感觉呢?到ESPN.com看关于你喜欢的运动和球队的精选信息、每天上团购网找你兴趣的商品、从Foursquare接收你感兴趣的餐厅信息……从这里可以看到未来发展的方向。由你寻找目标信息转变为目标信息来找你。过去,我们缺少数据和技术来视线这种个性化的体验。但一切在不断地迅速改变。那些势不可挡的丰富的社会化数据不仅留下了问题,同时也给出了解决方案。使用自然语言处理和语义分析来评估你发出的消息、状态更新(如分享和签到),就有可能对你的身份和兴趣以及其他特征做出整体的认知。一旦网络了解了你的喜好,它就可以变得……任何一个网站或应用可以利用这点来给你推送属于你的个性化体验。音乐的发展遵循了类似的进化过程。音乐的传播从原先通过专业策划(DJ,MTV)转变为社会化介绍(混杂磁带、播放列表)再到根据个人偏好组织(Pandora音乐盒)。所有这一切并不意味着编辑消失或你的朋友的推荐并不重要。相反,它是一个完全聚焦在你身上的新镜头。基于因特网的个性化信息服务研究【内容提要】个性化信息服务,是针对不同用户采用不同服务策略和方式提供不同信息内容的服务。它具有以用户为中心、对用户需求进行挖掘、灵活多样和主动将信息推送给用户的特点。其类型有:个性化内容定制服务;个性化信息检索定制服务;个性化界面定制服务。用户个性化需求可通过用户访问记录挖掘、Bookmark和Agent获取。个性化信息服务模型,可采用信息Agent自主学习法、信息过滤法、基于多Multi-Agent……随着因特网的飞速发展,网上信息资源迅猛增长,现有的搜索引擎如YAHOO等越来越难以满足用户获取信息的需要。这些搜索引擎在服务中,一方面忽略用户的个性化要求,另一方面不能提供主动信息服务,使因特网上的海量信息和用户对信息的有限获取能力形成了强烈的反差,使得因特网上信息的获取和利用面临着严重的效率和质量问题。有效解决这些问题的办法,就是利用新技术提高用户获取信息的能力,使信息服务更加符合用户自己的需要,概括地说,就是建立面向用户的个性化服务机制。1个性化信息服务的定义与特点1.1个性化信息服务的概念个性化信息服务是网络信息服务发展的重要方向,已经引起国内外许多专家学者的研究兴趣,因而近两年这方面的研究成果较多。但何谓个性化信息服务?个性化信息服务应包括哪些内容?如何实现个性化信息服务等问题,现在还没有统一的科学认识。所以在一些文献里,又将个性化信息服务称之为个性化服务、个性化定制服务、个性化信息搜索服务、个性化信息推荐服务、个性化信息提醒服务和个性化信息代理服务等等。下面是一些具有一定代表性的观点。(1)个性化信息服务是根据客户的特性提供具有针对性的信息内容和系统功能[1]。(2)个性化信息服务就是将用户感兴趣的信息主动提交给用户[2]。(3)个性化信息服务是基于信息用户的信息使用行为、习惯、偏好和特点,来向用户提供满足其各种个性化需求的一种服务[3]。(4)所谓个性化信息服务,是指能够满足用户的个人信息需求的一种服务,在某一特定的网上功能和服务方式中,自己设定网上信息来源方式、表现形式、特定网上功能及其它网上服务方式等,而主动地向用户提供可能需要的信息服务[4]。(5)所谓个性化信息服务,首先它应该是一种能满足用户的个体信息需求的服务,即根据用户提出的明确要求,或通过对用户个性、习惯的分析而主动向用户提供其可能需要的信息和服务;其次它应该是一种培养个性,引导信息需求的服务,以此促进信息业的多样化和多元化发展”[5]。(6)个性化信息代理就是一个能够理解用户真正需求的智能Agent。所谓个性是指Agent行为中所表现的一致的、稳定的、可信的、典型的特征和态度集;个性可以表示为有序的目标集和对于目标的规划的偏好程度[6]。笔者认为,个性化信息服务,就是针对不同用户采用不同的服务策略和方式,提供不同的信息内容的服务。1.2个性化信息服务的特点综上所述,个性化信息服务的根本就是尊重用户(或者说以用户为中心),研究用户的行为、兴趣、爱好和习惯,为用户搜索、组织、选择、推荐更具针对性的信息服务。通过对个性化信息服务特点的了解和掌握,可以使我们的服务更具针对性,从而提高用户对信息服务的满意度。具体地说,个性化信息服务具有以下特点:(1)以用户为中心。所有的服务必须以方便用户、满足用户需求为前提。(2)允许用户充分表达个性化需求,能够对用户需求行为进行挖掘。信息服务的系统不仅要提供友好界面,而且要方便用户交互,方便用户描述自己的需求,方便用户反馈对服务结果的评价。要能够了解用户的个人需求、习惯、爱好和兴趣,为其提供“量身定制”的个性化信息服务。(3)服务方式更加灵活、多样。不仅要为用户提供更加准确的信息,而且还要能够按照用户指定的方式进行服务,如满足用户对信息的显示方式、提供结果的方式(纸质、电子版、网络版、电子邮件等)的要求,对服务时间的要求,对服务地点的要求等。(4)能够主动将用户所需信息推送给用户。2个性化信息服务的类型在个性化信息服务系统中,用户可以根据自己的需要,选择不同的信息资源;依据自己的习惯,指定信息的显示方式,如对信息检索结果的不同的元数据排序。对于一般用户可能更关心需求的主题,希望将论文的题名放在显著的位置,而对于一个专家,他可能更关注学科内某些专家的研究成果,希望将著者姓名放在最显著的位置等等。就现阶段的环境条件而言,个性化信息服务至少应包括个性化内容定制服务、个性化信息检索定制服务、个性化界面定制服务和个性化信息推荐服务四个方面。2.1个性化内容定制服务个性化定制服务是有效获取用户需求信息的方法之一。它通过用户定制获取用户的个性化信息,从而理解用户的需求,为用户提供更为准确的信息服务,提高用户的满意度。同时通过与用户的直接或间接的沟通,改善与用户的关系,增加用户的忠诚度[7]。在个性化内容定制服务中,用户可以根据自己的兴趣和需求定制信息。定制的内容包括信息资源、界面和服务等等。个性化信息定制服务系统通常提供一些信息资源,让用户选择(定制)。例如在数字图书馆中,人们可以选择数据库资源、电子期刊、电子图书、相关网站、学科导航、搜索引擎等等。也有一些系统让用户指定资源地址,系统提供有关的更新通知等服务(这是一种简单的主动信息服务方式,系统能够及时主动将有关资源的更新信息推送给用户,提醒用户及时利用)。另外,如安全与隐私保护也是个性化信息定制服务中需要注意的重要问题。安全包括用户私人信息的安全和系统管理的安全。隐私保护也是用户关心的问题,一旦用户的个人信息被泄露,用户就会失去对我们的信任,而远离我们的服务,隐私保护需要制定完善的隐私保护政策,提供隐私政策公示,并提供用户隐私公开的工具和运用保证隐私不外泄的保护技术等。2.2个性化信息检索定制服务在数据库检索或网上信息的查询中,不同的用户由于其拥有的检索知识和所处的领域不同,往往其习惯也不同。初学者一般习惯用简单检索,专业人员习惯用高级检索。另外,不同用户可能用不同的词汇表达同一专业概念,不同用户对检索结果的选取原则和排序方法也可能不同。诸如此类,正是用户个性化的显著表现。因此,检索定制需要充分支持用户在检索策略、检索方法和检索结果处理上的个性化。根据初步分析,检索定制可包括[8]:(1)个人检索模板定制。用户可根据个人需要对所需信息的专业(用分类号或主题词、关键词确认)、应用目的(用文献类型区别,例如期刊论文、专利、会议文献等)、深度、语言、地域、数量、时域等进行定制,从而内在地表达自己相对稳定的检索限制条件。用户在每次检索时也可以选择“屏蔽”(Overwrite)模板条件,灵活表达特殊要求。(2)检索工具定制(选择数据库检索系统和搜索引擎)。已纳入资源定制。(3)检索式表示方式定制;用户可自定义默认检索方式是简单或复杂方式,自定义布尔检索式中“与”、“或”、“非”的表示符号,系统还可为用户记录最近的特定数量的检索式,供用户选择使用。(4)个人词表定制。可写入用户自定义的常用词汇的自定义规范词、通用限制词(检索时对所有检索式均加上此检索词)、特殊限制词(对某一个或几个词使用的限制词)、以及同义词和近义词;当该用户使用这些常用词汇时,系统可根据个人词表调用相应词汇优化检索,或弹出相应词汇供用户选择使用。(5)检索结果处理定制。可对检索结果的相关度计算标准、输出格式、排序方式、重复记录整合方式、分类组织、下载格式、传送地址等进行定制。(6)检索历史分析定制。用户可要求系统动态追踪其检索过程,提取最常用的检索词和检索式,最经常选择的数据库、期刊、网站等资源,最经常排除的资源,相近用户最常用的检索词、检索式、数据库、期刊及网站等(但必须掩蔽“相近用户”实际身份)。当然,这种追踪必须事先得到用户的授权(包括是否同意作为“相近用户”被分析的授权),同时必须安全地保护这些历史数据,这些历史数据可用来自动修改用户的有关定制信息(例如定题选报记录)。2.3个性化界面定制服务个性化界面定制服务是让用户根据自己的爱好选择桌面的显示方式,它包括界面的结构布局,显示颜色和显示内容的排列方式等。例如在一些网站中,让用户输入自己的个人信息,然后生成“我的主页”,“我的搜索引擎”,“我的图书馆”等等这类服务都属于个性化界面定制服务。2.4个性化信息推荐服务通过网络信息的挖掘,了解用户的需求和兴趣,为用户提供个性化的实时信息推荐服务,也是因特网服务的一个发展方向。面向单个用户的实时个性化推荐服务有4种方法[9]:(1)在Cache内的协作推荐。(2)利用聚类方法实现实时个性化推荐。(3)利用分类方法实现实时个性化推荐。(4)利用协作推荐的方法实现实时个性化推荐。3用户个性化需求的获取方法对用户需求、兴趣、爱好的了解和获取是个性化信息服务具备针对性的关键,而对用户网络信息需求的分析、获取和管理是保证个性化信息服务实施的基础。对用户需求的获取。目前主要有两大类方法:一类是通过人机交互模式获取用户的信息需求。这类方法的优点是可以准确地获得用户的需求信息,也是