【摘要】交互式问答平台是互联网进入Web2.0时代的产物,它以其独特的问答模式,为用户提供了知识发掘与共享的平台。本文通过对百度知道的案例分析,浅谈交互式问答平台的服务模式、用户分析和运营特点。【关键词】交互式问答用户百度知道【分类号】G20随着网络环境、信息技术的不断发展,人们在生活、学习、工作中遇到问题时获取答案的方式也发生着改变。今天,通过互联网来获取答案已经融入到了人们的生活学习之中。无论是百度知道、新浪问答、雅虎知识堂,还是soso问问、搜狗问答,它们都基于一种交互式的问答平台,为用户们分享知识。本文以百度知道为例对这种服务和用户进行分析,以期获得一些对于网络知识交流的认识。一、交互式问答平台产生的背景1、交互式问答是Web2.0时代的产物。虽然对于Web2.0的定义各有不同,但Web2.0与Web1.0的区别是显而易见的。Web2.0是以信息聚合、注重个人参与为特征,以个人信息媒体为形式的互联网时代[1]。交互式问答就是这样一个模式,它提供了一个所有人都可以参与的平台,在这个平台之中,人们可以提问和回答,人们的答案则会不断形成一个巨大的知识数据库,这个数据库又通过搜索引擎展现给所有人。Web2.0带给人们一个显著的特点是信息交流的变化,传统意义的非正式信息交流将会更多的与网络技术相结合,以全新的方式展现在人们面前。比如:原来的面对面的交谈,现在既可以通过E-mail或借助QQ等即时通讯工具进行[2]。同样的是,知识的问答也可以通过网络平台来实现。2、搜索引擎的缺陷。互联网的发展使网络信息得到不断的丰富,人们能够从网络中得到更多的知识和信息的同时,人们越来越难以获得有用的信息。搜索引擎的开发使得这一问题得到一定的解决,也使搜索引擎成为互联网市场的创富神话。然而搜索引擎仍然难以满足人们更加精确地查找,原因在于它是机械的,不能更好地解析自然语言。如果将国际互联网看作一个巨大的图书馆,那么,一个明显的问题是它没有一个像图书馆里那样可以工作的元数据[3]。网络信息不可能由一群专业小组去像给图书一样加以索引和文摘,因为那是不现实的。网络信息的这种特性使得搜索引擎检索的效率大大降低,而交互式问答平台通过数量庞大的网民的力量则可以较好地解决这一问题。例如当检索一个关于电脑毛病的问题,搜索引擎可能会返回许多关于电脑维修的专业知识介绍,而百度知道则可能会有一个曾经解决过类似问题的人分享他的经验,这个经验或许要比深奥的专业介绍简单容易得多。二、以百度知道为例的分析1、百度知道的简介百度知道是一个基于搜索的互动式知识问答分享平台,于2005年6月21日发布,并于2005年11月8日转为正式版。截止2011年1月5日23时,百度知道已解决问题114352880个,待解决问题2398335个。2、百度知道的功能模型2百度知道鼓励用户的创造力,用户在这个平台之上一方面通过搜索引擎使用别人的智力成果,另一方面又不断提供给别人答案,形成良好的互动。这种模型可用下图表示[4]:这是一个基于“问”、“答”、“搜”的模式。百度知道的成功不仅仅它的“问”和“答”,还在于“搜”。百度知道依托于百度搜索引擎,使由用户形成的知识库能够通过搜索提供给跟多的人。对于提问者,许多情况下,提问者并没有登录百度知道社区,他们仅仅是通过搜索引擎获取到了相关知识;登录百度社区的人也常常是先通过搜索确定是否有过类似问题,如果没有他们会进行提问寻求帮助。对于回答者,他们会主动寻找自己感兴趣的题目,然后直接回答,因为他们对此问题特别熟悉,也可能会通过搜索引擎查找问题的答案。在不断地积累过程之中,便形成了一个庞大的数据库。这个数据库凝聚着用户的智慧。可以看出,搜索引擎在此起到了一个非常关键的纽带作用。3、百度知道的激励模式百度知道是免费的知识共享平台,它同样需要一定的激励手段来鼓励用户参与的积极性。如同Web2.0时代的其他网络模式诸如BBS论坛等一样,百度知道也设计了一套完整的激励体系。百度知道的这套体系主要包括以下两个方面:(1)积分体系。它设计了一整套的制度来告诉用户你如何操作能够赚取积分,如何能够丧失积分。一个基本原则是,用户回答的问题越多且质量较高,则积分越高。积分属于一种虚拟货币,满足的是人的一种心理需求。积分不仅有激励作用,而且是广大网民判断由该用户所发表的信息质量的间接依据[5]。(2)头衔体系。他依据不同的积分设计了20种头衔等级,而且定制了六套角色,例如将军衔分为20个级别,积分越高,等级越高。此外,还有根据积分高低评选知识之星、知识掌门人等荣誉称号来鼓励用户的参与。4、百度知道的参与模式基于以上描述的功能模型和激励模式,可以对百度知道的用户参与模式作以下叙述:(1)对于任何用户(无论注册用户还是非注册用户),均可通过百度或其他搜索引擎获取写有问题和答案的网页。(2)任何用户可以免费注册百度知道社区(3)注册用户在百度知道社区提出问题,并选择设置悬赏。3(4)注册用户可以选择自己感兴趣或擅长的问题进行回答,以获取积分奖赏。用户的参与其实是不断循环的,不是每个人固定地充当提问者或答题者,也不是仅仅是注册用户可以获取知识。当用户通过搜索引擎获取不到理想的答案,用户可以在社区提问,而答题者在激励模式下回答问题,得到积分并提出其他问题。5、百度知道的用户行为分析:5.1从分类角度的分析百度知道将问题分为14个一级类目,一级类目下有二级类目,若干二级类目下仍有三级类目。如下表所示:1、电脑/网络电脑装机硬件软件反病毒互联网百度知道...2、生活服装/首饰美容/塑身美食/烹饪购车养车交通出行购物...3、医疗健康内科外科妇产科儿科五官科人体常识...4、体育/运动足球篮球赛车/F1健身运动用品武术搏击...5、电子数码手机购买手机使用照相机/摄像机MP4/MP3...6、商业/理财股票财务税务银行业务创业投资贸易个人理财...7、教育/科学升学入学学习帮助职业教育英语考试出国/留学科学技术...8、社会民生法律公务办理时事政治宗教求职就业世博会...9、文化/艺术文学历史话题民俗传统器乐/声乐舞蹈书画美术...10、游戏网络游戏单机游戏电视游戏手机游戏小游戏...11、娱乐休闲音乐电影电视动漫星座/运势宠物...12、烦恼恋爱夫妻家庭关系校园生活情感情绪交友技巧...13、资源共享视频共享音频/歌曲共享软件共享文档/报告共享...14、地区北京上海山东...百度知道的分类涉及到了生活学习工作的方方面面,但却既不像图书分类法那样按学科专业分类,也不像中国档案分类法那样按职能划分。这种分类有以下特点:(1)采用了主题分类,但有的主题很宽泛,有的主题很狭小。例如,“生活”是一个很宽泛的主题概念,而相比之下,“电脑/网络”范围就很窄。这种分类特点表现的是一种对用户需求的反映,比如,“游戏”“电脑”“数码”这些都是很狭小的主题概念,却得到重视,反映出人们使用互联网时涉及以上领域的行为较多。(2)对生活类划分较多,学科划分较少。“教育/科学”“文化/艺术”两类基本上代表了在中国图书分类法中的那些学科专业,而且具体学科的划分比如“哲学”“数学”则在“教育/科学”的三级类目。而关于生活的相关类目即是范围很小也能成为一级类目,像“游戏”这4一大类。“游戏”作为一级类目与“哲学”作为三级类目,这在中国图书分类法中是不可思议的。由此反映出互联网偏向于解决生活类问题,不太适合十分专业的问题。(3)在同一类目下,采用的划分标准也不尽相同。例如,一级类目“游戏”以下二级类目:腾讯游戏网易游戏盛大游戏金山游戏完美游戏巨人游戏光宇游戏久游游戏百度游戏网络游戏单机游戏网页游戏电视游戏掌机游戏手机游戏小游戏桌上游戏在这些二级类目中,诸如“腾讯游戏”、“网易游戏”、“盛大游戏”等是按照不同的游戏运营商来划分的类目,而诸如“单机游戏”“网络游戏”是按照游戏的运行环境来划分的,而像“手机游戏”又是一种依据游戏载体划分的。这种的分类有利于用户减少点击的次数,但也容易让人产生混乱。(4)对热点信息进行单独划分。例如“社会民生”下有一二级类目“世博会”,反映出在2010年,中国人对于上海世博会的关注。综上可以看出,百度知道的分类体系反映了网络信息资源的分类特色。网络信息量巨大,种类繁多,使用群体并不是集中在某一领域,而是分散的,形成了独特的分类方式。这种分类特色也存在于其他的各种互联网网站。各网站根据网络资源组织的需要、用户需求和技术环境等,构建了不同于传统文献分类法的类目体系,探索了适合网络环境的技术方法,并且呈现出“分类主题一体化”的趋势[6]。5.2从问题分布角度的分析图一:2006年百度知道问题分布[7]:5图二:2008年百度知道的亚分类问题数据统计[8]:图三:2010年3月1日-3月5日百度知道各类问题日提问数统计[9]:从图一可以看出,2006年百度知道用户所提问题涉及电脑/数码一类的占28%,教育/科学类占14%,生活/休闲/时尚和娱乐分别占11%、10%,这四类问题所占比重共计63%;所占比重最低的是体育运动和明星名人,均为2%。图二的数据经过统计,得到以下数据:电脑/网络类占21%,娱乐、明星占15%,游戏、教育考试两类均占8%,烦恼、生活时尚分别占7%和6%,以上6项占到了总数量的65%;所占比重最低的是音乐、美食、养车,每项所占只有不到1%。图三的数据引用参考文献中的统计结果如下:“教育科学”约占日总提问数的17.44%,“电脑网络”约占到总提问数的13.4%,“生活”约占日总提问数的10.52%,“地区”约占到日总提问数的10.69%,“休闲娱乐”占到9.55%,“商业理财”约占日总提问数的5.32%,6所占比重最低的是体育运动,只有1.07%[10]。以上3张图表反映了2006年、2008年、2010年三年百度知道用户提问的种类数量。从数据的统计结果可以对用户的行为作以下分析:1、从总的数据结构来看,最大类所占比重逐渐递减,例如,2006年、2008年、2010年最大类比重分别为28%、21%、17.44%。这种现象反映出人们所需要的问题越来越多样化,而不再集中到某一方面。2、通过比较所占比重较大的问题可以发现,电脑、网络、教育、娱乐、生活在三个年段中都属于问题较多的领域。电脑和网络问题较多比较容易解释,因为用户在浏览百度知道社区之时所接触的正是电脑和网络,人们总是把在上网时发现的问题归为电脑和网络问题。教育和娱乐反映出用户使用互联网的两种重要的需求,一方面,人们需要为解决问题而获取知识和答案,另一方面,人们需要在解决问题(工作和学习)之余休闲娱乐。毕竟大多数人从事的工作并不是在网络上完成,当人们进入网络时,他们的需求可能是需要网络为他们解决生活、工作、学习中的问题,也可能是娱乐和休闲。3、通过分析所占比重最低问题类型可以发现,体育运动总是问题最低的一类。或许这也能反映出用户的群体特点,也许是用户群体是那种不喜欢体育锻炼的人群,也许是人们上网时很难联想到体育运动,即使人们在网上观看体育直播,但他们或许更加关注那些体育明星而非体育本身。除此之外,也有因为分类的不妥导致问题比重很低,例如,2008年的“美食”、“音乐”,人们或许更容易把这类问题划入“生活”、“娱乐”。三、交互式问答平台的特点1、问答社区与搜索引擎的结合。交互式问答平台与搜索引擎的结合,使搜索引擎能够解决更多的问题。传统搜索是建立在已有信息基础之上的,而社区化搜索除了可以搜索已有信息之外,还可以引导获取尚不存在的信息并创造信息。2、独特的问答模式和互动性。交互式问答平台是一个基于“问—答”模式的知识共享、互动社区,并通过和搜索引擎的“搜”结合提供给更多的互联网用户群。3、隐性知识的发掘和共享。隐性知识的发掘指的是对隐性知识转化为显性知识。交互式问答平台鼓励用户将头脑中的隐性知识如人们的做事的经验等变成显性知识,通过对回答的沉淀和组织形成新的信息库。总结:类似百度知道的交互式问答平台丰富发展了互联网,显示了Web2.0时代的互联网特色,然而如同互联网的其他产品一样,交互式问答还有许多不足,如答案的准确度、正确性,这些