第二单元新媒体的类型和形态第五章Web1.0时代新媒体的主要形态Web2.0与Web1.0的区别在于,Web1.0是由网站主导生成内容,而Web2.0是由用户主导而生成内容的互联网产品模式。Web1.0采用的是技术创新主导模式,信息技术的变革和使用对于网站的新生与发展起到了关键性的作用。Web1.0的盈利都基于一个共通点,即巨大的点击流量。本章概要搜索引擎门户网站垂直网站电子商务第一节搜索引擎搜索引擎(SearchEngine)是指在互联网环境中的信息检索系统。随着网络技术的飞速发展,互联网上的信息资源量越来越庞大,用户越来越难以准确快捷地获取所需信息,从而产生了所谓的信息焦虑。互联网搜索引擎以其基于关键词匹配的信息检索机制为用户在瞬间搜寻出所需的相关信息,成为缓解人们信息焦虑最为有效的工具。1、搜索引擎的原理搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。搜索引擎的目的是帮助人们寻找信息资源。在互联网环境下,其典型实现是基于关键词匹配的信息检索机制。搜索引擎主要由四部分组成:搜索器、索引器、检索器和用户接口。搜索器的功能是在互联网中发现和搜索信息,它要尽可能快、尽可能多地搜集各种类型的信息,同时还要定期更新已有信息,避免死链接和无效链接。索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表,建立起自己的索引数据库。搜索引擎的组成部分检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口的作用是输入用户查询、显示查询结果、提供相关性反馈给用户。搜索引擎的组成部分1、搜索引擎的原理搜索引擎的原理,可以看作三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。2、搜索引擎的类型2.1按查询类型划分如同传统检索系统可划分为分类检索和主题检索一样,搜索引擎也可按查询类型分为分类型搜索引擎(即范畴层次搜索引擎)和词语型搜索引擎两大类。但是,分类型搜索引擎通常带有关键词索引,词语型搜索引擎通常带有范畴层次索引,以弥补分类法和主题法各自的不足。2、搜索引擎的类型2.2按覆盖范围划分1.通用搜索引擎2.专业搜索引擎2、搜索引擎的类型2.3按引擎功能划分搜索引擎按引擎功能可分为常规搜索引擎和多元搜索引擎(MetaSearchEngine)两大类。常规搜索引擎是单一引擎;多元搜索引擎是多个单一引擎的组合,对同一个查询可同时在多个搜索引擎上进行,或组合指定的搜索引擎查询,或在单一搜索引擎上查询,可综合输出查询结果,也可分别输出每个搜索引擎的查询结果。3、搜索引擎尚待解决的问题缺乏检索词汇控制自动标引有局限性缺乏检索专业信息的能力“把关人”缺失4、互联网信息检索策略4.1基本检索策略:布尔逻辑检索布尔运算符包括AND、NOT、OR。比如,检索式:engineAND(carORtruck)。用“AANDB”进行查询的结果是既包含查询词A又包含查询词B的文章。用“AORB”进行查询的结果是至少包含A和B中一个查询词的文章。用“ANOTB”进行查询的结果是包含查询词A而不包含查询词B的文章。4、互联网信息检索策略4.2范围限定二次检索:对于再次检索,可以重新开始,在整个索引中检索,也可限定在前次检索结果内,优化检索。时间范围(时间限制):雅虎系统设定检索时间范围为最近3年,用户也可在一天到三年的时间范围内进行选择。语言限制:AltaVista可以查询基于25种语言的信息,其中包括英语、日语、汉语、德语等。4、互联网信息检索策略4.3智能检索/概念检索Excite使用“智能概念检索”(IntelligentConceptExtraction)技术,通过发现词与概念间存在的关系,会自动加入一些检索词。如我们输入“elderlypeoplefinancialconcerns”,Excite除找出精确匹配这些词的文献外,还会找出有关“economicstatusofretiredpeople”,“thefinancialconcernsofseniorcitizens”等节点。4、互联网信息检索策略4.4字段限定字段限定指限定词语在文献中出现的部位。大部分系统都可进行字段限定,但是字段的数目和表示方法稍有不同。4、互联网信息检索策略4.5词语检索在一串词的前后加双引号(“”)或用连字符连接,可限定检索结果中的词语必须以同样的顺序出现且相邻,如“Chinaeconomicdevelopment”。4、互联网信息检索策略4.6其他检索策略字母大小写:有些系统区分字母大小写,如AltaVista,Infoseek;有些系统不区分大小写,如雅虎。名词检索:有些系统对名词检索有特殊规定,Infoseek要求人名或地名的首字母大写,如查找电影明星RockHudson,假如不大写首字母,则检索系统还会找出rockclimbing、rockmusic、HudsonRiver等资料。5、检索结果输出相关度:找到所有匹配结果以后,大部分系统都按相关性程度降序输出,首先显示相关度高的结果。有些系统还显示相关度大小(百分比)。大多数检索遵循以下结果显示原则:(1)匹配的词语数目。匹配的词语越多,相关性越高。(2)文献部位。标题中的词比文本和URL中的词权值高。(3)类目综合度。在雅虎类目等级结构中,综合类比专门类权值高。(4)检索词权值。在数据库中检索词出现的频率越低权值越高。5、检索结果输出显示格式:大多数系统都可改变显示格式。简短的可只包含标题,详细的可包括标题、摘要、地址、相关度、文件大小等信息。相应地,每页显示的结果数目也会发生改变。案例:Google案例:GoogleGoogle的基本搜索简洁方便,在输入查询内容后敲一下回车键,或单击“Google搜索”按钮即可得到相关资料。Google只会返回那些符合用户全部查询条件的网页,不需要在关键词之间加上“and”或“+”。Google不仅能搜索出包含所有关键词的结果,并且还对网页关键词的接近度进行分析,按照关键词的接近度确定搜索结果的先后次序,优先考虑关键词较为接近的结果。案例:GoogleGoogle储存网页的快照,当存有网页的服务器暂时出现故障时,用户仍可浏览该网页的内容。如果找不到服务器,Google储存的网页快照也可救急。可利用Google目录根据主题来缩小搜索范围。例如,在Google目录的ScienceAstronomy类别中搜索“Saturn”,可以找到只与Saturn(土星)有关的信息。而不会找到“Saturn”牌汽车、“Saturn”游戏系统,或“Saturn”的其他含义。案例:GoogleGoogle能够提供与原搜索相关的搜索词。这些相关的搜索词是根据过去Google所有用户的搜索习惯和Google提供的计算两个搜索词之间相关度的独家技术而产生的。通过包含特殊操作符“define:”,并使该操作符与需要其定义的字词之间不留空格,还可获得定义的列表。例如,搜索“define:HTML”将显示从各种在线来源收集到的“HTML”定义的列表。第二节门户网站门户(Portal),原意是指正门、入口,现多用于互联网的门户网站和企业应用系统的门户系统。门户网站是指通向某类综合性互联网信息资源并提供有关信息服务的应用系统。1、门户网站与新闻网站简单回顾门户网站的起源和历史,可以让我们清楚地看到,无论是搜索还是新闻,都只是门户网站发展的一个阶段,门户网站可以从搜索服务演进到新闻服务,未必就不能从新闻服务演进到别的什么服务。新闻网站指以经营新闻业务为主要生存手段的网站,包括国家大型新闻门户网站(如新华网等)、商业门户网站(如网易等)、地方新闻门户网站(如长江网等),还有各种行业门户网站(如湖北美食网、)。、典型门户网站1)雅虎2)新浪3)腾讯4)网易5)搜狐第三节垂直网站垂直网站是指将注意力集中于某些特定的领域或某种特定的需求,提供有关这个领域或需求的全部深度信息和相关服务的网站。和第一代大而全的水平网站(又称综合性网站)不同,垂直网站的注意力集中于某些特定的领域或某种特定的需求,提供有关这个领域或需求的全部深度信息和相关服务。作为互联网的新亮点,垂直网站正引起越来越多人的关注。垂直搜索垂直网站的基础是垂直搜索。垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,它对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的网页搜索引擎的最大区别是,它对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据。中国互联网的发展呈现四大发展趋势趋势一:单一向多元的扩张。趋势二:门户与搜索的融合。各大门户网站不断升级和改进搜索服务,以百度和谷歌为代表的搜索引擎已经成为新型门户网站。趋势三:大众向分众的渗透。趋势四:Web1.0向Web2.0的推进。中国垂直网站的发展趋势第一,IT类垂直网站近几年持续快速成长。中国IT类垂直网站数量规模总体呈上升趋势,总体收入将进一步增长,增幅在10%左右,处于一个成熟期。第二,房产类垂直网站如搜房网、搜狐焦点等的媒体优势明显。搜房网、搜狐焦点的覆盖人数比较多,但是月度有效浏览时间少,黏性较低。不过也有例外,如深圳房地产信息网比较本地化,所以覆盖人数比较少,但由于本地化服务更有针对性,所以用户黏性比较高,因此本地化的垂直网站也有自己的优势。中国垂直网站的发展趋势第三,中国财经类垂直网站处于快速成长期。第四,在线视频类网站为当前最具人气的垂直网站。目前,无论是从覆盖面还是从媒体黏性角度来考虑,优酷土豆的优势比较大,另外还有我乐网等。第五,分类信息网站是很多业内人士比较看好的垂直网站。分类信息网站为用户提供最直接的信息服务模式,很有发展前途。第四节电子商务网站电子商务电子商务网站的主要类型案例:淘宝网1、电子商务1.1电子商务的含义电子商务是以商务活动为主体、以计算机网络为基础、以电子化方式为手段,在法律许可范围内所进行的商务活动过程。电子商务利用计算机技术、网络技术和远程通信技术,实现整个商务(买卖)过程中的电子化、数字化和网络化。1、电子商务1.2电子商务的基本特征普遍性方便性整体性安全性协调性1、电子商务1.3电子商务的分类按照商业活动的运行方式分:完全电子商务和非完全电子商务。按照开展电子交易的范围分:区域化电子商务、远程国内电子商务、全球电子商务。按照使用网络的类型分:基于专门增值网络的电子商务、基于互联网的电子商务、基于Intranet的电子商务。1、电子商务1.3电子商务的分类按照交易对象分:企业对企业的电子商务(BusinesstoBusiness,B2B),企业对消费者的电子商务(BusinesstoConsumer,B2C),企业对政府的电子商务(BusinesstoGovernment,B2G),消费者对政府的电子商务(ConsumertoGovernment,C2G),消费者对消费者的电子商务(ConsumertoConsumer,C2C),企业、消费者、代理商三者相互转化的电子商务(ABC)。2、电子商务网站的主要类型网上综合商城垂直商店服务型网店导购引擎团购模式案例:淘宝网淘宝网由阿里巴巴集团在2003年5月10日投资创立,目前是亚太地区最大的网络零售商。淘宝网现在的业务跨越C2C、B2C两大部分。淘宝网统计显示,2012年上半年,淘宝网注册用户数达到4.7亿。案例:淘宝网1.网站设计客服中心:淘宝网的客服中心是其加强与用户互动的有力平台。一旦用户有什么不明白的问题,就可以到客服中心的页面下寻求帮助。淘宝网利用客服中心引导用户,赢得了用户的积极响应。虚拟社区:淘宝网的虚拟社区是淘宝网与用户之间,以