xxxx中国互联络信息资源数量调查报告xxxx年中国互联网络信息资源数量调查报告信息资源数量调查报告主持单位:国务院信息办推广应用组承办单位:中国互联网络信息中心完成时间:xxxxx年2月(本文图均略)目录第一部分调查背景1第二部分调查说明2一、调查对象2二、调查内容2三、调查时间3四、有关概念3五、调查方法4六、调查问卷7七、组织单位7第三部分调查结果9第一章域名、数及地区分布9一、域名数9二、数10第二章性质及服务内容12一、按性质分类12二、的基本情况13三、各类型信息服务内容及信息更新情况29第三章网页数量及性质特征60一、全国的网页情况60二、国内前100家大型的网页情况63三、全国的网页与国内前100家大型的网页情况比较65第四章在线数据库数量及性质67一、在线数据库数量及各类拥有在线数据库情况67二、在线数据库按内容和记录数分类情况70第五章总结79一、域名统计79二、统计79三、网页统计85四、在线数据库统计86图目录图1地区域名数量分布10图2不同性质类型分布图-柱状图(%)13图6平均每个每天的页面访问数13图7每天的页面访问数-按类型分布14图8企业每天的页面访问数-按行业分布(%)15图9制造业企业每天的页面访问数(%)16图10IT业企业每天的页面访问数(%)16图11各类的链接情况17图12各链接数的比例18图13各类的信息主要来源情况19图14各类提供的语种/文字阅读情况20图15各类提供全站信息搜索的情况21图16各类的网页上提供地图的情况21图17各类的网页上提供联系方式的情况22图18各类服务器拥有情况22图19拥有服务器的比例23图20各类拥有服务器情况24图21拥有服务器的各类所采用的操作系统情况25图22负责运营的全职员工人数情况26图23各类负责运营的平均全职员工人数26图24各类负责运营的全职员工人数拥有情况27图25的成立时间-饼图28图26提供各类信息服务的政府的比例30图27政府交互性服务31图28政府新闻更新周期32图29政府职能/业务介绍更新周期32图30统计数据/资料查询更新周期33图31法律法规/政策/文件更新周期33图32办事指南/说明更新周期34图33办公/业务咨询信息更新周期34图34政府通知/公告更新周期35图35办事进程状态查询更新周期35图36企业/行业经济信息更新周期36图37便民生活/住行信息更新周期36图38表格下载更新周期37图39政府公告、新闻、政策等信息通过发布情况37图40政府日常办公事务与相关服务的结合程度38图41提供以下信息服务的企业的比例39图42提供以下交互服务的企业的比例40图43企业信息总体更新情况41图44企业介绍更新周期41图45产品/服务介绍更新周期42图46行业新闻更新周期42图47企业动态更新周期43图48售后服务/技术支持更新周期43图49行业解决方案更新周期44图50行业报告更新周期44图51电子期刊更新周期45图52招聘信息更新周期45图53企业的行业分布46图54制造业中各类的分布47图55IT业中各类的分布47图56企业产品、服务、企业新闻等信息通过发布情况48图57企业业务与的结合程度48图58提供各类服务的商业的比例50图59提供各类信息的商业的比例51图60商业总体信息更新情况52图61商业新闻更新周期52图62商业产品信息更新周期53图63商业贸易信息更新周期53图64商业企业信息更新周期54图65商业科技信息更新周期54图66商业信息更新周期55图67商业招聘信息更新周期55图68商业金融财经信息更新周期56图69商业房地产信息更新周期56图70商业汽车信息更新周期57图71商业休闲娱乐信息更新周期57图72商业生活服务信息更新周期58图73商业体育信息更新周期58图74商业医疗健康/保健信息更新周期59图75商业文学艺术信息更新周期59图76商业旅游交通信息更新周期60图77商业交友征婚信息更新周期60图78全国的静动态网页数61图79网页的更新周期62图80全国前100家大型的动静态网页数63图81全国前100家的网页更新周期64图82前100家大型与全国的网页更新周期66图83各类拥有的在线数据库数和占全部在线数据库的比例67图84各类拥有在线数据库的比例68图85各类/平均每个拥有数据库数量情况69图86各类平均拥有在线数据库数量情况69图87拥有不同在线数据库数的比例70图88拥有各类在线数据库的比例情况71图89各类在线数据库平均拥有的记录数72图90各类在线数据库的更新周期情况73图91各类在线数据库的每次更新比率情况75图92各类在线数据库具有其它载体情况76图93各类在线数据库具体载体形式76图94在线数据库收费情况77图95在线数据库面向对象情况78表目录表1调查内容和指标2表2地区域名数量分布9表3各类的`链接情况17表6各类的信息主要来源情况18表7各类提供的语种/文字阅读情况20表8各类拥有服务器情况23表9拥有服务器的各类所采用的操作系统情况25表10各类负责运营的平均全职员工人数拥有情况27表11网页数及网页字节数情况61表12网页的编码情况62表13网页的内容分类情况(按多媒体形式)62表14网页的更新周期情况62表15前100家的网页数及网页字节数情况63表16前100家的网页编码情况63表17前100家的网页内容分类情况(按多媒体形式)64表18前100家的网页更新周期64表19在线数据库数量及分布情况67表20各类拥有在线数据库情况68表21拥有各类在线数据库的比例情况70表22各类在线数据库平均拥有的记录数71表23各类在线数据库的更新周期情况73表24在线数据库的每次更新记录比率情况74表25在线数据库的载体情况75表26各类在线数据库具体载体形式76表27在线数据库收费情况77表28在线数据库面向对象情况78第一部分调查背景信息资源是国家的战略资源,它在国民经济信息化中位于核心的地位。正确开发、利用信息资源对促进我国信息化的快速发展,导正我国信息化的发展方向,拉动国民经济和社会发展,提高全民族的文化素质和创新能力,促进社会进步和繁荣,实施西部大开发战略等方面有着十分重要的意义。互联网络信息资源是信息资源的重要组成部分,自从20世纪90年代中期开始,互联网在我国迅猛发展,网上中文信息资源快速增长,到xxxx年12月31日,全国在线数据库达到82929个,共15709万个网页,2744G数据量。网上政府信息、行业和企业信息、科技信息、文化娱乐信息、新闻信息、旅游信息、区域特色信息等均已形成一定规模。随着互联网络的飞速发展,我国互联网络信息资源得到了很大的发展,但是我国互联网络信息资源不断进展的同时,存在一些问题需要重视。例如,网络和数据库存在大量低水平重复建设,难以实现互联共享;信息资源的开发滞后应用,存在大量信息孤岛现象等。因此,加大对我国互联网络信息资源开发和利用的引导力度,迫在眉睫。为加深政府对我国互联网络信息资源开发和利用情况的把握,包括信息资源的存量、增量以及地区和行业分类特征等,为加快制定有关信息资源发展政策和措施提供重要参考依据,促进政府对信息资源开发的有力引导,促进我国互联网络信息资源的充分利用,国务院信息化工作办公室决定对我国各行、各业、各地区互联网络信息资源数量情况进行全面调查。本次调查是我国互联网络信息资源的第三次数量调查,开始于xxxx年12月,结束于xxxxx年2月,历时3个月。在保持与前二次调查有一定连续性、借鉴前二次调查成功经验的基础上,在调查方法、调查深度、结果分析等方面有所创新。本次调查初步探索了我国互联网络信息资源发展中的问题和规律,为我国政府进一步正确引导互联网络信息资源的开发利用提供了重要参考。第二部分调查说明一、调查对象所有域名注册单位属于中国(不包括香港、澳门、台湾)的总和,包括.COM,.NET,.ORG和.CN域名(含ORG.CN,GOV.CN,EDU.CN等)下的所有。二、调查内容表1调查内容和指标指标备注域名数量CNNIC数据+注册商上报数量CNNIC数据+注册商上报网页数量计算机自动搜索在线数据库数量问卷调查域名各地区域名分布状况CNNIC数据+注册商上报各地区分布状况CNNIC数据+注册商上报按照省级行政区域划分各种性质的分布状况按照的域名特征划分主要类型提供的服务问卷调查政府、商业、企业各行业分布状况按照标准行业分类法相关特征每天页面访问数服务器拥有情况的链接数的员工数成立时间频道数版本的可访问性地图等安全性防火墙、操作系统等效果指标信息发布可用性度量业务结合网页网页按内容形式分类比例计算机搜索包括图像、音频和视频网页按性质分类比例政府、企业、商业等网页按地域分布比例省域及七大区分布网页长度以字节数计算网页的更新周期网页编码状况简、繁体中文、英文等在线数据库按性质分类比例问卷调查政府、企业、商业等按地域分布比例华北、华南等七大区分布按内容分类比例产品、科技信息数据库等按形式分类比例图形文字数据综合等按使用情况分类比例分自用和公用公用下分免费和收费收费下分收费方式按服务方式分类比例面向终端用户或中介在线数据库更新状况-数据库容量物理存储量(G)是否同时具有其它载体否、是(光盘、纸质等)三、调查时间调查时间:xxxx年12月-xxxxx年2月;数据截至时间:xxxx年12月31日。四、有关概念1.在本次调查中,中国互联网络信息资源定义为:中国互联网络上公开发布的网页和在线数据库的总和。2.中国互联网络是指所有域名注册单位属于中国大陆的总和。3.在线数据库是指以Web为界面,提供公共检索的收费或免费的数据库。4.是指有独立域名的web站点,其中包括CN和通用顶级域名(gTLD)下的web站点。此处的独立域名指的是每个域名最多只对应一个域名,如:对域名sina.com.cn来说,它只有一个.cn,并非它有news.sina.com.cn、mail.sina.com.cn……等多个。5.商业指业务主要在网上进行的电子商业,如新浪、搜狐、网易等;企业是相对于商业而言,指业务主要在网下进行的企业所建立的,如联想集团的.cn。6.网页搜索是指对抽取的从其首页(域名)开始搜索,通过网页上的层层链接,抓取所有属于该的网页的特征及其文本内容。7.静态网页是指URL中不含?和输入参数的网页,包括:*.htm、*.html、*.shtml、*.txt、*.xml等。8.动态网页是指URL中含?或输入参数的网页,包括:ASP,PHP,PERL,CGI等在Server方进行处理的网页。9.网页的编码形式:是根据网页本身的信息通过分析得到的,不是通过一篇网页在HTML中的声明来判断的。因为大量国内的英文网页在其HTML声明中都是简体中文。10.网页的内容形式:是通过文件后缀获得的。关于图像、音频、视频的文件后缀定义标准参考MIME标准。11.网页的更新情况:网页的更新时间是指搜索到该网页的当日日期与该网页的最后更新日期之间的时间段。五、调查方法(一)数据获取方式和渠道域名和的总量数据通过国内各国际域名注册商和CNNIC联合获得。网页的特征数据由百度公司利用搜索技术对全国进行搜索获得。搜索时通过URL判断同一网页是否有多个链接指向,避免了对这类网页的重复计算,通过判断不同的IP地址和首页字节数是否相同,排除了不同域名指向同一的情况。的特征数据及在线数据库的特征数据通过CallCenter电话问卷调查的方式获得。(二)调查问卷的抽样方法1.总体界定按照对中国互联网络信息资源的定义(中国互联网络上公开发布的网页、在线数据库的总和),同时考虑到未注册域名而提供服务的数量较少以及调查的难度,本次调查中所指的总体为:中国(不包括香港、澳门、台湾地区)所有已注册域名的,包括.COM,.NET,.ORG和.CN域名(含ORG.CN,GOV.CN等)下的所有。2.抽样框关于抽样框,最直接的作法