网站决策支持系统2目录一、系统技术要求.................................................................................................3二、系统性能要求.................................................................................................7三、系统功能特性.................................................................................................8四、系统功能要求.................................................................................................84.1综合分析模块...............................................................................................84.2决策分析模块.............................................................................................154.3技术分析模块.............................................................................................25五、成功案例.......................................................................................................293一、系统技术要求B/S访问以及模块式架构系统要求采用B/S架构,任何局域网的用户可以使用Internet浏览器通过帐号和密码访问系统,并自由组合条件查看历史时间段的所有报表结果。整个系统采用了可伸缩的模块化架构,所有各类功能集成在一个应用平台,采用集中的登陆窗口、模块化的应用、分级权限管理。4可伸缩的扩充能力要求产品支持多线程、与多任务体系结构,同时支持集群部署的网络架构,所以支持任意大小的网站群,包括网站诊断与检测系统与网站分析系统。整个分析平台解决方案可以支持任意规模的网站群,从一个站点可以扩充到上千、万个站点。稳固的高可用性整个系统平台可以实现无人值守7*24自动分析,整个平台可配置为高可用性架构,如果任何一台“分析服务器”宕机或服务中断,其他服务器会自动接管对应的服务,同时会发硬件故障通知邮件给系统管理员。对于数据库服务器,同样可以配置两台硬件服务器,作为高可用架构中的主、备服务器。丰富的输出接口(1)强大的报表输出功能,可以支持任意设定输出项进行报表的输出。可以导出为PDF、EXCEL、图像格式、WORD、邮件格式。网站分析引擎网站分析引擎网站分析引擎网站日志网站日志网站日志网站日志浏览器网站日志数据库服务器网站分析引擎网站日志5(2)支持导出的报表自动通过邮件发送到指定的用户。(3)可以设定定时发送报表。(4)支持XML任意组合输出。其它接口程序可以调用此XML接口。(5)独立的发布模块能够根据需求把数据随意结合到对外的公开网络上,通过网站模板与XML输出的整合,提供了一个自动发布的接口。任意选择时间段,可以组合排名的功能对多个网站或多个频道进行排名发布。也支持进行某个时间段的特别网站活动。多界面风格整个系统平台可以根据用户的使用习惯不同,进行界面的风格转换,参见如下的几个软件系统截图。多层级权限控制本系统平台可以给不同用户按角色分配权限与功能,也可以任意自由组合权限与功能,包括精细到栏目/频道、站点、使用时间等。在建立用户时候所有的可配置的权限、主模块、子功能、站点、栏目、使用时间、次数都可以配置。当然,也可以直接通过角色选择预先定义好的功能,例如,可定义角色包括“系统管理员”、“单位领导”“部门主管”、“市场人员”、“技术人员”等。下图为权限管理的界面截图。6可伸缩的数据处理性能对于整个系统平台因为可以进行集群架构,所以如果要求的更高的处理性能速度。同时在有限硬件资源的情况,可以每台服务器可以启动多任务工作。对于招标要求的页面抓取性能、处理性能、分析速度可以设定阀值,如果低于这个阀值则自动启动第二个任务进行并行处理,以此递推。现在的服务器都是多核服务器,数据处7理可伸缩架构能够充分应用硬件的资料,最大限度地提高速度。二、系统性能要求(1)可靠性数据准确真实。超大数据量存取时,不出现IO故障。数据采集时不导致WEB服务器性能降低。7*24无故障工作。(2)可用性多种指标,包括页面数/访问量/唯一访问量/带宽等,全面客观衡量网站被访问程度。安装方便、使用界面友好、简便易用。多台服务器上同时高速获取日志,数据采集全自动完成。支持大型网络环境和服务器集群。即点即现的反应性能。支持无单点故障的高可用性配置。任何一台硬件服务器的故障都不会引起分析服务中断。如果有一台分析服务器出现故障,另一台可以接管所有的日志分析与日志搜集任务。(3)安全性没有客户端安装,不会给服务器带来安全隐患。通讯端口完全加密认证,密码加密存储。可分配多级用户权限,限定分析和操作的范围,主要用户角色包括:普通用户/市场分析人员/技术人员/经理/系统管理员提供用户信息审计,包括使用状况审计Web访问可以配置使用SSL加密(4)可维护性完全模块化设计,预留第三方数据接口和XML接口。完全基于WEB的图形化管理界面,便于管理员操作,不需要去后台操作。数据采集分析自动完成,不需要人工干预。(5)分析速度优化的并行数据分析引擎,减少数据库连接的内存Hash处理机制。单位时间内分析更多的数据以及支持对更多站点的分析,要求就平均每小时达到20GB的数据分析能力。(6)可扩充性8具有灵活的可扩充功能,同时整个系统平台的硬件配置可为高可用以及多服务器的集群方式。所以整体方案硬、软件系统架构具有很好的灵活性与可扩充性。如果分析的日志更多,或者网站群的数量增加,可以考虑多增加一个分析节点。增加服务器的时候,不需要中断原系统的运行。配置完毕后,直接并入整个运行体系,单独给它定义的配置信息,会自动通知给另外的分析服务器与数据库服务器。三、系统功能特性内容可访问性采用W3C标准应用了全文检索的技术进行网页内容扫描通过配置,可以任意设置扫描时间间隔可以实现7*24小时无人值守工作。深入挖掘网站各类运营数据,高层次的专业分析报告;可对多个网站同时监测,提供横向对照和分析;分栏目任选时间段,灵活设定条件得出分析报告;分析结果深入、详尽,图表、数据,报表导出;支持多服务器集群,自动进行高效率的数据收集;按国家,国内行政区域统计访问来源,可以自定义用户区域;跟踪可疑用户,固定用户的访问,自定义用户群的跟踪;支持服务器,错误源的分析,进一步完善网站结构;支持多用户,多角色进入,并可查看访问日志,提供用户信息审计;不需重复导入分析日志,有自己的数据库系统支持;动态更新;通讯端口完全加密认证,密码加密存储,不给服务器带来任隐患;适合各层次用户使用,使用简单,方便。打破了只有技术人员才能处理和操作的局面;四、系统功能要求4.1综合分析模块综合分析是对整个网站群分析结果的总的概括的分析页面。一般的普通用户,每天只需浏览综合分析,就可以知道所有的分析结果,而且还有概括性的文字描述,并可方便的打印存档,方便领导阅读。9101.页面分析页面分析,主要分析的就是页面数。所谓的页面数就是访问者访问本站点,只要点击任何页面都算为页面数,包括页面的刷新等。页面数是衡量一个网站访问量的大小,是否受用户喜爱和关注的重要指标。2.访问数分析访问数:指同一个IP地址在间隔小于30分钟内,访问同一个站点,都算一次。访问数和页面数同样是体现网站访问状况的一个参考指标。3.独立访问分析独立访问数:一天内同一个IP地址多次访问本站点,都算一次独立访问。因此独立访问数这个数值比较偏小。它统计的是每天独立IP的访问情况。4.流量分析网站访问的数据的流入和流出统计。帮助您了解分析范围内各天或时段的频宽使用情形。115.访问机率分析访问机率分析:平均每人次点击的页面的次数,通常指一个用户登入一个网站后点击的页面的总数,该指标一般说明网站的内容的丰富程度。126.时间段分析时间段分析,可按月、周、天、小时等不同的时间段内访问网站的页面数统计。并给出曲线图、饼图和表格。管理者可以清楚的看到,哪个时间段内访问的次数最多。用户可以根据自己的需要下载XLS和PDF格式的报表。通过时间段分析,决策层很容易掌握网站各个时间内用户访问的情况,从而自定相应的决策。137.进入页面分析进入页面分析是当访问者访问网站时最先访问的页面。8.IP分析访问者的来源IP地址统计,列出访问最多的IP地址,利于群组设置。14IP分析界面,点击IP可以查看每个IP的详细分析9.来源分析来源分析分为来源页面分析和来源站点分析。主要就是知道访问者来自于哪个页面链接或站点。a)来源页面分析来源页面分析指的是用户在访问到本网站之前访问的页面,或者用户是从哪些页面链接到本网站上来的。b)来源站点分析来源站点分析指的是用户是从哪些站点链接过来的,这些站点可能包括一些你的广告投放站点/友情链接的站点等等。154.2决策分析模块1.用户群分析显示用户来自哪个国家,如果是中国的来自哪个省和直辖市。并给出访问用户最多的是什么地方。列表可按序排列。1617继续点击“北京市”,你可以看到具体来自北京市的用户的访问情况,而且还可以看出这些用户的具体访问过哪些栏目、访问走势等。其中访问走势包括按天/按周/按月的趋势。18系统支持对各省的深度分析,点击具体的省份,可以提供地区级别的分析,下图是山东省各个地级市的分析。19202.网站栏目分析网站栏目标分析是对网站的各个栏目访问量进行分析,并生产走势图,如果栏目有好几级,可以一层一层深入挖掘下去。3.栏目对比分析对比分析,是任意两个时间段进行比较分析。可以是按天、周、月等时间段。通过栏目对比分析,使分析人员可以做时间上的同期比较,并可以比较它们在时间变化上的增量。214.新闻分析新闻分析是对于指定栏目下的新闻,每天的访问情况的分析。225.新客户分析统计一段时间内的客户分布情况,新客户/回访客户分布。6.回访率分析分析客户的回访情况,不同的客户在某时间段内的回访频度、次数。7.停留时长分析(黏度分析)分析客户的停留时长、访问页面数。238.流媒体分析流媒体分析主要针对在线媒体提供流媒体文件、流媒体访问者等分析,其中包括文件播放时长、流过流量、所使用播放器,每个文件在不同时间段、不同时刻被访问的次数,栏目的总播放参数等。流媒体分析同时支持对在线直播和点播的分析。249.专题分析系统可以对一类的页面聚合为专题进行分析,可以手动设置专题,也可以通过专题聚合工具来设置专题。254.3技术分析模块1.域名分析域名分析,是如果您的网站有好几个域名时,通过域名分析就可以清楚的知道,访问者访问本站点经常使用和喜欢的域名是什么。2.浏览器分析浏览器分析,是访问者最多使用的是什么浏览器和版本。同时系统给出,按页面数和访问数为分析指标的百分比图。263.操作系统分析操作系统分析,是分析访问者电脑所使用的是什么操作系统。同时系统给出,按页面数和访问数为分析指标的百分比图。4.搜索引擎分析搜索引擎分析,是从什么搜索引擎引用过来,访问次数最多的搜索引擎。还能查看每个搜索引擎访问最多的关键字。275.Spider分析Spider分析,是利用能够从互联网上自动收集网页的Spider系统程序,自