不良信息监控系统安全解决方案部目录背景分析一IDC/ISP信息安全管理系统建设情况二解决方案三国家政策要求《工业和信息化部关于进一步规范因特网数据中心业务和因特网接入服务业务市场准入工作的通告》(工信部电管函【2012】552号)•促进互联网行业健康发展,营造健康有序的市场环境,落实《工业和信息化部关于鼓励和引导民间资本进一步进入电信业的实施意见》(工信部通〔2012〕293号)。目的意义•《中华人民共和国行政许可法》•《中华人民共和国电信条例》•《电信业务经营许可管理办法》(工业和信息化部令第5号)等法规依据•《关于进一步规范因特网数据中心(IDC)业务和因特网接入服务(ISP)业务市场准入工作的实施方案》实施方案不良信息检测安全监管需求200920132014•2014年全国“扫黄打非”工作小组办公室、国家互联网信息办公室、工业和信息化部、公安部决定,在全国范围内统一开展打击网上淫秽色情信息“扫黄打非·净网2014”专项行动。•2013“扫黄打非”工作重心向网络倾斜,网络传播淫秽色情和低俗信息、在线侵权盗版、非法网络报刊和网络游戏等将成整治重点。•2009年七部委电视电话会议,全国开展整治互联网低俗之风专业行动。不良信息检测面临的问题2014年2月浙江舟山“藏书吧”网站传播淫秽色情信息案,淫秽小说9566部,注册会员709名。2013年底广东罗定“2·17”网上传播淫秽色情信息案。淫秽色情小说5700余部,网民访问次数923万人次2013年底安徽宣城“雪豹男同”网站传播淫秽色情信息案,有70余万名注册会员、200余名vip会员2014年2月,广东深圳公安部门发现,有人在网上利用传播淫秽色情视频种子文件牟利,通过深入侦查及时锁定犯罪嫌疑人陈某。2014年3月,甘肃省泾川县公安网安部门发现,有人以虚拟身份在其创建的“同城轻松夜话”QQ群内大肆传播淫秽色情图片、视屏、链接。目录背景分析一IDC/ISP信息安全管理系统建设情况二解决方案三IDC/ISP信息安全管理系统整体建设方案IDC信息安全管理接口管局侧系统(SMMS)资源管理数据上报信息检测封堵管控访问日志网络安全系统管理信息安全IP/域名备案系统互联网指挥平台向指挥平台提供访问日志超链地址调用部备案系统接口,返回对应备案状态信息互联网综合管理平台调用综合管理平台网站分类接口,返回网站分类信息机房内域名/IP地址输出至综合管理平台企业资源管理系统传递机房设备、用户信息至IDC管控平台资源管理网络安全增值业务信息安全日志审计统计分析系统管理策略管理企业侧系统(ISMS)企业侧IDC安全管理系统目录背景分析一IDC/ISP信息安全管理系统建设情况二解决方案三不良信息监控平台-总体架构策略管理爬虫服务基础服务架构去重服务噪音提取………数据库文本库索引库网页抓取信息抽取分类过滤特征识别入库……..协议识别内容识别分类分析调度机制审核机制……..黑名单白名单系统管理信息展示不良信息检测-网络爬虫技术根据IDC/ISP信息安管理系统上报的基础数据信息中的域名信息为基本源;部署爬虫引擎,通过对基本源目标网站进行超链接分析和递归爬取,完成抓取整改网站的页面数据;再通过内容检测层进行检测,主动发现域名页面内容不良信息。内容识别技术-关键字识别语义匹配识别技术的创新性应用突破了关键字过滤的局限性建立关键词权重系统,根据查准率和出现概率科学判别可以设置减权关键词,降低误报率用户可根据需求进行类别增删管理和关键字增删管理支持通配符匹配文字准确率99%,识别0.1秒以内关键词支持配置多个关键词字典,不同的检测策略可使用不同的字典关键参数内容识别技术-关键字识别通过关键字匹配,并可对非法内容进行分类处理(使用不同的关键字字典)通过权重(包含正、负权重)最大限度的降低误判率如“口交”一般为黄色信息判断的重要关键词,但用于“营口交行”,就是一种正常的情况。我们一般把后一个词设置成减权关键词,即系统设置如下:关键词所属类型权重口交黄色3营口交行黄色-3这样,出现“营口交行”的地方,该信息的权重为+3-3=0,就不会把该信息误认为黄色信息。通过内容匹配度,增加判断的正确性内容识别技术-智能分词技术通过提出被检测页面中的全部文字信息,根据丰富完善的字典将待检测文字信息自动分解为多个单个词组,自动匹配所需检测的不良信息关键字;对比传统的文件检索技术,智能分词技术可以降低误报率,是目前不良信息关键字检测准确率最高技术手段