金惠科技产品通介2017年1月目录企业介绍技术优势•不良信息监测服务/平台•电信反欺诈监测服务/平台•垃圾短信管控服务/平台•智慧园区信息化管理平台•互联网流量分析服务/平台•信息安全综合管理平台产品介绍公司简介起航成长深耕2003年不良信息堵截系统问世。2004-2013年,承担多个国家专项科研任务。获多项专利及发明。在多个行业提供不良信息治理解决方案。2014年7月公司发展里程碑:成立运营商事业部,在通信行业深耕细作。推出针对通信行业的产品及解决方案。包括不良信息监测、钓鱼网站监测等。与多个省份的运营商建立合作关系未来愿景:成为通信行业网络及内容安全综合管理解决方案提供者;使命:协助运营商做好信息安全管理工作,净化网络环境,为中国信息化建设保驾护航。1997年,金惠公司成立。1999年,开始在网络有害图像及不良信息内容识别检测领域进行自主研发。郑州金惠计算机系统工程有限公司成立于1997年1月,注册资金2511万元。国内领先的海量图像/视频信息筛选产品及行业解决方案提供商。公司产品涉及政府、教育、公安、运营商、高铁、国电、智能交通等多个领域。金惠荣誉网络色情图像和不良信息检测多功能管理系统基于内容的网络色情图像和不良图像检测系统在互联网上堵截色情图像与不良信息的系统识别WAP手机色情图像的区域分割肤色算法基于多模式组合策略的移动互联网色情图像识别方法WAP手机传媒色情图像、视频及不良内容的识别监管平台一种适用于交通路口复杂场景下的多视角人流量统计方法软件著作权发明专利光盘检测系统V2.0运维管理系统V2.0金惠反黄专家系统V2.0金惠多媒体教学系统V2.0金惠信息浏览监控系统V6.0网络有害内容侦控系统V1.0智能客流分析决策系统V1.0金惠教育网络安全管理系统V2.0金惠绿坝绿绿色上网专家系统V6.0金惠公共电子阅览室管理信息系统V6.0图像、视频流检测、侦控与监管系统V2.0金惠堵截黄色图像及不良信息专家系统V6.0移动通信网有害内容(图像)检测与监管系统V2.0承担专案序号项目名称项目支持来源备注1金惠堵截黄色图像和不良信息专家系统国家发改委高技术专项国家级2基于内容的互联网不良信息过滤系统创新基金国家级3视像光盘检测系统电子信息产业发展基金省软件专项国家级4自适应仿生模式识别技术嵌入式产业化省软件专项省级5网络有害信息视频流识别与阻断系统公安部十一五科技支撑项目省重大专项国家级6有害信息过滤取证与监管系统国家信息安全专项国家级7移动通信网有害信息过滤取证系统中国联通重大项目、市重大专项国家级8网络有害(色情)视频流检测过滤与监管系统市重大科技攻关市级9网络服务器级有害视频流过滤取证系统市产学研结合项目市级10网络有害(色情)图像/视频流检测过滤与监管系统高新区重大科技专项区级11便携式网络有害内容侦控装备及产业化市科技计划项目(重大工程)市级12手机互联网不良内容检测监管平台市信息化发展专项市级13手机互联网(WAP)色情图像、视频及不良内容检测过滤系统研发及产业化电子发展基金国家级14网络图像、视频流识别监管平台产业化特色产业中小企业发展资金项目国家级15基于视频智慧分析的人流监测技术研究郑州市产学研合作促进项目市级16互联网不良信息综合监管系统高新区重点科技成果转化项目区级目录企业介绍技术优势•不良信息监测服务/平台•电信反欺诈监测服务/平台•垃圾短信管控服务/平台•智慧园区信息化管理平台•互联网流量分析服务/平台•信息安全综合管理平台产品介绍整体技术优势•大数据框架之上的实时在线学习系统,处理各种非结构化数据•在教育、运营商、高铁、国电等领域多年系统集成经验•基于HDFS和Spark的分布式处理框架•CUDA并行处理•完全自主的海量图像识别引擎•超高速大文本比对算法核心图像识别/文本比对算法大数据处理技术领先机器学习算法多年系统集成经验金惠内容识别技术从静态图像中提取需要的前景和主体背景建模•肤色检测•像素转换可变部件模型目标检测基于DPM(DeformablePartModel可变部件模型)的目标检测技术,有效的解决了由于光照变化、部分遮挡、尺度变化、形变等对目标定位的影响;特点•不受光照影响•不受形状变化•不受尺度变化•不限部分遮挡人脸检测金惠内容识别技术基于随机映射的视觉语义搜索技术,利用随机映像算法E2LSH替换传统的K-Means框架,有效的解决了传统算法产生视觉单词的缺点,并且加快了搜索速度,该技术可以应用在大规模的图像快速比对中。视觉语义搜索特点•效率快、规模大•识别精确•不受环境影响SIFT(尺度不变特征转换算法),是一种电脑视觉的算法用来侦测与描述影像中的局部性特征其应用范围包含物体辨识、机器人地图感知与导航、影像缝合、3D模型建立、手势辨识、影像追踪和动作比对。(此算法是哥伦比亚大学计算机科学系教授DavidLowe1999年发明的)SIFT匹配算法适用范围•物体识别、手势识别•指纹与人脸识别•犯罪现场特征取证SIFT点检测随机映射……......……随机化视觉词典1空间金字塔匹配随机聚类森林视觉词汇直方图视觉语言模型视觉语义搜索随机化视觉词典L弱随机视觉词典金惠大数据技术基于HDFS和SPARK内存计算的大数据技术架构,结合分布式CUDA技术,能够实现海量结构化和非结构化数据的收集、特征提取、数据挖掘、规则匹配和模型训练。目录企业介绍技术优势•不良信息监测服务/平台•电信反欺诈监测服务/平台•垃圾短信管控服务/平台•智慧园区信息化管理平台•互联网流量分析服务/平台•信息安全综合管理平台产品介绍系统架构数据采集、还原及去重不良内容访问阻断和提醒智能学习库不良内容自动审计黑名单管理在线机器学习人工审核内容审计功能呈现系统管理界面呈现内容审计报表功能呈现系统接口系统自身防控管理呈现层数据分析层数据处理层采集控制层统计报表不良信息检测系统主要由采集控制层、数据处理层、数据分析层、呈现层四层体系架构组成;实现对暴力、淫秽、暴恐等不良内容提供自动审计、不良内容取证、查出有害源。工作流程采集用户访问URL前端去重前端采集图片和文字去重后的图片/文字缓存图片文字自动审核缓存不良图片和文字删除记录上传不良图片和文字全局URL去重自动审核后图片/文字/网址入库中标域名数据智能分析待审核记录派单,人工审核在线机器学习开始结束是不良信息是正常信息优化前端采集前端处理后台处理系统处理流程分为三个主要部分,分别为前端采集、前端处理(自动审核)、后台处理(人工审核+机器学习),从而实现对不良信息的检测。采集方式网络抓取服务器Internet网络抓取服务器网络抓取服务器内容识别服务器内容识别服务器内容识别服务器数据库服务器网管服务器Web服务器应用服务器IDC机房IDC机房CMNETIDC出口IDC出口分光/镜像分光/镜像前端采集节点后台处理中心后台处理服务器磁盘阵列CMNET防火墙内容识别内容识别服务器信息监测系统旁路镜像采集内容识别服务器通过人工智能手段,从大量的数据信息中识别疑似色情、暴恐、诈骗图片、视频和文字。不良信息内容审计:对采集的内容和信息进行识别和审核(去重、协议还原)分离出疑似不良信息内容并上传服务器。黑名单管理:当出现暴力、诈骗、淫秽等图像、文字、视频等网站,监测系统将会把他们自动加入黑名单行列。数据审核后台数据管理涉及到数据分类、去重、存储;中标数据的智能分析(多维度、多角度审核);系统采用两级审核机制确保中标域名和信息判断准确性,提高拦截率。数据采集、还原、识别、去重域名提取图片/文字记录入库图片文件缩略图存储域名入库任务派单域名/IP归并域名审核违规域名过滤数据处理否域名审核是网站取证内容审核域名封堵录像取证满足不满足人工初审人工复审目录企业介绍技术优势•不良信息监测服务/平台•电信反欺诈监测服务/平台•垃圾短信管控服务/平台•智慧园区信息化管理平台•互联网流量分析服务/平台•信息安全综合管理平台产品介绍背景2015年新增恶意样本(钓鱼网站)增长趋势2015年新增钓鱼网站监测数量随着移动互联网的高速发展,移动终端的功能日益强大,各类电信诈骗也层出不穷,电信诈骗案件数量也逐年递增,一些不法分子通过移动电信欺诈来谋取利益,从而导致越来越多的移动用户受到不法侵害。系统定位监测&发现钓鱼网站清理不良信息&链接落实安全管理制度审核内容把关机制系统架构页面社交关系分析通过采集到的海量URL链接关系及IP地址,评估URL的重要度。重要度越低,中标概率较高。关联规则算法通过分析样本违规内容用词,进行共现词分析,找出关键字关联规则,将可信度较高的关键字自动添加到词库中半监督分类算法在迭代步骤中将特定未分类样本加入训练集,提升分类准确性,降低漏检率主题模型通过提取主题并进行匹配,而非简单地进行关键字匹配,找出潜在的违规内容,提升查全率系统作业流程恶意代码监测作业流程样本预处理分析研判更新结果库处置数据提取提取URL数据去重挖掘分析数据过滤疑似样本整理静态分析动态分析内容识别人工审核特征提取防范策略更新黑白名单结果关联大数据分析结果导出网管中心流控设备客户端结束欺诈网站识别流程确定传播源头感知可疑URL实现流程:通过获取多渠道数据,并结合图像+文字的检测方式,对URL地址本身及抓取内容,例如title、logo等图像信息进行检测。通过对疑似钓鱼网站人工审核,结合源IP、目的IP等数据信息,查找恶意程序源头及传播路径,并进行相应的处置操作。数据源内容检测采集清洗快速比对利用URL相似度分析,进行仿冒地址分析,同时对URL抓取内容进行文本识别图像分析域名URLma.3g.qq.com/common.diditaxi.com.cn/passenger/getredpoint?datatype=1&vcode=99&suuid=723813D1042DA4F555801FFE8DAF753D_780&android_id=c1eec98c5b237940&lng=113.567773&cancel=testf40fea25ec03f1071ff4e29adb668f1b&pixels=1080*1812&cpu=Processor%09%3A+ARMv7+Processor+rev+3+%28v7l%29&networkT=f0b3245f&rid=f0b3245f&input=gid%3Ateacher_spring1%2Cfrom%3Aweb&module=teacher-transferm.qpic.cn/psb?/V1032B9t4NmsC3/SGOde3L.YAtNGCDQ0jyNLZwB9veSEZNPpwD57BQs4tY!/b/dNzB7G4cQgAA&ek=1&kp=1&pt=0&bo=uAFKArgBSgIFACM!&t=5&su=0131389665&mType=qzBigPicd统一DPI数据短信数据每天可获得万级左右的可疑URL采用图像识别技术,针对疑似URL抓取到的内容进行钓鱼网站分析比人工审核处置人工确认钓鱼网站,结合其他相关信息确认传播源和传播路径根据客户需求进行上报、告警推送、封堵等操作传播源传播路径实时处置恶意代码检测方式检测方法检测方法静态分析(特征库比对)动态分析(动态虚拟执行沙箱)静态分析基于特征码的检测方法,主要包括特征码比对和行为异常检测。可实现格式识别解析、Shellcode发现、堆喷射检测、字符串信息提取、漏洞检测等功能。对于恶意网站和脚本,采用专用脚本解析引擎与浏览器虚拟执行相结合的方式,使恶意代码和脚本的行为得到充分的释放。功能展现目前区别于现有传统检测方式,可加入大数据挖掘分析方式,通过先进的大数据分析算法,扩大检测范围,增加关联度分析,可最终实现对钓鱼网站进行多维度精确打击。获取URL检测处置获取URL检测分析处置传统检测方式大数据分析方式②传播途径分析①传播源分析③关联分析④受害用户分析⑤URL相似度分析...用户访问U