全球领先中文大数据综合解决方案中润普达(集团)公司2014-0212014年2月15日版本集团公司级公开文档132关于大数据•大数据、大机遇、大产业:中国大数据发展巨大机遇•大数据的核心是数据的采集和挖掘及技术的实现关于我们•中润普达(集团)信息技术有限公司:领跑中国大数据发展•公司治理结构:全球化资本巨头+中国产业资厚盾+顶尖智库+卓越团队核心业务•行业大数据云服务平台解决方案•大数据“渔网”风控系统•产业金融云平台解决方案3增值业务•大数据分析师培训•大数据风险要情杂志&报告•大数据课题研究•大数据预处理方案第一章第二章第三章第四章3“未来,数据将会像土地、石油和资本一样,成为经济运行中的根本性资源。”—美国人维克托·舍恩伯格在其《大数据时代》一书中如此描述。大数据时代来了2012年3月,美国公布了“大数据研发计划”。该计划旨在提高和改进人们从海量和复杂的数据中获取知识的能力,进而加速美国在科学与工程领域发明的步伐,增强国家安全。该计划还强调,大数据技术事关美国国家安全、科学和研究的步伐。中国在接触到“大数据”这个时髦名词的时间,已经到了2009年。从国内新闻报道情况看,大数据在中国的发展元年是2010年,2011年迎来了发展高涨期。4大数据、大机遇、大产业5大数据是什么?大数据不是一种新技术,而是一种自古就有的思维方式、观察角度。6大数据是什么?我们定义:大数据是一种综合解决方案集数据云计算、云数据、数据云服务、数据云交易为一体的综合解决方案7大数据的核心是数据的采集及技术实现挖掘及技术的实现不只是在于掌握庞大的数据信息而在于对这些含有意义的数据进行专业化处理即强调对数据的132关于大数据•大数据、大机遇、大产业:中国大数据发展巨大机遇•大数据的核心是数据的采集和挖掘及技术的实现关于我们•中润普达(集团)信息技术有限公司:领跑中国大数据发展•公司治理结构:全球化资本巨头+中国产业资厚盾+顶尖智库+卓越团队核心业务•行业大数据云服务平台解决方案•大数据“渔网”风控系统•产业金融云平台解决方案3增值业务•大数据分析师培训•大数据风险要情杂志&报告•大数据课题研究•大数据预处理方案第一章第二章第三章第四章德同资本、IDG创投、博信资本联合投资创立联合光明网、东华软件合资“光明数据”联合浙江大学成立“中国大数据研究院”中润普达公司介绍9国内领先的行业行业大数据和风险大数据服务商国内卓越的行业大数据云服务平台和风控系统综合解决方案机构国内领先的产业金融大数据综合解决方案机构业务覆盖行业大数据云服务与交易、行业风险大数据采集统计与分析、行业风险大数据监测、预警、预测与服务、产业金融大数据解决方案、行业大数据预处理、大数据分析师培训、大数据课题研究等。监管机构:中国证监会、中国银监会、中国林权交易所、中小企业股份转让系统有限责任公司、北京市银监局机构客户:潍坊银行、浙江能源局等培训客户:浙江大学、清华大学五道口金融学院中国大数据产业化“摇篮”1010金融事业部(比格达塔信息技术股份有限公司)政府、健康、教育、文化环保事业部(杭州金控数据科技股份有限公司)中润普达信息技术有限公司能源事业部(中能普达信息技术股份有限公司)产业金融事业部(艺术品、林权金融)(北京林权评估交易中心)大数据培训事业部浙江大学大数据研究院比格达塔(中国)研究院浙江(良渚)大数据产业园光明数据信息技术有限公司具有打击力的业务和产品11行业大数据云服务平台解决方案大数据渔网风控系统产业金融大数据解决方案大数据分析师培训大数据风险要情杂志&报告大数据课题研究大数据预处理方案深入研究信息技术和革命的发展趋势,创新文本挖掘、语义分析、数学算法、分词矩阵等大数据技术和方法,在云计算、云数据、云服务和云交易的基础上,开创性地推出面向行业的、独有的大数据风险控制综合解决方案和云服务平台,为用户决策提供服务。132关于大数据•大数据、大机遇、大产业:中国大数据发展巨大机遇•大数据的核心是数据的采集和挖掘及技术的实现关于我们•中润普达(集团)信息技术有限公司:领跑中国大数据发展•公司治理结构:全球化资本巨头+中国产业资厚盾+顶尖智库+卓越团队核心业务•行业大数据云服务平台解决方案•大数据“渔网”风控系统•产业金融云平台解决方案3增值业务•大数据分析师培训•大数据风险要情杂志&报告•大数据课题研究•大数据预处理方案第一章第二章第三章第四章基于“云+端”系统建设模式,将金融、能源等行业和本企业大数据进行多维度重新整合和深度挖掘,建立横向、纵向、交叉以及立体分析模型和对标体系,实现包含IAAS,PAAS及SAAS等数据的综合应用,为管理者提供辅助决策服务。核心业务(一):行业大数据云服务平台解决方案教育、健康、环保、政府、文化等行业大数据云服务平台逐步面市14行业大数据云服务平台解决方案3-5年打通主要行业大数据云服务平台,成为全球中文大数据“亚马逊”云数据服务咨询独立数据空间行业及成员数据共享数据统计分析服务云数据查询下载指数数据查询及应用标准数据查询及应用用户贡献数据支撑机构贡献数据支撑云数据建设管理行业标注数据系统建设客户标准数据系统建设基础数据中心系统管理数据导入与导出管理云数据备份应用物理数据建设逻辑数据库建设数据库备份财务数据监管数据经营数据行业数据市场数据社会数据技术数据其他企业(机构)不公开内部数据(用户贡献)网站数据论坛数据外媒数据搜索数据贴吧数据视频数据微博数据其他网络数据及其他社会化数据)大数据云服务平台用户:企业、监管机构、个人数据源:大数据来源行业大数据云服务平台解决方案云服务平台-总体架构图16数据采集数据存储数据挖掘应用展现信息源标准规范体系系统安全体系组件服务系统运维保障体系云服务平台综合解决方案17行业大数据云服务平台云计算云数据云服务云交易存储备份计算采集挖掘过滤排重分类查询统计评估分析检索追踪预警预测聚类抵押担保入股交易流转融资交换出租行业大数据云服务平台云服务平台-逻辑架构图18应用展现系统管理门户展示数据存储数据采集定向采集元搜索采集微博采集贴吧采集信息源新闻微博内部数据论坛博客……数据挖掘与分析语义分析Hadoop搜索引擎分词矩阵组件服务业务组件报表组件搜索引擎服务查询与分析服务……各行业信息采集与分析平台单点登陆用户与权限服务各行业风险控制与管理系统用户与权限管理个性化定义数据管理平台门户管理平台交易管理平台体系标准规范体系运维保障体系系统安全体系云平台数据交易平台总库行业库系统支撑库文件存储人工采集……数据挖掘模型……云服务平台-业务架构图19组件企业(机构)内部公开数据网络数据及其他社会化数据网站数据贴吧数据微博数据……财务数据监管数据经营数据……网络数据及其他社会化数据采集企业(机构)不公开内部数据上报企业(机构)内部公开数据采集网络数据及其他社会化数据库企业(机构)不公开内部数据库企业(机构)内部公开数据库网络数据及其他社会化数据挖掘企业(机构)不公开内部数据挖掘企业(机构)内部公开数据挖掘数据挖掘与分析组件基础平台组件系统管理组件数据应用展现平台数据分析与挖掘服务数据集成服务企业(机构)不公开内部数据人事数据产品数据销售数据……数据采集服务服务总线系统管理用户与权限管理数据管理平台门户管理平台交易管理平台内部用户外部用户系统管理员系统管理员客户N客户N客户1客户1业务管理员业务管理员业务分析员业务分析员客户2客户2数据交易组件移动平台组件客户3客户3……数据交易平台数据评估平台产业金融平台大数据云平台各行业大数据信息采集与监测平台各行业大数据“渔网”风险控制系统移动平台客户4客户4中国证监会:新三板风险预警与管理平台该模型基于对多维度和多渠道采集来的数据进行深度挖掘和分析,通过预测不同事件和维度的热词K线走势,从而达到监测整个行业风险目的。因为模型像一张渔网。所以叫大数据“渔网”风控系统。大数据“渔网”风控系统核心业务(二):大数据“渔网”风控系统大数据“渔网”风险控制系统核心业务–大数据“渔网”风控系统•网络舆情监测与预警系统•竞争对手竞争情报分析系统•网络舆论导向预测系统财务风险•特殊数据采集导入系统•特殊数据挖掘、算法和对标系统•特殊数据标准通用模型架构系统经营风险非结构化社会数据预处理系统网络信息采集分析统计系统•基于财报挖掘系统•基于财报算法系统•基于财报可视化系统企业(机构)结构化数据分析统计系统大数据渔网风控系统–社会化数据舆情风险人物舆情某某某某某某某热点监测热点舆情热点事件专题报道微博监测舆情预警网上举报首页焦点头条舆情数据舆情预警舆情地图北京市上海市天津市湖北省浙江省广东省热点监测来源监测外媒监测舆情地图统计分析来源监测网站报刊博客贴吧微博监测报告简报夹外媒…大数据渔网风控系统–社会化风险数据社会风险黑名单银行性质被企诉业所属行业案件性质被告方案件性质银行性质高管异动高管人事变动高管声誉高管负面声誉管理口碑指数毁誉度热度风险管理风险处置能力分析风险类型风险预警信用管理客户信用监测个人信用监测企业信用监测银行信用评测信心管理银行挤兑潜在风险度量潜在挤兑爆发距离潜在挤兑爆发概率投资信心指数商业危机操作风险信贷监测事件追踪高潮期发展期酝酿期回落期预警管理红色预警橙色预警黄色预警绿色积极蓝色祥和原告方大数据渔网风控系统–经营风险数据经营风险利润分配披露时间涉及金额开始时间结束时间关联交易交易类型交易对象交易金额交易时间收购出售资产交易类型交易对象交易金额交易金额交易时间投资披露时间涉及金额投资行业投资对象重组分立合并资产权利受限受限方式涉及金额对外担保担保对象担保金额担保期限关联方占用占用人资源类型占用价值大数据渔网风控系统–财务风险数据财务风险盈利能力营业收入毛利率归属于挂牌公示股东的净利润加权平均净资产收益率基本每股收益偿债能力总资产归属于挂牌公司股东的每股净资产资产负债率流动比率利息保障倍数营运情况现金流量净额应收账款周转率存货周转率成长情况总资产增长率营业收入增长率净利润增长率其他重要指标市场份额客户保持率研发投入新产品投资回报率核心业务–大数据“渔网”风控系统26基于大数据的“渔网”风控系统将在未来5-10年为国家产业转型升级、社会管理、企业风险控制和社会信用完善等方面起到重要作用。核心业务–大数据渔网风控系统之声誉风险破产指数系统企业声誉潜在风险(VAR)及违约距离(DP)定义示意图大部分时候各类机构和企业负面信息很少,但是,当风险发生时,负面的信息可能会迅速增加,正面的信息可能会下降,当正面和负面信息走势相交时,我们认为就是企业和机构声誉破产之时。因此,为了更好的对企业和机构风险作出预测,也为了更好的对企业和机构决策做支持,我们通过VAR模型计算出企业和机构的潜在风险,通过Garch模型计算了企业和机构的隐含风险。然后,我们通过边际风险最大化的定义计算出企业和机构声誉破产的均衡值,并推导出企业和机构声誉破产的临界值、企业和机构声誉破产概率和声誉破产违约距离。紫色框区域为预测走势示意图上图:企业声誉风险指标体系相关指标企业声誉风险指标体系的设想依据KMV模型、VAR模型、Garch模型理论为基础,涉及到的指标如上表所示。企业声誉风险指标体系理论依据计算公式决策指标声誉破产违约距离(DP)根据边际风险最大化公式及KMV公司违约距离的公式违约距离=(N日正面报道量-N日负面报道量)/当日正面报道量*N日正面报道量的方差声誉破产概率违约概率=违约距离的正态分布表的值声誉破产临界值声誉破产临界值=α+β*N日负面报道量风险指标企业声誉潜在风(VAR)根据var模型计算企业声誉潜在风险=n*totle*Sqrt*MathSqrt(averlt*maxtimes*realweek/24/forward)企业声誉隐含风险根据garch模型计算企业声誉隐含风险=MB+p*MD这个体系开发的目的不仅是预测企业和机构的声誉破产点,还在于帮助企业和机构做决策判断。具体实现设想是根据企业声誉潜在风险(VAR)的计算,找到VAR值与违约概率关系