西安电子科技大学工业大数据平台西安电子科技大学主要内容1、工业大数据2、工业大数据实践3、课题进展西安电子科技大学西安电子科技大学西安电子科技大学西安电子科技大学同时GE公司的报告还揭示了工业大数据所蕴含的巨大价值。西安电子科技大学西安电子科技大学工业大数据领域2/8法则数据价值密度20%的SQL小数据具有80%的价值密度例如:产品图纸、试验分析、加工工艺等80%的工业大数据密度只有20%,需要分析挖掘例如:工况数据、图片数据、文本数据等数据的依赖关系20%的SQL小数据将引爆80%工业大数据价值不举小数据之“纲”,难张大数据之“目”西安电子科技大学工业大数据演进过程案例西安电子科技大学在企业内部切换数据库的难度如果将数据比作血液,数据库相当于心脏替换数据库相当于心脏移植静脉血管,数据写入动脉血管,数据查询整个过程生命不能停顿,系统不能中断运行意外发生可以恢复,切换途中可以回退西安电子科技大学工业大数据的切换过程西安电子科技大学无耗损数据修补技术传统方案,造成三类数据损耗切换时刻不明导致误差损耗切换过程中发生的停机损耗切换试验造成的脏数据损耗利用双系统切换实现无损修补先进行双向删除,然后再进行修补西安电子科技大学双系统并行,非中断切换单系统停机切换存在的问题应用停机查询和写入接口同时修改,导致上层应用长时间不能工作以服务部门为例:停产一天,将导致百万元的损失数据丢失原始数据库停机后,实时数据丢失,无法找回西安电子科技大学微创式应用一直方案通过专用代理服务将大数据系统透明接入关系型数据库以最小代价实现关系数据库与大数据系统的优势整合使得遗留应用程序平稳过渡到大数据平台上西安电子科技大学应用一直复用SQL知识西安电子科技大学主要内容1、工业大数据2、工业大数据实践3、课题进展西安电子科技大学工业大数据应用系统开发西安电子科技大学面向领域的大数据应用系统开发与运行平台构建大数据应用系统的开发与运行平台创新大数据系统开发的软件工程方法为计算机辅助开发提供工具和平台支撑西安电子科技大学如何实现大数据系统的“计算机辅助开发”?“CAD”forBigDataSystems?CAD=ComputerAidedDevelopment如何“绘制”用户需求图纸?业务需求如何描述?如何根据需求图纸“装配”标准组件?如何根据用户需求选择、配置、部署大数据构件?如何“检查”标准组件是否满足图纸设定?如何根据大数据构件的运行时数据优化系统配置?西安电子科技大学开发与运行的生命周期西安电子科技大学集成设计开发环境——自动部署西安电子科技大学集成设计开发环境——需求建模西安电子科技大学大数据构件资源库——逆向工程西安电子科技大学大数据构件资源库——系统建模线程配置对副本一致性的影响西安电子科技大学运行时分析工具西安电子科技大学课题立项半年来的部分学术成果正式发表A类论文5篇ShaoxuSong,LeiChen,andHongCheng,’’OnConciseSetofRelativeCandidateKeys.”VLDB2014ShaoxuSong,etal.“RepairingVertexLabelsunderNeighborhoodConstrainst.”VLDB2014ShaoxuSong,HanZhu,andLeiChen.”Probabilisticcorrelation-basedsimilaritymeasureontextrecords.”InformationSciences2014ShaoxuSong,LeiChen,andHongCheng.“EfficientDeterminationofDistanceThresholdsforDifferentialDependencies.”TKDE2014MingshengLong,JianminWang,JiaguangSun,PhilipS.Yu.“DomainInvariantTransferKernelLearning.”TKDE2014MingshengLong.JianminWang.GuiguangDingetal.”TransferLearningwithGraphCo-Regularization.”TDKE2014申请国家发明专利2项分布式计算机数据存储系统中多副本一致性的控制方法,王建民,黄向东,201410165580.x数据搜索方法及系统,丁贵广林梓佳陈文烁,201410364896.1