全国林业行业信息监测系统解决方案夏聪目录一、项目背景二、业务实现三、系统框架四、方案价值一、项目背景现状趋势提升信息化能力提高数据利用率加强分析预测能力领导决策提供数据支撑制度建设逐步规范信息化手段相对滞后数据格式多样化数据源分散,利用率低一、项目背景全国林业行业信息监测系统建设的内容包括:1、对国家级林业重点工程的建设情况监测;2、实现重点林区森林资源防火防灾的自动监测;3、对全国各地主要林产品的价格的动态监测预警;4、国内外各地林业系统的网络舆情监测;5、建设一个集数据填报、运算、上报、审核、汇总的统计报表系统。6、建设一个集信息浏览、统计分析结果展示、全文检索于一体的门户。拟建内容二、业务实现•多数据源、多数据格式,包括结构化和非结构化数据数据采集•智能搜索引擎将数据加工为标准的格式,并索引数据加工•数据分类、自动聚类、定义数据模型进行分析预测数据分析•通过web门户进行数据展示、搜索数据展示二、业务实现采集的数据源包括:1、文本类:国家级林业重点工程承建单位的项目建设周报/月报,各业务司局关于工程建设的文档,国内外林业电子期刊杂志;2、图片、视频类:林业监测卫星、林业防火监测点形成的图片、视频;3、网页类:通过网页数据采集器采集各个主要林业站点的网页数据,包括国内外的林业新闻、各地林产品的价格等;4、统计报表:各单位填报的林业统计数据,包括月报/季报等。5、第三方数据源:Notes、Sharepoint等数据采集二、业务实现通过智能搜索引擎的相关模块将采集的新闻网页、统计报表类的结构化数据进行抽取入库,同时将文本、图片、视频类的非结构化数据进行编码转换,关键帧提取,最终形成的一个标准的数据格式,并定义索引字段。数据加工二、业务实现1、通过定义关键词对数据进行主题分类;2、智能搜索引擎基于自然语言语义分析对海量数据自动聚类,生成多个热点信息岛图;3、通过模式匹配算法对视频关键帧、图像进行监测;4、通过定义数据模型对林产品的价格进行动态监测预警;5、通过定义内容模板自动生成信息监测简报的初稿,供再编辑;6、通过自然语言语义分析对国内外的林业网络新闻舆情进行监测。数据分析二、业务实现数据展示包括:1、各单位填报统计报表的录入界面,用户的入口可以通过单点登录的方式集成到系统门户里。2、通过门户网站对各主题分类数据进行展示,提供统一搜索入口,而且能够根据用户的所属部门和浏览习惯自动推送相关信息。数据展示三、系统框架智能搜索引擎聚类分析预警分类Web门户展示,统一搜索文档库多媒体库关系型数据库.doc.pdf....jpg.rmvb...Oracle、Sqlserver...第三方数据源Notes、sharepoint...统计报表四、方案价值该方案价值包括:1、系统实现了集文本、网页、图片、视频等多种数据类型于一体的搜索与分析;2、系统将多个独立数据源的海量数据通过自然语言语义分析,实现自动聚类的分析与应用,更加智能化;3、系统基于面向服务体系的业务架构,对于林业行业的其他业务需求可以平滑扩展。谢谢