第4章+GIS数据采集和数据处理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第4章GIS数据采集和数据处理4.1GIS数据源4.2地理数据分类和编码4.3GIS数据采集和输入4.4GIS数据处理4.5数据质量和精度控制空间信息的获取是一个空间信息系统建设的首要任务。一个空间信息系统建设,70%以上的工作(费用)将花费在空间信息的获取上面。现实世界文字报告、遥感图象等数字化仪扫描仪解析测图仪键盘等编辑、接边、分层、图形与属性连接、加注记等空间数据库数据源?如何采集和处理?数据质量如何?4.1GIS数据源GIS数据源自地图数据、遥感数据、文本资料、统计资料(电子和非电子数据)、地表实测数据、野外测量或GPS数据、多媒体数据和已有系统的数据等,其中,遥感数据(RSData)和全球定位系统数据(GPSData)是GIS的重要数据源。各类数据输入见教材图4.1。图4.1数据采集与输入流程图4.1.1地图数据纸质地图(HardcopyMap)和图表是GIS的主要数据源,它不仅含有实体的类别和属性,而且含有实体间的空间关系。地图数据主要通过对纸质地图的跟踪数字化和扫描数字化获取。地图数据通常用点(居民点、采样点、高程点、控制点等)、线(河流、道路、构造线等)、面(湖泊、海洋、植被等)及注记(地名注记、高程注记、人口注记等)。地图注记往往是对GIS属性特征的描述,地图符号间的关系对应为目标间的框架关系。地图表达中蕴含着大量的信息内容,需要通过人工判读识别出来,这往往取决于数据采集人员的专业知识、地图判读经验。4.1.2遥感数据1.遥感影像包括航空相片和卫星影像。航空相片是指安装在飞机上的照相机,沿着预定的航向,按照一定的飞行高度和重叠度摄取的地表影像。与地图比较,航空相片所包含的信息内容丰富、客观真实,它不加选择地、详细地记录了在拍摄时刻被摄地区的地表现象,而不像地图内容是经过了地图制图人员的选取和概括的产物。通过对航空照片的解译和野外调绘,可以获取有关地区生态环境各要素数据。航空相片解译或调绘的成果通常转绘成地图,以地图的形式经数字化输入GIS,成为GIS的一个重要数据源。所以航空照片为显示专题要素提供背景,为地理数据更新提供依据。卫星影像是利用安装在卫星上的传感器接受由地面物体反射或发射的电磁波能量,经模数转换和计算机处理而获得的地表影像数据。如:TM1-7数据、SPOT5数据、IKONOS数据、NOAA数据、MODIS数据等,已成为GIS另一个重要的数据源。SPOT5数据各种融合影像2.GIS与RS数据关系由于卫星影像以数字形式存在,所以可直接或经过预处理后输入到GIS中,特别是影像处理软件(如:ERDAS或ENVI等)可以根据地理实体在影像上呈现的颜色将它们区别开,并能将辨别出来的地理实体组织成不同的栅格图层,存入地理数据库;由于卫星遥感周期性地重复获取同一地区的影像,利于获取监测、动态数据,利于实时更新地理数据库;通过使用不同波段的卫星影像或将不同波段的影像进行融合处理后,可提取或解译有关的专题要素,用于特定的分析和应用;与其他地理数据源相比,卫星数据获取的费用相对较低,它是目前GIS的重要数据源之一;GIS也可用卫星影像为背景显示专题要素,制作卫星影像地图用于区域分析;利用卫星影像有利于更新数据库的数据。4.1.3野外测量和全球定位系统(GPS)数据在没有所需的地图或遥感影像数据的情况下,就需要通过野外测量或使用GPS采集数据作为GIS的输入。目的在于确定测量区域内地理实体或地面各点的平面位置和高程。一般野外试验、实地测量等获取的数据可以通过转换直接进入GIS的地理数据库,以便于进行实时的分析和进一步的应用。GPS是一种采用距离交会法的卫星导航定位系统。通过测定测距信号的传播时间来间接测定距离,将无线电信号发射机从地面站搬到卫星上,组成一个卫星导航定位系统,较好地解决覆盖面与定位精度之间的矛盾。GPS由空间部分、控制部分和用户设备三部分组成。近年来,GPS已越来越多地应用于GIS数据的野外采集。4.1.4其他数据源其他数据包括:文本资料、统计资料、实测数据、多媒体数据、原有系统的数据等。1.文本资料文本资料是指各行业、各部门的有关法律文档、行业规范、技术标准、条文条例等,如边界条约等。这些也属于GIS的数据。2.统计资料各种类型的统计报告、社会调查数据等,是GIS属性数据的重要来源。3.实测数据如野外实地勘测数据、量算数据;台站的观测记录数据;遥测数据。4.多媒体数据多媒体数据(包括声音、录像等)通常可通过通讯口传入GIS的地理数据库中,目前其主要功能是辅助GIS的分析和查询。5.原有系统的数据GIS还可以从其它已建成的信息系统和数据库中获取相应的数据。由于规范化、标准化的推广,不同系统间的数据共享和可交换性越来越强。这样就拓展了数据的可用性,增加了数据的潜在价值。为整合各种来源的空间数据并进行数据处理,对于数据的分类和编码是很重要的。例如,空间数据的地理参照系(地球的形状、坐标系、高程系)的不同,引起空间数据来源不同时图幅往往不匹配,为此需要将一种投影的数字化数据转换为所需要投影的坐标数据,即进行投影转换。投影转换的方法有:解析变换(正解变换、反解变换)、数值变换、解析和数值变换。目前,大多数GIS软件是采用正解变换法来完成不同投影之间的转换,并直接在GIS软件中提供常见投影之间的转换。4.2.地理数据分类和编码4.2.1地理数据的分类1.分类概念及原则分类是指根据属性或特性将地理实体划分为各种类型,表示同一类型地理实体的数据可以采集在一起,构成一个图层(如图4.2所示)。图4.2现实世界和图层划分GIS是根据地理实体的类型(点或线或面)通过数字化采集和组织地理数据的。分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。拟定分类体系是进行空间数据编码的工作基础,其目的是识别要素和提供要素的地理含义。地理数据的分类体系由两部分组成,即类型名称和描述。类型名称可以根据地理实体的形态或功能而定,但究竟是形态分类还是功能分类,主要取决于地理数据的应用。分类体系的描述部分则是描述各类地理实体的基本功能和性质。例如八大土地类型是“类型名称”,各地类的特性如何则属于“描述”。注意几个问题:(1)分类体系问题。在一个大型GIS项目中,除非已有一个合适的分类系统,否则需要在深入理解用户需求的基础上,建立一个完整的地理数据分类体系,为地理数据的采集、编码和存储提供标准。(2)分类依据。一个理想的地理数据分类体系应该具有科学性、系统性、完整性和一致性,并能做到简明、充分满足地理数据应用要求。分类过细或过粗都会导致一些潜在的实际问题。(3)使用特征码。在GIS中,分类系统用特征码表示。特征码就是按照信息分类编码的结果,利用一组数字、字符或数字字符的混合来标记不同类别信息的代码。特征码多采用线分类法,它是将空间实体根据一定的分类指标形成若干层次目录,构成一个分层次、逐级展开的分类体系。拟定编码系统。由于分类系统是一个分级系统,因此使用的特征码必须采用统一拟定的编码系统,并符合各行各业邻域的分类分级体系,拟定的特征码要能为多用途数据库提供足够的实用信息,便于计算机处理与信息交换,易于识别和记忆,并使冗余数据最少,代码长度适度。分类与编码主要原则。如:①标准化和通用化;②唯一性和代表性;③清晰性和明确性;④可扩充性和稳定性;⑤完整性和易读性。目前,有关地理基础信息数据分类体系的中国国家标准主要包括1992年发表的“国土基础信息数据分类与代码”(标准编号:GB-T13923)、1993年的“1:500,1:1000,1:2000地形图要素分类与代码”(标准编号:GB-T14804)、1995年的“1:5000,1:10000,1:25000,1:500000,1:100000地形图要素分类与代码”(标准编号:GB-T15660)和2001年颁布的“专题地图信息分类与代码”(标准编号:GB-T18317)。不同的专业部门也有相应的分类系统。例如1984年,中国农业区划委员会根据土地的用途、经营特点、利用方式和覆盖特点等因素,将土地划分为八个一级类型、46个二级类型,表4.2描述了其中八个一级类型。2.分类码和标识码分类码是直接利用信息分类的结果制定的分类代码,用于标记不同类别信息的数据。分类码一般由数字或字符或数字字符混合构成。例如:美国地质调查局(USGS)制订的《数字线划图形标准》中的7位代码结构,前三位为主码,后四位为子码,如图4.3所示。图4.3USGC《数字线划图形标准》采用的代码结构例子说明:中国1:100万地形数据库的数据分类体系采用三级结构,即代码由三段码组成:归属码、分类码和标识码。归属码说明数据来源,包括提供数据的单位、系统名称和数据库名称等,它除在不同系统之间交换或转换数据外,一般不使用;分类码说明实体所属的类别,它完全按照《国土基础信息数据库分类与代码》国家标准;标识码也称识别码,用于标识主要的要素实体,如县级以上居民地及其行政界线、铁路、主要公路、主要河流和湖泊等,用于对实体界线检索,标识码有6位字符和数字混合构成。代码结构和标识码示意,如图4.4所示。图4.4代码结构和标识码示意图进一步说明:代码是给予被处理对象(事物、概念)的符号,是用来代表事物某种属性的一组有序的字母,具体地说,代码可用来代替某一名词、术语,甚至某一个特殊的描述短语。它是人机的共同语言,是进行信息分类、校对、统计和检索的关键。由于当前计算机只能识别以二进制为基础的数字、英文、汉字及少数特殊符号。代码设计就是如何合理地把被处理对象数字化、字符化的过程。代码设计是一项复杂的工作,需要多方面的知识和经验。涉及面广的代码,一般要由几方面人员在标准化部门组织下进行,制定后要正式颁布,统一贯彻。代码是用来表征客观事物的一个或一组有序的符号,它应易于计算机和人识别与处理。代码也简称为“码”。编码就是用数字或字母代表事物。通过编码,建立统一的信息语言,有利于提高通用化水平,使资源共享,达到统一化;有利于采用集中化措施以节约人力,加快处理速度,便于检索。具体地讲,代码具有鉴别功能、分类、排序以及专用含义4.2.2地理数据的编码地理编码是在数据分类的基础上,以易于计算机和人识别的代码(Code)唯一地标识地理实体的类型,代码由字符(数字或字母或数字和字母混合)构成,由于代码简单,计算机易于准确操作和管理,在地理数据库中,地理实体的类别大多以代码表示。在地理数据采集过程中,要以代码标识地理实体的类型和属性,是GIS设计中最重要的技术步骤——地理编码,它是现实世界与信息世界之间的转换接口(实际就是一个应用程序连接)。通用地理编码的基本要求包括:①要素识别(即地方名称、实体类型、地址等);②要素位置(用于唯一地识别实体在地表上的位置);③要求特征(属性);④作用范围描述;⑤提供地理定义。服务于空间分析的地理编码分为拓扑编码和坐标编码(详见第3章)。根据有关原则设计的代码主要用于控制地理数据数字化采集和输入,用于在地理数据库中系统地表示地理实体以及它们的属性。代码以及相应的描述通常也存储在地理数据库中作为元数数据的一部分,以帮助用户理解、分析、管理和显示地理数据。4.3GIS数据采集和输入地理数据采集主要指实地调查和采样,包括野外考查、GPS定位等。所选择的数据源资料一般要经过预处理(对空间数据分幅、分层和分专题要素)才能借助数字化或其它途径转换成空间数据库可用的数据。空间地理数据无论是来源于数字数据,还是来源于模拟数据,都需要与所使用的GIS软、硬件相兼容。模拟数据,需经过数字化才能输入到GIS中;常用的模拟数据输入方法有:手工数字化、自动数字化(包括扫描)和键盘输入等。计算机虽可阅读和存储数字数据,但输入的数字数据格式与所用的GIS软件不一致时,要经过数据格式转换后才能输录入。GIS数据采集与输入的同时,还实现数据编辑功能。数据录入和编辑就是各图层实体的地物要素按顺序转化为x、y坐标及对应的代码输入到计算机

1 / 88
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功