2014-3-21数据探查——GIS空间分析的基础数据探查◦探索性数据分析基于地图的数据操作属性数据查询空间数据查询栅格数据查询GIS究竟能干什么?◦有大批空间和属性数据◦蕴含着大量有用的信息◦提供强力的数据分析功能借助于GIS——从“数据”到“信息”◦数据探查(第10章)◦数据分析(第11章以后)有两种常用的方法◦探索性数据分析——初级阶段(简单)没有程式化模型概率统计理论——统计描述、统计图、统计推断如,全国人口数据统计,等等。◦模型拟合——高级阶段(困难)利用已有的数学模型取决于应用对象,通常需要编程如,经济领域用经济模型;地质领域用地质模型SpatialAnalysis½Mile¼Mile1MileV1=f(V2)+f(V3)+f(V…)V1V2V3V…V1V2V3V…ExploratoryRegression1.数据位置在哪里?2.数据点的属性值是什么?3.数据位置和属性值是否有关?如何解决上述提出问题呢?有三类方法可用◦简单的描述性统计量值域、中值、四分位数、平均值、方差等◦复杂统计图直方图、散点图、方差云图等◦统计推断理论(第18章)空间自相关等从直方图中我们能看出◦Bell-shaped◦Nooutliers◦Mean≈Median◦Skewness(偏斜)≈0◦Kurtosis(峰度)≈3LineGraphBarChartScatterPlotCumulativeFrequencyGraphBubbleplotBoxplotVariogramcloud3Dplot传统统计理论用于GIS数据探查,因为是空间数据,需注意以下几点◦有些理论可以继续沿用简单统计量统计图表◦有些理论改进后沿用散点图(含义不同)◦有些理论重新定义统计推断,加入空间变量有三种探查方法◦数据分类采用各种统计量对数据分类,然后用专题地图法显示分类结果◦空间集聚定性或定量方法,观察数据分类结果的图形◦地图比较制作不同专题地图,分析数据,提炼信息表示各州失业率分布状况◦白色:全国平均值以下◦灰色:全国平均值以上用均值和标准差表示各州失业率情况◦分五级表示1990年美国各州人口变化率◦颜色深,人口变化较大◦颜色浅,人口变化较小表示2000年美国各州人口变化率◦西部各州人口增长较快◦呈团状聚集的方式比较鹿的迁徙◦北部区域呈两极◦南部区域鹿的分布更广泛◦呈集聚方式定义(关系数据库)◦通过处理属性数据,获取数据子集结果(GIS特点?)◦先高亮属性,再高亮图形操作步骤◦沿用关系数据库的查询方式结构查询语言(SQL)◦ArcMapSelectbyattributesSQL基本语法◦select属性列表◦from关系◦where条件Select◦从数据库中选择字段From◦从数据库中选择表格Where◦查询条件或指标例如,属性表Owner和ParcelPINOwner_nameP101WangP101ChangP102SmithP102JonesP103CostelloP104SmithPINSale_dateAcresZone_codeZoningP1011-10-981.01ResidentialP10210-6-683.02CommercialP1033-7-972.52CommercialP1047-30-781.01Residential关系:Owner关系:Parcel查询P101宗地的出售日期◦selectParcel.Sale_date◦fromParcel◦whereParcel.PIN=‘P101’查询Costello的宗地出售日期◦selectParcel.Sale_date◦fromParcel,Owner◦whereParcel.PIN=Owner.PINANDOwner_name=‘Costello’查询P101宗地的“户主”◦selectOwner_name◦fromParcel,Owner◦whereParcel.PIN=Owner.PINANDParce.PIN=‘P101’查询表达式◦whereParcel.PIN=‘P101’◦布尔表达式和连接符组成布尔表达式◦操作数,如Parcel数据库、PIN字段名、P101字段值◦逻辑运算符,如=、、、=、=、◦运算符,如+、-、*、/等◦布尔连接符,如AND、OR、XOR和NOT选择地块面积不大于2acres,且位于商业区的记录运算类型=BCA=BC+=A=BC-=A=BC=创建新的选择集从当前集选择从当前集删除添加到当前选择集•用途-增加查询灵活性-例如,先查询Parcel.Acres2;再查询Parcel.Acres2,且Parcel.Zone_code=2-先执行“创建新的选择集”,再执行“添加到当前选择集”定义◦直接对地理要素操作,获取子集结果◦先高亮图形,再高亮属性操作◦由指针选择要素(普通操作)◦由图形选择要素(GIS简单操作)◦由空间关系选择要素(GIS复杂操作)◦属性数据和空间数据二者结合查询选择要素◦用鼠标拖画出方形区域选择要素◦用图形(如圆形)选择要素例如,力学小学的学区,以力学小学为圆形,1公里为半径画圆,选择与居民区相交的地块。处于该居民区范围的孩子才能入学。用于查询的空间关系◦包含选择完全落入A要素之内的B要素如,查询天津市范围内所有的大学◦相交选择与A要素相交的B要素如,查询与地震板块相交的城市◦邻近选择落在A要素指定距离之内的B要素如,查询天津大学1公里内的餐馆操作◦栅格的像元值查询方法◦SQL结果◦满足条件的像元高亮显示单一栅格查询◦例如,elevation2000ft多栅格查询◦为珍稀植物寻找适宜地:较高海拔(elevation),陡峭山坡(slopes)和茂密森林(forest)◦elevation800,slope20%andlandusecategory=coniferousforest(42)