SEGY修订版1数据交换格式1SEG技术标准委员会2版本1.0,2002年5月12001,勘探地球物理学家学会,版权所有2编者:MichaelW.Norris和AlanK.Faichney目录1.简介2.概述2.1.不变的条目2.2.修订版0到修订版1的变化2.3.注释2.4.监管机构2.5.致谢3.SEGY文件结构3.1.记录介质3.2.文件结构3.3.数字格式3.4.变道长3.5.坐标4.原文文件头5.二进制文件头6.扩展原文文件头6.1.扩展原文文件头结构6.2.结尾文本段6.3.文本段示例7.数据道7.1.道头7.2.道头数据附录A.写SEGY数据到磁盘文件附录B.SEGY磁带标签附录C.磁带上的SEGY文件块附录D.扩展原文文本段D-1.位置数据D-1.1位置数据文本段D-1.2位置数据文本段示例D-2.面元网格定义D-2.1面元网格定义文本段D-2.2面元网格定义文本段示例D-3.资料地理范围和覆盖区域D-3.1资料地理范围文本段D-3.2资料地理范围文本段示例D-3.3覆盖区域文本段D-3.4覆盖区域文本段示例此例基于图3D-4.数据取样测量单位D-4.1数据取样测量单位文本段D-4.2数据取样测量单位文本段示例D-5.处理历史D-5.1处理历史文本段D-5.2处理历史文本段示例D-6.震源类型/方位D-6.1震源类型/方位文本段D-6.2震源类型/方位文本段示例D-7.震源测量单位D-7.1震源测量单位文本段D-7.2震源测量单位文本段示例附录E.文字格式数据附录F.EBCDIC码和ASCII码附录G.参考文献图片图1.带N个扩展原文文件头记录和M道记录的SEGY文件字节流结构图2.面元网格定义图3.地震调查的数据范围和覆盖区域变化表格表1.原文文件头表2.二进制文件头表3.道头表4.SEGY磁带标签表5.位置数据文本段表6.面元网格定义文本段表7.资料地理范围文本段表8.覆盖区域文本段表9.数据取样测量单位文本段表10.处理历史文本段表11.震源类型/方位文本段表12.震源测量单位文本段表13.IBM3270字符集参考CH10,GA27-2837-9,1987年4月1.简介最早的SEGY数据交换格式(修订版0,参考第45页)自1975年出版以来在地球物理行业得到广泛的使用。这种广泛的使用引起许多所有权的变更。自从SEGY修订版0出版以来,地震数据采集、处理和地震硬件的特性发生了重大地变化。三维地震采集技术和快速、大容量记录介质的引入指示了SEGY修订版0修订的必要。SEGY修订版1引入的主要变更有:头信息位置标准化以便当前处理实践并定义SEGY数据体为字节流格式。SEG技术标准委员会强烈建议SEGY数据体生产者和用户迅速转成修订的标准方式。2.概述2.1.不变的条目允许文本的EBCDIC编码。最初的3200字节原文文件头,400字节二进制文件头和240字节道头大小。开始的3200字节原文文件头数据位置。2.2.修订版0到修订版1的变化SEGY文件可写到任意介质上,这样就可溶为可变长度的数据流。数据文字格式扩充到包括4字节、IEEE浮点和1字节整型数据文字。定义了400字节二进制文件头和240字节道头中少许增加的字段,并且澄清了一些已存在词目的用法。引入了由额外3200字节原文文件头块组成的扩展原文文件头。定义了扩展原文文件头中使用文本段编排和标准文本段中的数据。扩充了道的辨认。引入了工程转换。原文文件头和扩展原文文件头都可以用EBCDIC或ASCII字符编码。2.3.注释本文中术语CDP看成是CMP的同义词。2.4.监管机构SEGY修订版1由SEG技术标准委员会管理。任何问题,更正或格式中遇到的问题都可以写信到:SocietyofExplorationGeophysicist.P.O.Box702740.Tulsa,Ok74170-2740.留意:SEG技术标准委员会电话:(918)497-5500传真:(918)497-5557网址:技术标准委员会感谢大量个人和组织所付出的时间和努力。要特别赞扬P.E.S.G.B数据管理组。P.E.S.G.B.数据管理组主席JillLewis.负责成员BobFirth,EleanorJack和JillHolliday。RogerLott.提出了位置数据、面元网格定义和数据范围的扩展原文文本段。感谢FrankBrassil组织来自澳大利亚地质学会的回复。3.SEGY文件结构最初SEGY标准是在9道磁带还是正规的地震数据存储介质时产生的,当时800字节每英寸和1600字节每英寸普遍使用,6250字节每英寸刚起步。修订的格式是为使其独立于如今所记录上的介质。1975年的标准规定“任何一个磁盘上至多可以有一条地震测线数据”,现在早已不现实。这篇修订稿中使用的“SEGY文件”将代替最初标准中的“地震磁盘”。新标准中,术语“文件”和“数据集”是同义词。两者都是逻辑上关联的数据道或道集和相关辅助数据的集成。3.1.记录介质1975年标准中描述的SEGY格式,定义的数据格式依赖于9道磁带。有了这个修订格式,SEGY文件可以写到任意支持变长度记录的介质。无论使用哪种介质,数据必须可以分解为变长度记录流。它包括磁带设备,比如9道磁带和3480卡带,它们能在硬件上实现。它还包括大容量磁带设备,比如DD2或3590,尽管它们需要使用某种模块化和/或逻辑封装,来更高效使用和可能允许记录关联的元数据。SEGY文件可作为逻辑文件写到SEGRODE封装磁带上。显然当地震数据转换为SEGY格式,使用的介质和封装方案都必须让数据提供者和接受者容易接受。一种不符合变长度记录模式的重要介质类型是磁盘文件,它是在现在系统上定义的字节流,没有任何结构。人们习惯了把SEGY数据写到磁盘,包括CD-ROM,方便数据分发。这项工作要正确地遵从一定规则。附录A定义了如何将SEGY数据写成磁盘文件。为了让SEGY与SEGD修订版2标准一致,附录B定义了SEGY磁带标签,使用基于RP66存储单元标签的格式。标签不是SEGY强制的,但是它们在比如自动磁带库和大规模处理中心的环境下是很必要的。附录C定义了SEGY数据的简单模块化方案。允许更有效使用大容量磁带介质。它是基于在SEGD修订版2中定义的方案。3.2.文件结构图1举例说明了SEGY文件的结构。文件开始3600字节是文本文件头,然后是400字节二进制文件头,他们连接在一起组成完整的文件头。接着是任选地3200字节扩展原文文件头,由零或3200字节的扩展原文文件头记录组成。SEGY文件的剩余部分包含变化数目的数据道记录,每道开始有240字节道头。扩展原文文件头是此修订版唯一引入的结构变化,并且不严格向下兼容1975年SEGY格式,它已经被谨慎地设计使其最小地影响现存SEGY读取软件。用现存软件修改来检测新头的存在和处理或忽视扩展原文文件头应当很简单。扩展原文文件头的格式在第6章完全地描述。3.3.数字格式在1975年SEGY标准中,所有二进制值都用“big-endian”字节顺序定义。这符合IBM磁带标准,也意味着用这些字节制成一个数字,最有意义的字节(包括符号位)写在最靠近文件开始,最没有意义的字节写在最靠近文件末尾。这种字节顺序习惯在此SEGY格式修订版中维持着,同时它也应当被所有SEGY修订版一致遵从。它独立于特定SEGY文件所写的介质(即如果文件写在主机的磁带和PC的磁盘上,字节顺序没有差别)。二进制文件头和道头中的所有值都是两个互补的整数,不管是两字节还是四字节长。在头中没有定义浮点型数值。道数据采样值是两个互补整数或浮点数。此修订版增加了8位整数和32位IEEE浮点数。IBM浮点数(如最初标准中定义)和IEEE浮点数值写成big-endian字节顺序(即标记/解释字节写在最靠近文件首)。3.4.变道长SEGY标准为采样间隔和采样点数在文件中两个分隔位置指定了字段。二进制文件头包含用于整个文件的值,道头包含用于关联道的值。最初的标准对怎样一起使用它们不清楚。一个观点是SEGY支持变道长,道头中的采样点数允许道之间和二进制文件头的值存在变化。另一个观点是SEGY文件中的所有道将是相同长度并且在二进制文件头中采样点数将与所有道头中的一样。第二种情况中,数据道必要地填补或截断。在SEGY修订版1中,文件中变道长显式允许。二进制文件头中的采样间隔和采样点数值应该是文件中地震数据道中第一位的。这种方法允许二进制文件头可读、可述,例如,“这是6秒数据以2毫秒采样间隔采样”。每个道头中的采样点数值可能随二进制文件头中的对应值变化,反应了道中的实际采样点数。每道记录的字节数必须与道头中的采样点数一致。对于写成磁盘文件的SEGY数据特别重要(见附录A)。允许变道长暗示顺序读取并排除随机读取磁盘文件,因为开始后的道的位置未知。为能随机读取,在二进制文件头中添加了一个新的字段作为固定道长标志。如果设置了此字段,文件中所有道必须有相同长度。这种情况对于叠后数据更有典型。必须认真留意二进制文件头中采样点数是文件的最大道长,而不是第一位数据道的长度。然而,要注意最大道长不一定在二进制文件头写时就知道,尤其是在转录条件中。这也是为什么在二进制文件头中没有比如“开始和最终记录数”的字段。固定长度标志在某些程度上改善了由变长度道引起的问题。如果设置了固定记录长度标志,文件中的最大道长已知(即所有道具相同长度)。3.5.坐标知道震源和道的位置是处理地震数据的首要,知道处理数据相对于其他数据的位置在解释中是必要的。传统地地震坐标以地理坐标和/或网格坐标提供。SEGY适应任意一种形式。然而没有清晰的参考坐标系(CRS)定义,位置将不明确。SEGY修订版1重要地扩充了用包含在二进制头原文文件头和道头中的坐标来定义CRS的能力。单一的CRS必须用于在个别SEGY数据集中所有的坐标。另外坐标单位必须同所有坐标一样。4.原文文件头开始的3200字节,原文文件头记录了包含40行原文信息,提供SEGY文件中地震数据的可读性描述。这些信息是自由形式,也是1975年标准中头的最不好定义之处,尽管标准提供了开始20行排版的建议。同时这是头排版更严格的独特优点,很明显按照现在使用的排版生成一个能普遍接受的是不现实。SEGY修订版1以更易理解地定义结构定义了一个分隔的原文头,而原文信息可存储为机器可读的方式。这个新的头将被称为扩展原文文件头,它将在第6章详细描述。注意“传统的”原文文件头完全和扩展原文文件头分开,并且将一直成为有关文件内容的可读信息的首要位置。特别地,它应包含文件的任意不寻常特征,例如如果道头中记录延迟时间字节109-110不为零。用到的SEGY格式的修订版标准(二进制文件头字节3501-3502)必须包含在所有写成SEGY修订版1格式的文件中。SEGY修订版标准强制包含在原文文件头中。表1是在第39个记录有SEGY修订版标准的原文文件头示例。5.二进制文件头400字节二进制文件头记录包含影响整个SEGY文件的二进制值。在二进制文件头中的值定义为2字节或4字节,两者是等效的整数。这个头中的一些值对文件中数据的处理至关重要,尤其是采样间隔、道长和编码格式。此修订版在任选部分定义了两附加字段,也澄清了一些已有条目的如何使用。表2.二进制文件头400字节二进制文件头字节描述3201-3204作业标识号3205-3208测线号。对3-D叠后数据而言,它将典型地包含纵向测线(In-line)号3209-3212卷号3213-32145每个道集的数据道数。叠前数据强制要求3215-32165每个道集的辅助道数。叠前数据强制要求3217-32186微秒(us)形式的采样间隔。叠前数据强制要求3219-3220微秒(us)形式的原始野外记录采样间隔3221-32226数据道采样点数。叠前数据强制要求注释:二进制文件头中的采样间隔和采样点数应当是文件中地震数据的首要一组参数3223-3224原始野外记录每道采样点数3225-32266数据采样格式编码。