Oracle数据块原理深入剖析-入门基础时间:2009-03-1000:00来源:IT168bitsCN编辑字体:[大中小]数据块(OracleDataBlocks),本文简称为“块”,是Oracle最小的存储单位,Oracle数据存放在“块”中。一个块占用一定的磁盘空间。特别注意的是,这里的“块”是Oracle的“数据块”,不是操作系统的“块”。Oracle每次请求数据的时候,都是以块为单位。也就是说,Oracle每次请求的数据是块的整数倍。如果Oracle请求的数据量不到一块,Oracle也会读取整个块。所以说,“块”是Oracle读写数据的最小单位或者最基本的单位。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块(StandardBlock)。块的大小和标准块的大小不同的块叫非标准块(NonstandardBlock)。同一数据库中,Oracle9i及以上版本支持同一数据库中同时使用标准块和非标准块。Oracle允许指定5种非标准块(NonstandardBlock)。操作系统每次执行I/O的时候,是以操作系统的块为单位;Oracle每次执行I/O的时候,都是以Oracle的块为单位。Oracle数据块大小一般是操作系统块的整数倍。数据块的格式(DataBlockFormat)块中存放表的数据和索引的数据,无论存放哪种类型的数据,块的格式都是相同的,块由块头(header/CommonandVariable),表目录(TableDirectory),行目录(RowDirectory),空余空间(FreeSpace)和行数据(RowData)五部分组成,如下图所示。块头(header/CommonandVariable):存放块的基本信息,如:块的物理地址,块所属的段的类型(是数据段还是索引段)。表目录(TableDirectory):存放表的信息,即:如果一些表的数据被存放在这个块中,那么,这些表的相关信息将被存放在“表目录”中。行目录(RowDirectory):如果块中有行数据存在,则,这些行的信息将被记录在行目录中。这些信息包括行的地址等。行数据(RowData):是真正存放表数据和索引数据的地方。这部分空间是已被数据行占用的空间。空余空间(FreeSpace):空余空间是一个块中未使用的区域,这片区域用于新行的插入和已经存在的行的更新。头部信息区(Overhead):我们把块头(header/CommonandVariable),表目录(TableDirectory),行目录(RowDirectory)这三部分合称为头部信息区(Overhead)。头部信息区不存放数据,它存放的整个块的信息。头部信息区的大小是可变的。一般来说,头部信息区的大小介于84字节(bytes)到107字节(bytes)之间。数据块中自由空间的使用当往数据库中插入(INSERT)数据的时候,块中的自由空间会减少;当对块中已经存在的行进行修改(UPDATE)的时候(使记录长度增加),块中的自由空间也会减少。DELETE语句和UPDATE语句会使块中的自由空间增加。当使用DELETE语句删除块中的记录或者使用UPDATE语句把列的值更改成一个更小值的时候,Oracle会释放出一部分自由空间。释放出的自由空间并不一定是连续的。通常情况下,Oracle不会对块中不连续的自由空间进行合并。因为合并数据块中不连续的自由空间会影响数据库的性能。只有当用户进行数据插入(INSERT)或者更新(UPDATE)操作,却找不到连续的自由空间的时候,Oracle才会合并数据块中不连续的自由空间。对于块中的自由空间,Oracle提供两种管理方式:自动管理,手动管理行链接和行迁移(RowChainingandMigrating)行链接(RowChaining):如果我们往数据库中插入(INSERT)一行数据,这行数据很大,以至于一个数据块存不下一整行,Oracle就会把一行数据分作几段存在几个数据块中,这个过程叫行链接(RowChaining)。如下图所示:如果一行数据是普通行,这行数据能够存放在一个数据块中;如果一行数据是链接行,这行数据存放在多个数据块中。行迁移(RowMigrating):数据块中存在一条记录,用户执行UPDATE更新这条记录,这个UPDATE操作使这条记录变长,这时候,Oracle在这个数据块中进行查找,但是找不到能够容纳下这条记录的空间,无奈之下,Oracle只能把整行数据移到一个新的数据块。原来的数据块中保留一个“指针”,这个“指针”指向新的数据块。被移动的这条记录的ROWID保持不变。行迁移的原理如下图所示:无论是行链接还是行迁移,都会影响数据库的性能。Oracle在读取这样的记录的时候,Oracle会扫描多个数据块,执行更多的I/O。块中自由空间的自动管理Oracle使用位图(bitmap)来管理和跟踪数据块,这种块的空间管理方式叫“自动管理”。自动管理有下面的好处:◆易于使用◆更好地利用空间◆可以对空间进行实时调整块中自由空间的手动管理用户可以通过PCTFREE,PCTUSED来调整块中空间的使用,这种管理方式叫手动管理。相对于自动管理,手动管理方式比较麻烦,不容易掌握,容易造成块中空间的浪费。PCTFREE参数用于指定块中必须保留的最小空闲空间百分例。之所以要预留这样的空间,是因为UPDATE时,需要这些空间。如果UPDATE时,没有空余空间,Oracle就会分配一个新的块,这会产生行迁移(RowMigrating)。PCTUSED也是用于设置一个百分比,当块中已使用的空间的比例小于这个百分比的时候,这个块才被标识为有效状态。只有有效的块才被允许插入数据。文章转载自网管网:(一)一直以来对“块”的概念总是含混不清,从字面意义理解,只知道这是ORACLE存放数据的最小单位,然而它的内部世界如何呢,本人打算从今天开始连载几篇文档,对它进行深度分析。通过很多文档、资料,了解到了数据库基本结构鱼刺图:基本上每个对象对应一个段(Segment),只有分区对应多个段,这里的对象包括table,index,partition等等,段可以跨越多个数据文件。每个段又有多个区(extent)来组成,这些区不能跨越多个数据文件,同时在系统使用过程中自动扩展。最后是块(block),所有的数据都是存放在块中。为了适应操作系统,每个块在创建数据库的时候默认了一个大小,这个大小一般是8K,同时在9I及其以后的版本中增加了不同大小的块参数,这将在以后的实验中体现。先说说这个8K大小的块,一般来说,为了使得oracle运行读写数据文件的时候有一个合理的吞吐量,这里的块大小,都跟操作系统块大小设为整数倍,例如ntfs格式化的磁盘文件,每个物理块大小为4,这里oracle的块大小为8,即是代表每读取一个oracle块,其实物理上也就是读取了两个操作系统块。这里主要指的是数据文件存放在块设备上,在实际的生产环境中,大部分情况都是将数据库安装在裸设备(RAW)也叫做原始分区之上。关于RAW将在以后进行讲解。通过上面这段文字,我们可以了解到ORACLE基本的存储结构,下一篇将针对块的大小与存放数据大小来做实验。(二)上一节了解到了ORACLE的存储结构,这节讲一讲块的大小与数据存放之间的关系。大家都知道了在ORACLE环境中,所有的对象都是存放在块中,这个块大小与存放的记录之间到底存在怎样的关系呢?做一个实验看看:创建一个表空间testcreatetablespacetestdatafile'/oracle/oradata/test.dbf'size100m;创建一个用户createusertestidentifiedbytestdefaulttablespacetest;创建一个表createtabletest.t1(a1number,a2varchar2(100));检查段,可以发现在这个视图中出现了名称为T的段,段类型为TABLE,这个段里面分配了1个区,其中包含8个块,大小为64K字节。selectsegment_name,blocks,extents,bytes,segment_type,tablespace_namefromdba_segmentswhereowner='TEST';SEGMENT_NAMEBLOCKSEXTENTSBYTESSEGMENT_TYPETABLESPACE_NAME--------------------------------------------------------------------T8165536TABLETEST检查区,可以发现在这个视图中出现了一个区,区号为0,包含8个块,大小为64K字节。selectsegment_name,segment_type,extent_id,blocks,bytesfromdba_extentswhereowner='TEST';SEGMENT_NAMESEGMENT_TYPEEXTENT_IDBLOCKSBYTES----------------------------------------------------------TTABLE0865536检查块,可以发现这里没有载入到内存的块,由此断定,在数据未写入的时候,内存中并没有存放数据的块。selectfile#,block#,class#,status,xnc,objdfromv$bhwherets#=12;未选定行插入10行数据,进行测试。SQLdeclare2inumber3;4begin5foriin1..10loop6executeimmediate'insertintotest.tvalues(:x,:y)'usingi,i;7endloop;8end;9/PL/SQL过程已成功完成。再次查看v$bh视图,检查内存中是否使用到了块。selectfile#,block#,class#,status,xnc,objdfromv$bhwherets#=12;FILE#BLOCK#CLASS#STATUXNCOBJD-------------------------------------------------------1280894xcur0110381280901xcur011038哈哈,果然出现了数据,说明在数据插入的表的时候在内存中已经载入了分配的块,同时在这些块中写入了数据,这里占用了两个块,块号分别为28089,28090,其中我们可以根据CLASS#来判断出他们属于不同类型。(三)这一节紧接着上一节来说。上一节通过实验,我们了解到,块的创建和读取流程,不过只是针对一个会话的,现在我们来看看在一个会话中插入数据之后,同时在另外一个会话查询数据,这样的情况会对块有什么影响。打开一个新的会话,然后执行如下命令:查询表,由于插入数据的事务没有提交,这里在另外的会话中就看不到任何数据,深深体现了ORACLE的多版本一致性select*fromtest_gao.t;未选定行查询视图v$bh,看是否有了变化selectfile#,block#,class#,status,xnc,objdfromv$bhwherets#=12;FILE#BLOCK#CLASS#STATUXNCOBJD-------------------------------------------------------1280894xcur0110381280901cr0110381280901cr0110381280901xcur011038果然和上一节查询出来的结果不同,多了红色字体标识出来的两行,大家可以看到这两行的STATUS字段值为cr,什么是cr呢?它是ConsistencyRead(一致性读取)的缩写。从这里可以看出28090这个块被两个会话进行了操作。