sql语句优化

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

一、操作符优化1、IN操作符用IN写出来的SQL的优点是比较容易写及清晰易懂，这比较适合现代软件开发的风格。但是用IN的SQL性能总是比较低的，从Oracle执行的步骤来分析用IN的SQL与不用IN的SQL有以下区别：ORACLE试图将其转换成多个表的连接，如果转换不成功则先执行IN里面的子查询，再查询外层的表记录，如果转换成功则直接采用多个表的连接方式查询。由此可见用IN的SQL至少多了一个转换的过程。一般的SQL都可以转换成功，但对于含有分组统计等方面的SQL就不能转换了。推荐方案：在业务密集的SQL当中尽量不采用IN操作符，用EXISTS方案代替。2、NOTIN操作符此操作是强列不推荐使用的，因为它不能应用表的索引。推荐方案：用NOTEXISTS方案代替3、ISNULL或ISNOTNULL操作（判断字段是否为空）判断字段是否为空一般是不会应用索引的，因为索引是不索引空值的。推荐方案：用其它相同功能的操作运算代替，如：aisnotnull改为a0或a’’等。不允许字段为空，而用一个缺省值代替空值，如申请中状态字段不允许为空，缺省为申请。4、及操作符（大于或小于操作符）大于或小于操作符一般情况下是不用调整的，因为它有索引就会采用索引查找，但有的情况下可以对它进行优化，如一个表有100万记录，一个数值型字段A，30万记录的A=0，30万记录的A=1，39万记录的A=2，1万记录的A=3。那么执行A2与A=3的效果就有很大的区别了，因为A2时ORACLE会先找出为2的记录索引再进行比较，而A=3时ORACLE则直接找到=3的记录索引。5、LIKE操作符LIKE操作符可以应用通配符查询，里面的通配符组合可能达到几乎是任意的查询，但是如果用得不好则会产生性能上的问题，如LIKE‘%5400%’这种查询不会引用索引，而LIKE‘X5400%’则会引用范围索引。一个实际例子：用YW_YHJBQK表中营业编号后面的户标识号可来查询营业编号YY_BHLIKE‘%5400%’这个条件会产生全表扫描，如果改成YY_BHLIKE’X5400%’ORYY_BHLIKE’B5400%’则会利用YY_BH的索引进行两个范围的查询，性能肯定大大提高。6、UNION操作符UNION在进行表链接后会筛选掉重复的记录，所以在表链接后会对所产生的结果集进行排序运算，删除重复的记录再返回结果。实际大部分应用中是不会产生重复的记录，最常见的是过程表与历史表UNION。如：select*fromgc_dfysunionselect*fromls_jg_dfys这个SQL在运行时先取出两个表的结果，再用排序空间进行排序删除重复的记录，最后返回结果集，如果表数据量大的话可能会导致用磁盘进行排序。推荐方案：采用UNIONALL操作符替代UNION，因为UNIONALL操作只是简单的将两个结果合并后就返回。select*fromgc_dfysunionallselect*fromls_jg_dfys二、SQL书写的影响1、同一功能同一性能不同写法SQL的影响。如一个SQL在A程序员写的为Select*fromzl_yhjbqkB程序员写的为Select*fromdlyx.zl_yhjbqk（带表所有者的前缀）C程序员写的为Select*fromDLYX.ZLYHJBQK（大写表名）D程序员写的为Select*fromDLYX.ZLYHJBQK（中间多了空格）以上四个SQL在ORACLE分析整理之后产生的结果及执行的时间是一样的，但是从ORACLE共享内存SGA的原理，可以得出ORACLE对每个SQL都会对其进行一次分析，并且占用共享内存，如果将SQL的字符串及格式写得完全相同，则ORACLE只会分析一次，共享内存也只会留下一次的分析结果，这不仅可以减少分析SQL的时间，而且可以减少共享内存重复的信息，ORACLE也可以准确统计SQL的执行频率。2、WHERE后面的条件顺序影响WHERE子句后面的条件顺序对大数据量表的查询会产生直接的影响。如：Select*fromzl_yhjbqkwheredy_dj='1KV以下'andxh_bz=1Select*fromzl_yhjbqkwherexh_bz=1anddy_dj='1KV以下'以上两个SQL中dy_dj（电压等级）及xh_bz（销户标志）两个字段都没进行索引，所以执行的时候都是全表扫描，第一条SQL的dy_dj='1KV以下'条件在记录集内比率为99%，而xh_bz=1的比率只为0.5%，在进行第一条SQL的时候99%条记录都进行dy_dj及xh_bz的比较，而在进行第二条SQL的时候0.5%条记录都进行dy_dj及xh_bz的比较，以此可以得出第二条SQL的CPU占用率明显比第一条低。3、查询表顺序的影响在FROM后面的表中的列表顺序会对SQL执行性能影响，在没有索引及ORACLE没有对表进行统计分析的情况下，ORACLE会按表出现的顺序进行链接，由此可见表的顺序不对时会产生十分耗服物器资源的数据交叉。（注：如果对表进行了统计分析，ORACLE会自动先进小表的链接，再进行大表的链接）三、SQL语句索引的利用1、操作符优化（同上）2、对条件字段的一些优化采用函数处理的字段不能利用索引，如：substr(hbs_bh,1,4)=’5400’，优化处理：hbs_bhlike‘5400%’trunc(sk_rq)=trunc(sysdate)，优化处理：sk_rq=trunc(sysdate)andsk_rqtrunc(sysdate+1)进行了显式或隐式的运算的字段不能进行索引，如：ss_df+2050，优化处理：ss_df30‘X’||hbs_bh’X5400021452’，优化处理：hbs_bh’5400021542’sk_rq+5=sysdate，优化处理：sk_rq=sysdate-5hbs_bh=5401002554，优化处理：hbs_bh=’5401002554’，注：此条件对hbs_bh进行隐式的to_number转换，因为hbs_bh字段是字符型。条件内包括了多个本表的字段运算时不能进行索引，如：ys_dfcx_df，无法进行优化qc_bh||kh_bh=’5400250000’，优化处理：qc_bh=’5400’andkh_bh=’250000’四、其他ORACLE的提示功能是比较强的功能，也是比较复杂的应用，并且提示只是给ORACLE执行的一个建议，有时如果出于成本方面的考虑ORACLE也可能不会按提示进行。根据实践应用，一般不建议开发人员应用ORACLE提示，因为各个数据库及服务器性能情况不一样，很可能一个地方性能提升了，但另一个地方却下降了，ORACLE在SQL执行分析方面已经比较成熟，如果分析执行的路径不对首先应在数据库结构（主要是索引）、服务器当前性能（共享内存、磁盘文件碎片）、数据库对象（表、索引）统计信息是否正确这几方面分析。1.对查询进行优化，要尽量避免全表扫描，首先应考虑在where及orderby涉及的列上建立索引。2.应尽量避免在where子句中对字段进行null值判断，否则将导致引擎放弃使用索引而进行全表扫描，如：selectidfromtwherenumisnull最好不要给数据库留NULL，尽可能的使用NOTNULL填充数据库.备注、描述、评论之类的可以设置为NULL，其他的，最好不要使用NULL。不要以为NULL不需要空间，比如：char(100)型，在字段建立时，空间就固定了，不管是否插入值（NULL也包含在内），都是占用100个字符的空间的，如果是varchar这样的变长字段，null不占用空间。可以在num上设置默认值0，确保表中num列没有null值，然后这样查询：selectidfromtwherenum=03.应尽量避免在where子句中使用!=或操作符，否则将引擎放弃使用索引而进行全表扫描。4.应尽量避免在where子句中使用or来连接条件，如果一个字段有索引，一个字段没有索引，将导致引擎放弃使用索引而进行全表扫描，如：selectidfromtwherenum=10orName='admin'可以这样查询：selectidfromtwherenum=10unionallselectidfromtwhereName='admin'5.in和notin也要慎用，否则会导致全表扫描，如：selectidfromtwherenumin(1,2,3)对于连续的数值，能用between就不要用in了：selectidfromtwherenumbetween1and3很多时候用exists代替in是一个好的选择：selectnumfromawherenumin(selectnumfromb)用下面的语句替换：selectnumfromawhereexists(select1frombwherenum=a.num)6.下面的查询也将导致全表扫描：selectidfromtwherenamelike‘%abc%’若要提高效率，可以考虑全文检索。7.如果在where子句中使用参数，也会导致全表扫描。因为SQL只有在运行时才会解析局部变量，但优化程序不能将访问计划的选择推迟到运行时；它必须在编译时进行选择。然而，如果在编译时建立访问计划，变量的值还是未知的，因而无法作为索引选择的输入项。如下面语句将进行全表扫描：selectidfromtwherenum=@num可以改为强制查询使用索引：selectidfromtwith(index(索引名))wherenum=@num应尽量避免在where子句中对字段进行表达式操作，这将导致引擎放弃使用索引而进行全表扫描。如：selectidfromtwherenum/2=100应改为:selectidfromtwherenum=100*29.应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描。如：selectidfromtwheresubstring(name,1,3)=’abc’-–name以abc开头的idselectidfromtwheredatediff(day,createdate,’2005-11-30′)=0-–‘2005-11-30’--生成的id应改为:selectidfromtwherenamelike'abc%'selectidfromtwherecreatedate='2005-11-30'andcreatedate'2005-12-1'10.不要在where子句中的“=”左边进行函数、算术运算或其他表达式运算，否则系统将可能无法正确使用索引。11.在使用索引字段作为条件时，如果该索引是复合索引，那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引，否则该索引将不会被使用，并且应尽可能的让字段顺序与索引顺序相一致。12.不要写一些没有意义的查询，如需要生成一个空表结构：selectcol1,col2into#tfromtwhere1=0这类代码不会返回任何结果集，但是会消耗系统资源的，应改成这样：createtable#t(…)13.Update语句，如果只更改1、2个字段，不要Update全部字段，否则频繁调用会引起明显的性能消耗，同时带来大量日志。14.对于多张大数据量（这里几百条就算大了）的表JOIN，要先分页再JOIN，否则逻辑读会很高，性能很差。15.selectcount(*)fromtable；这样不带任何条件的count会引起全表扫描，并且没有任何业务意义，是一定要杜绝的。16.索引并不是越多越好，索引固然可以提高相应的select的效率，但同时也降低了insert及update的效率，因为insert或update时有可能会重建索引，所以怎样建索引需要慎重考虑，视具体情况而定。一个表的索引数最好不要超过6个，若太多则应考虑一些不常使用到的列上建的索引是否有必要。17.应尽可能的避免更新clustere