数据库的优化与调优:从理论到实践Outline•数据库性能优化与调优:从理论到实践–理论篇•从串行到并行•从畅通无阻到排队•必须了解的硬件知识–实践篇•MySQL各版本的优化•MySQL使用中的调优Moore'sLawAmdahl'slawQueueingTheory理论篇•理论篇–从串行到并行•欢迎来到并行世界:•并行世界,串行的副作用:–从畅通无阻到排队•并发的世界,充满排队:–必须了解的硬件知识•CPU/Cache/Memory/Disk...•欢迎来到并行世界摩尔定律(Moore'sLaw)失效了?–No,只是转变了形式而已。•HerbSutter–TheFreeLunchIsOver–AFundamentalTurnTowardConcurrencyinSoftware.•何谓FreeLunch?–通过CPU主频提升,软件能够自动提升性能的时代已经一去不复返;–是时候考虑多线程/并发程序了;•并行世界,串行的副作用GeneAmdahl怎么说(Amdahl'slaw)?––––––P:程序可并行执行比率1-P:串行比率N:N个ProcessorsS(N):加速比解读:程序的极限性能,最终取决于程序串行部分所占比率;尽量消除程序中的串行部分;无限制的并行,您无法达到•现实生活中••无限制的并行,您无法达到(续)硬件资源瓶颈/软件内部等待–CPU/Memory/Disk...–Mutex/Spinlock/...排队论(QueueingTheory)–资源利用率;–响应时间/等待时间;–吞吐量;–这些指标,均与性能相关;•Little’sLaw–L:平均队列长度;–Lambda:平均吞吐率;–W:平均响应时间;写程序,为什么需要了解硬件?•看看他们怎么说?–Hardwareandsoftwareworkingtogetherinharmony.•MartinThompson–KnowHardwaretoDesignBetterSoftware.•未找到出处,暂时算我说的吧•硬件与软件性能息息相关–硬件各组件的Latency和Throughput;–语言那些与硬件相关的特性;当前的硬件发展到了什么阶段?•注:来自MartinThompsonCPUCacheFlushingFallacy一文;硬件各组件Latency对比注:来自GreggBrendan《SystemsPerformance:EnterpriseandtheCloud》一书;授人以鱼不如授人以渔•你应该亲自测试这些硬件性能指标–IgorOstrovsky——GalleryofProcessorCacheEffects••••测试内存Latency;测试CacheLines大小;测试L1/L2/L3Cache大小;...–ccBench——EverythingYouAlwaysWantedtoKnowaboutSynchronizationbutWereAfraidtoAsk(SOSP’13)•小工具,可以测试CPUCache/CacheCoherence/AtomicOperations性能理论结束,该来点实战了•吐槽时间–前面说了这么多,真的跟MySQL数据库的优化与调优有关系吗?你不是在忽悠吧?–接下来,让我们通过实践篇,来看看前面的这些理论,在MySQL数据库中是如何得到实践的。数据库的优化与调优:实践篇•实践篇–MySQL各版本的优化•基础优化:串行并行•进阶优化:减少系统中的串行点•高级优化:软硬件相辅相成–MySQL使用中的调优•资源利用率没到100%•认识MySQL,构建平衡系统•基础优化-拿串行开刀(一)臭名远播的prepare_commit_mutex–––––目的:保持事务在InnoDB存储引擎与MySQLBinlog中提交顺序的一致性;InnoDBPrepare:持有此MutexMySQLBinlogCommit;InnoDBCommit:释放此Mutex事务串行化提交;•MySQLGroupCommit–OracleMySQLGroupCommit•StartingwithMySQL5.6–MariaDBGroupCommit•StartingwithMariaDB5.3–How?基础优化-拿串行开刀(二)•你的Slave延迟了多久?–MySQLReplication•基于Binlog的复制–两个线程•I/OThread:•SQLThread:负责与Master通讯,接收Binlog负责Binlog在Slave的回放,单线程•ParallelSlaveReplication–OracleMySQL•StartingwithMySQL5.7.2–MariaDBImplementation•StartingwithMariaDB10.0.5–效果(见右图)••进阶优化-减少系统串行点(一)kernel_mutex–InnoDB引擎内部有很多共享资源,如:内存分配;日志系统;事务与锁表;ReadView...–早期InnoDB版本,所有的这些共享资源,都通过一个kernel_mutex来保护–kernel_mutex,针对MySQL/InnoDB系统来说,就是一个较大的串行点;一字真言–拆!!!–Kernelmutexremovedtrx_sys_t::locklock_sys_t::mutex–事务&ReadView:–锁表:–...进阶优化-减少系统串行点(二)•IndexTreeLock–InnoDB每一个Index,有一把RWLock(读写锁);–读/写,加S锁;–索引页面分裂/合并,加X锁;–索引页面分裂时,整个索引树不可访问•二字真言–算法!!–C.Mohan,Aries/IM–SMO操作,只跟SMO本身冲突,不会堵塞用户的读写;高级优化-软硬件相辅相成(一)•高级CPU指令–SIMDSSE4•Single-Instruction-Multiple-Data•合适的应用场景–InnoDB页面计算Checksum;–硬件指令加速;高级优化-软硬件相辅相成(二)•CacheCoherence&FalseSharing–CacheCoherence•多线程并发读写同一内存;–FalseSharing•64BytesCacheLine•G5Patch–问题起因•srv_n_rows_read++–Per-ThreadCounter•减少CacheCoherence–CounterPadding•消除FalseSharing•ib_counter_t::m_counter[(N+1)*(CACHE_LINE_SIZE)/sizeof(Type)]高级优化-软硬件相辅相成(三)•CompileOptimization–CPU执行–L1ICache高速指令缓存•减少ICacheMiss–Perf:定位CacheMiss–PGO:优化编译–优化效果•ICacheMiss:•Performance:10%to8%44%提升••••MySQL调优-关注资源利用率一个数据库系统,其硬件资源(CPU、Disk、SSD...)利用率是不是越高,说明系统调优的越好?用户关注–响应时间(Latency)老板关注–资源有没有浪费?调优关注–保证用户响应时间的基础上,最大限度提高资源利用率;–FindingTheKneeMySQL调优-认识MySQL,构建平衡系统•认识MySQL––MySQL能支持多少并发?消耗多少CPU?指导采购不同的硬件配件;•构建平衡系统(BalancedSystems)–BalancedSystems••硬件有着基本相同的资源利用率吗?每个硬件的利用率都处于拐点吗?––指导数据库服务器选型;合适的CPU、磁盘、网络、SSD组合;•MySQL调优-终极调优面向程序员的数据库访问性能优化法则•写在最后的一句话–数据库层面做再大的性能优化,都抵不上应用层的优化。同样是MySQL,既可以用来支撑Google/FaceBook/Taobao应用,也可能连你的个人网站都撑不住;Q&A