厦门大学信息科学与技术学院计算机系《信息存储技术》论文阅读报告0科技论文阅读报告要求:1.撰写科技论文阅读报告是对阅读的一个归纳和提炼,并针对这些问题提出自己的见解。2.中文撰写,1-3页,主要包括以下几点:(1)论文要解决的问题是什么,该问题为什么重要?(Introduction和Motivation章节)(2)论文提出了什么解决方案,效果如何?(Introduction,Design和Conclusion章节)(3)论文提出该解决方案的动机是什么?(Introduction和Motivation章节*重要)(4)论文提出的解决方案有何不足之处?(Design和Performance及自己的见解*重要)(5)以前解决该问题有哪些方法,有何不足之处?(RelatedWork章节)(6)针对该问题你是否有更好的解决方案?(自己的见解*重要)其中第(4)点和第(6)点是论文阅读报告的重点,需要通过阅读论文和分析提出自己对于该问题更加深入的理解和认识。3.每个人阅读的论文不同,根据需要还可以参考阅读其他相关论文,相互之间可以讨论,但论文阅读报告的撰写必须个人独立完成,最后需要同时提交电子版和打印版。4.附录是一个论文阅读报告的范例,供大家参考。附件中另两篇论文介绍了如何有效地阅读一篇科技论文。近三年的FAST会议论文可以从以下链接找到:FAST’09:’10:’11:或者:,用户名:stuwsz(密码为空)注意:每个人根据个人兴趣选择一篇论文下载并阅读,然后完成阅读报告。为了保证所有人的题目各不相同,大家确定文章后及时发邮件(suzhen@xmu.edu.cn)通知我,务必在邮件中写清楚姓名、学号以及文章题目,我会在FTP上将你的姓名标注在该文章上,其他人不得再选。如有多人选择同一篇文章,则根据邮件的先后顺序取舍。厦门大学信息科学与技术学院计算机系《信息存储技术》论文阅读报告1姓名:***学号:***********A.论文的基本信息:SuzhenWu,HongJiang,DanFeng,LeiTian,andBoMao.WorkOut:I/OWorkloadOutsourcingforBoostingtheRAIDReconstructionPerformance.InProceedingsofthe7thUSENIXConferenceonFileandStorageTechnologies(FAST2009),SanFrancisco,CA,USA,February24-27,2009,pp.239-252.B.论文要解决的问题及其重要性?在磁盘阵列中,当某个磁盘发生故障后,磁盘阵列需要在线恢复故障盘中的数据到备份磁盘中,这一过程称为磁盘阵列在线重建。论文要解决的主要问题就是如何提高磁盘阵列在线重建性能,同时优化重建过程中用户的响应性能。由于在以磁盘阵列为基础的大规模存储系统中,磁盘数量是相当大的,最近的研究表明在大规模存储系统中磁盘故障发生的概率是非常高的。因此磁盘阵列的在线重建也是一个经常性发生的事件,并且磁盘阵列在线重建的性能直接关系到存储系统的可用性和可靠性,如何快速的恢复失效的数据块并最低化对用户性能的影响是一个非常重要的研究问题。C.论文提出了什么样的解决方案,效果如何?针对磁盘阵列的在线重建问题,论文提出了WorkOut方法。WorkOut利用请求重定向技术将来自用户的写请求和热点读请求重定向到代理磁盘阵列中,从而可以减轻重建中磁盘阵列的负载,以加快重建过程。同时由于重定向到代理磁盘阵列的请求没有收到重建的影响,用户的性能也提高了。WorkOut主要包括5个模块:用户接口模块(AdministrationInterface):为系统管理员配置WorkOut的参数而提高的用户接口;热点数据识别模块(PopularDataIdentifier):识别在线重建过程中用户的热点访问数据;请求重定向模块(RequestRedirector):处理重建过程中用户请求的定位,将这些请求按照WorkOut策略发送到对应的存储设备中;回收模块(Reclaimer):当磁盘阵列重建完成后,从代理磁盘阵列中回收所有的被重定向的写数据到完成数据重建的磁盘阵列中;代理设备空间管理模块(SurrogateSpaceManager):对代理磁盘阵列中的空间进行管理,并控制被重定向的数据在代理磁盘阵列中的数据布局方式;通过对WorkOut的原型系统的测试,对比现有的磁盘阵列重建算法如PR和PRO,WorkOut可以减少重建时间1.26到5.89倍,减少用户响应时间1.22到2.87倍。通过TPC-C的标准测试,WorkOut可以减少响应时间46.6%和36.9%,减少重建时间15%。同时,WorkOut还可以适用于磁盘阵列的同步、磁盘擦洗等其他后台任务。D.论文提出该解决方案的动机是什么?论文提高该解决方案的主要动机有以下三个方面:(1)最近的大量研究表明大规模存储系统中磁盘发生故障远高于预期,使磁盘阵列在线重建变得尤为重要;(2)磁盘阵列重建过程中用户的I/O请求和磁盘阵列重建的I/O请求是相互影响的。随着用户请求的强度下降,磁盘阵列的重建性能相应提高了;(3)通过对用户负载的访问分析发现,用户的访问是存在局部性的,即某些热点数据是经常被访问的。基于以上三个现象,作者提出了利用请求重定向的技《信息存储技术》论文阅读报告范例厦门大学信息科学与技术学院计算机系《信息存储技术》论文阅读报告2术来加快磁盘阵列在线重建的性能。E.该解决方案有何不足之处?通过对该论文的阅读,发现该方法虽然可以有效地加快磁盘阵列在线冲击的性能,但是也有一些不足之处:(1)对代理磁盘阵列的性能有一定的影响。因为重定向到代理磁盘阵列的用户请求会占有代理磁盘阵列中的磁盘资源,从而降低代理磁盘阵列本身的用户性能。在论文的4.3节中有介绍,当代理磁盘阵列是活跃的时候,WorkOut对其性能有23.6%到43.9%的影响;(2)WorkOut方法不能简单地应用于单个磁盘阵列中。在单个磁盘阵列中是没有其他磁盘阵列的,所以用户的请求就没有地方可以重定向了,因此WorkOut只适用于包含很多磁盘阵列组的大规模存储系统中。F.以前解决该问题的方法及不足之处?以前解决磁盘阵列重建问题的方法主要分为两类:(1)通过优化磁盘阵列重建算法来加快重建速度,如DOR、PR和PRO等。(2)通过改变磁盘阵列数据布局和请求调度来加快磁盘阵列重建性能,如ParityDeclustering和FARM等。但是以上这些方法都局限于在单个磁盘阵列内部来加快磁盘阵列的重建性能,没有考虑对用户的I/O请求进行优化,同时也没有考虑大规模存储系统中多个磁盘阵列组之间的协作。G.进一步的优化方法或问题扩展?通过阅读该论文发现提高磁盘阵列的在线重建性能是一个非常严峻的问题。认真分析后觉得可以从以下方面来进一步优化:(1)在大规模存储系统中,可以智能地选择一个负载比较轻的代理磁盘阵列来重定向用户请求,从而可以减轻对代理磁盘阵列性能的影响。如果代理磁盘阵列本身的负载比较重,此时重定向的用户请求会加剧代理磁盘阵列的负载,从而同时降低代理磁盘阵列的性能和重定向过去请求的响应延迟;(2)当前以Flash为存储介质的固态盘已日渐成熟,如果将磁盘阵列中的磁盘替换为固态盘,由于固态盘固有的不同属性,这些已有的磁盘阵列重建算法是否适用于固态盘阵列?或者对于固态盘阵列是否有新的数据重建方法?