当前位置:首页 > 商业/管理/HR > 企业文化 > 基于CUDA平台的GPU并行计算技术研究
HUNANUNIVERSITY毕业论文论文题目:基于CUDA平台的GPU并行计算技术研究学生姓名:蒋悦孟学生学号:20100730212专业班级:自动化1002班学院名称:电气与信息工程学院指导老师:张小刚学院院长:王耀南2014年5月20日第I页湖南大学毕业论文基于CUDA平台的GPU并行计算技术研究摘要近年来,随着GPU(GraphicProcessingUnit,图形处理器)技术的持续发展创新,GPU的并行运算能力越来越受到人的重视。由于GPU的应用普及,NVIDIA公司推出了基于CUDA架构的廉价高性能并行运算平台。本文基于NVIDIA公司推出的CUDA平台,对相应的GPU架构体系及CUDA软件体系进行了深入的分析,对CPU+GPU异构平台基础上的并行操作及算法优化方法进行了研究总结。同时,本文利用图像搜索技术作为切入点,介绍了当今基于内容的图像搜索技术原理,使用CUDA并行运算加速感知哈希算法,探讨CUDA并行运算在算法及优化方法在通用运算中的结合方式,在使用Opencv的前提下,对比仅在CPU中的图像搜索程序,获得了3.66倍的运算收益。关键字:并行运算,图形处理器,统一设备计算架构,图像搜索第II页湖南大学毕业论文GPUParallelComputingTechnologyResearchBasedOnCUDAPlatformABSTRACTInrecentyears,astheGPU(GraphicProcessingUnit)technologycontinuingtodevelopandinnovative,GPUparallelcomputingdrawsmoreandmorepeople'sattention.DuetoGPU’suniversalapplication,NVIDIAhaslaunchedacheaperandmoreefficientparallelcomputingplatformwhichisbasedonCUDA.BasedonCUDA,whichislaunchedbyNVIDIA,thisarticlehaveadepthanalysisontheGPUarchitectureandCUDAsoftwaresystem,andwealsodiscussandconcludeaboutthemethodsofalgorithmoptimizationandtherealizationofparallelcomputing.Atthesametime,thisarticleusestheimagesearchtechnologyasabreakthroughpoint,Introducingtheprincipleofcontent-basedimageretrieval,usingCUDAtoacceleratethePerceptionofHashi,exploringthejuncturebetweentheCUDAparallelcomputingalgorithmandoptimizationmethodingeneralarithmetic.OnthepremiseofusingOpenCV,wecomparedtheoperationspeedofparallelcomputingprogramandserialcomputingprogram,andgained3.66timesspeed-upratio.KeyWords:ParallelComputing,GraphicProcessingUnit(GPU),ComputeUnifiedDeviceArchitecture(CUDA),ImageSearching第III页湖南大学毕业论文目录1.绪论...........................................................................................................................11.1.课题研究背景及目的...................................................................................11.2.CUDA概述....................................................................................................21.3.CUDA并行运算技术研究现状及范例........................................................21.4.论文构成及研究内容...................................................................................42.CUDA架构及编程模式...........................................................................................62.1.CUDA架构下GPU硬件结构......................................................................62.2.CUDA软件体系............................................................................................72.2.1.CUDA的存储器模型.........................................................................72.2.2.CUDA编程模型.................................................................................92.3.CUDA并行运算的优化..............................................................................133.基于内容的图像搜索.............................................................................................163.1.图像检索概况.............................................................................................163.2.CBIR的结果评价........................................................................................174.CUDA与CBIR的结合实验过程..........................................................................194.1.感知哈希算法.............................................................................................194.2.CUDA并行运算在图像搜索中的应用......................................................215.结论.........................................................................................................................246.结束语.....................................................................................................................286.1.工作总结.....................................................................................................286.2.展望.............................................................................................................29致谢...............................................................30参考文献...........................................................31第1页1.绪论1.1.课题研究背景及目的并行运算作为现今科技创新发展的重要支撑方式之一,已然成为突破摩尔定理局限性的重要研究手段,而在大系统、大数据时代下,科技不断进步,计算机计算能力的飞速提升,在处理大数据、大系统事件中处相对优势的并行运算技术迅速得到了全球各行各业尤其高新科技行业的研究兴趣。近年来,已经迈进并行计算时代的计算机行业,在并行运算的研究发展中起着很重要的作用,多核CPU技术也在这整个过程中扮演重要角色,业内领先的CPU制造商先后宣布计划推出更多计算核的CPU,这足以证明并行运算已经为人类带来了不可忽视的好处。然而,在微处理器系统和大型高性能计算系统都是异构的大环境下,多核CPU技术面临的问题和挑战仍然很多,例如并行运算的速度、质量受数据移动的影响、开发软件随硬件的更新存在严重滞后、集成电路元器件存在种种严重限制等等,这些情况都制约着多核CPU技术并行运算的发展。早期的GPU(GraphicProcessingUnit,图形处理器)并行运算方式如OpenGL与DirectX在GPU技术迅速发展壮大的前提下也得到了为数不少的技术研究人员的青睐,但是早期的GPU并行运算技术对内存的写入方式和写入位置有严格限制,代码调试不方便,且开发人员必须对着色语言(ShadingLanguage)十分熟练,其对并行运算的互斥性、同步性以及原子性多方面存在不支持缺陷等等,这些都限制着其发展壮大,并不能成为较大众接受的通用并行运算方式。自2006年11月NVIDIA公司发布了第一款DirectX10GPU以来,该公司引进了新系列的GPU架构,并且开发出相对应的GPU通用计算技术(即CUDA),大众化并行运算得到了很好的发展。采用的是工业标准C语言的CUDA架构,更为方便快速开发人员去解决运用、调试的问题,运行应用程序的单位成本、单位消耗要低很多。综合其以上特点,CUDA并行运算平台逐渐成为了更为大众化的并行运算平台,得到更多人使用,并在各个领域得到成功的应用,其不断发展壮大的技术被广泛地应用到医学图像处理、环境科学、流体动力学、金融虚拟货第2页币挖掘等领域。本课题研究的目的基于CUDA运算平台的大众化,在PC端加装NVIDIA公司高性能GPU图卡后,构建基于CUDA架构的编程环境,对比CUDA架构下的并行运算与CPU上的串行运算时间复杂度,探讨CUDA架构在并行运算加速中的优劣,并尝试结合Opencv(OpenSourceComputerVisionLibrary)在C环境下对图像进行并行快速处理。在已然成熟的图像搜索原理下,运用感知哈希(pHash)检索方式,实现以“图”搜“图”的检索方式,对图像信息进行整合处理,比
本文标题:基于CUDA平台的GPU并行计算技术研究
链接地址:https://www.777doc.com/doc-2533582 .html