基于OpenCL图像模糊化算法优化与研究.pdfVIP

基于OpenCL图像模糊化算法优化与研究.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

基于OpenCL 的图像模糊化算法优化研究? 1,2 1 1 张樱 张云泉 龙国平 中国科学院软件研究所并行软件与计算科学实验室 北京100190 1 中国科学院研究生院 北京100190 2 摘 要 现代 GPU 一般都提供特定硬件 如纹理部件、光栅化部件及各种片上缓存 以加速二维图像的处理和 显示过程,相应的编程模型 CUDA、OpenCL 都定义了特定程序设计接口 CUDA的纹理内存,OpenCL 的图像对象 便于图像应用能利用相关硬件支持。以典型图像模糊化处理算法在AMD 平台GPU 的优化为例,探讨OpenCL 的 图像对象在图像算法优化上的适用范围,尤其是其相对于更通用的基于全局内存加片上局部存储进行性能优 化方法的优劣。实验结果表明图像对象只有在图像为四通道且计算过程中需要缓存的数据量较小时能带来较 好的性能改善,其余情况采用全局内存加局部存储能获得更好性能。优化后的算法性能相对于精心实现的CPU 版加速比为200-1000;相对于NVIDIA NPP 库相应函数的性能加速比为 1.3-5。 关键词 AMD GPU,blur,OpenCL,图像对象 中图法分类号 TP302 文献标识码 A Research on image blur algorithm optimization using OpenCL 1,2 1 1 ZHANG Ying , ZHANG Yun-Quan , LONG Guo-Ping Laboratory of Parallel Software and Computational Science, Institute of Software, 1 the Chinese Academy of Sciences, Beijing 100190, China 2 Graduate University, the Chinese Academy of Science s, Beijing 100190, China Abstract Modern GPUs generally provide specific hardware such as texture, grating components and various on-chip cache to accelerate the 2D image processing and displaying process. Programming model defines specific APIs to facilitate image applications taking advantage of image-related GPU hardware, such as CUDA’s texture memory and OpenCL’s Images Object. Take the optimization of image blur algorithm on AMD GPU as an example, in order to get a deep insight into the using of OpenCL’s image object on image applications, especially its advantage and disadvantage compared to the more general optimization method based on global memory and the on-chip local memory. The experimental results demonstrate that the image object can provide better performance only when the processing image is four-channel and the amount of data to be cached is small. For other cases, optimizing with global memory and local memory can get better performance. After optimization, the speedup reaches 200x to 1000x

文档评论(0)

sjatkmvor + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档