中国科学技术大学
硕士学位论
基于多核VL I W DSP的数字信号变换函数并行优化
作者姓名: 甄扬
学科专业: 计算机应用技术导师姓名: 顾乃杰教授完成时间: 二O一五年四月
万方数据
U niversity of Science and Technology of China
A th es i s fo r m aste r’S d eg ree
Pa ra l l e l izati o n of D i g ita l S i g n a l
I ranStorm I nq卜U nCtIonS baSed
O n M u lti co re VL IW D S P
Author’S Name: Yang Zhen Speciality: Computer Application Technology Supervisor- Gu
Finished time: April,2015
万方数据
中国科学技术大学学位论文原创性声明
本人声明所呈交的学位论文,是本人在导师指导下进行研究:丁二作所取得的成果。除已特别加以标注和l致谢的地方外,论文中不包含任fk!,fi旦人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。
作者签名:堑丝 签字同期:塑15:哆:≯F
中国科学技术大学学位论文授权使用声明
作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允汁沦文被查阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文文件的内容和纸质论文的内容相一致。
保密的学位论文在解密后也遵守此规定。
匝终丌口保密( 年)
作者签名: 塑a圣 翩虢塑礁导师签名: 型型堡丝
签字同期: №,28 签字同期: J
摘要
摘 要
伴随着音视频娱乐行业的迅速进步,数字信号处理器『F逐渐成为研究人员重点关注的对象,如何提高数字信号处理器平台上相关应用的性能和效率也受到越来越多的重视。然而,当6,J-流行的多核、超标量、单指令流多数据流(Single Instruction,Multiple Data,SIMD)、乱序执行、超长指令字(Very Long Instruction Word,VLIW)技术使得数字信号处理器的体系结构越来越复杂,普通用户很难编写出能够充分发挥处理器性能的软件。
针对特定数字信号处理器平台进行函数库改进是软件优化领域当6,,其关键在于提升代码对处理器、存储器等硬件的使用效率。本文针对上述问题,基于国产BWDSPl00进行深入研究,针对其搭载的基本信号处理函数库实施并行优化。考虑到该函数库结构复杂、例程数量较多,本文采用重点研究典型函数的方式,对其中最为重要的数字信号变换函数进行优化,使用到的主要优化方案有如下三个层次:
(1) 利用BWDSPl00汇编指令集提供的特殊指令改编函数库中部分函数的实现,从而达到减少代码量,提升程序执行效率的目的。BWDSPl00提供的特殊指令包括累加、累减、复数、选大、选小、定点、超算,其中超算指令包括正余弦、倒数、自然对数等。
(2) 针对数字信号处理函数循环计算多的特点,通过循环展丌技术对函数内的循环操作进行重点优化。循环展开能够成倍的提升每一轮迭代时参与运算的数据个数,这样做的效果是有效的降低了循环体执行的总次数。该技术可以提高软件效率的原因有二:一方面它提高了单次迭代内部有效计算(非索引比较)的数目;另一方面它拉长了程序代码,基于此可以进一步变换代码以便进行指令调度、对变量进行重命名以减少数据相关。
(3) 依据BWDSPl00支持指令多发射的特点,通过指令调度技术对指令次序进行调整,这样不仅可以减少流水线的空转和等待时间,同时州+以提高循环展丌的展开数。
实验结果表明,经过优化之后,本文中所有函数的加速均超过9,其中80% 的函数加速比超过10。本文的工作成果对其它软件的优化工作有借鉴意义。
关键词:超长指令字单指令流多数据流数字信号处理循环展丌并行化多簇 BWDSPlOO
摘要
11
ABSTRACT
ABSTRACT
With the rapid development of multimedia industry,digital signal processing technology,along with the digital signal processor,is ing more and more important
基于多核vliw dsp的数字信号变换函数并行优化 来自淘豆网www.taodocs.com转载请标明出处.