DSP芯片在实时图像处理系统中的应用(精)
第一次干什么作文-幽默短信大全
爵霆鱼稔疆
PostgraduateForum
DSP芯片在实时图像处理系统中的应用
柯丽-,:黄廉卿-
(1.中国科学院长春光学精密机械与物理研究所,吉林长春130033;
2.中国科学院研究生院,北京100039)
【摘要】在通用计算机上用软件实现图像处理
,要占用CPU几乎全部的处理
能力,且速度相对较慢。数字信
号处理器fDSP)的可编程
性和强大的处理能力使其可用于快速实现各种数
字信号处理算法,在图像处理领域。尤其在实时图像处理
系统中得到了广泛应用和
发展。本文介绍了DSP芯片及其在实时图像处理系统中的开发、应用及发展方
向。
关键词:DSP芯片:图像处理系统;实时处理中图分类号:TP391.4
1
DSPchipanditsapplicationinreal-tim
eimagepr
ocessingsystem
KELil・2
HUANGLian-qin91
(1.Changehun
InstituteofOptics,FineMechani
csand
Physics,Chinese
AcademyofSciences,Changchun130033,
China;
2.GraduateSchoolofChineseAcademyof
Sciences,Beijing100039,China)
Abstract:All
operationcapacityofCPU
willbetakenupifimageispr
ocessedsutin
gslowprocessingspeed.Digitalsignal
on
generalcomputerbysoftware,re—
process(DSP)can
beusedtoimplementallkindso
falgorit
hmsofdigital
signalprocessingwithi
tspowerfulpro
cessingcapacity.DSPchipisapplieda
ndd
evelopedwidelyinthefieldofim—ageproc
ess
ing,especiallyinreal-timeimagepro
cessing.Thepa
perintroducesDSPchip,it
sdevelopmentandappli・ca
tioninreal-ti
meimageprocessingsystem.
Keyw
ords:DSPchip;imageprocessingsy
stem;real-timepr
ocessing
1
引言
压缩。图像处理技术尤其是实时处理,现已成为一热门的研究课题。
实现图像处理的主要方式有:
f1)在通用计算机上用软件实现图像处理;f2)在通用计算
机系统中加入
专用的加速处理模块;
随着计算机及通信技术的发展,图像和视频的应用愈加J
1泛。大部分图像数
据在实际应用前皆需进行有针对性的处理.如根据图像数据特点和应用领域对图像<
br>进行增强、除噪、锐化和识别等。此外.为了有效实时地传输信息,还必须对图像
进行
』!J鲨an塑u碘arHyllll2仉00c0591。_l!三
万方数据
l——————————
f3)利用通用单片机:f4)利用专用DSP芯片;f5)利用通用可编程
DSP芯片。 <
br>在众多图像处理方式巾,最常用的是第1种,但此种方式要占用CPU几乎全
部的处理能力,速度
相对较慢,不适于实时处理,需要对其加以改进;而其他几种
方式各有不足,如第2种方式不适于嵌入式
应用,专业性较强,应用受到限制;第
3种方式适于数字控制等不太复杂的数字信号处理,不适合计算较
大的图像数据处
理;第4种方式洲为采用的是专用DSP芯片,故其廊用范围受限,系统不够灵
活,无法进行算法的升级与更新;第5种方式必须要用能充分考虑DSP内部并行
性的_7r:编语0„
进行编制DSP程序,具有一定困难。但是,TI公司为了
解决这个问题.推出了一个开放、具有强大集
成能力的开发环境(CCS)罔。它
采用了由先进的开发_:_[具组成的直观系统,使用CCS提供的
工具.开发者
可以非常方便地对DSP软件进行设计、编码、编译
、调试、跟踪和实时性分析,
可有效减少DSP编程时问。
综上所述,利用通用可编程DSP
芯片[[-21实现图像处理较之其他方式
具有一定的优越性,而且DSP芯片的可编程性和强大的处理
能力.使其可用
DSP芯片采用不同于普通单片机的体系结构,具有---・些显著特点。
2.1
哈佛结构”I
传统计算机采用传统的冯・诺伊曼(Von
Neu
mannl结构,其程序和数据共用一个存储空间和单一的地址及数据
总线,处理器要执行任何指令时,
都要先从储存器巾取出指令解码,再取操作数执
行运算,即使单条指令也要耗费几个甚至几十个周期.在
高速运算时。在传输通道
上会出现瓶颈敛应。
所有的DSP芯片均采用哈佛(Harvard
)结构。哈佛结构是~种并行
体系结构,它的主要特点是将程序和数据存储在不同的存储空问中.即程序
存储器
和数据存储器是两个相瓦独立的存储器,每个存储器独立编址、独立访问。与两个
存储器
相对应的是系统中的4套总线:程序的数据总线与地址总线,数据的数据总
线与地址总线。这种分离的程
序总线和数据总线可允许在一个机器周期内同时获取
指令字f来自程序存储器)和操作数(来自数据存储
器),从而提高了执行速度,
使数据的吞吐率提高了1倍。又由f程序和数据存储器在两个分开的空间巾
,闪此
取指和执行能完全重叠。图1给出了冯・诺伊曼结构和哈佛结构的比较。
地址总线
于陕速地实现各种数字信号处理算法,成为目前图
像处理系统的最佳选择。
2
DSP芯片
数据总线
(a)冯-诺伊曼结构f单存储器)
线
、‟
数字信号处理器fDSP)
f1。21是一类具有专门为数字信号处理任务而
优化设计的体系结构和指令系统的通用处理器件.具有
处理速度快和有复合功能的
单周期指令等特点,在高速图像处理中得到了越来越多的应用。
D
SP芯片内部采用程序和数据分开存储和传输的哈佛结构.具有专门硬件乘
法器,广泛采用流水线操作.
提供特殊的DSP指令.可用来快速地实现各种数字
信号处理算法,加之集成电路的优化设计,使其处理
速度比最快的CPU还快lO
一50倍。
DM地址总线
线DM数据总线
(b)哈佛结构(双存储器)
图1冯・诺伊曼结构与哈佛结构的比较
2_2流水线技术[1】
与哈佛结构相似,DSP芯片广泛采用流水线以减少指令执行时间.
从而增强
J‟处理器的处理能
!曼噶急
万方数据
力。
流水线处理器是由一系列处理电路组成.这些
处理电路
称为片断或部分。操作数流经每个片断,即每个片断对操作数进行部
分处理,操作数经过所有片断后才能
得到最后结果。流水线操作即把一条指令分成
一系列步骤来完成,不同步骤完成不同的任务,一条指令只
有经过所有步骤才能得
到结果.。这些步骤可以独立进行,这样就可以实现多条指令在不同步骤上的重复
运行,从而加快运行速度。
流水线分为指令流水线和算术流水线。指令流水线是指取指令和执
行指令的不
同阶段在流水线上进行:算术流水线是指算术操作的不同阶段在流水线上进行.D
S
P芯片一般采用指令流水线方法。
由丁采用了流水线技术,DSP芯片可以单周期完成乘法累加运算。
大幅提高
了运算速度,减少了指令执行的时间,从而增强r处理器的处理能力。处理器可以
并行
处理2~4条指令。每条指令处于流水线的不同阶段。2.3特殊的硬件结构
【1-2】
数字
信号处理中最重要的基本运算足乘法和累加运算,它们占用了大量运算时
间,是最主要和最耗时的运算。
DSP中设置了硬件乘法器和乘法并累加(MA
C),这些操作往往可以在单周期内完成,大幅提高了D
SP作乘法和累加的速
度。因此,单周期的硬件乘法器和MAC是DSP芯片实现快速运算的保证。现代
高性能的DSP芯片甚至具有两个以上的硬件乘法器以提高运算速度。数据宽度也
从16位增加
到32位。
数学运算消耗的时问往往少于存储器的操作。DSP芯片在片内集成了大容量
的R
OM和RAM来分别存放程序和数据,程序在片内执行的效率远远高于相同规
格的通用微处理器,这样既
降低了产品的体积和成本.又加快了处理速度。在数字
信号处理中要遇到大量的地址运算,在某些情况下.地址运算量甚至超过了数据的
运算
万
方数据量。DSP中设计有一个特殊的硬件算术单元——地
址产生器。地址计
算由这个专门的硬件来负责.不需要耗费额外的时间。现在
的某些微处理器中也有独立的地址产生单元,
对于一些特殊的地址运算不需要耗费
额外的CPU时问。但是DSP的地址运算单元更强大,支持如比特
翻转寻址和循
环寻址,可极大加快运算速度,而对于非哈佛结构的处理器可能需要更多的处理周
期。2.5并行处理结构[21
图像处理中的运算量巨大,单个处理器无法满足实时处理的需求,需要多处理
器并行处理。 <
br>DSP内部一般都集成多个处理单元。如硬件乘法器(MUL)、累加器(A
CC)、算术逻辑单
元(AIJU)、辅助算术单元(ARAU)以及DMA控制
器等。它们都可以并行地在同一个周期内执
行不同的任务,例如辅助算术雎元能为
卜一次的运算做好准备.适于完成连续的乘加运算。芯片内部还包
括其他总线,如
DMA总线等.可实现数据的后台传输而几乎不影响主CPU的性能。
为了提
高并行处理能力,现代DSP芯片通常采用单指令多数据流结构(SI
MD)、超长指令字结构fⅥ.I
W)、超标星体系结构、多DSP核体系结构和
DSP/MCU混合结构,这些并行处理机制碌著提高了
DSP芯片的性能。
3
DSP的发展历程和方向
3.1
DSP发展历程
DSP发展历程Ⅲ大致分3个阶段:2
0世纪70年代埠论先行.20世纪8
0年代产品普及,20世纪90年代突飞猛进。
在DS
P出现之前,数字信号处理只能依靠微处理器(MPU)来完成,但M
PU的低处理速度无法满足高速实
时的要求,因此直到20世纪70年代.才有人
提出了DSP的理论和算法基础。那时的DSP仅停留在
教科书上,即便是研制出
来的DSP系统也是由分立元件组成的,其应用领域仅局限于军事、航空航天部
门。
塑Ja型nua型r翱!皇y
2005
■——二————————一
2.4特殊的寻址方式[1l
麝黧壁镳錾
PostgraduateFOrum
随着大规模集成电路技术的发展,1982年,世界上
诞生了首枚DSP芯
片。这种DSP器件采用微米工艺NMOS技术制作.虽功耗和尺寸稍大,但运算<
br>速度却比MPU快了几十倍,尤其在语音合成和编码解码器中得到了广泛应用。D
SP芯片的问世
足个里程碑.它标志着DSP应用系统由大型系统向小型化迈进了
一大步。到20世纪80年代中期,随
着CMOS技术的进步与发展,第2代基于
CMOS工艺的DSP芯片应运而生.其存储容量和运算速度
都得到成倍提高,成
为语音处理和图像硬件处理技术的基础。
20世纪80年代后期,第3代
DSP芯片问世,运算速度进一步提高,其应
用范围逐步扩大到通信和计算机领域。
20世纪90年代,DSP发展最快,相继出现了第4代和第5代DSP器<
br>件。现在的DSP属于第5代产品,与第4代相比,其系统集成度更高,并将DS
P芯核及外罔元
件综合集成在单一芯片上。这种集成度极高的DSP芯片不仅在通
信和计算机领域发挥重要作用.而且逐
渐渗透到人们日常的消费领域。
3,2
DSP发展方向[11
现在DSP产品的应用已扩大到人们的学习、
工作和生恬的各个方面,并逐渐成为电子产品更
新换代的决定因素:而半导体
技术和超大规模集成电路的发展为DSP的推陈出新提供了物理基础,用户
的需求
又为DSP的发展指出了方向。总体而言,DSP技术将向以下几个方面发展:
(1)
系统级集成。缩小DSP芯片尺寸始终是DSP的技术发展方向。当前
的DSP多数基于精简指令集计算
(RISC)结构,这种结构的优点是尺寸小、
功耗低和性能高。各DSP厂商纷纷采用新工艺,改进D
SP芯核,并将几个DS
P芯核、MPU芯核、专用处理单元、外围电路单元和存储单元集成在一个芯片
上,成为DSP系统级集成电路。
f2)更高的运算速度。目前一般的DSP运算速度为10
0MIPS,即每
秒钟可运算1亿条指令,但由
兰Q崃器一
万
方数据
于电子设备的个人化和客户化趋势,DSP必须追求更高更快的运算速
度,才能跟上电子没备的更新步伐
。DSP运算速度的提高主要依靠新j二艺改进
芯片结构。目前,Ⅱ的TM320C6X芯片由于采用超
长指令字(VLlw)结
构设计,其处理速度已高达2000MIPS。当前的DSP器件大都采用0.
5
—0.351xmCMOS工艺,按照CMOS的发展趋势,D
SP的运算速度完
全可能再提高100倍(达到1600CIPS)。
(3)可编程性。可编
程DSP给生产厂商提供了很大的灵活性。生产厂商可
在同一个DSP平台上开发出各种不同型号的系列
产品,以满足不同用户的需求。
同时,可编程DSP也为广大用户提供了易于升级的良好途径。人们已经
发现,许
多微控制器能做的事情,使用可编程DSP能做得更好更便宜,例如冰箱、洗衣机
这些
原来装有微控制器的家电如今皆已换成可编程DSP来进行大功率电机控制。
f4)支持高级编程语言
的DSP开发软件。使用高级语言进行DSP软件开
发可缩短软件开发的周期.加快DSP产业的发展。
(51并行处理结构。并行结构所带来的好处是显而易见的,各DSP厂家纷
纷在器件中引入并
行机制,主要分为片内并行和片间并行。
(6)功耗低。
4图像处理系统中DSP芯片的选择
对图像处理技术而言,由于要处理的数据量大,计算复杂
,计算中间结果精度
要求高,因此需要选择合适的DsP芯片。DSP。墨片的选择应根据实际的应用<
br>系统需要而确定。一般来说,选择DSP芯片时应考虑如下诸多因素:
(1)确定选择定点或浮
点DSPt”。数字信号处理算法的数据格式有定点
和浮点之分,而数字信号处理系统采用的数据格式决
定了它所处理信号的处理精
度、动态范围和信噪比.且不同数据格式的易用性和开发难度也不一样。选择
定点
或浮点DSP,白„
露鳃鳖镳龌
PostgraduateForum
先要看模数转换时需要的比特数.如果图像的每个像素小于16b
it,则用
16bit定点DSP即可:如果大于16bit,则需要用浮点DSP来捕捉更
大
的动态范围。其次考虑算法的复杂度和经济问题。一般说来,浮点DSP芯片的
运算精度高,动态范围大
,寻址空问大,指令运算能力较强,但功耗大、成本高、
体积较大。定点DSP芯片的运算精度与浮点D
SP芯片相同(数据位数和浮点芯
片相同的情况下),而功耗、成本、体积与浮点DSP芯片相比较小,
且易于实
现,稳定性好。
(2)根据DSP芯片运算速度选择具体芯片【”。运算速度是DS
P芯片的
-个最重要的性能指标.也是选择DSP芯片时所需考虑的一个主要因素。DSP
芯片
的运算速度一般采用DSP的指令周期、单周期的乘加次数或采用数字信号处
理中的基准程
序,如用F丌和数字滤波等的执行时间来测评DSP
芯片的速度性能。
f31其他
考虑因素[。。在硬件方面还应考虑芯片的外部总线结构、片上存
储器结构、DMA功能、串行通信lY
I和芯片间通信能力等因素,在软件方面主
要足开发软件的功能性和时间要求等因素。
目前。
应用最为广泛的是TIfTexasInstrumentsl公司T
Ms320c6000[1-3I
系列的数字信号处理器。美国德州TI公-J自
1982年推出第l代数字信号处理器以来,现已相继推
出了多代数字信号处理
器.成
为世界上最大的DSP芯片供应商√rMS320C6000
系列是.I‟I公司于1997年推出的高端系列的DSP。该系列的DSP
在芯片没计上,最
初主要是针对多通道无线通信和有线通信的应用领域,但由于其
优异的高速处理性能和出色的对外接口能
力,使它也很适用于图像处理领域。
TMS320C6000是
基于超长指令字(VLIW)结构的通用DSP系
列,具有超长指令字处理能力。其内部有8个并行处理
单元,8条指令组成一个指
令包,
・个指令包的总字长为256位。它可在一个
时钟周期内并行执行8条指令。这种高速高性能数
万
方数据字信号处理器的工作
频率可达200MHz,每秒可完成1.6G次操
作。该结构包括定点的C62x、浮点的C67x和新
的C64x。C64x和C
62x代码兼容.但结构有显著的加强,其初期的工作频率可达750MHz
。,
C67x在C62x8个功能块中的6个上增加了浮点功能,因此其指令集是不同
的。 <
br>将TMS320C6000系列的数字信号处理器用于图像处理系统开发中。
势必使技术水平得到
进一步的提高。
5基于DSP的图像处理软件开发
TI公司针对TMS320C6000系
列芯片推出了一种CCS集成开发软
件。CCS(Code
Composer
Studio)t1I
是一个开放、具有强大集成能力的开发环境,它采用了ftl先进的开
发T具
组成的直观系统,可大幅减小DSP编程时问,并能在极短的时间内消除实时工作
中的间
歇。CCS包括TMS320C6200代码生成工具、集成开发环境ID
E、DSP/B10s插件和
应用程序接几实时数据交换(AP[、RTDS)插
件和主机接口等部分。使用CCS提供的工具,开发
者可以非常方便地对DSP软
件进行设计、编码、编译、调试、跟
踪和实时性分析。DSP软件开发11]流程
图如图2所示。
DSP软件开发包括3个阶段:
(1)第l阶段是指图2中“C代码优化”之前的部分。在第l阶段丰要是在C
CS环境下用C
6000的代码产生工具,编译产生在C6000内运行的代码,
证明其功能正确,然后再用CCS调试
工具,分析确定代码中可能存在的影响性能
的低效率段,进入第2阶段。
(2)图2巾从“C
代码优化”开始至“线性汇编”之前为第2阶段。这一阶段主
要是利用优化方(3)其余部分为第3阶段
。在这一阶段从C语
竺J堕an型uar2005
■二
法改进C语言代码,主要
使用内联函数、数据打包处理、软件流水线技术以及
展开循环结构代码等优化手段,然后反复检查C代码
性能,优化C代码,如果仍不
能达到所期望的效率,进入第3阶段。
褥纛鸯罐蕊
Postgraduate Forum C代码的编写 用,可使代
码效率高达95%以上。
6基于DSP的图像处理系统 代码编译 基于DSP的图
像处理系统"1的主要思想是利
用C6000这样具有强大运算能力的DSP来
满足图 像处理技术中运算速度和处理的实时性要求。以
DSP为核心部什的图像
处理系统具有以下特点:
(1)接El方便。DSP系统与其他以现代数字技术
为
基础的系统或设备均相互兼容,同这样的系统接El 来实现某种功能要比模拟
系统与这样的系统接口要
容易的多;(2)编程方便。DSP系统中的可编程D
SP
芯片可使设计人员在开发过程中灵活方便地对软件
进行修改和升级;(3)
稳定性好。DSP系统以数字处
理为基础,受环境温度及噪声的影响较小.可靠
性高;(4)精度高。16位数字系统的精度可达10~;
(5)可重复性好。
模拟系统的性能受元器件参数性
能变化的影响较大。而数字系统基本上不受影
响,
因此数字系统便于测试、调试和大规模生产;(6)集
成方便。DSP系统
中的数字部件有高度的规范性, 便于大规模集成。
图像处理系统一般由图像采集
模块、图像处理 模块和数据通讯模块三部分组成(如图3所示)。
待处理 图像 网
一网一降 L—j L—J L——J I模块 模块 I模块1 <◇ 罔2 i
Y 网3 冈像
处理系统组成 图3中的图像处理模块接收来自采集模块的数
宁图像数据,刘其进
行相应处理,是系统的丰体部 分.其核心是用来实现处理算法的DSP芯片,如
r兀公司TMS320C6000系列芯片。 图像处理计算量大且实时性要求
高,虽然DSP
DSP软件开发流程图 言程序中抽出对性能影响很大的程序段,
使用线性
汇编语言重新编写.井使,}=}j汇编优化器优化该段代 码。
最后可
用EVM板或其他开发硬件.根据实时
性的要求反复优化C程序和线性汇编程
序,直到系 统符合实时性和代码长度的要求。在这种CCS集
成开发软件的环境
下,C编译器的效率可达80%, 若将新的线性『L编语言和C6000
i_
厂:编优化器配合使 芯片对提高处理速度有一定的优越性.但对如遥感
图像等大
型且重要的图像数据却常常不能达到实时
处理。因此需要采用多个DSP并行处
理方式14“j,进
一步提高算法的运行速度,达到真正的实时处理。
日前比较常
用的是双DSP结构㈣。两片DSP芯片交 丝—裟笋繁 万 方数据
褥窕鳖锤辘 Postgraduate FOrum
替进行采集和处理工作,
可以实现数据采集和图像 压缩的并行操作.降低处理时间:而在一片DSP
内,
也可将数据缓冲区分为两部分.同时进行数据
读取和编码,实现片内并行操作,
进一步节省时 间。 7
DSP将是未来集成电路中发展最快的电子产品,并 将成为
电子产品更新换代的决定因素。将DSP芯
片川于图像处理系统可大幅提高图像
的处婵速度, 满足实时性需求,而且DSP系统具有接几方便、
易于编程、稳定
性好、精度高、可重复性好和集成 结 论
方便等特点.因此可以说基于DSP的图
像处理系 统是图像处理领域的发展方向。(No.7)
在当今数字化时代的背景
下.DSP已成为通 信、计算机、消费类电子产品等领域的基础器件。
参考文
献: [1】刘党辉,沈兰荪.DSP芯片及其在图像技术中的应用….测控技
术,20
01,20(5):16—23. [2]赵训威.基于TMS320C
6200系列DSP芯片的应用
与开发【MJ,北京:人民邮电出版社,200
2. [3】徐盛
,陈健.TMS320C6201数字信号处理器在图像处理中
的应用…,电if-&术应用,1999
,(1):70—72. 【4】Wan
g Y H,Zhang T X,Yah
T.x.Modularized nmhi
—DSP real-time image
processing system
『J]SPIE,4552:12—15. Oil
【5]Haskell B
G.Image and video coding-eme晒ng
standar
ds and beyond[J].IEEE Trans yi如o
Teehn0
1.,1998,8(7):8 14—837. Circui如and
Syst
ems扣r [6]朱伯春,国澄明,土兆华,舣片TMS320C40并行实时
图像
处理系统[J].通信学报,1998,19(1):39—44. 快速粮
食成份光电分析仪
由长春光枧所应用光学国家覆点塞验窒薅僦的壤遴搬黉戚髂糍
电努析仪是-种髓够快速、
准确地定最分析农产品(包括谷物、油料、饲料等)
威份的仪器,是根据粮食在近红外光谱长
波段吸收信息丰富,结合化学计量学及
统计数学等手段可在极短的时间内同时获得样晶的多种
成份含量的原理而研制
豹。该仪器鑫分析样品时茏需样晶进弦冗繁的化学预处理,样品制各简
单快捷、
无污染,在不超过五分钟的时间内即可完成粮食样品多种成努C如蛋白质、脂肪、
淀
粉、纤维、水分等)的同劳测量,被称为是绿色的分析仪器。,该类仪器已强
国辨粮食深加工生
产的质量控制、粮油黟晶的嚣质监测、种子发放时的成分检测
等蠹面得到较为广泛的使用。
快速粮食成份光电藏褥彼霸蕊制,充分考虑到了国
内近红辨分析仪用癌的使用要求,3t:菇
在软件设计上完全符合巾镧瓣现窦魉
季终蠢藏翱使用习惯0谶嫂器在蠢拣镶农辩虢巍囊瓣≯番
林德大有限公司油脂厂
和羲毒滚威寨豢麓发蠹穰鏊霹灌,黪煮地瘴麓蠢藏荔j繁獯蓼,撩簿黪德嫦效
果。浚仪器的研制成功将使豢期簿雾藜零霉藜藜鬻磐鬻鬻纛簟戆鬻》峨壤矮矧麟
鬻。
旦J竺anu塑ar堕!生堕也——y 万 方数据 2005 [二——