上网时间:2006年6月 文章来源:电子工程专辑 作者:来大伟
DRC Computer公司与其软件伙伴Celoxica公司联合开发了用于关键算法加速的基于FPGA的协处理器模块和软件开发工具。DRC的这种协处理器模块基于赛灵思Virtex-4 FPGA系列,通过HyperTransport总线与AMD的Opteron处理器连接。
DRC公司首席执行官Larry Laurich表示,该技术初期主要瞄准石油和天然气、金融和生命科学应用,在这些领域,计算密集型算法可在FPGA硬件中并行执行。首批开发系统会在今年第三季度面市,售价将为约2.5万美元。
在过去20年来,FPGA吸引了产业界和学术界的广泛兴趣,一直被用作可配置计算平台。Laurich透露,早在上世纪八十年代末,DRC创办人Steve Casselman就对此产生浓厚兴趣,有意开发基于FPGA的计算平台。Casselman在1987年创办Virtual Computer公司,但该公司在2000年的低迷时期倒闭。
而随着规模更大、速度更快的FPGA的问世,Casselman成为率先认识到HyperTransport总线有可能打破另一个瓶颈—相对低速的PCI总线—的人士之一。Casselman在2004年找到新的投资人,创办了DRC公司,公司名“DRC”即取“自动态可重配置协处理器”(Dynamic Reconfigurable Coprocessor)之意。Casselman现担任DRC公司的首席科学家兼首席技术官。
Laurich介绍,总部设在英国的Celoxica公司是与DRC签约的首个软件开发伙伴。他希望今后有更多的公司参与共同开发。
Celoxica(美国)公司总经理Jeff Jussel表示,Celoxica的工具提供了重新编译C代码以用于DRC协处理器模块的能力。他说,FPGA能并行运行许多算法,与传统服务器处理器相比,其功耗要低很多。
Jussel表示:“举例来说,为了运行诸如Black Scholes这样的金融分析算法,银行会购买大量CPU和机架,其占用的空间越来越大,且需要大量能耗进行冷却。作为改进措施,银行可以采用FPGA协处理器来分担其中一些关键算法,这样功耗要低很多的,同时性能表现却能提高100倍。”
Jussel指出,相比过去一些用户通过开发ASIC来实现算法加速,如今这种基于FPGA的方法要便宜很多,且为熟悉C语言编程工具的程序设计人员敞开了大门。
图2:DRC的协处理器可实现计算算法加速。
Laurich介绍,DRC的协处理器模块与AMD的Opteron处理器管脚兼容,能插到IBM、惠普等大公司及其他十多家较小公司采用Opteron处理器的主板上。HyperTransport总线向Opteron处理器传输数据的延迟时间约为60ns,这项指标仅是PCI总线的大约1/10。此外,DRC的协处理器模块可连接主板上的大量DRAM存储器。
“与那些DIMM插槽通信的DDR控制器是我们知识产权(IP)的一部分。我们的IP使算法能以极低的延迟访问主板存储器。”Laurich表示。一旦容量更大的DDR-2普及,DRC的协处理器就有能力访问最高可达32GB的可用内存。
DRC的协处理器模块由增加了几条指令的Linux BIOS控制。该协处理器的标准配置是200MHz@8位,且可通过调整一个可协商(negotiated)接口来实现不同位宽度和位速率。
用户可期待该模块硬件能实现赛灵思承诺的性价比曲线。“我们已着手设计一款16位版本,预计在今年年中推出。眼下,该模块的最高速度为400MHz,但今后会变得更快,”Laurich表示。现在,一个基于LX-60 Virtex-4 FPGA的模块,售价4,500美元,但他估计,明年将降为3,000美元。相关的开发系统包括一个带DRC协处理器和Opteron处理器的工作站、Celoxica的工具,以及来自DRC和赛灵思的软件。
Laurich称,DRC估计其技术能将整数应用程序加速约100倍、单精度浮点应用程序加速10倍,而双精度浮点应用程序运行速度可提高5倍。 |