专注FPGA图像加速领域,深维科技跨入发展快车道
日前,在2019赛灵思开发者大会(美洲站)上,深维科技正式面向全球发布ThunderImage三款重磅图像加速产品:全球最快的JPEG2JPEG缩略图方案、超高性能的JPEG2WebP转码方案及世界级超高密度算力的JPEG2JPEG缩略图方案。新产品一经发布立即“技惊”四座。与此同时,深维科技迅速的发展势头,也引起业内的广泛关注。这家专注于FPGA图像加速领域的新锐公司,经过3年的发展,已然迈入了全面提速的发展阶段。
全球领先三款图像加速产品全部斩获大客户
1.全球最快的JPEG2JPEG缩略图方案
该方案主要应用于手机云相册、云存储等领域,可提供高达20倍的算力(相较于CPU方案)。即对于相关业务的服务器集群,采用该方案后,用一台CPU服务器(配置一张AlveoU200加速卡),最高可替换20台同样型号的CPU服务器。完成同样功能和算力的服务器集群可缩减10倍功耗。它的出现大大降低了数据中心的采购成本、运营成本。同时,服务器的服务响应时延可降低到之前的5%,并且可实时配适各种手机终端型号、尺寸,极大地提升客户体验。
2.超高性能的JPEG2WebP转码方案
由于WebP相较于JPEG格式可节省额外25%—34%的数据空间,为了进一步节省网络流量和数据存储,目前在业界已经广泛、大规模的使用了WebP格式。不过,由于算法复杂度很高,WebP的编解码运算是个沉重的负担。作为超高性能JPEG2WebP转码方案,ThunderImage JPEG2WebP(M4)具有10倍加速比(相较于2U的E5-2680v4)。即用一台2U的E5-2680v4服务器(配置一张AlveoU200加速卡),采用该方案最高可替换10台同样型号CPU的服务器。与此同时服务响应时间缩减9倍,客户体验明显提升。
“在行业内WebP应用的领域非常广泛,如电子商务、社交媒体、新媒体、视频媒体都有大量的应用,ThunderImage JPEG2WebP将会有非常惊人的部署量,它也许会改变人们对于图像处理的认知。”深维科技创始人、CEO樊平如此评价。
3.世界级超高密度算力的JPEG2JPEG缩略图方案
ThunderImage JPEG2JPEG U50是基于赛灵思Alveo U50加速平台的最新产品。在相同的物理空间下,1张Alveo U200的空间等于2张Alveo U50的占用空间,此方案将提供最高24倍的加速比,即对于相关业务的服务器集群,用一台CPU服务器,采用该方案最高可替换24台同样型号的CPU服务器。而由于Alveo U50的HBM高带宽能力,该方案的响应时延缩短为CPU的4%。从数据来看,对于高算力密度的缩略图生成集群,ThunderImage JPEG2JPEG U50是世界级超高密度算力的解决方案。
据樊平透露,由于三款产品的独特优势,深维科技目前已经与6家国内外知名互联网企业就上述三款新产品达成合作意向,并有多家企业明确表示具有浓厚兴趣,正处于合作洽谈阶段。
图像处理领域的公认最佳实践:FPGA异构计算
根据有关数据和研究结果,自2005年以来,尤其是近几年,摩尔定律逐步加速放缓。而随着移动互联网、大数据、5G应用、物联网、AI应用的飞速发展,数据中心的算力需要也随之而爆发。
数据中心如何在摩尔定律失效的情况下提升算力,从而满足日益暴增的业务处理需要,已经成为其面临的重大挑战。目前业界主流的算力提升方案无外乎以GPU、FPGA和ASIC为核心的异构计算方案。
由于GPU、FPGA和ASIC各自算力特性不同,因而在处理不同的计算类型、计算场景时拥有各自优势。GPU属于冯诺依曼结构,具有高并发、高灵活性的特点,但也存在能耗高、实时性差的缺点。ASIC和FPGA则在能效上略胜一筹,主要因为其体系结构无指令、无需共享内存。ASIC是为了某种特定需求专门定制的芯片,体积小、功耗低、计算性能和效率高,但其算法调整难度极高,适合算法固定、应用规模化的计算场景。
FPGA介于两者之间,具有低延时、低功耗的特性,且可编程灵活性高、开发周期短,支持后期的调整升级。因此,FPGA具有得天独厚的优势,市场空间及潜力巨大,比如图像处理领域。正是基于这个判断,深维科技从建立伊始即专注于FPGA领域。深维科技创始人、CEO樊平说:“FPGA异构计算市场将会是一个千亿美元级的市场,未来深维科技将持续聚焦,深耕图像视频处理、大数据处理和高性能计算等领域。”
编程困难+设计复杂,FPGA应用的“罩门”
尽管FPGA优势明显,市场空间巨大,但实际应用却有相当高的技术门槛:其一,编程困难,鉴于RTL编程复杂低效,HLS设计又不够成熟,编译时间漫长且调试困难;其二,硬件系统设计复杂,目前异构计算体系复杂需要定制软件栈。因此,行业内通常所认知的FPGA应用的开发周期是以“年”计,还要面临最终产品性能不理想的风险。这都导致很多科技公司对FPGA“望而却步”。
而深维科技作为“后起之秀”,却优雅地解决了这两个难题,在不到一年的时间内,以分别顺序成功推出三款图像加速的颠覆性产品,平均每款产品的研发周期不到3个月。
深维科技:基于Vitis的高层次FPGA设计方法的典范
产品研发速度快,效果好,深维科技是怎么做到的?
樊平认为,原因有三。一是团队强大EDA及相关技术背景,使得FPGA应用开发举重若轻;二是自研EDA辅助工具,在极端情况下可发挥关键作用;三是依靠团队的高效组织和昂扬斗志。
以团队基因而言,深维科技的核心技术成员交叉覆盖图像视频应用算法和FPGA核心技术,团队多来自于Cadence、IBM、微软研究院、京微雅格、中科院、复旦微电子等,对行业的理解以及产品工程能力较有优势,在FPGA芯片架构设计与评估技术、FPGA EDA工具算法、高性能算法等方面具有深厚的积累。
而由于核心团队对于FPGA芯片架构和EDA工作机制有着深刻的理解,在开发过程中,首先采用基于C/C++语言开发,一方面可以支持更大规模算法,另一方面提升芯片架构的灵活性,让改动周期缩短;其次,采用自研开发工具,包括FPGA设计工具、调试工具、标准化专用系统设计工具等,保障了产品的性能。
此次XDF大会上,赛灵思FPGA软件开发副总裁Dan Gibbons在Vitis开发者与生态的专题报告里,以深维科技作为成功案例,详细介绍了深维科技的产品与技术,高度评价了深维科技的图像处理产品性能,称“深维科技很好的示范了基于Vitis的高层次FPGA设计方法”。
赛灵思FPGA软件开发副总裁Dan Gibbons于XDF2019
“目前来看,我们的研发效率和效果在业内已经处于明显的领先地位,图像处理产品已经得到了很多客户的认可。未来,我们将根据产品计划,分批次推出更为重磅的视频处理分析方案、高性能计算方案和大数据方案。”对于新产品、新未来,樊平充满信心。
在FPGA图像加速领域,深维科技已经跨入了发展的快车道。未来,能否在该领域持续保持领先优势,并不断开拓新领域,我们拭目以待!