在英伟达GTC年度大会上,英伟达(NVIDIA)发布了全新处理器 DPU(Data Processing Unit,数据处理单元),并将其定位为数据中心中继CPU、GPU之后的“第三颗主力芯片”,正式将DPU这一概念推向时代潮头。
放眼国内各家DPU芯片研发厂商,中科驭数(北京)科技有限公司(以下简称:中科驭数)率先于2019年流片了业内首颗数据库和时序数据处理融合加速芯片“DPU-K1”,现已为华泰证券、中泰证券、上交所等头部证券企业输出成熟的产品及硬件加速解决方案。
此外,创业邦还获悉,中科驭数将在2022年面向市场推出性能强化、带宽及协议格式更加丰富的“DPU-K2”芯片。
01随着摩尔定律放缓,通用CPU性能增长的成本迅速上升,但整个网络带宽的增长却不断加速,这在国内金融、云计算、数据中心等场景下尤为常见。
这些场景下的网络带宽正在从主流的10G朝着40G、100G甚至400G发展,带宽和节点的剧增使得数据的通路更宽、更密,处于端、边、云各处的计算节点直接暴露在了剧增的数据量下,使得CPU的性能增长率与数据量增长率出现了明显的“剪刀差”现象,CPU难以直接应对庞大数据计算负载。
DPU作为给CPU“减负”的帮手,主要作用在于卸载CPU部分算力并释放到上层应用中,支持存储、安全、服务质量管理等基础设施层服务,帮助使用者获得超高性价比的算力,有效克服通信延迟,提升数据安全水平。
据《中国数据处理器行业概览系列短报告》数据研究预测,仅在DPU应用需求最大的云计算领域,2025年中国DPU市场的容量有望达40亿美元,而当前DPU应用较为广泛的金融、电信领域更有望在短期内支撑起一个百亿规模的市场,规模十分可观。
02中科驭数成立于2018年,孵化于中科院计算所计算机体系结构国家重点实验室,是一家专注于专用计算架构研发的硬科技企业,致力于解决后摩尔定律时代通用算力不足的核心问题,为智能计算提供DPU芯片和解决方案。
在创立之初,中科驭数便提出了“软件定义加速器”的技术路线,并研发专用技术芯片架构——KPU(Kernel Processing Unit,核处理器)。
这是一种专为加速特定领域核心功能计算而设计的一种协处理器架构,以功能核作为基本单元,具备超强异构核集成和调度能力。
一颗KPU根据需求可以集成数十至数百个功能核,可直接对应用中的计算密集型应用进行抽象核和高层综合,实现以数据为中心的架构“定制”,灵活性极高,在保障充沛算力的同时以最低功耗支撑更多运算负载类型。
据中科驭数创始人&CEO鄢贵海介绍,在运行机制上,KPU采用“数据驱动并行计算”的方式,通过运行过程中的数据流来激活不同的功能核进行相应计算。另外,“软件定义”的方式也可让用户灵活建立“功能核”与应用层运算间的关系,满足“一对一”服务需求,保证计算效率。
基于这一专用技术芯片架构,中科驭数推出DPU芯片产品——DPU-K1。该产品在业内率先支持网络数据库一体化加速功能,除传统的网络协议处理及相关应用卸载,DPU-K1还涉及芯片级别的运算功能,用于承载数据库及大数据处理中的核心运算负载,具备高效能算力。
中科驭数DPU芯片实物图
这一芯片主要是针对序列数据处理及大数据分析而设计,集成了序列卷积tscov、序列滤波tsfir、序列距离tsdist、序列相似tsdtw等20多类功能核,在超低延时智能网卡、大数据处理、风控等应用领域,可较传统软件解决方案实现超两个数量级的性能提升,与DPU-K1拥有相同功能的FPGA版本芯片现已实现量产出货。
除此之外,中科驭数还增加了大数据处理引擎和查询加速引擎,这也是现在DPU厂商比较关键的技术点,且包含部分定制化加速单元,基本构建起来整个DPU的框架,在此基础上中科驭数继续做加法和整合、不断迭代,也为DPU-K2系统的设计奠定了基础。
03目前,市面上做DPU研发的除了芯片公司,还有互联网巨头入局,如AWS的Nitro,阿里云的MOC卡等。出于匹配自身上层负载需求,互联网巨头的“造芯”往往具有一定的封闭性,有的重视存储卸载,有的强化IO能力,还有的关注路由转发,对这部分“造芯”势力而言,DPU的标准化道阻且长。
中科驭数将自身定位于一家芯片设计公司,致力于研发泛行业的DPU产品,从设计阶段就尽可能地标准化,尝试对接开放系统,实现更广泛的网络协议加速和查询加速,而非适应单一的内部封闭系统需求。这在中科驭数第二代芯片产品DPU-K2上得到了很好的体现。
DPU-K2芯片较上代产品得到多重强化,以异构众核为基础实现了以数据为中心的高性能DPU架构。该芯片在数据平面集成了四类KPU处理引擎,以数据为中心,集成自研FlashNOC?流式片上互联架构,可实现数百个处理核互联,在2TB/S数据带宽下保证零阻塞数据传输。
在控制平面,该芯片集成了多核ARM Cortex-A72通用处理器核,为用户提供以Linux操作系统为基础良好编程性的开发环境,并搭载驭数自研LightningDMA?底层驱动程序,可实现控制平面与数据平面超低延时交互。
DPU-K2还搭建了DPU KOS运行时系统,对DPU各资源进行动态监控,在控制平面实现了完备的安全控制,以高性能的规则引擎支持金融、电信、边缘计算及数据中心等场景。该款芯片预计将于2022年完成流片,并逐步投入测试生产。
042021年,中科驭数还面向市场推出了专用计算敏捷异构软件平台HADOS,这也是中科驭数整合行业需求、支持异构计算更多应用的前端标准化平台。
鄢贵海介绍:“DPU-K1在为客户提供应用时并没有完整的中间件,为了把我们的方案放进去,就要从驱动开始做SDK,为客户做软件的开发平台、数据库,最后还要去移植他们上层的应用协议,做风控时还要用数据库的前端GDBC和ODBC,中科驭数现将这些功能水平整合,并按照不同的层次、客户的上层应用来做分流,推出了HADOS。”
HADOS集成中科驭数在领域专用计算架构、专用处理器研发及相关产品和应用经验,可支撑DPU芯片及其他异构计算硬件平台算力输出,兼容标准软件应用生态,大幅降低以KPU架构和DPU芯片为核心的应用软件开发难度。
基于HADOS软件开发平台,客户可以通过自有软件团队,快速开发包括DPU芯片等异构算力在软件定义网络、软件定义存储、虚拟化IO、安全、大数据运算等计算基础设施方向上的应用,大幅提升系统性能和效率,提升系统易用性,平台现已配合DPU芯片产品投入使用。
05商业模式上,中科驭数为客户规划DPU产品解决方案,提供硬件产品、软件配套,并帮助客户做应用导入。公司整体上采用垂直行业深耕的打法,扎实服务于金融、证券客户,并已覆盖华泰证券、中泰证券等前20大券商。
2021年中科驭数开始拓展电信及泛金融领域客户,承担部分政府项目,B端客户的平均项目交付周期为9个月左右,2022年有望控制在4个月以内。
中科驭数团队现有成员百余人,其中研发人员占比近90%,核心成员来自于中科院计算所体系结构国家重点实验室,在异构计算方面积累深厚。
鄢贵海本人担任中科院计算所研究员、博士生导师,主要研究专用计算机体系结构,在容错计算、可定制计算、软件定义加速器等方向取得一系列研究成果。
截至目前,中科驭数已布局发明专利130项,其中已获得66项发明专利授权,公司还获得多项软件著作权和集成电路布图产权保护。
融资方面,中科驭数现已完成A轮融资,历史投资方包括华泰创新、国新思创、中科创星和灵均投资,多家股东连续多轮注资。
接下来,中科驭数将以金融计算加速作为抓手,面向数据中心、电信运营商等客户类型,不断推进DPU方案的应用落地,并与中科曙光等生态伙伴合作,在产品适配后进一步拓宽客户渠道,逐渐帮助更多信创产业客户、政府客户等解决或协助解决算力难题。