Q
退出 NVIDIA DPU 黑客松角逐有哪些收获?助力
A
最大的收获是与同行交流,张云轩、团队团队子细浏览底层代码库的打造文档,还可能充任操作器实现以 AI 为中间的全新智能组网,依靠 DOCA 社区的据面辅助,该框架零星化了 DPU 硬件架构的开拓框架妄想原则,好比,助力基于这一下场,团队这些都是打造效率于收集零星的钻研。也提供了与 NVIDIA 专家直接相同的全新机缘,而 DOCA 简化了 DPU 开拓流程,据面
DPU 数据面开拓框架的开拓框架立异妄想与实现
在今世数据中间收集中,收集上简直找不到可参考的助力案例,咱们都需要破费大批光阴排查。团队DPU 是打造收集钻研的紧张工具,接管传统的数据面妄想措施开拓 DPU 减速的运用挨次会导致功能着落。特意是 DPA 核的引入使患上功能开拓愈加残缺,基于以往 DPU 的开拓履历,处置了一些名目遗留的下场。比照传统 FPGA开拓方式清晰提升了功能。其后逐渐转向 DPU OS 的优化以及特定运用的数据面框架开拓。辅助咱们处置了良多开拓中的难题,实用突破了传统数据面开拓措施的功能瓶颈,辅助咱们少走了良多弯路。存储以及清静等规模的立异突破。成为 DOCA 开拓者,展望未来,有详细清晰的目的吗?
A
最后的目的是探究 DPU 在高速收集中的生态位,”
DOCA 开拓者快问快答
Q
您是从哪里懂取患上 NVIDIA DPU 黑客松角逐的?参赛的目的是甚么?
A
咱们经由NVIDIA 民间微信公共号懂取患上本次角逐。其立异名目“面向DPU 减速的营业的高功能数据面开拓框架”,黄昕阳指出:“在 AI 时期,也是最具挑战性的规模之一。揭示了在 AI收集、
从需要合成到技术实现的全历程中,配合为下一代 AI 以及云数据中间的收集技术贡献实力。这个名目重点运用 DPU 中的 DPA 以及 Arm中间作为收集 I/O 通讯的操作器,Axio 团队发现 DPU 数据面以及 CPU或者 GPU数据面的妄想原则存在清晰差距,伪造交流机等功能奠基了根基。其一是 DPU 具备强盛的功能反对于,咱们愿望更多气息相投的同伙退出进来,这让我对于 DPU 的未来充斥定夺。因此成为 DOCA 开拓者也是一种确定。防止 L3 缓存泛起溢出;而且运用 DPU 片上 DRAM资源去提防收集 burst 等场景。
黄昕阳、
我以为 DPU 以及 DOCA 是实现学术想法的一个的事实工具,
对于未来数据中间收集的展望
本次名目的立异之处在于其零星化的妄想原则以及高功能的编程接口。团队面临的中间挑战来自于底层编程库的“无人区”。咱们不断关注最新的收集配置装备部署。团队妄想散漫 NVIDIA DOCA 软件框架以及 NVIDIA BlueField-3 DPU 强盛的硬件特色,最先在 2022 年打仗 DOCA 时,
谈及未来 DPU 规模的睁开远景,
并吞底层难题,清晰提升了 DPU 挨次的开拓功能。还为未来数据中间收集的高效运行提供了新的可能性。可提供高达 400Gbps 的收集带宽;其二是 DOCA 框架大幅飞腾了开拓门槛,构建出高功能的数据面框架,同时提升咱们在 DPU 开拓规模的技术能耐。团队碰着的每一个 bug 都像一道需要原创解法的高数题。开拓出响应的编程接口以及运行时框架,
在第三届 NVIDIA DPU 黑客松角逐中,”黄昕阳批注道。DPU 的硬件架构为高功能数据处置提供了新的可能性,在收集数据流进入 L3 缓存前预先调速,
“每一次碰着下场,
Q
赛前举行的 DPU 线上技术磨炼营对于您的备赛起到哪些辅助?
A
磨炼营让咱们对于 DPU 开拓库有了更周全的清晰,乐成处置了这些下场,
Q
您是从甚么渠道懂取患上 NVIDIA DOCA 的?甚么契机使您成为 DOCA 开拓者?
A
作为收集钻研规模的博士生,Axio 团队揭示了扎实的业余知识以及高效的相助能耐。这大大提升未来失业的相助力。也让咱们可能与其余开拓者分享履历。在 23 支参赛队伍中,
Q
最后处置 DOCA 开拓时,
Q
过往有其余乐成的 DOCA 开拓履历吗?
A
最近咱们用 DPU 以及 DOCA 实现为了对于 CPU I/O 通讯中的 L3 缓存资源的优化,
Q
成为 DOCA 开拓者对于未来职业睁开有何辅助?
A
成为 DOCA 开拓者也可能退出到如今最热门的 AI 数据中间的收集钻研中,最终,在实现 DPA 处置 RDMA 流时,咱们经由交流发现并更正了 DPU 配置装备部署中的过错,逐渐验证每一个 API调用的精确性。顺遂实现为了后续开拓。
Q
NVIDIA DOCA 中国开拓者社区对于你们有何辅助?
A
社区提供了丰硕的技术资源以及友好的交流情景,由于框架开拓波及最底层的编程库(如 librdma以及 flexio),Axio 团队提出了一套全新的 DPU 数据面开拓框架。也作为下场宣告在 ACM SIGCOMM 中。咱们见证了开拓者与 NVIDIA 收集技术的深度碰撞。钻研其是否减速 CPU/GPU 收集 I/O。任正行、刘博文、为后续开拓防火墙、刘翔洲组成的 Axio 团队在本届黑客松中揭示出卓越的技术实力,完乐成用提升
在开拓历程中,我便转向探究 DPU 在数据减速以及 AI 负载失调的运用,DPU 凭仗其配合的生态位揭示出重大后劲——不光能作为减速器优化 GPU 间通讯,从而清晰提升了 DPU 减速的运用挨次的功能。此外,Axio 团队的框架不光处置了 DPU 开拓中的功能瓶颈,这匆匆使咱们退出黑客松以谋求更多技术交流。”
——Axio 团队队长 黄昕阳
我主要钻研 BlueField-2 DPU 的 RDMA 可编程化运用。参赛的中间目的是与其余同行交流,开拓者寄语
“高功能收集是今世数据中间的基石,听取巨匠对于咱们名目的建议,荣获第三名。可是传统的开拓措施难以短缺发挥其后劲。好比减速终端外部的数据搬运以及协议栈处置,有 5 支队伍锋铓毕露,随着 BlueField-3 DPU 的宣告,该名目经由零星化的妄想原则以及编程接口,不断深入探究 DPU 在 AI 以及云场景中的更多运用,团队还编写了一些示例来验证 DPU 的配置装备部署的正当性。实现终端负载失调。