英国初创公司Oriole发布全球首个面向AI的全光子网络Prism
光纤在线伦敦讯,总部位于伦敦的光子系统初创公司 Oriole Networks 14r日宣布推出其 PRISM(可扩展模型光子路由基础设施)解决方案。PRISM 是全球首个专为数据中心、高性能计算(HPC)和分布式深度学习(DDL)工作负载设计的纯光子交换网络。
在当今的人工智能训练和推理系统中,拖慢速度的并非计算硬件,而是内存和网络。尽管计算能力有了巨大飞跃,但实际性能往往会遇到瓶颈,由于网络瓶颈,仅能实现峰值性能的一小部分。
PRISM 通过更高的吞吐量、更低且可预测的延迟、更短的完成时间和更低的功耗来解决网络瓶颈问题。该架构集成了物理网络、人工智能通信模型和调度逻辑,消除了网络瓶颈,确保以最小的开销实现最高性能。它是一种全栈全光架构,旨在以高速和简便的方式大规模连接 xPU。
PRISM 具有以下几个关键特性:
处理任意流量:结合纳秒级交换和跨时间、波长和空间的网络控制,实现快速电路配置。这允许光数据传输的快速突发,高效处理大数据和小数据传输。
真正的全连接:提供端口级的全到全通信,任何端点都可以连接到任何端点。
低功耗和低温:由于完全被动的互连和交换机,网络核心保持清洁和高效(不消耗功率或需要冷却)。复杂性大大降低,而所有控制都移到边缘。
设计上的弹性和可靠性:无单点故障。每个节点到其他每个节点都有多个路径,因此即使出现故障,通信也能继续。
可扩展:支持具有 1 跳直径的多达一百万个端点的系统,能够支持日益复杂和分布式的工作负载。
专为人工智能工作负载设计:为光电路交换网络量身定制的集体通信策略专用算法,实现无调度、无竞争的数据传输。这些操作即使在最大规模下也只需几个步骤即可完成,显著降低延迟,并确保 GPU 在通信过程中不会停滞。
PRISM 是一个全栈解决方案,包括:
软件栈:包括 xCCL 插件和 PCIe 驱动程序,可与 PRISM 网络栈无缝集成,替代集体通信库使用的默认传输层。
高性能网络接口卡:以紧凑的形式提供 800 Gbps 的带宽,适用于大多数标准服务器。
XTR - 集成光子交换机和收发器:动态处理波长和路由选择,从单个接口实现与多达一百万个节点的连接。
光子路由器:一种无源、模块化的光路由器,无需电源即可运行,适用于机架顶部和中央部署,提供双路径弹性。
PRISM 通过更高的吞吐量、更低的延迟和更低的功耗解决了网络瓶颈问题。它为下一代高性能数据中心提供了坚实的基础,帮助构建具有可预测性能的大规模人工智能基础设施。PRISM 将通过世界上第一个快速、节能的纯光子网络,释放下一代分布式人工智能训练和推理的潜力。
关于 Oriole Networks
在低碳世界中加速人工智能 ——Oriole Networks 是一家光子网络公司,为人工智能 / 机器学习和高性能计算网络开发颠覆性技术,将彻底改变数据中心。这些技术解决了人工智能最大的挑战 —— 速度、延迟和可持续性。我们的整体方法用光子交换取代了高能耗的电子交换。通过仅使用光在网络中传输数据,我们的解决方案将把大型语言模型(LLM)的训练和推理效率提高到前所未有的水平,同时大幅降低数据中心的能源消耗,目前数据中心的能源消耗给美国和欧洲的电网带来了巨大压力。我们可以在不牺牲地球的情况下提供更快、更高效、更可持续的人工智能。
信息来源:光纤在线
特别声明:文章转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。