5月20日,在2026阿里云峰會上,阿里發(fā)布基于平頭哥新一代AI芯片真武M890的128卡超節(jié)點服務(wù)器,搭載互聯(lián)芯片ICN Switch 1.0,通信時延低至百納秒級,可讓128張AI芯片組成一臺計算機,滿足海量Agent并發(fā)推理和大模型訓(xùn)練需求。
Agentic時代,算力集群需要承載成千上萬個Agent同時運行,每個Agent在一次任務(wù)中可能連續(xù)發(fā)起數(shù)十次模型調(diào)用,這對通信時延和帶寬有極高要求。磐久AL128超節(jié)點服務(wù)器基于自研AI芯片和互聯(lián)芯片打造,通過單機柜128卡緊密耦合互聯(lián),P2P時延低于150ns,單柜帶寬達到Pb/s級,可支海量Agent的并發(fā)請求。該超節(jié)點服務(wù)器已上線阿里云百煉,支持Qwen、DeepSeek、Kimi等主流模型。
據(jù)介紹,首次亮相的真武M890采用自研并行計算架構(gòu),內(nèi)置144GB顯存,性能是真武810E的3倍,片間互聯(lián)帶寬達到800GB/s,芯片原生支持FP32到FP4等多種數(shù)據(jù)精度,可應(yīng)用于高精度訓(xùn)練、低精度和超低精度推理的全場景,低精度推理場景下,不僅可以保證模型輸出質(zhì)量,還能顯著降低單次推理的算力開銷。
平頭哥互聯(lián)芯片ICN Switch 1.0支持自研ICN互聯(lián)總線協(xié)議和PCCL通信庫,吞吐量達25.6Tbps,可支持真武M890的高效互聯(lián),提升AI集群的算力效率。真武M890搭配ICN Switch1.0芯片,可實現(xiàn)64卡全帶寬互聯(lián),顯著提升大規(guī)模智算集群計算的效率與穩(wěn)定性?;谄筋^哥自研T-Head SAIL軟件棧的軟硬協(xié)同,可最大程度釋放芯片的算力。
大會現(xiàn)場,平頭哥首次公布真武系列芯片的規(guī)劃,未來兩年將陸續(xù)推出算力更強的真武V900、真武J900兩代芯片,以滿足Agentic時代千行百業(yè)的AI算力需求。目前,真武系列芯片已累計出貨56萬片,服務(wù)了中國電信、中國一汽、浦發(fā)銀行等20多個行業(yè)的400多家客戶。
隨著Agent應(yīng)用的爆發(fā),AI的核心任務(wù)逐漸從純對話轉(zhuǎn)向任務(wù)執(zhí)行,這不僅需要高AI算力支撐,其任務(wù)規(guī)劃、狀態(tài)管理、工具調(diào)用等環(huán)節(jié)極其依賴CPU,CPU成為影響Agent執(zhí)行效率的關(guān)鍵部件。平頭哥擁有自研的服務(wù)器CPU倚天系列,可與真武AI芯片高效協(xié)同,大幅提升AI推理效率,有效應(yīng)對Agent高并發(fā)任務(wù)的負(fù)載壓力。
目前,平頭哥已推出真武系列AI芯片、倚天系列Arm服務(wù)器CPU、磐脈系列智能網(wǎng)卡、鎮(zhèn)岳系列存儲主控芯片、ICN Switch互聯(lián)芯片等數(shù)據(jù)中心核心芯片,實現(xiàn)算力、網(wǎng)力和存力的全棧自研。
曉風(fēng)
校對 吉啟雷