英偉達和軟銀聯手 要打造日本最強大AI超算
來源:倍可親(backchina.com)
11月13日,在日本舉行的2024年AI峰會上,英偉達與軟銀公布了一系列合作計劃,旨在加速日本主權AI項目( Sovereign AI,即國家層面的AI基礎設施)的發展,並強化英偉達在全球的技術領先地位,同時為全球電信行業帶來數十億美元的新收入。
英偉達創始人兼CEO黃仁勛在主題演講中透露,軟銀正利用Blackwell平台構建日本最強大的AI超級計算機,並計劃在未來升級至Grace Blackwell平台。
同時,英偉達宣布,軟銀已成功利用NVIDIA AI Aerial平台,實現了全球首個AI與5G電信網路的融合試驗,這一突破將為電信運營商開闢數十億美元的新收入渠道。
此外,英偉達與軟銀還共同宣布,將藉助NVIDIA AI Enterprise軟體,打造滿足日本本土安全AI計算需求的市場。這一新服務將支持AI培訓、邊緣推理等功能,幫助軟銀成為日本AI網格的核心,為各行業、消費者及企業創造、分發和使用人工智慧服務的新商機。
黃仁勛表示,此次與軟銀的合作將推動日本邁入AI產業革命,引領電信、交通、機器人及醫療保健等行業的新增長時代。
軟銀總裁兼CEO宮川潤一則強調,全球正加速採用AI促進社會發展,軟銀與英偉達的長期合作將助力這一轉型。憑藉強大的AI基礎設施及創新的分散式AI-RAN解決方案「AITRAS」,軟銀將重塑5G網路,加速全球範圍內的創新步伐。
軟銀將首次接收Blackwell
軟銀即將接收全球首台英偉達DGX B200系統,此系統將成為其新型NVIDIA DGX SuperPOD超級計算機的核心構建模塊。
軟銀打算利用這台由Blackwell驅動的DGX SuperPOD,不僅推動自身的生成式AI研發及AI相關業務,還將支持日本各大學、研究機構及企業的AI需求。
預計建成后,軟銀的DGX SuperPOD將成為日本性能最卓越的超算系統。它配備了NVIDIA AI Enterprise軟體和NVIDIA Quantum-2 InfiniBand網路,特別適合開發大語言模型。
除了DGX SuperPOD,軟銀還規劃了另一台專註於高計算密集型任務的超級計算機。該計算機初步計劃基於NVIDIA Grace Blackwell平台構建,並融合NVIDIA GB200 NVL72多節點、液冷、機架級系統,將NVIDIA Blackwell GPU與高效的Arm架構NVIDIA Grace CPU完美結合。
AI-RAN實現新的里程碑
軟銀與英偉達密切合作,實現了一個技術里程碑——研發出一種能兼顧AI與5G工作負載的新型電信網路,業界稱之為AI無線接入網路(AI-RAN)。這一創新基礎設施廣受電信行業生態系統青睞,因其助力運營商將基站從成本負擔轉變為AI創收資源。
在日本神奈川縣的戶外試驗中,軟銀驗證了其基於英偉達加速的AI-RAN方案已達成運營商級別的5G性能,並能在利用網路剩餘容量的同時,順暢運行AI推理任務。
傳統電信網路為應對高峰時段而設計,但平均利用率僅達三分之一。而AI-RAN所具備的通用計算能力,預計能讓電信公司有機會將剩餘的三分之二容量轉化為AI推理服務,實現商業化。
據英偉達與軟銀估算,電信運營商在新AI-RAN基礎設施上每投入1美元資本支出,有望獲得約5美元的AI推理收入。綜合考慮運營成本與資本支出,軟銀預測,每增設一台AI-RAN伺服器,其基礎設施的回報率最高可達219%。