當全球聚焦NVIDIA在AI領域的霸主地位時,這位晶片巨頭正面臨高效能運算(HPC)領域的嚴峻挑戰。最新TOP500榜單顯示,Blackwell架構的FP64運算效能竟未超越前代Hopper,這讓HPC用戶擔憂是否遭到冷落。
在近期SC25國際會議上,知名學者直指從Hopper到Blackwell架構的轉變中,NVIDIA的FP64運算能力實際上沒有明顯提升。尤其當Blackwell B200的64位元Tensor Core效能甚至不及前代H200,讓許多進行氣候模擬、材料科學研究的機構仍傾向選購舊款H100/H200系列。
數據會說話:最新B300 Ultra Blackwell顯示卡僅有可憐的1 teraflop FP64效能,比五年前的A100還不如。這顯然反映NVIDIA正將資源集中在符合AI需求的FP4低精度運算——Blackwell架構在這方面能爆發14 petaflops的驚人效能。
NVIDIA資深高層Dion Harris緊急滅火表示:『FP64仍是我們的核心技術』,強調精準模擬運算對訓練AI代理模型至關重要。該公司更預告將在GTC 2026大會揭露下代架構的64位元效能強化方案。
HPC專家則提出技術解方:透過cuBLAS函式庫模擬高精度環境可彌補部分效能缺口。但就像過去從向量處理器轉向分散式運算的變革,這需要時間讓程式模型適應。
值得玩味的是,當NVIDIA市值突破5兆美元之際,該公司會否為市占率較小的HPC市場犧牲AI晶片的發展動能?這場精準度與效率的拉鋸戰,明年三月即將揭曉。
手機巴士






