2025年英偉達開發者大會如期召開。
相比2024年公司股價氣勢如虹、市值突破3萬億美元,今年英偉達需要面臨更多算力需求質疑,股價走低。在美國時間3月18日主題演講中,英偉達CEO黃仁勛強調AI推理時代算力需求更加旺盛,并推出新一代AI芯片以及配套系統、硅光網絡交換機等新品,亮相首款推理模型、首款人形機器人模型、首個推理軟件等,全面備戰人工智能推理時代。
不過,會后英偉達股價下跌3.4%,報收115.43美元/股;3月19日開盤,A股光通信、算力板塊走弱。
算力規模增長將超百倍
自從DeepSeek證明采用極低的算力成本可以進行模型開發后,就引發了市場對算力需求是否持續的質疑,全球算力總龍頭英偉達股價從1月下旬大跌。英偉達官方及黃仁勛就曾在多個場合表示,DeepSeek主要在模型推理上運用了創新技術,而AI推理依然需要大量英偉達GPU和高性能網絡。
本次開發者大會上,黃仁勛大方承認,人工智能行業在模型訓練上的整體需求放緩,不過,他強調DeepSeek在模型推理上的創新,AI推理時代即將到來,Scaling Law法則對規模的要求不僅不會變小,反而會進一步擴大。
Scaling Law(擴展定律)是人工智能領域的核心理論,指模型性能與參數規模、數據量、計算資源之間的正相關關系。這項定律長期以來也被黃仁勛奉為圭臬,以打造AI算力帝國。
黃仁勛表示,當前從生成式AI發展到Agentic AI(智能體),最終到物理AI(Physical AI)是行業新的發展方向。在生成式AI階段,“Scaling Law”法則集中體現在模型訓練的預訓練環節;而在Agentic AI階段,由于其強調自主性與復雜問題解決能力,每一步邏輯思考過程都需要“模型推理”,推理將成為核心動力。
他預測,推理所需算力需求規模增長能“輕松超過去年估計的100倍”,未來行業需要更多、性能更強的AI芯片,數據中心建設的投入到2028年將達到1萬億美元。
本次演講中,黃仁勛重點展示了英偉達“護城河”CUDA-X庫生態系統最新概況,涵蓋了從物理學、生物學,到量子計算等各個科學領域,以及海量軟件庫,構建起AI軟件基礎設施,通過“軟硬一體”的戰略,降低AI開發門檻,加速AI應用的落地。
下半年推出下一代架構
相比以往,本次發布會上,英偉達錨定AI推理需求,推出專為AI推理打造的NVIDIA Blackwell Ultra GPU。相比上一代B200 GPU,它性能提升50%,基于低精度的四位浮點數格式FP4標準算力約為15P FLOPS,內存從192GB提升到288GB,搭載業內最先進的HBM3e。在此基礎上,HGX B300 NV16運用NVLink高速互聯網絡連接8個Blackwell Ultra GPU,在大模型推理速度上相較于上一代Hopper架構提升了11倍。
黃仁勛表示,Blackwell已經在全力生產中,客戶需求量非常龐大。Blackwell的核心目標是構建“AI工廠”,如同工業革命時期的工廠一樣,AI工廠將大規模生產Token(詞元,人工智能的基本構成單元),驅動各種智能應用。
面向企業部署AI的產品線方面,英偉達推出了采用Blackwell Ultra芯片的工作站DGX station以及DGX Spark。據介紹,今年下半年,預計思科、戴爾、惠普、聯想和超微將率先推出基于Blackwell Ultra的服務器;浪潮旗下Aivres、華擎機架、華碩、富士康、技嘉、英業達、和碩、廣達、緯創和緯穎等硬件制造商也將提供Blackwell Ultra服務器解決方案。
從去年開始,英偉達芯片架構更新周期從兩年加速到一年。最新芯片路線圖顯示,英偉達將在2026年下半年推出基于下一代Rubin架構的Rubin GPU,算力性能約是Blackwell Ultra GPU的3.3倍;2027年下半年推出Rubin Ultra GPU,在相同標準下算力為100P。兩款產品將采用HBM4、HBM4e先進AI內存。到2028年,英偉達還將推出新一代Feynman架構產品。
另外,英偉達推出首款開源模型推理軟件Dynamo,大幅提高開源模型的推理效率。據介紹,在GB200 NVL72機架組成的大型集群上運行DeepSeek-R1模型時,Dynamo能將每個GPU生成的Token數量提高30倍以上,處理同樣推理任務速度快30倍。
打造物理AI引擎
隨著AI數據工廠規模的擴張,網絡基礎設施也需要同步徹底革新。
本次發布會上,英偉達還發布兩款硅光網絡交換機,分別是適用于企業網絡的NVIDIA Spectrum-X和適用于專用計算集群的NVIDIA Quantum-X。這兩款產品首次利用“光電共封裝技術”(CPO)將光通信直接集成到交換機上,是英偉達商用化硅光交換機產品。英偉達希望通過將硅光子技術直接集成到交換機中,突破超大規模和企業網絡的傳統限制,為目前萬張、十萬張GPU的數據中心向百萬張GPU的AI工廠過渡奠定基礎。
黃仁勛表示,圍繞云、企業以及機器人,英偉達分別打造了“AI基礎設施”。機器人作為具身智能載體,英偉達推出了生成機器人訓練數據的物理世界模型Cosmos、人形機器人基礎模型GROOT N1以及3D實時仿真平臺Omniverse;
其中,本次新推出的GROOT N1是通用機器人基礎模型,也是全球首款開源的人形機器人功能模型。該模型采用雙系統架構,建立在合成數據生成和模擬學習的基礎上,能模仿人類認知,具備“快思考”和“慢思考”能力,可讓機器人實現抓取、操作和使用工具等動作,開發者還能用自己的數據對其進行微調。另外,英偉達利用Omniverse平臺來調節Cosmos生成模型,通過集成物理引擎和GPU加速技術,實現虛擬環境的無限擴展和精確控制,利用合成數據解決機器人訓練的數據問題。
面向機器人仿真,英偉達聯合谷歌DeepMind和迪士尼研究院共同開發打開源物理引擎Newton,用于模擬人工智能、機器人和機器學習。在演講現場,名叫Blue的機器人上臺露面,與黃仁勛互動,該機器人配有英偉達最新的GR00T N1機器人通用基礎模型。
本次開發者大會上,英偉達對量子計算的態度發生轉變,宣布將在波士頓建設NVIDIA加速量子研究中心(NVAQC)。據介紹,NVAQC將使用最先進的英偉達GB200 NVL72機架級系統以及CUDA-Q量子開發平臺,幫助實現量子系統的復雜模擬,開發新的混合量子算法和應用程序。
去年谷歌發布的Willow芯片攻克困擾量子計算研究30年的“量子糾錯”難題,市場升溫帶動量子計算概念股股價上漲;今年2月,微軟宣布推出全球首款拓撲量子計算芯片Majorana1,驗證了拓撲量子比特的可行性,也被視作為未來規模化應用奠定了基礎。而黃仁勛曾在今年1月表示要造出“非常有用的量子計算機”,可能需要20年。該評論導致量子計算相關股票應聲下跌。
對于市場擔憂量子計算顛覆性影響,黃仁勛表示,量子計算不會單獨取代現有的計算技術,而是作為AI計算能力的補充。未來的量子計算將成為AI超級計算機的“增強工具”,在藥物開發、新材料制造等特定高復雜性領域發揮作用。