隨著最新的AI芯片Blackwell GB200的訂單量攀升,英偉達(dá)股價(jià)也水漲船高。但這場(chǎng)AI盛宴的背后,AI算力市場(chǎng)卻呈現(xiàn)出“冰火兩重天”的景象。
自英偉達(dá)在今年3月發(fā)布Blackwell架構(gòu)GB200芯片以來,這款產(chǎn)品一直備受外界矚目。最近,天風(fēng)證券分析師郭明錤在研究報(bào)告中表示,英偉達(dá)GB200芯片訂單量激增,微軟是這款芯片最大的客戶,其第四季度的訂單量增長3-4倍,超過其他所有云服務(wù)商的總和。
在新一代AI芯片需求爆發(fā)的同時(shí),曾經(jīng)炙手可熱的H100芯片卻有些遇冷,在算力租賃市場(chǎng)的價(jià)格已由巔峰時(shí)期的8美元/小時(shí)降至2—3美元/小時(shí)。證券時(shí)報(bào)記者向業(yè)內(nèi)人士了解到,從今年上半年開始,國內(nèi)算力的價(jià)格就呈現(xiàn)下降趨勢(shì),在大模型訓(xùn)練需求有所下滑及早期“囤卡”導(dǎo)致供給相對(duì)過剩的背景下,一些規(guī)模較小的算力供應(yīng)商或?qū)⒚媾R虧損,正加速被市場(chǎng)“洗”出去。
值得注意的是,在AI大模型的浪潮下,多家A股上市公司此前已布局算力服務(wù),其中不乏跨界玩家。在風(fēng)起云涌的AI浪潮中,算力供給及市場(chǎng)需求情況瞬息萬變,相關(guān)投資是否能夠取得理想的回報(bào),正成為一個(gè)越來越不確定的問號(hào)。
GB200芯片訂單,未來一年已排滿
最近,摩根士丹利的分析師與英偉達(dá)首席執(zhí)行官黃仁勛、首席財(cái)務(wù)官及管理團(tuán)隊(duì)的其他成員舉行了一場(chǎng)會(huì)議。根據(jù)會(huì)議中得知的消息,分析師Joseph Moore表示,英偉達(dá)下一代GPU芯片Blackwell的生產(chǎn)正在“按計(jì)劃進(jìn)行”,且未來12個(gè)月左右的供應(yīng)已經(jīng)售罄。
天風(fēng)國際證券分析師郭明錤在最新發(fā)布的英偉達(dá)Blackwell GB200芯片產(chǎn)業(yè)鏈訂單信息也顯示,Blackwell芯片的產(chǎn)能擴(kuò)張預(yù)計(jì)在2024年第四季度初啟動(dòng),預(yù)計(jì)2024年第四季度的出貨量將在15萬到20萬塊之間,2025年第一季度出貨量將顯著增長200%到250%,達(dá)到50萬到55萬塊。郭明錤還指出,目前微軟是英偉達(dá)Blackwell GB200芯片的全球最大客戶,今年第四季訂單量將激增3至4倍,其訂單量將超過其他所有云端服務(wù)商的總和。
作為英偉達(dá)新一代的AI旗艦芯片,Blackwell GB200芯片包含了2080億個(gè)晶體管,采用臺(tái)積電N4P制程,為雙芯片架構(gòu),AI算力達(dá)20petaFLOPS(FP4),是Hopper的5倍。據(jù)國海證券研報(bào),與上一代AI旗艦芯片H100相比,英偉達(dá)主打的GB200NVL72服務(wù)器可將AI大模型訓(xùn)練速度(如1.8T參數(shù)GPT-MoE)提高30倍。
手握高性能的AI芯片,來自各大客戶的訂單也紛至沓來。黃仁勛曾在CNBC的欄目訪談中提到,微軟、OpenAI、Meta等科技公司對(duì)Blackwell芯片的需求十分強(qiáng)烈,“每個(gè)人都希望擁有最多,也希望成為第一”。
“Blackwell GB200芯片需求爆發(fā),不僅預(yù)示著英偉達(dá)在AI硬件領(lǐng)域的領(lǐng)先地位進(jìn)一步鞏固,也表明全球AI發(fā)展正在加速進(jìn)入以更高效、更強(qiáng)大計(jì)算能力為支撐的新階段。”天使投資人、資深人工智能專家郭濤在接受證券時(shí)報(bào)記者采訪時(shí)表示,GB200若成功量產(chǎn)出貨,將對(duì)全球AI生態(tài)系統(tǒng)產(chǎn)生深遠(yuǎn)影響,促進(jìn)復(fù)雜模型訓(xùn)練與推理效率的提升,推動(dòng)人工智能在多個(gè)行業(yè)的深度應(yīng)用,加速AI技術(shù)的普及和創(chuàng)新步伐。
H100芯片遇冷,租賃價(jià)格較高峰期跌超50%
與GB200芯片需求爆發(fā)相比,曾經(jīng)一度炙手可熱的上一代旗艦芯片H100在算力租賃市場(chǎng)上卻已從“一卡難求”轉(zhuǎn)為“供過于求”。
時(shí)間回溯至2023年3月,英偉達(dá)推出了H100系列GPU。與再上一代的芯片A100相比,H100基于Hopper架構(gòu),擁有18432個(gè)CUDA核心,支持更先進(jìn)的內(nèi)存技術(shù)和更高的帶寬,性能提升3倍,尤其在AI訓(xùn)練和推理任務(wù)上表現(xiàn)出色,這也使H100一躍成為近兩年來最強(qiáng)大、最搶手的GPU產(chǎn)品。
在大模型的狂潮下,GPU的性能很大程度決定了模型訓(xùn)練的效果,因此各大公司都投入了巨額資金搶購H100。證券時(shí)報(bào)記者從一名做算力資源池的業(yè)內(nèi)人士處了解到,搭載H100的服務(wù)器一般是以8卡的形式出售或出租,去年8卡整機(jī)的出售價(jià)格一般都在300萬元以上,如今價(jià)格已降至230萬元—240萬元左右,“一周一個(gè)價(jià)”。而英偉達(dá)對(duì)華特供的H20芯片,8卡整機(jī)的價(jià)格也從之前的140萬元左右降至110萬元以內(nèi)。
在算力租賃市場(chǎng),價(jià)格下降的幅度更加明顯。據(jù)了解,H100芯片最初的租賃價(jià)格為4.7美元/小時(shí),在需求巔峰時(shí)期一度被爆炒至每小時(shí)8美元以上。記者查詢算力租賃網(wǎng)站發(fā)現(xiàn),如今1個(gè)H100NVL的租賃價(jià)格在每小時(shí)2—3美元之間,價(jià)格比巔峰時(shí)期已跌超50%。
“現(xiàn)在算力價(jià)格下降得比較厲害,我們也都在觀望之中。”該業(yè)內(nèi)人士向記者表示,算力價(jià)格下降并非Blackwell GB200芯片推出后才有的現(xiàn)象,他從今年上半年開始就感覺市場(chǎng)的水溫在轉(zhuǎn)涼,此前訓(xùn)練大模型的需求很旺盛,加上市面上可用的算力不多,所以大家都在囤貨,從而進(jìn)一步推高了價(jià)格。
該業(yè)內(nèi)人士觀察認(rèn)為,如今算力價(jià)格趨于下行主要有兩方面的原因。一是需求減少,在經(jīng)歷了前期的瘋狂投入以后,AI的收益曲線似乎沒有人們想象中的那么陡峭,很多公司開始重新審視對(duì)AI的投入,投資趨緩;二是算力供給提升,尤其在國產(chǎn)化提速、模型開源的背景下,企業(yè)從尋找大規(guī)模、高性能的算力,逐漸轉(zhuǎn)向更具性價(jià)比、可滿足小集群訓(xùn)練或推理任務(wù)的芯片。
在價(jià)格下行的趨勢(shì)下,一些業(yè)內(nèi)人士表達(dá)了對(duì)GPU泡沫破裂的擔(dān)憂。不過,也有不少從業(yè)者認(rèn)為,這一趨勢(shì)是技術(shù)迭代和市場(chǎng)自我調(diào)節(jié)的正常表現(xiàn)。郭濤向記者表示,所謂的“GPU泡沫破滅”可能過于悲觀,“當(dāng)前AI算力市場(chǎng)正處于動(dòng)態(tài)平衡中,雖然個(gè)別產(chǎn)品價(jià)格波動(dòng),但整體需求依然強(qiáng)勁。”
上百家上市公司入局算力租賃,盈利問題仍迷霧重重
自生成式AI引爆算力需求后,許多的上市公司進(jìn)軍算力市場(chǎng),其中算力租賃作為一種更為靈活、更具成本優(yōu)勢(shì)的方式,更是成為各路玩家布局的重點(diǎn)賽道。同花順數(shù)據(jù)顯示,截至10月26日,已有107家上市公司涉及到算力租賃業(yè)務(wù),其中既有云服務(wù)、數(shù)據(jù)服務(wù)等領(lǐng)域的公司,也不乏地產(chǎn)、建筑材料、紡織服裝、印花染料等領(lǐng)域的跨界入局者。
在算力租賃價(jià)格下行的背景下,前期在算力方面的資本投入能否取得理想的回報(bào),成為彌漫在所有玩家前方的迷霧。英偉達(dá)曾預(yù)測(cè),GPU每小時(shí)租賃價(jià)格將在4年內(nèi)保持4美元/小時(shí)左右的價(jià)格,然而如今H100在一年半的時(shí)間內(nèi),租賃價(jià)格就已降至每小時(shí)2-3美元,這對(duì)于早期大量囤卡的算力租賃商而言,意味著利潤的急遽下滑。
根據(jù)外媒latent.space作者Eugene Cheah在最近一篇文章中的測(cè)算結(jié)果,當(dāng)GPU租賃價(jià)格跌破1.65美元/小時(shí),算力提供商就面臨嚴(yán)重的虧損風(fēng)險(xiǎn)。Eugene Cheah直言,投資購買新的H100已不再具有收益。事實(shí)上,不僅是H100,英偉達(dá)另一款熱門的消費(fèi)級(jí)芯片4090在今年3月時(shí),租賃價(jià)格還普遍在每月1.3萬元左右,如今已跌至每月七八千元,相關(guān)投資的收回周期將被拉長。
一方面,算力租賃價(jià)格具有高度的不確定性;另一方面,算力租賃市場(chǎng)需求也面臨較大的波動(dòng)。在經(jīng)歷了2023年的“百模大戰(zhàn)”以后,如今硝煙似乎已淡化,許多公司逐漸放棄預(yù)訓(xùn)練模型,縮減預(yù)訓(xùn)練投入,更多地從模型訓(xùn)練轉(zhuǎn)向應(yīng)用,對(duì)高性能預(yù)訓(xùn)練芯片的需求也逐漸減少。考慮到絕大多數(shù)公司近兩年才入局算力租賃業(yè)務(wù),還處于早期投資階段,成本還未收回。以上的這些因素,將對(duì)算力租賃業(yè)務(wù)的盈利構(gòu)成較大的挑戰(zhàn)。
另外,由于國際關(guān)系等復(fù)雜的外部原因,國內(nèi)廠商能否如期獲得高性能算力卡也是一個(gè)問題。例如,去年“味精大王”蓮花控股宣布入局算力業(yè)務(wù)。最近,蓮花控股發(fā)布公告,對(duì)轉(zhuǎn)型算力業(yè)務(wù)相關(guān)情況進(jìn)展進(jìn)行說明。其中提到,公司全資子公司蓮花科創(chuàng)在去年9月與新華三信息簽訂330臺(tái)GPU系列服務(wù)器采購合同,合同金額為6.93億元。然而,目前新華三信息除去年11月交付了12臺(tái)以外,剩余318臺(tái)尚未交付。公告還提示,剩余318臺(tái)GPU系列服務(wù)器的交付存在不確定性的風(fēng)險(xiǎn),交付期限存在不明確的風(fēng)險(xiǎn)。
“一方面,算力價(jià)格下降壓縮了服務(wù)提供商的利潤空間,增加了運(yùn)營壓力;另一方面,也為更多企業(yè)提供了低成本獲取高性能算力的機(jī)會(huì),促進(jìn)了AI技術(shù)的廣泛應(yīng)用。”郭濤表示,技術(shù)更新?lián)Q代的速度加快會(huì)帶來投資貶值的問題,對(duì)于進(jìn)入算力業(yè)務(wù)的公司而言,需要密切關(guān)注市場(chǎng)動(dòng)態(tài),合理規(guī)劃投資,避免盲目跟風(fēng),同時(shí)加強(qiáng)技術(shù)創(chuàng)新和服務(wù)優(yōu)化,以應(yīng)對(duì)潛在的市場(chǎng)波動(dòng)和不確定性。