DeepSeek-R1推理模型上線不到一個月,已經攪得AI江湖“天翻地覆”。
DeepSeek-R1的API定價僅為OpenAI o1模型運行成本的3%,但在性能上,它又能比肩OpenAI o1,這意味著,DeepSeek實現了低成本與高性能的對齊。
更關鍵的是,DeepSeek將R1模型進行了完全的開源。IDC中國副總裁周震剛向21世紀經濟報道記者表示,“DeepSeek的開源降低了人們使用高水平AI的門檻,將大大促進人工智能落地的趨勢。”
這一趨勢在過去一個月已經顯現。不管是上游的芯片、云服務商,還是下游的應用,整個AI生態都在積極接入DeepSeek。C端市場,DeepSeek的表現同樣搶眼,據QuestMobile數據,2月1日,DeepSeek日活躍用戶突破3000萬大關,成為史上最快達到這一里程碑的應用。
毫無疑問,DeepSeek的崛起,正加速AI的普及以及AI應用生態的繁榮。但隨之而來的問題是,眼看著DeepSeek在市場上大殺四方,其他大模型廠商該如何應對?
在DeepSeek-V3發布之前,整個中國AI市場彌漫著一股悲觀氣息。
英偉達芯片的限供,讓中國大模型廠商在算力層面始終被束縛著手腳,同時,即便可以獲得足量的芯片供應,高昂的算力成本也開始讓許多大廠感到頭疼。
某頭部大模型廠商人士告訴21世紀經濟報道記者,在去年的一次內部講話中,他們公司高層就直言希望GPT5晚點發布,因為卡已經買不起了。
據記者了解,按照這家企業的財力,說買不起卡著實有些夸張,但這番表態背后,也折射出中國大模型廠商當時的焦慮——在規模法則(Scaling law)放緩的背景下,追求更大規模模型的效率在變低,許多企業擔心大量成本投入進去后,模型性能無法以正比呈現。
在此背景下,中國2023年“百模大戰”的熱鬧景象也成為曇花一現,到了2024年,仍然在做預訓練模型的廠商已經屈指可數。
在大模型最典型的創業代表——零一萬物、百川智能、階躍星辰、智譜AI、月之暗面、MiniMax等“六小虎”中,零一萬物是最先表態不再追求超大模型的。
2025年初,零一萬物和阿里云合作成立了產業大模型聯合實驗室。零一萬物CEO李開復當時稱,從商業角度考慮,只有大公司能繼續做超大模型。而零一萬物將依賴大廠訓練更大規模的模型,來幫助自己提升輕量化模型的性能。
2月14日,零一萬物與蘇州高新區聯合成立的產業大模型基地正式授牌,該基地將重點打造制造、金融、醫療、政務等多個領域的行業大模型解決方案。
而百川智能將目光聚焦到了醫療模型和產品。2月13日,百川智能以Baichuan-M1為底座打造的“AI兒科醫生”經過近一個月的內測后,已經在北京兒童醫院“上崗”。
此外,月之暗面今年曾和DeepSeek-R1“撞車”。1月20日,在DeepSeek-R1發布的同一天,月之暗面也發布了Kimi k1.5多模態思考模型,但該模型并未引起太大關注。
近日有媒體報道稱,月之暗面已經因DeepSeek開始調整工作重心。月之暗面一位研究員還反思稱,公司一年前就驗證過長思維鏈,但因為成本高先做了長文本。這也暴露了創業公司的弊端,很可能因為資金問題錯過前沿突破的機會。
至于剩下“三小虎”,智譜AI近期在發力其模型產品的ToB合作,MiniMax和階躍星辰則都分別發布了最新的多模態模型。需要指出的是,目前階躍星辰和MiniMax均已在其產品中接入了DeepSeek。
DeepSeek的出現,讓外界對于“六小虎”未來的發展路徑充滿了擔憂。李開復甚至表示,當預訓練結果已經不如開源模型時,每個公司都不應該執著于預訓練。尤其是創業公司,更需要考慮商業化的問題。
隨著模型性能的提升與推理成本的下降,2025年被視為中國大模型賽道的商業化拐點。一位行業分析人士向記者表示,中國大模型行業正由早期的預訓練賽道向應用落地和商業模式優化轉變,對“六小虎”們而言,今年的決勝點將是大模型能力的商業落地。
受到DeepSeek沖擊的除了“六小虎”,還有字節跳動、阿里巴巴和騰訊等大廠們。
某大廠員工告訴21世紀經濟報道記者,DeepSeek-R1發布時,其團隊正在外地進行團建,隨后被公司高管緊急叫停,全員回到公司來應對這一變化。
另一位大廠員工則向記者表示,其管理團隊去年曾表示,通用大模型在不斷收斂,未來只有大廠才有機會,而六小虎都是在給大廠進行試錯。
但DeepSeek的出現,似乎讓整個市場在大廠之外,看到了另外一種可能。不過仔細分析DeepSeek會發現,它其實并不是像六小虎一樣的創業公司,而是“初創+隱形大廠”的打法。
自2023年誕生以來,DeepSeek就沒有啟動過融資,其背靠的是資源量不亞于大廠的量化巨頭幻方,這使得DeepSeek擁有了足夠的資金、芯片等資源,同時也讓DeepSeek有底氣去“不計商業回報”的追求AGI。
因此大廠們與創業公司不同,DeepSeek的成功反而會激發其斗志。上述大廠員工就表示,“如果DeepSeek能,我們為什么不能?”
周震剛表示,DeepSeek應用的很多技術,其實都不是剛出現的,但DeepSeek在這些基礎上做了許多新的功能化應用,所以DeepSeek的成功也是工程化優化的結果。
因此對其他有實力繼續投入的大廠來說,未來也增加了許多想象空間。比如DeepSeek通過算法優化,用一萬張卡做出了別人十萬張卡的模型,那如果有人用十萬張卡,沿著DeepSeek這種工程模式,會訓練出什么效果的模型?
再或者通過其他方式的優化,能否用一千張卡就實現十萬張卡的效果?這些都需要大廠們繼續探索來回答。
而現階段,大廠們則需要通過調整策略,來應對短期內DeepSeek的影響。對字節跳動而言,去年其投入大量資源做豆包App的營銷,日活已經達到1695萬,成為行業第一,但今年很快就被DeepSeek超越。
對此,字節跳動CEO梁汝波近日也在內部全員會上反思,“DeepSeek R1創新點之一的長鏈思考模式不是業界首創。去年9月OpenAI發布長鏈思考模型、成為行業熱點后,字節意識到技術重大變化,但跟進速度不夠,如果當時及時關注到,有機會更早實現。”
對于2025年,梁汝波提出,字節跳動在AI業務上的目標是追求“智能”上限、探索新的交互和加強規模效應。
而在大模型時代一直強調“穩扎穩打、不急于求成”的騰訊,面對DeepSeek卻一反常態,在業內率先開啟了全面擁抱。截至目前,騰訊元寶、微信、ima、騰訊文檔、QQ瀏覽器、QQ音樂等多款騰訊產品均已接入DeepSeek-R1模型。
騰訊擁有自研的混元大模型,此前,騰訊內部很多團隊也使用外部開源模型,但都逐漸收斂至混元。而這次,騰訊卻給予了DeepSeek與混元平起平坐,甚至要高于混元的待遇。
作為擁有超10億月活用戶的國民級產品,微信團隊的風格向來謹慎。去年微信搜一搜就加入了混元大模型能力,但也是隱藏在搜索功能當中,即用戶需要先進行搜索,然后在搜索結果中,才會有大模型能力的呈現。而現在,為了DeepSeek,微信單獨開發了“AI搜索”的入口。
有行業分析人士告訴21世紀經濟報道記者,騰訊此次面對DeepSeek的快速反應,體現了其“產品為先”的經營策略。尤其是微信,過去沒有為混元單獨開放AI搜索的入口,說明微信并沒有因為混元是自家產品,就降低對其的要求。
不過,騰訊方面也向記者表示,騰訊產品接入DeepSeek,并不意味著放棄自研。相反,通過接入DeepSeek,會以賽馬的方式倒逼混元的快速迭代,以及推動各產品加快場景建設。
對于未來大模型市場格局,浪潮信息高級副總裁劉軍在接受21世紀經濟報道記者采訪時表示,未來大模型市場不會是單一壟斷,而是多個模型并存。
“DeepSeek之所以受到全球歡迎,是因為它打破了OpenAI的封閉壟斷模式。通過開源,用戶不僅僅是消費者,還可以成為創造者,這有助于激發全球各個層面的創新活力”。劉軍說,“就像兩年前Llama剛開源,全球都在擁抱Llama一樣,現在全球都在擁抱DeepSeek-R1,這也構成了一個多模齊放的生態,相信未來也會有更優秀的模型繼續出現。”