21世紀經濟報道記者孔海麗 北京報道
從2024年12月發布V3大模(mo)型,到最近推出R1模(mo)型和(he)多模(mo)態模(mo)型Janus-Pro,DeepSeek持續出圈,形成了全球AI界乃至整個科技圈的“DeepSeek現象”。
多次采訪馬斯(si)克(ke)等AI企業家的(de)知(zhi)名播(bo)客主持(chi)人萊克(ke)斯(si)·弗里德曼(Lex Fridman),用(yong)了一個(ge)詞叫(jiao)做(zuo)“DeepSeek 時刻”來描述,“我(wo)認為 5年(nian)后它仍將作為科(ke)技史上的(de)關鍵事件被人們銘記。”
DeepSeek出圈(quan)的(de)原因之一(yi)是,它(ta)采用“更(geng)聰明”的(de)算法(fa),把AI訓練(lian)成(cheng)本(ben)砍掉近60%,卻實現甚至(zhi)超越了同類(lei)模型的(de)性能(neng)。簡(jian)單來說(shuo),同樣的(de)產(chan)品,別(bie)人(ren)花100塊訓練(lian)一(yi)個AI模型,它(ta)只(zhi)要40元。這(zhe)種“省錢(qian)打法(fa)”直接戳中了行(xing)業的(de)痛點——過去拼的(de)是誰能(neng)買更(geng)多高價芯片(pian),現在(zai)比的(de)是誰能(neng)把芯片(pian)用得更(geng)好。
DeepSeek不僅提供(gong)了(le)新的(de)AI技術路(lu)線,更(geng)重要的(de)是,它在硅谷和華(hua)爾街(jie)聯合主導的(de)全球(qiu)AI敘事(shi)鐵墻上(shang)撕開了(le)一道(dao)口子(zi)。
但我(wo)們(men)在(zai)自豪和興奮之余,還是要保持清醒的(de)(de)頭(tou)腦。且不(bu)說,在(zai)資金、技術(shu)、人(ren)才等方面(mian)(mian),以(yi)DeepSeek為(wei)代(dai)表的(de)(de)新創(chuang)AI企業,尚無法向OpenAI、Anthropic 這些巨頭(tou)發(fa)起(qi)全面(mian)(mian)挑戰(zhan),單單就(jiu)V3、R1而(er)言,其算法優(you)化也有代(dai)價(jia):處理復雜場景時(shi),它的(de)(de)表現(xian)明顯不(bu)如燒錢堆出來(lai)的(de)(de)大模型(xing)。就(jiu)像(xiang)用(yong)精簡(jian)版PS軟件修圖(tu)——日常夠用(yong),專業場景會露怯。何況,短時(shi)間內我(wo)們(men)還不(bu)足以(yi)撼動英(ying)偉達(da)巨頭(tou)們(men)的(de)(de)硬件江湖。
擺脫硬件依賴尚不現實
在“DeepSeek現象”推動下,未來(lai)的算(suan)力(li)圖景,并非單一曲線(xian)繪就。
一方面,像DeepSeek這樣的產品,更(geng)低開(kai)發和消(xiao)費成本、更(geng)高流量,可能帶來AI應用的突然(ran)爆發,這是所有從業人員夢寐以求的場景。
另一方面(mian),當訓練成本下降刺激(ji)更多公(gong)司入(ru)場,消(xiao)費者應(ying)用呈指數級增加,催生(sheng)AI生(sheng)態鏈全面(mian)繁榮,芯片需(xu)求將迎來超乎預期的(de)增長。
硬幣兩(liang)面,恰(qia)好構成了算力命題的悖(bei)論。
業(ye)內(nei)人(ren)士援引騰(teng)訊(xun)之前(qian)發布的(de)白皮書(shu),AI Agent應用要實現跳(tiao)躍式增長乃至爆發,必須闖過三關:場景滲透率大(da)于(yu)15%、任務完(wan)成度大(da)于(yu)80%、用戶信任度大(da)于(yu)60%。
僅以信任度(du)為例,此(ci)前Gartner的一項(xiang)抽樣調查顯示,64%的人表示,不希望在客戶服務中使用人工智能。
目前AI Agent應(ying)用的技(ji)(ji)術能(neng)力僅(jin)滿(man)足簡(jian)單場景,如(ru)客服(fu)、日程管理等。而(er)復雜決策如(ru)醫療咨詢、法(fa)律建議等,仍存在(zai)難(nan)以填補的缺陷。AI最大(da)的應(ying)用場景是教(jiao)育、醫療、金(jin)融等,但是,誤診(zhen)率(lv)5%的AI醫生(sheng)看病,依然很難(nan)被(bei)(bei)接受。就(jiu)好比,無人(ren)駕駛(shi)比人(ren)類(lei)更安全(quan),但無人(ren)駕駛(shi)每出(chu)現一(yi)次事故都會(hui)被(bei)(bei)凝視被(bei)(bei)放大(da)。人(ren)類(lei)對(dui)AI的信任,只是處于初始水(shui)平(ping),此外(wai)還面臨著各國隱(yin)私(si)保護法(fa)規(gui)、用戶習(xi)慣、能(neng)源約束、技(ji)(ji)術路線分歧、多(duo)智(zhi)能(neng)體(ti)協作、倫(lun)理困(kun)境等方面的挑(tiao)戰。
業內此前(qian)預計,要(yao)到2026年前(qian)后,才將出現AI信任度的分水嶺(ling)(大于60%)。“DeepSeek現象”會(hui)(hui)不會(hui)(hui)加快(kuai)這個(ge)時間表(biao)的到來?現在沒有人能夠斷(duan)定。
有人說(shuo),2025年將(jiang)是(shi)AI Agent應(ying)用元年。而DeepSeek通過(guo)異(yi)構(gou)計(ji)算(suan)架構(gou)、CPU+FPGA+ASIC混合部署和動態負(fu)載均衡算(suan)法等創新,將(jiang)單(dan)位算(suan)力(li)產出提升2倍多,這是(shi)否意味著它探索的技(ji)術方向將(jiang)打破算(suan)力(li)壟斷(duan),導致算(suan)力(li)過(guo)剩?
這關(guan)系到算(suan)力(li)現狀(zhuang)。其特點(dian)是(shi)嚴(yan)重不均衡。一(yi)是(shi)地區不均衡。北美(mei)(mei)尤其是(shi)美(mei)(mei)國占據了(le)全球(qiu)算(suan)力(li)規模(mo)最大份額,其次是(shi)中(zhong)國,但高(gao)性能算(suan)力(li)基本集中(zhong)在北美(mei)(mei)。同一(yi)經濟體內也存(cun)在區域不平衡。
二是(shi)(shi)(shi)供(gong)應不(bu)均衡。GPU廠商(shang)主要是(shi)(shi)(shi)英偉達,2025年其(qi)GPU銷量(liang)預計(ji)可達700萬塊;CPU廠商(shang)主要是(shi)(shi)(shi)英特(te)爾、AMD;BSIC芯片的(de)(de)主要廠商(shang)是(shi)(shi)(shi)博通(tong)和Marvell,合計(ji)占有超60%的(de)(de)份(fen)額;云(yun)計(ji)算方面,谷(gu)歌、微(wei)軟、亞(ya)馬遜占據全(quan)球65%的(de)(de)市(shi)場(chang)份(fen)額。這就是(shi)(shi)(shi)大家所說的(de)(de)算力壟斷。
三(san)是企(qi)業(ye)不均衡(heng)。高(gao)(gao)端芯(xin)片方面,微軟(ruan)、Meta、谷歌、亞馬遜、xAI幾大巨頭目前囤積的算力總共約合(he)355萬(wan)塊等效H100,這還不包括(kuo)AI新(xin)貴OpenAI在內(nei)。其他(ta)經(jing)濟(ji)體企(qi)業(ye)能拿(na)到的高(gao)(gao)端芯(xin)片量,無法與(yu)之相(xiang)比。
算(suan)力供需還(huan)存在(zai)結構性錯配的問題。從縱向看(kan),隨著多模(mo)態(tai)應用(yong)的普及,推理(li)側的算(suan)力需求(qiu)增速已經超(chao)過(guo)訓練(lian)側,但算(suan)力還(huan)主要布局于訓練(lian)側,調整需要一點時間;從橫(heng)向看(kan),大量算(suan)力被消耗在(zai)數據清洗和模(mo)型調試等(deng)非(fei)核心環節。
以大模型(xing)算(suan)力為例。2024年下半年以來(lai),大模型(xing)算(suan)力已(yi)經從訓練向推理轉移(yi),其中占據推理算(suan)力市場(chang)最大份(fen)額(e)的,仍然是英偉(wei)達(da)。
《中國算力發(fa)(fa)展報告(2024)》援引(yin)援引(yin)IDC報告,截至(zhi)2023年四季(ji)度,英偉達GPU全球(qiu)市(shi)場份額達95.9%,英特爾和AMD在(zai)(zai)CPU市(shi)場合計占比89.2%。英偉達通過在(zai)(zai)CUDA和GPU兩端同(tong)時發(fa)(fa)力,構筑了軟硬協同(tong)的護(hu)(hu)城(cheng)河(he)。有人說DeepSeek通過架構革新,繞(rao)開了CUDA,沖破了它的護(hu)(hu)城(cheng)河(he),這其(qi)實是(shi)誤讀。多位專(zhuan)家研讀DeepSeek公開(開源))論文后表示,V3、R1的底層架構仍然是(shi)基于(yu)CUDA生態(tai)建構。
在這種市場格(ge)局下(xia),其他區域及(ji)其廠商要(yao)發起挑戰,試圖打破巨頭壟(long)斷(duan),擺脫以(yi)英偉達為代表的算力(li)依賴(lai),更多是樂觀主義的展望式預(yu)期。除非量子芯(xin)片(pian)實現規模(mo)化商用,但那是5年甚至10年以(yi)后(hou)的事。
至于(yu)(yu)算力(li)過(guo)剩,短期內不(bu)(bu)存在(zai),整體上(shang)仍然是(shi)供(gong)大于(yu)(yu)求。《中國(guo)算力(li)發展報告(2024)》援引(yin)中國(guo)信通院(yuan)數(shu)據,截至2023年(nian)底,全球算力(li)規(gui)模同比增(zeng)長40%,但以CPU為代表但芯片年(nian)性能提升(sheng)不(bu)(bu)足(zu)15%,無(wu)法滿足(zu)視頻(pin)、圖片等(deng)非結構化數(shu)據的(de)處理需(xu)求。賽迪(di)智庫(ku)2024年(nian)初測算,2023年(nian)中國(guo)智能算力(li)需(xu)求達(da)123.6EFLOPS,但智能算力(li)供(gong)給規(gui)模僅為57.9EFLOPS,嚴重供(gong)不(bu)(bu)應求。“DeepSeek現象”目前看來是(shi)增(zeng)加了(le)而不(bu)(bu)是(shi)減少(shao)了(le)硬件需(xu)求。比如,32G的(de)英(ying)偉達(da)RTX50系顯(xian)卡(ka),近半個(ge)月漲勢兇猛,最(zui)高已經炒到了(le)6萬元(yuan)以上(shang)。其中部分原(yuan)因在(zai)于(yu)(yu),不(bu)(bu)少(shao)消費(fei)者購入RTX50顯(xian)卡(ka)去(qu)做DeepSeek V3、R1本地化部署。
AI巨頭為何焦慮
既然(ran)DeepSeek尚未突(tu)破硬件(jian)限制,所做的(de)也是巨(ju)人肩上的(de)創(chuang)新,但為什么還是引起美國AI巨(ju)頭的(de)焦慮甚至恐慌?
從表層(ceng)看,美國AI巨頭嗅(xiu)到(dao)了危機(ji),不是(shi)(shi)因為(wei)技術被超越,而是(shi)(shi)實現目標(biao)的(de)(de)技術路徑(jing)變了,新創企業有(you)(you)了更多選(xuan)擇(ze)(ze)。就(jiu)像燃油車時(shi)代比拼的(de)(de)是(shi)(shi)發動機(ji),電(dian)動車時(shi)代比拼的(de)(de)是(shi)(shi)電(dian)池管(guan)理技術。DeepSeek證明了硅谷堆(dui)硬(ying)件堆(dui)數據(ju)的(de)(de)路線不是(shi)(shi)唯一選(xuan)擇(ze)(ze),高效用好現有(you)(you)資源同樣能(neng)打。
DeepSeek省(sheng)錢省(sheng)力的(de)(de)R1模型發布時,剛好是OpenAI、甲骨文、英偉達等(deng)科(ke)技巨頭宣布5000億美元算力基建(jian)——星際之門計劃的(de)(de)時間段,放在這個(ge)背景下對比來看,美國AI巨頭的(de)(de)刺痛感就更強烈了。
一(yi)位資(zi)深(shen)AI觀察人士告訴21世(shi)紀經濟(ji)報道(dao)記者,DeepSeek發(fa)起的(de)這場“效率(lv)革(ge)命”,是(shi)AI發(fa)展(zhan)從技術理想主義轉向工程實(shi)用主義的(de)標(biao)志性事(shi)件(jian)。它(ta)證明了,在現有硬件(jian)和物理約束條件(jian)下(xia),通過計算拓撲結構優化獲得(de)的(de)邊際收益(yi),遠高于單純增加芯(xin)片數量的(de)線性增長。
這解(jie)釋了為何美(mei)國AI巨頭會產生戰略焦(jiao)慮(lv)的(de)深層因素——當工(gong)程(cheng)創(chuang)新能力(li)開始在(zai)AI競爭中脫穎而(er)出,硅谷長期(qi)主導的(de)技術先(xian)發優勢就面臨(lin)重(zhong)(zhong)估,而(er)且它也將(jiang)帶來(lai)AI敘事的(de)重(zhong)(zhong)估,背(bei)后是資本和(he)資本市(shi)場的(de)重(zhong)(zhong)估。
宏(hong)觀(guan)趨勢(shi)(shi)研究學(xue)者、經(jing)濟學(xue)家David Woo近日接受訪談時表示,過去兩年,人(ren)們(men)一直在談論美(mei)國(guo)經(jing)濟的(de)(de)(de)“例外主義”,而AI是(shi)推動這(zhe)一論斷形成的(de)(de)(de)重要因素。美(mei)股(gu)市(shi)值占全球(qiu)資(zi)本(ben)市(shi)場(chang)(chang)的(de)(de)(de)份額達63%,其中ChatGPT出現后(hou)的(de)(de)(de)兩年,就增加了10個百(bai)分(fen)點(dian),而七大科(ke)技(ji)巨頭又(you)占美(mei)股(gu)市(shi)值的(de)(de)(de)25%。這(zhe)些巨頭正是(shi)依靠AI技(ji)術的(de)(de)(de)強大優勢(shi)(shi)鞏固(gu)了它們(men)的(de)(de)(de)地位,從而間接鞏固(gu)了美(mei)國(guo)資(zi)本(ben)市(shi)場(chang)(chang)的(de)(de)(de)優勢(shi)(shi)地位。
因(yin)此,AI與美國科(ke)技巨頭、資本市場(chang)其實是(shi)捆綁在(zai)一(yi)起的,也正(zheng)是(shi)硅(gui)谷和華爾街聯合(he)主(zhu)導了(le)全球AI敘事(shi)。
如(ru)今,來自(zi)東方的神秘力量DeepSeek向這套(tao)AI敘事發起了沖(chong)鋒。全球科(ke)技和(he)資本領域持續10多天的熱烈反應(ying),可以從側面解釋科(ke)技巨頭(tou)的焦慮和(he)資本市場(chang)為何(he)如(ru)此緊張。截至2月3日(ri)(ri)美股盤(pan)前,英偉(wei)達股價(jia)自(zi)1月24日(ri)(ri)以來已跌去20%。當然,這不排除是投(tou)資者市場(chang)(避(bi)險)情緒的短(duan)期波動。
前述資(zi)深(shen)AI觀(guan)察(cha)人(ren)士(shi)認為(wei),DeepSeek創造的歷(li)史性價值有兩點:一是力(li)行開源,本(ben)質上(shang)是人(ren)類資(zi)源、科技(ji)創新的共享表達;二是提供了碓(dui)砌算(suan)力(li)和數據之外的新的技(ji)術路徑。記者這幾天(tian)的采訪發(fa)現(xian),DeepSeek以上(shang)兩點貢獻,基本(ben)已(yi)成為(wei)業內的共識。
在現實層面,DeepSeek也揭示了一個(ge)殘酷(ku)的真相(xiang):當創(chuang)新(xin)進入深水區(qu),工(gong)程(cheng)能(neng)力比學術突破(po)更重要,成本控制比參(can)數競賽(sai)更致(zhi)命(ming),社會接受度比算法精度更關鍵。
如果跳開(kai)地緣政治誰贏誰輸的(de)問題,僅(jin)僅(jin)著眼于(yu)行業本(ben)身,商業本(ben)質在于(yu),賺錢(qian)的(de)公司才能活下去。當資本(ben)泡沫退去,或許我們會發現,技術強大固然重(zhong)要,但應用和生存(cun)才是企業當下的(de)現實,也是所有AI新創企業的(de)必答題。
從 “誰(shui)能燒錢造最(zui)大模型”,過渡到“誰(shui)能用最(zui)少錢辦最(zui)多(duo)事” ;美國企(qi)業依然掌握著最(zui)先進的(de)(de)芯片,但中國企(qi)業找到了更省錢的(de)(de)玩法——這才是DeepSeek重新書(shu)寫的(de)(de)AI敘(xu)事。
畢竟,不(bu)是所(suo)有新(xin)創企業都像OpenAI、xAI動不(bu)動就(jiu)能融資到60億美元。正是在這(zhe)個意義上,DeepSeek的技術路線,受(shou)到全(quan)球(qiu)(qiu)大批(pi)AI企業的效仿,其開(kai)源策略受(shou)到全(quan)球(qiu)(qiu)研(yan)究機構(gou)的稱贊,其價格策略引發全(quan)球(qiu)(qiu)消(xiao)費者的熱(re)捧。
高效率(lv)低成本的(de)技術創新,加上(shang)全球關注的(de)巨大(da)(da)流量,讓(rang)DeepSeek贏得(de)了寶貴的(de)時間窗口。這是堆積(ji)大(da)(da)量美元都難以買到(dao)的(de),也是OpenAI、Anthropic等AI新創企業羨慕甚至(zhi)嫉妒的(de)。

