在大模型成為風(fēng)口之初,頭部初創(chuàng)公司Minimax曾舉辦了一場(chǎng)招標(biāo)會(huì)來(lái)采購(gòu)算力。
阿里云、百度云和字節(jié)旗下的火山引擎均在競(jìng)標(biāo)受邀之列,現(xiàn)場(chǎng)出現(xiàn)了互聯(lián)網(wǎng)行業(yè)許久不見的火藥味。
各家自有算盤,也對(duì)這個(gè)客戶志在必得:阿里云市場(chǎng)份額還在第一,但已經(jīng)有下跌之勢(shì),保住地位是當(dāng)務(wù)之急;百度云在基礎(chǔ)架構(gòu)服務(wù)層的客戶積累比較薄弱,想多搶一些份額;火山引擎連市場(chǎng)份額排名的榜單都進(jìn)不去,想借著大模型客戶的機(jī)會(huì)再往上沖一沖。
三家工作人員在精心制作的PPT里展示自己的技術(shù)特點(diǎn)和優(yōu)勢(shì),但Minimax方面參評(píng)的技術(shù)專家們對(duì)此并不感興趣。價(jià)格,是他們最終且唯一關(guān)注的要素。
局面最終演變成了競(jìng)價(jià)會(huì)。
“5折。”
“4.8折!
“4.5折。”
對(duì)于常規(guī)客戶,各家云計(jì)算平臺(tái)能夠給到的價(jià)格在6折到5折左右,但此次競(jìng)價(jià)已經(jīng)沖破原來(lái)的標(biāo)準(zhǔn)——互聯(lián)網(wǎng)大廠也在降本提效,最近一兩年大家已經(jīng)不愿意以低價(jià)換市場(chǎng)份額。但一位參與競(jìng)標(biāo)的架構(gòu)師把當(dāng)時(shí)的場(chǎng)面形容為“大家奔著不要錢的方向去了”,最后的成交價(jià)低至2折。
在競(jìng)標(biāo)之前,這位架構(gòu)師根本沒(méi)有意料到如此競(jìng)價(jià)的場(chǎng)面,底價(jià)也沒(méi)有提前在公司內(nèi)部溝通。到最后他根本不敢再出價(jià),最終丟了這個(gè)標(biāo)。
贏家是火山引擎。他們不惜一切代價(jià)想要爭(zhēng)奪下這家大客戶,延續(xù)了字節(jié)跳動(dòng)“大力出奇跡”的慣性。
但并不是每一次“大力”都能出奇跡。幾個(gè)月后,火山引擎又丟掉了這個(gè)大客戶。
“核心競(jìng)爭(zhēng)力是什么?”
無(wú)論是阿里云、百度云還是火山引擎,這些大廠的云計(jì)算平臺(tái),都太需要大模型客戶了。
甚至在大模型還沒(méi)有被打上聚光燈前,Minimax、智譜AI等頭部大模型客戶已經(jīng)成為兵家必爭(zhēng)之地——這是云計(jì)算廠商近幾年來(lái)為數(shù)不多的增量客戶。
隨著這些大模型公司業(yè)務(wù)體量的擴(kuò)張,每天的調(diào)用量都在指數(shù)級(jí)增長(zhǎng)。早期他們往往依靠自建的小規(guī)模算力平臺(tái)即可滿足需求,但兩三年以后,自己的算力肯定是不夠用了。
去年3月,大模型被ChatGPT驟然推上風(fēng)口。頭部初創(chuàng)公司融資屢創(chuàng)記錄,投資人和大廠也接連涌入。大模型對(duì)外要講的第一個(gè)故事就是大模型能力,訓(xùn)練參數(shù)規(guī)模是其中重要指標(biāo),而算力決定了大模型訓(xùn)練的質(zhì)量和速度。
拿到足夠多的錢之后,大模型公司進(jìn)入了一個(gè)瘋狂采購(gòu)算力的階段!笆遣皇谴嬖诶速M(fèi)的情況,根本不是他們關(guān)注的重點(diǎn)!币晃粩(shù)據(jù)中心從業(yè)者對(duì)界面新聞?wù)f。
大模型公司向云計(jì)算公司傳遞焦慮,而云計(jì)算平臺(tái)轉(zhuǎn)而瘋狂向英偉達(dá)采購(gòu)用于AI計(jì)算的GPU芯片。在目前的形勢(shì)下,英偉達(dá)GPU等同于“算力”,幾乎沒(méi)有替代品,A800是國(guó)內(nèi)能買到最好的芯片。
但英偉達(dá)的產(chǎn)能完全跟不上全球大模型公司洶涌而至的AI算力需求。
一位知情人士告訴界面新聞,國(guó)內(nèi)云計(jì)算平臺(tái)中,火山引擎采購(gòu)量比較大,規(guī)模約有幾萬(wàn)張計(jì)算卡,但英偉達(dá)根本無(wú)法保證交貨時(shí)間。據(jù)其透露,火山引擎一家去年和英偉達(dá)簽的訂單量已經(jīng)達(dá)到了前年BAT三家的總和,而BAT幾家大廠和英偉達(dá)的訂單已經(jīng)簽到了2024年。
也正是在這個(gè)關(guān)鍵時(shí)間,因?yàn)樗懔Ω簧,火山引擎最終丟掉了靠低價(jià)競(jìng)標(biāo)得來(lái)的大客戶Minimax。
就連更早向英偉達(dá)采購(gòu)GPU芯片的公司也未能如愿。云從科技副總裁張立告訴界面新聞,其在前年12月采購(gòu)的A800芯片按約定在23年4月到貨,但因?yàn)?月大模型被炒出風(fēng)口,訂單延期三四個(gè)月才交付!熬拖袷菙D牙膏一樣,每個(gè)月供一點(diǎn)。”
在對(duì)A800芯片的爭(zhēng)奪中,英偉達(dá)處于絕對(duì)強(qiáng)勢(shì)的位置。上述知情人士透露,在和國(guó)內(nèi)各家云計(jì)算平臺(tái)的交付合同中,英偉達(dá)不接受不能按時(shí)交付需支付違約金的懲罰性條款,能交付多少就交付多少!叭绻銏(jiān)持想要違約金,那對(duì)方一張都不賣了!
A800買不到,但大模型訓(xùn)練不能停。Minimax只能放棄火山引擎,再次多方尋找算力——但阿里云和百度云也沒(méi)有搶到這個(gè)覬覦已久的客戶,因?yàn)樗麄円矝](méi)有足夠多的GPU。
Minimax甚至找到了一家服務(wù)器公司,而這家服務(wù)器公司又試圖通過(guò)參與競(jìng)標(biāo)的大廠購(gòu)買顯卡——產(chǎn)業(yè)鏈上下游邏輯被徹底打亂了,無(wú)人在意服務(wù)器公司根本沒(méi)有支撐大模型訓(xùn)練的能力,只要你有A800,跟誰(shuí)買都行。
“我們的核心競(jìng)爭(zhēng)力是什么?根本沒(méi)有核心競(jìng)爭(zhēng)力!逼渲幸患掖髲S的云計(jì)算平臺(tái)銷售負(fù)責(zé)人李武對(duì)界面新聞?wù)f。
最終,這家優(yōu)質(zhì)的大模型客戶被擁有足夠數(shù)量英偉達(dá)芯片的騰訊云挖角。
目睹了Minimax尋找算力全過(guò)程的李武告訴界面新聞,騰訊云對(duì)外宣稱自己的異構(gòu)計(jì)算能力等等優(yōu)勢(shì),但這些能力都沒(méi)那么重要。大模型公司最核心的需求就是模型跑起來(lái)之后不能宕機(jī),否則需要從頭再跑一遍,浪費(fèi)時(shí)間就等于浪費(fèi)錢。幾家互聯(lián)網(wǎng)大廠都在努力保證服務(wù)的穩(wěn)定性,實(shí)際上技術(shù)能力的差異性并不大。
產(chǎn)品沒(méi)有獨(dú)特的競(jìng)爭(zhēng)力,這意味著誰(shuí)家擁有更多的A800,誰(shuí)就擁有了“核心競(jìng)爭(zhēng)力”。
從搶客戶到搶卡大戰(zhàn)
誰(shuí)也沒(méi)有預(yù)料到,云計(jì)算平臺(tái)的競(jìng)爭(zhēng)已經(jīng)演變?yōu)榱艘粓?chǎng)“搶卡大戰(zhàn)”。
去年10月17日,美國(guó)更新了針對(duì)人工智能芯片的出口管制規(guī)定,英偉達(dá)包括A800和H800在內(nèi)的GPU芯片對(duì)華出口都受到影響。
A800的價(jià)格隨之水漲船高,到了一天一個(gè)價(jià)格的地步。
而國(guó)內(nèi)云計(jì)算平臺(tái)在前年第四季度給英偉達(dá)下的訂單,到去年底才幾乎供齊。去年二三季度的訂單對(duì)于這些甲方來(lái)說(shuō),交付依然遙遙無(wú)期。
“雖然訂單已經(jīng)下了,但英偉達(dá)會(huì)不會(huì)違約?這些訂單到底啥時(shí)候能供貨?到貨的時(shí)候大模型的算力需求還存不存在?還能不能賺到錢?這些問(wèn)題我們真的判斷不了!币患以朴(jì)算平臺(tái)高管對(duì)此非常頭疼。
從23年年中到現(xiàn)在,A800芯片的價(jià)格已經(jīng)從8萬(wàn)元左右一路上漲到了17萬(wàn)元左右。買到卡囤幾個(gè)月再賣掉,變成了一個(gè)投機(jī)的好生意,但并不是所有人都有這樣的眼光。
當(dāng)各家云計(jì)算平臺(tái)和服務(wù)器公司都瘋狂找卡的時(shí)候,一個(gè)“笑話”在業(yè)界流傳:2022年初,騰訊云囤了幾萬(wàn)張英偉達(dá)計(jì)算卡,但他們覺(jué)得沒(méi)有太大多用處,年中又把一批卡轉(zhuǎn)手賣給了火山引擎。后來(lái)騰訊自然是十分后悔,因?yàn)檫@相當(dāng)于幾億元的利潤(rùn)沒(méi)了。
到了2023年,騰訊云也因?yàn)槿笨绷恕?jù)一位和騰訊云合作的服務(wù)器廠商高管透露,后來(lái)騰訊云拿到一批A800之后,因?yàn)橐逼壬暇,騰訊云的工程師和服務(wù)器廠商的工程師現(xiàn)場(chǎng)攢機(jī),一天可以攢8-10臺(tái),攢完就立即交付上線。
而算力價(jià)格波動(dòng)甚至讓云計(jì)算平臺(tái)的產(chǎn)研們也非常苦惱——即便他們經(jīng)歷過(guò)云計(jì)算行業(yè)殘酷的價(jià)格戰(zhàn),也沒(méi)有見過(guò)要每天要像盯股市大盤一樣盯A800價(jià)格的陣仗。
作為一個(gè)服務(wù)產(chǎn)品,云計(jì)算銷售給予不同客戶的折扣尺度有相當(dāng)大的浮動(dòng)空間,背后依托的正是產(chǎn)研對(duì)成本和利潤(rùn)的核算。傳統(tǒng)意義上,低于3折的價(jià)格肯定會(huì)讓公司成本難以為繼,但如果為了爭(zhēng)取到一個(gè)優(yōu)質(zhì)客戶,這樣的虧損可以通過(guò)時(shí)間和其他客戶的利潤(rùn)攤平——這也是過(guò)去廠商們價(jià)格戰(zhàn)的核心策略,能夠計(jì)算準(zhǔn)確的前提是成本保持穩(wěn)定。
但沒(méi)有人能預(yù)見A800之后幾個(gè)月的價(jià)格,而新的芯片供給還需要再等——英偉達(dá)計(jì)劃在今年第二季度量產(chǎn)符合美國(guó)出口規(guī)定的AI芯片H20。這款芯片本來(lái)應(yīng)該在去年11月推出,但服務(wù)器廠商在集成芯片時(shí)遇到了困難。屆時(shí)國(guó)內(nèi)的大客戶們誰(shuí)能夠搶到這一批芯片,還很難有定論。
因此,對(duì)于廠商來(lái)說(shuō),定價(jià)還是難題;蛟S這個(gè)月打三折,公司還有毛利;再過(guò)幾個(gè)月,報(bào)價(jià)打五折都不一定能夠回本。
客戶也在精打細(xì)算的過(guò)日子。雖然去年3月以來(lái),各家初創(chuàng)公司對(duì)算力的需求迫切,但隨著下半年風(fēng)口漸停,融資變得沒(méi)有那么容易了,在采購(gòu)算力的時(shí)候,大模型公司也更加看重價(jià)格。
原本在降本增效的背景下,從2023年開始,阿里、騰訊和百度等幾家大廠在整體戰(zhàn)略上已經(jīng)放棄了以價(jià)格戰(zhàn)換市場(chǎng)的思路,僅僅針對(duì)個(gè)別優(yōu)質(zhì)客戶去打價(jià)格戰(zhàn)。
而在目前缺卡的背景下,價(jià)格甚至也缺乏說(shuō)服力,資源變成了唯一的子彈。行業(yè)內(nèi)的挖角方式變成了,即使甲方已經(jīng)和某家平臺(tái)簽下了訂單,依然會(huì)有人找上門來(lái),“告訴你對(duì)方缺卡,我們這里還有算力,要不你先過(guò)來(lái)跑。”
在大模型風(fēng)口之下,想要通過(guò)出售算力賺錢的“賣水人”——那些云計(jì)算平臺(tái),沒(méi)人有底氣說(shuō)自己賺到錢了。只有英偉達(dá),成為了那家真正賺到錢的公司。
大模型不是云計(jì)算大廠的出路
“你希望算力能夠?qū)崿F(xiàn)什么價(jià)值?”
在不斷被客戶問(wèn)“有沒(méi)有卡”時(shí),AWS的銷售總監(jiān)趙孟總是試圖把話題推向另一個(gè)維度。
一卡難求的局面不僅影響到了大模型行業(yè),互聯(lián)網(wǎng)、游戲等領(lǐng)域的客戶也有各自新增的算力需求。如何在有限的資源條件下平衡不同的客戶,也是云計(jì)算平臺(tái)面臨的另一個(gè)難題。
在大模型公司對(duì)云計(jì)算方的考察中,有沒(méi)有卡成為了決定性因素,但云計(jì)算平臺(tái)自身能力的差異化缺被忽視。在趙孟看來(lái),只有了解對(duì)方想用算力解決什么問(wèn)題,云計(jì)算平臺(tái)才能發(fā)揮出更大的價(jià)值。
簡(jiǎn)單來(lái)說(shuō),云計(jì)算平臺(tái)賺的錢本身就是其附加價(jià)值——從上游采購(gòu)服務(wù)器資源,再通過(guò)提供統(tǒng)一化、標(biāo)準(zhǔn)化的服務(wù)接口,可以讓客戶在無(wú)需關(guān)注服務(wù)器設(shè)備的情況下,更靈活的使用計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源。
這是云計(jì)算平臺(tái)作為“中間商”能夠替客戶省心的作用,但當(dāng)上游服務(wù)器所需要的GPU不斷漲價(jià)也一卡難求時(shí),云計(jì)算平臺(tái)能從附加價(jià)值中賺到的錢已經(jīng)所剩無(wú)幾。
趙孟更希望自己出售給客戶的不僅僅是算力,而是幫助他們解決問(wèn)題的工程化支持和工具,“OpenAI本質(zhì)上也提供算力,真正有價(jià)值的是能被應(yīng)用層使用的能力。”
實(shí)際上,包括阿里云和百度云也是類似的思路,他們都在訓(xùn)練自己的大模型,希望向應(yīng)用層的公司出售其大模型的能力。
但并不是所有人都接受云計(jì)算廠商們的方案。客戶兩極分化非常明顯,而不接受的客戶占比更大。
當(dāng)趙孟去向游戲和互聯(lián)網(wǎng)客戶講述大模型的能力,客戶們的心態(tài)往往會(huì)經(jīng)歷三個(gè)階段:第一階段是受到震撼;第二階段是展開想象、想象大模型能力能夠如何為自己落地應(yīng)用;到真正收斂需求的第三個(gè)階段,沒(méi)有人真正知道大模型能提供什么實(shí)際的價(jià)值。
除了價(jià)值模糊,這條路的另一個(gè)阻力是收入微薄。
從界面新聞獲得的一份百度智能云千帆大模型平臺(tái)的調(diào)用數(shù)據(jù)情況來(lái)看,大模型應(yīng)用層給云計(jì)算平臺(tái)帶來(lái)的商業(yè)收益十分有限,甚至遠(yuǎn)不如直接出售算力。
這份數(shù)據(jù)顯示,目前百度智能云千帆大模型平臺(tái)周調(diào)用量過(guò)萬(wàn)的已經(jīng)是超級(jí)大客戶。但核算成收入每個(gè)月僅為幾萬(wàn)元,這與預(yù)訓(xùn)練大模型的前期投入成本完全不成比例。相比之下,一個(gè)新能源汽車客戶一年給百度云帶來(lái)的收入可以達(dá)到幾億元。
百度千帆大模型平臺(tái)的一位業(yè)務(wù)負(fù)責(zé)人向界面新聞表示,“業(yè)界對(duì)大語(yǔ)言模型的預(yù)期被炒的過(guò)高,但它并不是萬(wàn)能的!蹦壳捌鋺(yīng)用也僅限于文檔處理、客服等少數(shù)幾個(gè)場(chǎng)景,真正需要人工智能提升生產(chǎn)力的工業(yè)制造領(lǐng)域,大模型目前還談不上有可發(fā)揮的空間。
“年初想大干一場(chǎng),現(xiàn)在已經(jīng)不抱什么希望。”這位負(fù)責(zé)人在2023年下半年接到了一家頭部大模型初創(chuàng)公司的橄欖枝,對(duì)方承諾了數(shù)量可觀的期權(quán)。在過(guò)去五到十年的風(fēng)口中,這樣的挖角可能意味著財(cái)富自由的機(jī)會(huì),但這一次,這位負(fù)責(zé)人并沒(méi)有太多興奮感。
“大模型的風(fēng)口真的存在嗎?”他問(wèn)出了心中盤旋已久的疑惑!叭绻竽P偷娘L(fēng)口都不存在,云計(jì)算大廠的出路又在哪里呢?”
(應(yīng)采訪對(duì)象要求,文中李武、趙孟為化名)