文 | 航通社,作者 | 書(shū)航
歲末年初,杭州的大模型創(chuàng)業(yè)公司“深度求索”DeepSeek 不斷放出大新聞。它所公布的一個(gè)開(kāi)源模型DeepSeek-V3,在各種基準(zhǔn)測(cè)試等方面,能夠大致打平需要付錢(qián)的GPT-4o。
而一個(gè)更重要的問(wèn)題是,這是中國(guó)公司在受到制裁,算力有限,不能購(gòu)買(mǎi)足夠數(shù)量顯卡的基礎(chǔ)上,使用小數(shù)據(jù)集蒸餾等方法,而得到的一個(gè)更節(jié)省成本的模型。
官方技術(shù)論文披露,v3模型的總訓(xùn)練成本僅為557.6萬(wàn)美元,相比之下GPT-4o等模型的訓(xùn)練成本約為1億美元。因此DeepSeek還被稱(chēng)為“AI界拼多多”。
這條新聞的重大意義在于,它可能會(huì)減少人們對(duì)于“大模型的智能程度=英偉達(dá)提供的算力”這樣一個(gè)認(rèn)知的依賴(lài)。因此,消息還被認(rèn)為是間接影響了英偉達(dá)的股價(jià)。
在整個(gè)消息發(fā)酵的過(guò)程當(dāng)中,是非常有趣的“出口轉(zhuǎn)內(nèi)銷(xiāo)”然后再出去的,變來(lái)變?nèi)サ姆绞健?/p>
兔撕雞在即刻上總結(jié)說(shuō),國(guó)外的消息被引到國(guó)內(nèi)的時(shí)候,大家都看闌夕發(fā)的微博。但那條微博正確地指出了,DeepSeek 突破的真正意義在于GPU需求變小。“這標(biāo)志著美國(guó)對(duì)中國(guó)的AI封鎖戰(zhàn)略不算成功,也不需要搭建GPU萬(wàn)卡集群,就能獲得不錯(cuò)的效果。”
這一層意思被重新譯介回Twitter/X上面,又讓硅谷的那幫人回過(guò)神來(lái)了,所以影響英偉達(dá)的股價(jià)。而且還需要對(duì)沖,the information說(shuō)字節(jié)將會(huì)700億采購(gòu)英偉達(dá)芯片,然后字節(jié)否認(rèn)。如果這個(gè)消息不是真實(shí)的,那么可以認(rèn)為,發(fā)出這個(gè)消息的,就是算力相關(guān)股票的護(hù)盤(pán)手。
總之,這種猜測(cè)甚是玄學(xué)。由此產(chǎn)生了兩個(gè)段子:
- 其一,杭州新四小龍:宇樹(shù)科技、DeepSeek、游戲科學(xué)、影視颶風(fēng);
- 其二,闌心一言,一個(gè)字近億美元。
12月27日,原先在DeepSeek的羅福莉加入小米的消息大范圍流傳,其實(shí)之前她早就自我官宣過(guò),而且也在大模型業(yè)界小范圍流通。但是自從有媒體將羅形容為“95后天才少女”之后,情況就不一樣了。
這條消息獲得營(yíng)銷(xiāo)加成,與其說(shuō)利好小米,更不如說(shuō)是加碼營(yíng)銷(xiāo)了羅福莉的前東家DeepSeek,也就是證明了他們的團(tuán)隊(duì)確實(shí)有實(shí)力,足夠優(yōu)秀的人可以在團(tuán)隊(duì)內(nèi)做出非常厲害的事。
不得不說(shuō),在DeepSeek出圈前,AI業(yè)界對(duì)它的評(píng)價(jià)都非常高。因?yàn)?,即使人們發(fā)現(xiàn)它的訓(xùn)練數(shù)據(jù)集有可能使用了來(lái)自ChatGPT的輸出結(jié)果——它曾在很多情況下都自稱(chēng)為ChatGPT——這也只是無(wú)傷大雅的插曲。你行你也上啊,如果只要用ChatGPT輸出就能做這么好,你也可以試一試。
畢竟谷歌也在這么做。谷歌Gemini的事實(shí)核查人員是外包的,用來(lái)檢查雙子座模型所生成的結(jié)果是否屬實(shí)。而谷歌被曝光要放低人工核對(duì)的標(biāo)準(zhǔn),讓人員檢查跟自己本專(zhuān)業(yè)能力不相關(guān)的答案的準(zhǔn)確性,同時(shí)還允許他們借助類(lèi)似Claude這樣的,其他模型生成的結(jié)果來(lái)核對(duì)。
當(dāng)某個(gè)階段你所做出的成績(jī),是僅此一家別無(wú)分店的時(shí)候,那就說(shuō)明潑天的富貴將會(huì)降臨到你的身上。
最近呢,當(dāng)然是快手的可靈,在Sora之前吸干了屬于它的關(guān)注度。之前另外一個(gè)華裔的作品Pika也類(lèi)似。但Pika在初期版本比Runway強(qiáng)不少,之后就比較后勁乏力,連帶著聯(lián)合創(chuàng)始人郭文景,也不再繼續(xù)被稱(chēng)作“天才少女”刷屏了。
但是這當(dāng)中最典型的案例則是月之暗面(Kimi)。
在差不多一年前。Kimi成為AI界當(dāng)紅炸子雞,因?yàn)樗趪?guó)內(nèi)外的競(jìng)品當(dāng)中,最早提出了一個(gè)新的概念,就是“超長(zhǎng)文本(tokens)”。長(zhǎng)文本成為各大模型開(kāi)始卷的領(lǐng)域,而Kimi依靠這個(gè)單獨(dú)概念對(duì)用戶(hù)心智的教育,牢牢的吸了一波粉絲和媒體關(guān)注。
自從長(zhǎng)文本概念首倡以后,Kimi獲得融資的規(guī)模和頻次就像瘋了一樣,終于到達(dá)了需要老股東掐架的程度。在這一年當(dāng)中,Kimi的產(chǎn)品發(fā)布,包括智能體、深度思考、聯(lián)網(wǎng),以及尚未發(fā)布的視頻生成,都只能說(shuō)是按部就班。
但是Kimi獲得了充足的彈藥,不僅在開(kāi)發(fā)周期上面可以比較舒緩,沒(méi)有壓力,而且可以鉚足了勁兒,在B站砸錢(qián)營(yíng)銷(xiāo),使得大模型推廣的價(jià)格水漲船高。
在豆包積極跟進(jìn)廝殺之余,連騰訊都熬不住這么玩了。目前混元大模型的能力被植入微信、QQ、讀書(shū)、輸入法等具體的產(chǎn)品內(nèi),單行版元寶則處于放養(yǎng)狀態(tài),不再用力宣傳。
這就是為什么社長(zhǎng)認(rèn)為,在今年,如果各家大廠還想要新的投資標(biāo)的的話(huà),最合適的選擇就是DeepSeek。因?yàn)檫@一次輪到它提出新概念了,這個(gè)概念是“低成本訓(xùn)練”。
如果論資本市場(chǎng)的青睞程度,能跟月之暗面媲美的還有智譜。但智譜的融資輪數(shù)已經(jīng)太多了,從目前的發(fā)展來(lái)看,它也沒(méi)有持續(xù)領(lǐng)先。
其實(shí)就算是強(qiáng)如OpenAI,也不可能永遠(yuǎn)“炸裂顛覆嚇尿革命”。它可能只需要一次嬰兒的啼哭,向世界證明它此時(shí)此刻是領(lǐng)先的。對(duì)它來(lái)說(shuō)這個(gè)概念叫“ChatGPT”。
這樣的機(jī)會(huì),這種對(duì)一個(gè)概念的定義權(quán),只要一個(gè)創(chuàng)業(yè)公司擁有一次,就已經(jīng)足夠幸運(yùn)。在此之后它是否還能定義第二個(gè)概念,或許不太重要;蜂擁而至的融資將會(huì)是對(duì)它之前定義概念的獎(jiǎng)賞。
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論