(圖片來源:unsplash)

AI大模型等技術(shù)和應用爆發(fā)式發(fā)展,正加速推動中國構(gòu)建更龐大的算力基礎(chǔ)設(shè)施。

鈦媒體App 9月5日消息,國家統(tǒng)計局最新數(shù)據(jù)顯示,截至5月底,規(guī)劃具有高性能計算機集群的智算中心達10余個,智能算力占算力總規(guī)模比重超過30%。目前,中國算力機架總規(guī)模超過195萬架,整體上架率達63%左右。東西部樞紐節(jié)點間網(wǎng)絡(luò)時延已基本滿足20毫秒(ms)要求。

國家數(shù)據(jù)局黨組書記、局長劉烈宏在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上透露,截至今年6月底,中國八大國家樞紐節(jié)點直接投資超過435億元,拉動投資超過2000億元。

很顯然,中國正加大 AI 算力投資力度。

在這其中,如果把 AI 大模型的推理放到邊端,通過分布式推理,可有效降低算力成本。AMD CEO蘇姿豐(Lisa Su)曾預估,未來價值4000億美元規(guī)模的AI加速計算市場中,其中超過一半的份額,即至少2000億美元將被專門用于AI推理計算場景的應用。

“我們正處于一個各大企業(yè)大規(guī)模深化應用、上云復制的階段。”中國信息通信研究院云計算與大數(shù)據(jù)研政企數(shù)字化轉(zhuǎn)型部主任徐恩慶在9月4日舉行的“Power to Pioneers·2024分布式云計算論壇暨PPIO AI產(chǎn)品發(fā)布會”上表示,2023年中國數(shù)字經(jīng)濟規(guī)模占GDP的比重達42.8%,整個數(shù)字經(jīng)濟規(guī)模處于蓬勃發(fā)展狀態(tài)。其中,互聯(lián)網(wǎng)廠商、數(shù)智廠商、網(wǎng)絡(luò)運營商所代表的經(jīng)濟規(guī)模只占20%,傳統(tǒng)的政企單位以及大量企業(yè)深入使用新一代的數(shù)字化技術(shù)所創(chuàng)造新的經(jīng)濟規(guī)模價值占80%。

在徐恩慶看來,伴隨著 AI 和大算力基礎(chǔ)設(shè)施的建設(shè)過程中,分布式算力體系已經(jīng)成為支持新一代IT技術(shù)發(fā)展的關(guān)鍵。這些新一代超大規(guī)模分布式算力基礎(chǔ)設(shè)施通過分布式計算,確保了 AI 算法的高效運行,同時也需要一個更強大的操作平臺來融合異構(gòu)算力和智算基礎(chǔ)設(shè)施。

會上,PPIO派歐云聯(lián)合創(chuàng)始人、CEO姚欣發(fā)布專為AI推理場景設(shè)計的Serverless產(chǎn)品,公司通過算法、系統(tǒng)和硬件協(xié)同創(chuàng)新,提供模型部署、運行優(yōu)化、彈性伸縮及API服務(wù),幫助客戶在自定義模型時獲得高效的彈性效率和極致的運行成本。Serverless產(chǎn)品的推出使得開發(fā)者無需再管理和運維算力服務(wù)器,而是能夠?qū)⒕杏诤诵臉I(yè)務(wù)的應用邏輯開發(fā)與創(chuàng)新,從而幫助企業(yè)實現(xiàn)降本增效。

姚欣預測,未來三年,AI 大模型推理成本或?qū)⑾陆?000倍以上。而遵循Scaling Law(尺度定律)的基本原理,計算能力將決定大模型創(chuàng)新和應用的上限。那么在計算資源成本高昂而需求爆增的市場格局下,分布式算力將成為引領(lǐng)下一輪科技革命的重要推動力,正在逐步改變?nèi)蛴嬎阗Y源的供給和利用方式。
PPIO派歐云董事長姚欣

PPIO派歐云董事長姚欣

PPIO派歐云成立于2018年,由PPTV創(chuàng)始人姚欣(Bill)和首席架構(gòu)師王聞宇聯(lián)合創(chuàng)立,主要在網(wǎng)絡(luò)和邊緣側(cè)基礎(chǔ)設(shè)施上建構(gòu)計算云服務(wù),科技“按需付費”形成商業(yè)落地。姚欣形容,PPIO派歐云是“算力版的滴滴”,主要整合企業(yè)側(cè)閑置碎片化的算力,承載多種服務(wù),包括音視頻和AI推理等。

場景商業(yè)化層面,PPIO派歐云主要業(yè)務(wù)范疇在云和邊兩側(cè),重心是邊緣云業(yè)務(wù)和算力云業(yè)務(wù)。其中,派歐算力云產(chǎn)品可廣泛應用于產(chǎn)業(yè)園、寫字樓、住宅、文娛和高校等園區(qū)進行算力入園的管理服務(wù),并實現(xiàn)不同地區(qū)、時間和業(yè)務(wù)的彈性算力調(diào)度和大模型推理加速,為園區(qū)內(nèi)的AI應用提供智算服務(wù),滿足智能數(shù)據(jù)處理、大模型部署、AIGC生成、AI算法加速、渲染加速等一系列應用需求,合作客戶包括

姚欣強調(diào),PPIO派歐云主要是與端側(cè)協(xié)調(diào)配合,不與端側(cè)設(shè)備廠商競爭。

融資層面,截至目前,PPIO派歐云已經(jīng)完成三輪融資,總額超過3億元人民幣,投資方包括張江科投、藍馳創(chuàng)投、沸點資本等知名機構(gòu),以及百川智能創(chuàng)始人王小川、迅雷創(chuàng)始人程浩、元氣森林創(chuàng)始人唐彬森等科技行業(yè)內(nèi)人士。

值得一提的是,論壇上,PPIO派歐云聯(lián)合創(chuàng)始人兼CTO王聞宇還推出全新Model API服務(wù)產(chǎn)品,支持生成式AI應用開發(fā)所需的全模態(tài)API,商業(yè)模式是“按需付費”。價格方面,GLM-4的 Model API 費用達到每1億(100M)Token價格達0.5元,從而以低價格來顯著提升AI應用的開發(fā)效率,并有效降低企業(yè)開發(fā)和運營成本。

會后交流時,姚欣向鈦媒體App坦言,算力需求和使用不平衡是一個長期存在的問題。從未來算力構(gòu)成來看,95%是推理算力,5%是訓練算力,但這95%也不會出現(xiàn)一家獨大局面。

“未來兩、三年內(nèi),我們有望看到大模型逐漸走向集中化和標準化,在這其中,異構(gòu)推理算力硬件環(huán)境將會呈現(xiàn)‘百花齊放’狀態(tài),針對不同的場景,不同的領(lǐng)域,有不同的解決方案,不同的卡去解決它。對于未來三年 AI 推理成本下降100倍、1000倍的過程預測,我們是非常樂觀的。”姚欣認為,開源技術(shù)是推動中國 AI 發(fā)展的關(guān)鍵要素。

“我過去經(jīng)常講一句話,被AI干掉的不是你,而是最先掌握AI的人,我們必須一次面對技術(shù)創(chuàng)新,無論多么高深必須先掌握,掌握它的人才有資格談能不能在未來時代發(fā)展;第二,對于新技術(shù)往往短期過于高估,長期過于悲觀,對我們來說,即使十年時間放在技術(shù)路線來講還是其中一小段過程,真正技術(shù)發(fā)現(xiàn)落地需要長期堅持過程。

雖然現(xiàn)在外面經(jīng)濟環(huán)境、資本環(huán)境不是那么好,但是對真正做事的人來講是一個好環(huán)境,因為今天做的每一分積累都是好回報。所以,今天的創(chuàng)業(yè)者、創(chuàng)始人也需要抱團取暖,需要形成我們的社區(qū),需要互相協(xié)作,一起來迎接支持新的 AI 時代到來,用自己心中的夢想堅定走自己的道路。”姚欣在演講結(jié)尾表示。

以下是姚欣與鈦媒體App等進行的部分對話交流整理:

問:如何看待未來算力有可能過剩這一觀點?AI算力如何實現(xiàn)供需平衡?

姚欣:在算力中心建設(shè)方面,我們見證了一種與之前數(shù)據(jù)中心建設(shè)相似的趨勢,即適度超前建設(shè)后迅速普及。然而,真正的應用需求和技術(shù)革新是連續(xù)且不斷迭代的過程,甚至有的時候是一個“躍變”的過程,你很有可能在這個過程中“死在黎明前”。

在大模型訓練領(lǐng)域,預計訓練將越來越集中,規(guī)模不斷擴大,因為規(guī)模越大,效果越好,這是所謂的scaling law效應。但能夠進行這種大規(guī)模訓練的廠商數(shù)量將減少,行業(yè)競爭將集中在幾個大玩家手中,這是產(chǎn)業(yè)成熟和技術(shù)進步的標志。

隨著技術(shù)的成熟,大規(guī)模應用將隨之而來。就像過去每個人都需要自己開發(fā)手機和操作系統(tǒng),現(xiàn)在只需要選擇幾個主流的即可。大模型的發(fā)展也將走向集中化,新應用將隨之普及。AI推理算力市場正經(jīng)歷著從文字互聯(lián)網(wǎng)到視頻互聯(lián)網(wǎng)的轉(zhuǎn)變,流量消耗呈百倍、萬倍增長。預計到2024、2025年,行業(yè)將觸底反彈,大規(guī)模應用將帶來更多推理算力需求。盡管未來95%的算力可能都是推理算力,但市場不會只有一家獨大,可能會有3家、5家甚至更多廠商共存。

在智能設(shè)備上執(zhí)行推理任務(wù)時,我們關(guān)注的焦點可能會因應用環(huán)境的不同而有所差異。例如,為了優(yōu)化智能設(shè)備的功耗,推理算法的設(shè)計需要特別注重能效比,以在保證準確性的同時降低能耗。在音視頻實時對話系統(tǒng)中,網(wǎng)絡(luò)分布和延遲成為核心考量,推理模型的選擇和部署需要能夠應對網(wǎng)絡(luò)波動,確保數(shù)據(jù)的低延遲和高質(zhì)量傳輸。如果目標是運行大規(guī)模模型以獲得更高的性價比和擴展性,那么模型的復雜度和計算能力就變得至關(guān)重要,這可能需要高性能硬件和優(yōu)化的推理引擎。智能設(shè)備的多樣性也對推理任務(wù)提出了更高的要求,需要根據(jù)不同設(shè)備的實際情況靈活調(diào)整算法和模型參數(shù),以實現(xiàn)最佳性能和效率。

未來,推理卡市場將出現(xiàn)從低端到高端的多樣化細分,以滿足不同任務(wù)的需求。然而,從IT行業(yè)的長期趨勢來看,單位算力的成本將持續(xù)下降,從未出現(xiàn)過上升的情況。這表明,隨著技術(shù)的進步,算力的普及和成本效益將不斷加速。

問:如何看待AI泡沫和過熱現(xiàn)象?

姚欣:我們目前處于行業(yè)發(fā)展的早期階段,這一時期往往伴隨著過熱現(xiàn)象,例如去年模型數(shù)量的激增,我們認為這是不必要的,因此我們并沒有跟風。我們?nèi)ツ甑牟呗允菍W⒂谖磥?,而不是追逐短期的泡沫。在早期,行業(yè)可能會出現(xiàn)泡沫,這是每個時代、每個行業(yè)不可避免的過程。但隨著時間的推移,市場逐漸回歸理性,轉(zhuǎn)向?qū)嶋H應用,這是符合當前環(huán)境的,也是我們投融資的價值觀。我們不追求簡單的技術(shù)概念,而是相信技術(shù)必須服務(wù)于行業(yè)和產(chǎn)業(yè)。作為基礎(chǔ)設(shè)施和基礎(chǔ)算力的提供商,我們需要耐心,穩(wěn)步前行。

我們不歡迎那些追求短期泡沫、融資驅(qū)動的現(xiàn)象,我們更看重的是那些能夠通過自身盈利模式吸引客戶、而非依賴融資的客戶。我們追求的是長期價值,歡迎那些有耐心、看重獨特商業(yè)模式和技術(shù)積累的資本。我們不認為,公司的估值越高、融資越多就意味著成功。相反,我們認為應該回歸價值創(chuàng)造,遵循技術(shù)的長期成熟規(guī)律。這種實事求是的投資人是我們所歡迎的。

在藍馳的投資經(jīng)歷深刻影響了我今天的商業(yè)價值觀。我們在初創(chuàng)時期就確立了商業(yè)價值觀,即要做有價值創(chuàng)造且需求落地的事情。我們不愿意僅僅為了榜單排名或展示我們的學術(shù)實力和師資能力。我們更重視的是自身的實力和能力,希望我們的團隊能夠吸引一系列閃亮的客戶,通過實際的業(yè)務(wù)成果來證明我們的價值。

坦白講,這波生成式AI才大規(guī)模發(fā)展了2年,所以我們得耐心地等,一個一個耐心地去積累,這就是我們的一個選擇。

問:現(xiàn)在公司算力云產(chǎn)品的商業(yè)化程度如何?

姚欣:我們團隊已經(jīng)建立了穩(wěn)定的營收和客戶基礎(chǔ),我更關(guān)注于尋找能夠長期合作并形成正向循環(huán)的客戶。自2020年起,我們就開始研發(fā)云游戲、數(shù)字人和分布式邊緣計算產(chǎn)品,不斷積累技術(shù)。去年,我們開始為大模型提供服務(wù),但主要聚焦于內(nèi)部和合作伙伴。我們重視中小開發(fā)者的需求,他們需要AI技術(shù)來提升營銷和市場分析能力。同時,我們感謝開源社區(qū)的支持,通過與開源模型的整合和優(yōu)化,我們的產(chǎn)品已經(jīng)成熟,能夠為不同規(guī)模的客戶提供定制化的服務(wù)。

另外,我們非常要感謝開源,我們的確從開源上得到了幫助,比如開源模型。接下來,我們會與百川、智譜等開源模型進行深度整合,做性能優(yōu)化。

實際上,兩年前就開始在做準備技術(shù),去年已給一些大客戶在內(nèi)部試用,那今年,我們覺得是已經(jīng)做得比較成熟,同時可針對大、中、小型客戶提供不同層次的產(chǎn)品能力。

問:對于 AI 算力研發(fā)高昂挑戰(zhàn),PPIO派歐云如何應對?

姚欣:那就是你的商業(yè)模式要掙錢,有營收。其實你如果看我們這種業(yè)務(wù)發(fā)展和增長,包括我們其實應該我們上一輪融資的時候,音視頻的流量需求是一度猛增的,所以我們自身的整個營收和規(guī)模已經(jīng)到了一種體量。甚至可以這樣講,經(jīng)過這么多年的打磨了,我們邊緣業(yè)務(wù)已經(jīng)走到盈利狀態(tài),邊緣業(yè)務(wù)是盈利的。

同時,我們的 AI 算力業(yè)務(wù)是投入的,是今天我們愿意去培育和等待市場,特別中小創(chuàng)業(yè)者慢慢成長和發(fā)展起來。我們再等待新的一波的這些明星公司,我們在耐心地陪待和等待他們的發(fā)展。從企業(yè)的角度來講的話,我們不是靠融資做大的公司,做ToB一定是要掙錢的。

問:其他國內(nèi)AI Infra公司與你們的區(qū)別是什么?

姚欣:很多企業(yè)是可能都有各自的專注,我能看到的是基于分布式專注做推理,且具備全站優(yōu)化能力的,是我們一家。AI 推理加速引擎框架只是我們其中的一部分,同時,我們有非常強的這個工程化研發(fā),加上學術(shù)界的背景,在系統(tǒng)結(jié)構(gòu)、體系結(jié)構(gòu)、高性能計算、并行計算、分布式計算等領(lǐng)域都有深厚背景。

而且,我們又有PPTV的技術(shù)積累,至少我們也承載過 4.5 用戶,每天的用戶訪問量也達到一個海量數(shù)字,也服務(wù)過一系列頭部的互聯(lián)網(wǎng)企業(yè),每天有數(shù)億用戶在我們的網(wǎng)絡(luò)上間接單使用我們的服務(wù)。

所以我們無論是在互聯(lián)工程側(cè),還是在系統(tǒng)結(jié)構(gòu)這種學術(shù)領(lǐng)域側(cè),我們都是最強。再加上分布式的特性,我們并不是去自己建數(shù)據(jù)中心,也不是為這個大的這個數(shù)據(jù)中心打工,我們在整合分布式和碎片化的算力,所以這三者之間做交集。我覺得,我們有挺強的差異化和獨特性。這也是為甚么我們敢喊出“三年持續(xù)極致性價比”這一口號。因為是端到端領(lǐng)域,我們不是只做 AI 推理這一件事。

(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|胡潤峰)

 

轉(zhuǎn)載請注明出處、作者和本文鏈接。
聲明:文章內(nèi)容僅供參考、交流、學習、不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

掃描下載App