算力需求大爆發(fā)誰是“大推手”?

  大約5億年前,地球迎來了物種的突然大爆發(fā),標(biāo)志著生物進(jìn)化除了緩慢漸變,還可能以跳躍的方式進(jìn)行。

  同樣,人工智能在經(jīng)歷70余年曲折發(fā)展之后,也處于一個(gè)極為關(guān)鍵的時(shí)刻,在模型、數(shù)據(jù)、算力等各項(xiàng)基礎(chǔ)技術(shù)多年持續(xù)迭代、升級(jí)的驅(qū)動(dòng)下,各種形式與樣態(tài)的智能體大爆發(fā),人工智能展現(xiàn)出令人驚嘆的“跳躍式”進(jìn)化速度。

  這其中,算力在人工智能“跳躍式”進(jìn)化中發(fā)揮著不可低估的作用,不僅支撐起人工智能的快速創(chuàng)新,自身也迎來變革與爆發(fā)式增長(zhǎng)。Gartner最新報(bào)告顯示,2024年第三季度全球服務(wù)器銷售額617.1億美元,同比大幅增長(zhǎng)85.1%,出貨量303.2萬臺(tái),同比增長(zhǎng)7.2%,其中浪潮信息以11.7%的市占率蟬聯(lián)全球第二,中國(guó)第一。同時(shí)Gartner預(yù)計(jì)2024年全球服務(wù)器市場(chǎng)規(guī)模預(yù)計(jì)可突破2000億大關(guān),達(dá)到2164億美元,出貨量約為1199萬臺(tái),同比增長(zhǎng)6.5%。

  再仔細(xì)分析,AI算力又展現(xiàn)出極強(qiáng)的增長(zhǎng)態(tài)勢(shì),主導(dǎo)著算力產(chǎn)業(yè)未來演進(jìn)方向。Gartner甚至預(yù)測(cè),到2028年,全球服務(wù)器市場(chǎng)規(guī)模將超3329億美元,其中AI服務(wù)器占據(jù)70%的市場(chǎng)份額,一個(gè)由AI算力主導(dǎo)驅(qū)動(dòng)的人工智能“大爆炸”時(shí)代正全面開啟。

  回顧過去兩年AI的發(fā)展,基礎(chǔ)大模型無疑是最大主角。在Scaling Law定律加持下,基礎(chǔ)大模型進(jìn)化速度日新月異。如今,基礎(chǔ)大模型不僅是各類智能應(yīng)用的底座,使得各類AI應(yīng)用具備人類的理解、推理等能力,更加速進(jìn)入到垂直行業(yè)之中,成為千行百業(yè)數(shù)智轉(zhuǎn)型升級(jí)的基石。

  如果說數(shù)據(jù)是基礎(chǔ)大模型的原料,那么算力就是基礎(chǔ)大模型的引擎。因此,基礎(chǔ)大模型的激烈競(jìng)爭(zhēng),直接導(dǎo)致全球加大對(duì)于算力等基礎(chǔ)設(shè)施的投入,算力即競(jìng)爭(zhēng)力成為AIGC時(shí)代的不二法則。

算力需求大爆發(fā)誰是“大推手”?(圖1)

  例如,超大規(guī)模云服務(wù)提供商既是基礎(chǔ)大模型的深度參與者,也是AI服務(wù)器市場(chǎng)的需求主力軍。Gartner數(shù)據(jù)顯示,微軟、Meta、Google等公司在2024年預(yù)計(jì)投入了722億美元在AI服務(wù)器采購(gòu)上,占據(jù)整個(gè)AI服務(wù)器市場(chǎng)的56%,巨頭們對(duì)于AI基礎(chǔ)設(shè)施的重視可見一斑。

  從地域來看,北美和大中華區(qū)兩個(gè)超大規(guī)模數(shù)據(jù)中心集中的區(qū)域也是全球服務(wù)器的銷量擔(dān)當(dāng),其中北美地區(qū)同比增長(zhǎng)149%,大中華區(qū)同比增長(zhǎng)116%。事實(shí)上,北美和大中華區(qū)也是當(dāng)下基礎(chǔ)大模型、智能應(yīng)用創(chuàng)新高地,不僅有互聯(lián)網(wǎng)巨頭,還涌現(xiàn)出一批像OpenAI、Anthropic、月之暗面、DeepSeek等一批AI初創(chuàng)公司,這些初創(chuàng)公司對(duì)于AI算力的需求亦是水漲船高。

  另外,垂直行業(yè)全面擁抱AI的趨勢(shì)也不容忽視,自動(dòng)駕駛、智能交通、智慧金融、工業(yè)AI、醫(yī)療AI等行業(yè)趨勢(shì)同樣帶動(dòng)了AI服務(wù)器的采購(gòu)。Gartner數(shù)據(jù)顯示,2024年全球企業(yè)用戶在AI服務(wù)器采購(gòu)支出上同步增長(zhǎng)高達(dá)184%。事實(shí)上,隨著基礎(chǔ)大模型能力的持續(xù)提升,垂直領(lǐng)域的大模型也在今年迅速興起,行業(yè)用戶普遍渴望擁有屬于自身領(lǐng)域的大模型和基于垂直大模型來廣泛構(gòu)建各類智能應(yīng)用,從而重塑自身業(yè)務(wù)場(chǎng)景、流程和用戶體驗(yàn)。

  可以說,2024年是人工智能發(fā)展的里程碑式一年。既有OpenAI o1、o3,Anthropic ,Claude 3.5i等眾多令人驚艷的大模型發(fā)布,也有五花八門具身智能產(chǎn)品的大量涌現(xiàn),更有各大垂直行業(yè)嘗試推動(dòng)AI與場(chǎng)景的深度融合,這一切眼花繚亂的背后都離不開算力的支撐與推動(dòng)。

  那么,2025年隨著人工智能的發(fā)展達(dá)到一個(gè)關(guān)鍵拐點(diǎn),接下來又會(huì)對(duì)算力需求產(chǎn)生哪些重要影響?

  人們從對(duì)大模型的預(yù)訓(xùn)練的關(guān)注,已經(jīng)延伸到了后訓(xùn)練和推理。事實(shí)上,在今后相當(dāng)長(zhǎng)的時(shí)間里,Scaling law依然非常重要,因?yàn)榇蠹以诓煌膱?chǎng)景中依然要持續(xù)的訓(xùn)練迭代,提升模型的性能。

  24年,大模型的技術(shù)路徑從LLM(Large Language Model)演進(jìn)到LRM(Large Reasoning Model),推理已經(jīng)成為接下來業(yè)界重點(diǎn)突破的方向。正如OpenAI 前創(chuàng)始人、首席科學(xué)家Ilya Sutskever所言:整個(gè)基礎(chǔ)大模型領(lǐng)域正重新進(jìn)入一個(gè)“發(fā)現(xiàn)和探索”的新階段。

  例如,OpenAI的o1模型采用“推理時(shí)間計(jì)算(test-time compute)”技術(shù),展現(xiàn)出令人震驚的復(fù)雜推理和決策能力;Google則在2025年初發(fā)布了Transformer 架構(gòu)的替代者--Titans架構(gòu),取消上下文限制,并將“推理時(shí)間計(jì)算”技術(shù)應(yīng)用在記憶(memory)層面;Anthropic則在Claude 3.5采用合成數(shù)據(jù)和強(qiáng)化學(xué)習(xí)來提升模型的性能表現(xiàn)……

算力需求大爆發(fā)誰是“大推手”?(圖2)

  另一方面,隨著基礎(chǔ)大模型進(jìn)入到各種業(yè)務(wù)場(chǎng)景之中,不僅加速與各種軟件進(jìn)行融合,bwin必贏官方網(wǎng)站更產(chǎn)生出極為豐富的AI應(yīng)用和各類AI Agent,也進(jìn)一步增加大量推理的需求。AWS CEO Matt Garman在去年底2024 re:Invent大會(huì)上表示,推理正變得愈發(fā)重要,成為構(gòu)建應(yīng)用當(dāng)之無愧的核心組件模塊之一。

  例如,《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,2024年,中國(guó)的生成式人工智能產(chǎn)品用戶規(guī)模已達(dá)到2.49億人,生成式人工智能在中國(guó)的應(yīng)用和普及已初具規(guī)模。而2025年,所有企業(yè)將面臨AI轉(zhuǎn)型,AI的普及與落地將帶來全新的推理算力需求的爆發(fā)。

  可以預(yù)見,“訓(xùn)練”依然會(huì)成為消耗算力的“大戶”,不過“推理”也會(huì)變得與“訓(xùn)練”一樣重要,成為人工智能舞臺(tái)上未來幾年的主角。這一改變不僅是整個(gè)產(chǎn)業(yè)界創(chuàng)新的重點(diǎn),也將持續(xù)帶動(dòng)算力的需求和創(chuàng)新。VerifiedMarketResearch預(yù)測(cè),推理芯片2024-2030年復(fù)合年增長(zhǎng)率高為22.6%。Gartner也預(yù)測(cè),2025年,推理的集群算力規(guī)模將超過訓(xùn)練,也將是AI走向普及化的關(guān)鍵之年,到2028年,應(yīng)用于推理的服務(wù)器將占整個(gè)市場(chǎng)規(guī)模70%。bwin必贏官方網(wǎng)站

  隨著人工智能與業(yè)務(wù)場(chǎng)景的深度融合,復(fù)雜的訓(xùn)練和推理任務(wù),對(duì)算力基礎(chǔ)設(shè)施提出了全新的需求,算力演進(jìn)需要去突破算力多元化、數(shù)據(jù)中心能耗、建設(shè)運(yùn)營(yíng)模式等一系列新挑戰(zhàn)。

  如今,人工智能的“跳躍式”進(jìn)化,不僅帶來巨大且持續(xù)的算力資源需求,更直接推動(dòng)算力產(chǎn)業(yè)加速演進(jìn)。

  首先,在人工智能快速發(fā)展的驅(qū)動(dòng)下,算力走向多元化成為大勢(shì)所趨,算力的演進(jìn)也將加速打破過去的固有封閉生態(tài),從芯片到算力系統(tǒng)將以更短的周期進(jìn)行升級(jí)與迭代,這必然需要算力更加開放化,逐步實(shí)現(xiàn)全面解耦和多元化生態(tài)。事實(shí)上,近年來OAM、OCM等標(biāo)準(zhǔn)獲得產(chǎn)業(yè)界的高度重視,從NVIDIA、AMD等芯片廠商,到Amazon、Meta、Google、阿里等超大規(guī)模數(shù)據(jù)中心用戶,再到浪潮信息等整機(jī)系統(tǒng)廠商,紛紛投入資源,讓不同算力能夠共享統(tǒng)一平臺(tái),以降低算力創(chuàng)新成本和適配成本,也讓多元化的應(yīng)用場(chǎng)景都能方便快捷的適配到貼合的方案,加速AI算力的創(chuàng)新。

算力需求大爆發(fā)誰是“大推手”?(圖3)

  其次,隨著AI的普及需求,未來需要一切計(jì)算皆AI,哪怕是通用算力也需要處理AI推理工作負(fù)載,服務(wù)器等算力設(shè)備的應(yīng)用邊界將持續(xù)擴(kuò)大,以滿足AI越來越多的算力需求。事實(shí)上,算力成本的昂貴是當(dāng)前最為突出的挑戰(zhàn),一切計(jì)算皆AI有望成為緩解算力資源匱乏和算力成本高昂的有效手段之一。以浪潮信息為例,基于張量并行、NF4模型量化等算法優(yōu)化,其元腦服務(wù)器僅需要4顆CPU就能完成運(yùn)行千億參數(shù)的運(yùn)行;另外,還有最新發(fā)布的元腦服務(wù)器新平臺(tái),也在Llama大模型的AI推理場(chǎng)景中性能獲得大幅提升。

  第三,AI算力帶來的高功耗挑戰(zhàn)刻不容緩,綠色算力相關(guān)規(guī)范會(huì)愈加成熟,相關(guān)技術(shù)也會(huì)加速得到應(yīng)用與普及。如今,萬卡、十萬卡規(guī)模的AI集群不斷涌現(xiàn),加上AI算力性能的提升,單機(jī)系統(tǒng)功耗不斷攀升,使得整個(gè)數(shù)據(jù)中心的散熱成為一項(xiàng)長(zhǎng)期挑戰(zhàn)。因此,AI液冷整機(jī)柜的相關(guān)規(guī)范正在制定中,冷板式液冷、熱管式液冷、浸沒式液冷等產(chǎn)品將加速普及;甚至,從規(guī)劃咨詢、設(shè)備定制到交付施工的全生命周期最優(yōu)液冷解決方案會(huì)在市場(chǎng)中收到用戶的青睞。以浪潮信息為例,日前采用119個(gè)集裝箱,僅用時(shí)120天,就像“搭樂高積木”一樣建成10MW的元腦“算力工廠”, 該算力工廠內(nèi)部署了高密智算算力倉(cāng),包括50kW負(fù)載的風(fēng)冷機(jī)柜和130kW負(fù)載的液冷機(jī)柜,實(shí)現(xiàn)智能算力的高密部署與綠色節(jié)能。

  最后則是算力使用模式和算力服務(wù)生態(tài)也在加速演進(jìn),除了公有云能夠提供各種便捷算力服務(wù)之外,GPU租賃、托管等模式需求也大幅上漲,將形成新的AI算力服務(wù)供給生態(tài)。例如,美國(guó)對(duì)AI基礎(chǔ)設(shè)施的投資額爆發(fā)增長(zhǎng),這些初創(chuàng)公司已經(jīng)將GPU算力租賃與托管的模式走通。在中國(guó),智算中心的建設(shè)熱度也居高不下。Gartner預(yù)測(cè)到2028年90%的中國(guó)企業(yè)將采用托管而非自建AI基礎(chǔ)設(shè)施,智算中心未來在AI基礎(chǔ)設(shè)施中獎(jiǎng)發(fā)揮重要作用。

  綜合觀察,Gartner最新全球服務(wù)器市場(chǎng)報(bào)告充分表明,在基礎(chǔ)大模型、AI應(yīng)用等快速發(fā)展的帶動(dòng)下,算力市場(chǎng)2024年已全面爆發(fā);同時(shí),算力需求側(cè)與供給側(cè)的需求結(jié)構(gòu)也在發(fā)生重要調(diào)整,來自AI推理的越來越多需求,將極大推動(dòng)算力未來的演進(jìn)。無論是AI芯片廠商,還是整機(jī)廠商,均需要正視和適應(yīng)算力市場(chǎng)的變化,以提升算力密度和能源利用效率,滿足AIGC“大爆發(fā)”時(shí)代的算力需求。

  特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

  上海女子報(bào)警:價(jià)值百萬的珠寶被女兒60元賣了!原因竟是為了...警方緊急調(diào)查→

  油價(jià)大跌近1100元/噸后,全國(guó)92號(hào)汽油大漲“4毛/升”,1個(gè)好消息

  減負(fù)、減負(fù)、減負(fù),說再多也不如直接掀桌子/

  主站 商城 論壇 自運(yùn)營(yíng) 登錄 注冊(cè) 減負(fù)、減負(fù)、減負(fù),說再多也不如直接掀桌子 廉頗 2025-01-2...