2025年算力產(chǎn)業(yè)十大趨勢(shì)|年度專題策劃

  在過去一整年的時(shí)間里,始終貫穿了兩條全球性的核心主題,一個(gè)是以生成式AI為代表的人工智能技術(shù),一個(gè)是以綠色能源為代表的能源技術(shù),尤其是在全球數(shù)以萬計(jì)資金的大規(guī)模算力基礎(chǔ)設(shè)施投入背景下,能源需求大增,算力產(chǎn)業(yè)也因此成為這一周期下的最大產(chǎn)業(yè)受益者。 據(jù)中國(guó)IDC圈不完全統(tǒng)計(jì),截止2024年12月31日,中國(guó)智算中心建設(shè)項(xiàng)目已將近700個(gè),由此催生的一系列機(jī)遇、挑戰(zhàn)與變化正接踵而來,隨著2025年的來臨,身處算力產(chǎn)業(yè)中的我們又將面臨什么?

  在經(jīng)濟(jì)領(lǐng)域,事態(tài)演變的節(jié)奏往往表現(xiàn)為一個(gè)悖論其發(fā)展進(jìn)程初期較預(yù)期更為緩慢,而一旦臨界點(diǎn)被突破,其變化速度則會(huì)遠(yuǎn)超預(yù)期閾值。

2025年算力產(chǎn)業(yè)十大趨勢(shì)|年度專題策劃(圖1)

  在過去一整年的時(shí)間里,始終貫穿了兩條全球性的核心主題,一個(gè)是以生成式AI為代表的人工智能技術(shù),一個(gè)是以綠色能源為代表的能源技術(shù),尤其是在全球數(shù)以萬計(jì)資金的大規(guī)模算力基礎(chǔ)設(shè)施投入背景下,能源需求大增,算力產(chǎn)業(yè)也因此成為這一周期下的最大產(chǎn)業(yè)受益者。

  據(jù)中國(guó)IDC圈不完全統(tǒng)計(jì),截止2024年12月31日,中國(guó)智算中心建設(shè)項(xiàng)目已將近700個(gè),由此催生的一系列機(jī)遇、挑戰(zhàn)與變化正接踵而來,隨著2025年的來臨,身處算力產(chǎn)業(yè)中的我們又將面臨什么?

  新年伊始,中國(guó)IDC圈將與您一起拉開2025年的算力序幕,帶來「2025年算力產(chǎn)業(yè)十大趨勢(shì)」:

  進(jìn)入2025年,以數(shù)據(jù)中心為代表的算力產(chǎn)業(yè)面臨著前所未有的可持續(xù)性挑戰(zhàn)。OpenAI CEO Sam Altman指出,充沛的智能需要建立在強(qiáng)大的能源基礎(chǔ)之上。的確,能源不僅是人工智能的基石,更是所有算力基礎(chǔ)設(shè)施的命脈。全球范圍內(nèi),包含10萬卡(H100 GPU)甚至千兆瓦級(jí)規(guī)模的超大規(guī)模集群正在加速建設(shè),算力基礎(chǔ)設(shè)施的能源需求持續(xù)攀升,這對(duì)能源供應(yīng)和環(huán)境可持續(xù)性構(gòu)成嚴(yán)峻考驗(yàn)。

  電力消耗方面,專業(yè)機(jī)構(gòu)預(yù)測(cè),2025年全球科技巨頭擁有的芯片數(shù)量將高達(dá)1240萬塊(等效H100 GPU),其折算功耗超過1萬MW,耗電量驚人。此外,科技巨頭購(gòu)買GPU芯片還需承擔(dān)每年數(shù)以千萬美元計(jì)的電力成本。據(jù)測(cè)算,一個(gè)擁有20480塊GPU的數(shù)據(jù)中心集群,在80%利用率和1.25PUE條件下,每年理論耗電量高達(dá)249,185 GWh。

  水資源消耗同樣不容忽視。加州大學(xué)河濱分校和德克薩斯大學(xué)阿靈頓分校的研究人員估算,到2027年,AI基礎(chǔ)設(shè)施的全球水資源需求將超過丹麥全年用水量,相當(dāng)于英國(guó)用水量的一半。

  在全球“雙碳”政策背景下,構(gòu)建可持續(xù)的算力基礎(chǔ)設(shè)施勢(shì)在必行。為實(shí)現(xiàn)可持續(xù)發(fā)展目標(biāo),PUE亦需向更加精細(xì)化的方向演進(jìn),例如對(duì)機(jī)柜內(nèi)IT設(shè)備功耗進(jìn)行更精準(zhǔn)的統(tǒng)計(jì)監(jiān)測(cè)與管理,以便在猛烈的能源需求到來前,盡早構(gòu)建可持續(xù)的算力基礎(chǔ)設(shè)施。

  2025年,英偉達(dá)下一代GPU GB300可能會(huì)出現(xiàn)多個(gè)關(guān)鍵硬件規(guī)格變化:引入GPU插槽、增設(shè)冷板模塊并采用更高功率電源模塊(獨(dú)立電源架)等等。而這些背后的核心驅(qū)動(dòng)因素是對(duì)算力效率和商業(yè)回報(bào)。顯然,AI持續(xù)爆發(fā)正對(duì)全球算力基礎(chǔ)設(shè)施的彈性提出更高要求。

  以GPT-4為例,該模型參數(shù)規(guī)模龐大,計(jì)算復(fù)雜度極高,必贏官網(wǎng)首頁對(duì)底層算力基礎(chǔ)設(shè)施提出了嚴(yán)峻挑戰(zhàn)。

2025年算力產(chǎn)業(yè)十大趨勢(shì)|年度專題策劃(圖2)

  如圖所示的GPT-4性能估算,清晰地展現(xiàn)了不同硬件配置下性能的顯著差異。對(duì)比H100和GB200等不同硬件配置驅(qū)動(dòng)GPT-4的性能,采用GB200 Scale-Up 64配置的盈利能力是H100 Scale-Up 8配置的6倍。這意味著在相同投入下,新一代算力基礎(chǔ)設(shè)施能提供更高的算力效率與商業(yè)回報(bào),而這些都基于更具彈性的設(shè)計(jì)與硬件迭代。

  對(duì)IDC廠商來說,面向AI爆發(fā)與IT的快速迭代,如何讓長(zhǎng)達(dá)5年甚至更長(zhǎng)的數(shù)據(jù)中心建設(shè)具有彈性正在受到更多市場(chǎng)關(guān)注。

  對(duì)算力核心設(shè)備廠商來說同樣面臨巨大挑戰(zhàn),光子學(xué)技術(shù)的先驅(qū)、Ayar Labs首席執(zhí)行官M(fèi)ark Wade就對(duì)此表示過明確的擔(dān)憂:銅互連已經(jīng)無法以經(jīng)濟(jì)的方式支持AI工作負(fù)載。業(yè)界現(xiàn)在面臨一個(gè)情況,即硬件構(gòu)建者需要大幅提高這些系統(tǒng)的成本效益吞吐量。否則,我們都將走向類似于互聯(lián)網(wǎng)泡沫破裂的崩潰。。

  進(jìn)入2025年,大模型訓(xùn)練的放緩并沒能阻止AI熱潮的延續(xù),以Agent為代表的AI推理需求正在進(jìn)一步加速算力基礎(chǔ)設(shè)施建設(shè)。尤其Agent帶來的異步互動(dòng)特性(與用戶或其他系統(tǒng)進(jìn)行非實(shí)時(shí)的交互)將大幅消耗token數(shù)量,進(jìn)而對(duì)AI算力基礎(chǔ)設(shè)施形成更加強(qiáng)烈的依賴。

  與此同時(shí),混合云市場(chǎng)份額也將因Agent特有的工作狀態(tài)需求獲得大幅提升。屆時(shí),從算力供給結(jié)構(gòu)來看,AI算力中將有75%用于推理,25%用于訓(xùn)練。

  在全球范圍內(nèi),各國(guó)從政府到大型企業(yè)都在投入可持續(xù)能源建設(shè)以支持算力產(chǎn)業(yè)發(fā)展,持續(xù)強(qiáng)化以數(shù)據(jù)中心為代表的算電協(xié)同,并催生一系列創(chuàng)新技能技術(shù)的誕生。一方面,算力增長(zhǎng)需要大量電力能源支持,另一方面,能源電力系統(tǒng)轉(zhuǎn)型也需要算力提升對(duì)新能源消納的能力和比例,最終創(chuàng)新技能技術(shù)成為算力與電力的一致需求。

  展望2025,在這一趨勢(shì)下,算力和電力協(xié)同模式將會(huì)在各種創(chuàng)新節(jié)能技術(shù)趨勢(shì)下迎來發(fā)展機(jī)遇,尤其核電正在受到全球各國(guó)政府及科技巨頭關(guān)注。

  近年來,由中國(guó)主導(dǎo)的一場(chǎng)清潔能源技術(shù)熱潮就是其中一個(gè)重要表現(xiàn),中國(guó)太陽能電池板和電網(wǎng)儲(chǔ)能應(yīng)用都顯著超出市場(chǎng)預(yù)期。2023年中國(guó)是風(fēng)電和太陽能發(fā)電增長(zhǎng)占全球新增太陽能發(fā)電量的51%、新增風(fēng)力發(fā)電量占60%。德國(guó)加速推進(jìn)能源轉(zhuǎn)型,目前全國(guó)50%應(yīng)用綠電,住宅面積、屋頂光伏覆蓋將不能低于30%。英國(guó)正通過Sizewell C項(xiàng)目加速擴(kuò)展核能發(fā)電。

  與此同時(shí),微軟、谷歌、亞馬遜、Meta等科技巨頭在各地建立數(shù)據(jù)中心同時(shí),也開始紛紛合作開發(fā)核電項(xiàng)目(如SMR等),用于保證未來AI算力基礎(chǔ)設(shè)施的能源持續(xù)供應(yīng)。國(guó)內(nèi)外都廣泛采用多種模式展開,包括綠電直供、源網(wǎng)荷儲(chǔ)一體化、綠電交易(包括歐美的電力購(gòu)買協(xié)議Power Purchase Agreement,PPA等)、隔墻售電等等。

  與此同時(shí),通過創(chuàng)新算法、硬件材料等創(chuàng)新技術(shù)降低數(shù)據(jù)中心能耗等方式也廣泛存在,比如密歇根大學(xué)(University of Michigan)、華盛頓大學(xué)(University of Washington)與加州大學(xué)圣地亞哥分校(UC San Diego)的研發(fā)團(tuán)隊(duì)開發(fā)的創(chuàng)新算法,可以調(diào)節(jié)大模型訓(xùn)練階段功耗降低30%用電量。與此同時(shí),采用更加耐高溫或冷卻需求更低的服務(wù)器材料也稱為更多數(shù)據(jù)中心的選擇,據(jù)專業(yè)機(jī)構(gòu)估算,數(shù)據(jù)中心每提高1攝氏度,就能節(jié)省5%左右的電力成本。

  生成式AI的全面爆發(fā)正推動(dòng)機(jī)架功率密度的持續(xù)上升。目前,科技巨頭所建設(shè)的AI算力基礎(chǔ)設(shè)施平均密度為每機(jī)架36kW,未來有望達(dá)到50kW以上,且AI超大規(guī)模集群需求預(yù)計(jì)更將達(dá)到每機(jī)架100kW。

  與此同時(shí),為了支持大模型的高帶寬低延時(shí)需求,同時(shí)考慮到降低成本和故障,數(shù)據(jù)中心中的芯片與芯片、服務(wù)器與服務(wù)器之間的距離要求越來越緊密,算力硬件密度需求也由此出現(xiàn)。尤其是AI數(shù)據(jù)中心(智算中心)大規(guī)模建設(shè)之后,未來將普遍面臨網(wǎng)絡(luò)成本高企。

  隨著AI應(yīng)用的爆發(fā),未來智算中心在運(yùn)行中將不得不考慮網(wǎng)絡(luò)成本問題。從傳統(tǒng)的南北向流量,到如今智算中心中高達(dá)80%以上的東西向流量,如何保證在大規(guī)模訓(xùn)練推理時(shí)不會(huì)出現(xiàn)大幅性能損耗成為關(guān)注重點(diǎn)。

  知名半導(dǎo)體機(jī)構(gòu)SemiAnalysis在其2024年10月發(fā)布的《Datacenter Anatomy Part 1:Electrical Systems》報(bào)告中指出:“任何無法提供更高密度液體冷卻能力的數(shù)據(jù)中心,將無法為客戶帶來顯著的性能與總擁有成本(TCO)改進(jìn),最終將在生成式AI的競(jìng)爭(zhēng)中落后?!?

  液冷技術(shù)已存在多年,但高成本、漏液可能損壞部件等問題曾阻礙其與風(fēng)冷競(jìng)爭(zhēng),直到如今冷卻需求達(dá)到風(fēng)冷近乎極限且低效的程度。然而,這并不意味著風(fēng)冷即將退出歷史舞臺(tái),相反,通過對(duì)服務(wù)器CPU功耗與散熱解決方案關(guān)系的可以看出,風(fēng)冷與液冷將在很長(zhǎng)一段時(shí)間內(nèi)并存,形成一種混合模式。

2025年算力產(chǎn)業(yè)十大趨勢(shì)|年度專題策劃(圖3)

  從服務(wù)器高度(U)和CPU插槽功耗(W)來看,不同散熱方式有其適用范圍:

  低功耗(350W):通常采用風(fēng)冷,成本低、結(jié)構(gòu)簡(jiǎn)單、維護(hù)方便,適用于對(duì)計(jì)算性能要求不高的場(chǎng)景,服務(wù)器高度從1U到6U+均可應(yīng)用。

  中等功耗(350W-1500W):更適合閉環(huán)液冷,隨功耗增加,服務(wù)器高度通常為2U及以上。

  高功耗(1500W):需采用更復(fù)雜的開環(huán)液冷,服務(wù)器通常需要較高機(jī)箱空間(6U+)。

  液冷散熱效率雖高,但成本、結(jié)構(gòu)復(fù)雜性及維護(hù)難度也相對(duì)較高,對(duì)于低功耗服務(wù)器而言并不經(jīng)濟(jì)。即使液冷技術(shù)未來發(fā)展普及,其成本和復(fù)雜性仍高于風(fēng)冷。不同類型的液冷方案(如閉環(huán)和開環(huán))也分別適用于不同功耗范圍,體現(xiàn)了散熱技術(shù)多樣性并存的趨勢(shì)。散熱技術(shù)的演進(jìn)(如3D均熱板、高密度冷卻等)提高了散熱效率,使風(fēng)冷和液冷都能應(yīng)對(duì)更高功耗,促進(jìn)了風(fēng)液混合模式的長(zhǎng)期共存。

  過去一年來,AI生產(chǎn)力依然局限于小場(chǎng)景應(yīng)用,真正的AI生產(chǎn)力繁榮需要三大因素的共同作用:公司在AI領(lǐng)域大規(guī)模資本支出+算力及軟件價(jià)格的大幅下降+AI技術(shù)有效融入核心產(chǎn)品服務(wù)。

  進(jìn)入2025年,這一趨勢(shì)有望初具雛形,以Agent應(yīng)用、自動(dòng)駕駛為代表的超級(jí)算力場(chǎng)景有望陸續(xù)到來,要充分釋放人工智能的潛力,需要進(jìn)行更根本性的變革

  AI算力基礎(chǔ)設(shè)施的電力需求激增,正在給數(shù)據(jù)中心供電帶來持續(xù)挑戰(zhàn)。雖然全球數(shù)據(jù)中心總用電量自2015年以來保持穩(wěn)定,但工作負(fù)載卻增加了一倍多,這主要得益于效率提升和基礎(chǔ)設(shè)施改進(jìn)。但隨著AI爆發(fā),正在對(duì)工作負(fù)載帶來包括能源波動(dòng)問題在內(nèi)的諸多全新挑戰(zhàn),尤其是新能源供電方面。

  智算中心中的AI訓(xùn)練工作負(fù)載非常耗電且波動(dòng)劇烈。AI硬件的運(yùn)行功率通常接近其熱設(shè)計(jì)功率(TDP),每臺(tái)AI服務(wù)器現(xiàn)在都超過了10kW。當(dāng)前智算中心負(fù)載波動(dòng)劇烈,可達(dá)50%以上,甚至瞬間超過150%或200%。因此,需重新評(píng)估UPS抗過載能力、系統(tǒng)架構(gòu)以及制冷方案。例如,傳統(tǒng)的PID控制制冷方式可能無法有效應(yīng)對(duì)智算中心負(fù)載的快速變化,需要探索新的解決方案。此外,我國(guó)在新能源供電方面也明確要求未來達(dá)到10%以上的自備出力(自備電廠的輸出功率),目前傳統(tǒng)能源的自備出力基本上在70%以上。

  此外,為應(yīng)對(duì)供電挑戰(zhàn),數(shù)據(jù)中心也正在采用多種供電方案,比如,長(zhǎng)期來看,高壓直流(HVDC)等技術(shù)可以減少能量損耗,提高供電穩(wěn)定性。

2025年算力產(chǎn)業(yè)十大趨勢(shì)|年度專題策劃(圖4)

  即日起,中國(guó)IDC圈將陸續(xù)為您帶來「2025年算力產(chǎn)業(yè)十大趨勢(shì)」更多精彩內(nèi)容,敬請(qǐng)期待。

  關(guān)注中國(guó)IDC圈官方微信:idc-quan我們將定期推送IDC產(chǎn)業(yè)最新資訊

  加快推進(jìn)全國(guó)一體化算力網(wǎng)的建設(shè):通過這些措施,可以加快推進(jìn)全國(guó)一體化算力網(wǎng)的建設(shè),進(jìn)一步提升我國(guó)在全球數(shù)字經(jīng)濟(jì)中的競(jìng)爭(zhēng)力。

  2024年算力發(fā)展預(yù)測(cè)概括為:算力需求持續(xù)增長(zhǎng),高性能算力占比提升,算力服務(wù)更便捷,大模型技術(shù)多模態(tài)感知,AI治理推動(dòng)可靠發(fā)展,科技創(chuàng)新驅(qū)動(dòng)經(jīng)濟(jì)增長(zhǎng)。

  從長(zhǎng)遠(yuǎn)來看,新玩家不僅影響了算力產(chǎn)業(yè)的未來格局,也會(huì)推動(dòng)算力產(chǎn)業(yè)的發(fā)展和創(chuàng)新。拼資本、拼技術(shù)、拼服務(wù),隨著新玩家的涌入,算力產(chǎn)業(yè)的競(jìng)爭(zhēng)力要素又會(huì)如何變化呢?

  當(dāng)前,算力的重要性已被提升到新的高度。算力作為數(shù)字經(jīng)濟(jì)時(shí)代新的生產(chǎn)力,對(duì)推動(dòng)科技進(jìn)步、行業(yè)數(shù)字化轉(zhuǎn)型以及經(jīng)濟(jì)社會(huì)發(fā)展發(fā)揮著重要作用。

  經(jīng)過多年的高速增長(zhǎng),算力產(chǎn)業(yè)在國(guó)家“東數(shù)西算”戰(zhàn)略的加持下,將進(jìn)入到高質(zhì)量發(fā)展新階段。