彭博社 需求沖擊人工智能需要更多能源、芯片、數(shù)據(jù)、土地和水……

  

彭博社 需求沖擊人工智能需要更多能源、芯片、數(shù)據(jù)、土地和水……(圖1)

  人工智能行業(yè)需要大量資源,如電力、芯片、數(shù)據(jù)、土地和水,以滿足日益增長的需求。

  02由于此,科技公司正競相鎖定長期供應,投資更高效的AI開發(fā)方式和替代能源解決方案。

  03然而,AI的需求加劇了對化石燃料發(fā)電的依賴,可能導致全球超出應對氣候變化的關鍵排放目標。

  04另一方面,AI行業(yè)本身正在創(chuàng)造數(shù)百萬就業(yè)機會,同時面臨人才短缺和偏見等問題。

  生成式AI表面上看很簡單:向ChatGPT提問,它就會作答。但深入了解后,會發(fā)現(xiàn)每個任務都依托于海量的資源消耗:數(shù)百萬名工程師、標記員和模型訓練人員,足以供應多個國家的電力,遍布全球的大型數(shù)據(jù)中心園區(qū),龐大的電力線網(wǎng)絡和互聯(lián)網(wǎng)電纜,以及水、土地、金屬和礦物。人工智能需要這一切,而且需求只會與日俱增。

  研究顯示,處理一次ChatGPT查詢所需的電力約為傳統(tǒng)谷歌搜索的十倍。普通搜索引擎只需從已建立的大型索引中獲取網(wǎng)絡內容。而最新的AI產(chǎn)品則依賴“大型語言模型”(LLMs),這些模型需要處理數(shù)十億字的文本輸入,包括從莎士比亞全集到美聯(lián)儲的最新預測。通過檢測模式和關聯(lián),這些模型形成數(shù)以百億計的參數(shù)用來模仿人類行為。借助這些模型,ChatGPT等產(chǎn)品能夠創(chuàng)造新內容,這就是“生成式AI”一詞的由來。

  可以說,AI是一個資源密集型產(chǎn)業(yè),而這一特性正在主導競爭的輸贏。掌握最多資源的機構將擁有最先進的AI系統(tǒng),這引發(fā)了對稀缺資源和芯片使用權的激烈爭奪。科技公司被迫尋求更高效的AI開發(fā)方式,并向核聚變等替代能源解決方案投入數(shù)十億美元。這些方案此前因缺乏資金和技術突破而發(fā)展緩慢。同時,AI的需求也加劇了對化石燃料發(fā)電的依賴,而這可能導致全球超出應對氣候變化的關鍵排放目標。

  雖然AI發(fā)展為投資者、企業(yè)和社會帶來巨大機遇,但也存在風險。許多人已經(jīng)指出了這類系統(tǒng)可能帶來的危害和偏見。與此同時,華爾街對等待技術轉化為實際利潤已經(jīng)失去耐心。即便是注重效率的企業(yè),也可能因過度投資基礎設施而面臨隱憂。

  AI主要運行在數(shù)據(jù)中心,這些中心內部布滿了持續(xù)運行的主板、芯片和存儲設備。如今,這些中心對電力的需求已超出世界多個地區(qū)的供應能力。根據(jù)高盛的數(shù)據(jù),美國數(shù)據(jù)中心的電力使用量預計到2030年將占總用電量的8%,幾乎是2022年AI熱潮開始時的三倍。該公司稱,這是“一個世紀以來從未見過的電力增長”。瑞典和英國也預測會出現(xiàn)類似的需求激增。到2034年,數(shù)據(jù)中心的全球年度能源消耗量預計將從目前的500TWh增至1580TWh,相當于整個印度的用電量。

  谷歌在2023財年消耗了超過24TWh的電力,較2021年增長了31%以上。微軟的用電量與之相仿,較兩年前增長了70%。全球頂級科技公司已清醒地認識到,電力可能是AI供應鏈中最具挑戰(zhàn)性的環(huán)節(jié),它們正競相鎖定長期供應。今年5月,微軟與布魯克菲爾德資產(chǎn)管理有限公司的綠色能源部門簽署了迄今規(guī)模最大的企業(yè)清潔能源采購協(xié)議。

  10月,全球規(guī)模最大的太陽能和風力發(fā)電運營商NextEra能源公司宣布達成協(xié)議,計劃到2030年為僅兩家財富500強公司開發(fā)10.5GWh的可再生能源和存儲設施。這預示著即將到來的資源競爭,而且不僅限于科技公司。正如NextEra首席執(zhí)行官約翰·凱奇姆向投資者所說:“這一繁榮使得數(shù)據(jù)中心以外的其他行業(yè)也更有動力去鎖定低成本的可再生能源發(fā)電。所有行業(yè)都在這股浪潮中上升?!?

  煤炭是全球碳排放最大的能源之一,目前仍占發(fā)電量的三分之一。天然氣雖然相對清潔,但也會產(chǎn)生溫室氣體排放,占發(fā)電量的20%。近年來,風能和太陽能發(fā)展迅速,但由于數(shù)據(jù)中心需要穩(wěn)定的電力供應,這些可再生能源的間歇性成為一大挑戰(zhàn),除非配備大型儲能電池系統(tǒng)。

  谷歌開創(chuàng)性地開發(fā)出一個解決方案:利用軟件定位電網(wǎng)中可再生能源富余的區(qū)域,并在這些地點優(yōu)化數(shù)據(jù)中心運營效率。目前,核能是唯一可靠的全天候零排放電力來源。這就是為什么微軟在9月份同意重啟賓夕法尼亞州三哩島核電站的一座反應堆,盡管該電站在1979年曾發(fā)生過嚴重事故。隨后不久,亞馬遜簽署了三項小型核反應堆開發(fā)協(xié)議,而谷歌也投資并承諾從一家模塊化反應堆公司購買電力。

  “我的天哪,核反應堆?你在開玩笑吧?”甲骨文董事長拉里·埃里森在9月份的分析師會議上感嘆道?!斑@聽起來像是天方夜譚,但確實是真的。我們以前見過這種事嗎?”

  輸電線路和變電站是AI鏈中最容易被忽視的環(huán)節(jié)。所有新建的數(shù)據(jù)中心都需要連接到電網(wǎng),而現(xiàn)有電網(wǎng)已經(jīng)老化、負荷過重,且容易受惡劣天氣影響。在4月份的彭博社情報活動中,云服務提供商CoreWeave的聯(lián)合創(chuàng)始人布萊恩·文圖羅指出,他們這些公司正在開發(fā)的大型數(shù)據(jù)中心將給電網(wǎng)帶來巨大壓力。他舉例說,一個工業(yè)區(qū)的變電站通常供應30兆瓦電力,其中一個數(shù)據(jù)中心就可能需要5兆瓦。

  剩余電力則供應其他辦公室和工廠。而現(xiàn)在,文圖羅說,像CoreWeave這樣的公司會提出“我需要500兆瓦”的要求,“這意味著必須建設新的輸電線路和變電站?!贝送?,這些變電站需要安裝變壓器,而變壓器的訂購周期可能長達數(shù)年。

  而500兆瓦只是開始。OpenAI的聯(lián)合創(chuàng)始人兼CEO薩姆·阿爾特曼提到的數(shù)據(jù)中心可能需要高達5000兆瓦的電力。Constellation Energy公司CEO喬·多明格斯表示,短期內從零開始建設如此大規(guī)模的電力系統(tǒng)“在技術上是不可能的”。作為向微軟供電的三哩島核電站所有者,多明格斯建議數(shù)據(jù)中心應考慮在現(xiàn)有大型電力設施周邊選址,比如他的核電站。他提出了一個解決方案:在一到兩座核反應堆旁建設大型園區(qū),配套可再生能源和儲能電池,通過新建電力線路和負荷轉移控制系統(tǒng)連接起來,從而打造一個獨立的電網(wǎng)系統(tǒng)。

  服務器的每一瓦電力都會產(chǎn)生熱量。過高的溫度不僅會損壞設備,還會降低系統(tǒng)運行速度。目前,在數(shù)據(jù)中心中,使用水冷卻空氣是最節(jié)能且最具成本效益的方法。據(jù)Bluefield Research估計,數(shù)據(jù)中心每天消耗超過10億升水(包括能源生產(chǎn)用水),相當于330萬人的日常用水量。

  2023年的一項研究顯示,與ChatGPT進行10到50次對線毫升的瓶裝水。而僅僅是訓練ChatGPT背后的一個早期AI模型,就消耗了近75.8萬升水。更值得注意的是,為了避免環(huán)境問題和設備故障,這些用水大多是飲用水。

  水務局數(shù)據(jù)顯示,在愛荷華州西德梅因,OpenAI使用的微軟數(shù)據(jù)中心網(wǎng)絡已成為該地區(qū)最大的用水戶,用水量甚至超過了整個城市。(該地區(qū)表示,目前正在調查一起導致用水量激增的泄漏事故。)在西班牙的塔拉韋拉德萊雷納小鎮(zhèn),Meta Platforms公司計劃建設一個年度用水量達6.65億升的中心,此事已與當?shù)鼐用癞a(chǎn)生爭議。

  大語言模型需要通過互聯(lián)網(wǎng)消化海量數(shù)據(jù)來學習,而AI工具的使用者又進一步推高了這種需求。AT&T公司CEO約翰·斯坦基在5月份指出,該公司的無線%,這種增長勢頭在AI使用量上升的情況下不會放緩。他說:“如果要維持每年30%到35%的使用量增長,就必須建設更寬闊的數(shù)據(jù)高速公路來承載它。”

  Verizon Communications公司消費者集團CEO索米亞納拉揚·桑帕特在同期的一次采訪中表示,過去五年間,由于視頻觀看和流媒體服務的普及,該公司的網(wǎng)絡流量已增長了一倍多。他預計,未來五年內,由于AI模型的提示和數(shù)據(jù)輸入,流量將再次翻倍。他說,AI“將成為我們的下一個增長引擎”??萍脊緦饫w網(wǎng)絡的渴求如此迫切,以至于電信公司Lumen Technologies公司在8月份宣布,它已獲得了50億美元的AI相關連接需求業(yè)務(并正在洽談另外70億美元)。

  全球范圍內,已建成或處于不同開發(fā)階段的數(shù)據(jù)中心超過7000個,相比2015年的3600個翻了近一倍。但這似乎仍然不夠。即使在ChatGPT出現(xiàn)之前,數(shù)據(jù)中心服務需求就在快速增長,主要原因是企業(yè)紛紛將數(shù)據(jù)處理外包并轉向云服務。如今,各主要國家都在爭相建設本土AI中心,掀起了一場全球基礎設施競賽。

  數(shù)據(jù)中心需要大量土地。以專注于數(shù)據(jù)中心房地產(chǎn)投資信托基金的Equinix公司為例,該公司購買了200英畝土地用于建設一個數(shù)百兆瓦的園區(qū)。另一家公司則最近簽約租用2000英畝土地,計劃建設一個千兆瓦級園區(qū)。然而,尋找適合數(shù)據(jù)中心高電力需求的土地并不容易,這導致了激烈的競購。除了土地外,這些龐大的建筑群還需要大量建筑材料和施工人員,bwin必贏官方授權平臺而目前這兩者都供不應求。云服務提供商CoreWeave的文圖羅表示,一些客戶甚至要求將整個園區(qū)專門用于他們的業(yè)務。用他的話說:“市場發(fā)展速度遠遠超過了傳統(tǒng)實體產(chǎn)業(yè)供應鏈的建設速度?!?/a>

  GPU是訓練AI模型的核心。這種處理器能同時處理數(shù)千個任務,這就是所謂的并行運算。一個數(shù)據(jù)中心可能需要數(shù)百甚至數(shù)千個這樣的處理器,每個的價格都超過一輛家用車。生成式AI熱潮初起時,幾乎所有主要科技公司都面臨這類芯片短缺。微軟和谷歌在近期財報會議上都將GPU庫存不足列為主要挑戰(zhàn)。

  英偉達通過每年推出新技術,讓這場競爭更加激烈。這進一步加劇了供應鏈的緊張。該公司11月表示,其新款Blackwell產(chǎn)品已恢復正常生產(chǎn),出貨量超出預期。但要完全滿足市場需求,仍需要數(shù)個季度。

  上述設備都離不開金屬和礦物原料。以硅為例,它是芯片、電路和處理器的基礎材料。中國作為全球最大的硅原料和精制硅材料生產(chǎn)國,隨著中美及其盟友關系趨緊,供應擔憂日益加劇。最近北卡羅來納州就出現(xiàn)了供應鏈危機。10月,海倫颶風不僅造成數(shù)十人死亡,讓美國東部多地民眾受困,還影響了該州兩座礦山的運營。這兩座礦山共同生產(chǎn)了約五分之四的高純度石英,這種石英用于制造坩堝,硅在坩堝中被加熱熔化并重結晶,形成制造半導體的理想材料。

  半導體中含有金、銀、鋁和錫等金屬,這些材料的供應基本充足。但兩種較為冷門的芯片金屬——鎵和鍺已成為潛在瓶頸。12月,中國宣布禁止向美國出口這些金屬,這是科技戰(zhàn)升級的最新舉措。銅則廣泛應用于芯片、數(shù)據(jù)中心、電氣設備和冷卻裝置中,這可能引發(fā)AI、可再生能源和電動交通三方對銅資源的爭奪。此外,作為建造數(shù)據(jù)中心和電纜等基礎設施的關鍵材料,鋼材的供應也至關重要。

  關于AI可能淘汰的工作崗位已有諸多討論。2月,瑞典金融科技公司Klarna Bank AB宣布其AI助理的工作效率相當于700名全職客服人員,引發(fā)廣泛關注。全球研究和分析機構警告,金融、法律和客服等領域的就業(yè)將受到重大沖擊。國際貨幣基金組織估計,AI可能會取代或改變全球近40%的工作崗位。

  然而,AI行業(yè)本身正在創(chuàng)造數(shù)百萬就業(yè)機會。這些崗位包括計算機科學家、數(shù)據(jù)架構師、研究人員、數(shù)學家、軟件工程師、芯片設計師、產(chǎn)品和項目經(jīng)理以及合規(guī)律師。此外還有大量內部分析師、營銷人員和銷售人員。11月初,Salesforce就宣布計劃招募1000多名員工來銷售其新的生成式AI產(chǎn)品。

  在這場AI人才爭奪戰(zhàn)中,大多數(shù)領域都面臨人才短缺??萍纪顿Y者和AI創(chuàng)業(yè)公司都在為缺乏優(yōu)秀且經(jīng)驗豐富的人才而發(fā)愁。硅谷甚至出現(xiàn)了“AI名?!币辉~,指代包括Alphabet、微軟和OpenAI在內的幾家培養(yǎng)精英人才的公司,這些人才往往成為其他公司爭相挖角的對象。與此同時,越來越多的人才從印度等國被招募到海外,負責構建和優(yōu)化AI系統(tǒng)所需的高質量數(shù)據(jù)集。

  生成式AI模型需要高質量數(shù)據(jù),就如同人類需要食物。大語言模型通過吸收被分解成“標記”的小文本單元進行“訓練”。在這個過程中,模型會識別文本模式,通過反復迭代來預測哪些文本應該跟隨其他文本。世界上最重要的LLM每個都接受了超過一萬億個標記的訓練。為了便于理解,2048個標記大約相當于1500個單詞。bwin必贏官方授權平臺目前,關于全球累積文本數(shù)據(jù)的標記總量,各方估計差異較大,從幾萬億到數(shù)千兆不等。

  令人意外的是,如此龐大的數(shù)據(jù)量可能仍然不足以推動AI按期望速度發(fā)展。包括OpenAI在內的全球AI模型開發(fā)商發(fā)現(xiàn),尋找新的、未開發(fā)的、高質量的訓練數(shù)據(jù)變得越來越困難。

  非英語數(shù)據(jù)資源有限,而關注非西方或非白人群體的數(shù)據(jù)更是稀少。這種多樣性的缺失可能導致AI產(chǎn)品對少數(shù)族裔、女性和其他弱勢群體產(chǎn)生偏見。例如,彭博社今年的分析顯示,ChatGPT背后的基礎AI模型在按姓名對簡歷排序時,對某些族裔表現(xiàn)出偏見。OpenAI表示,這些結果可能并不反映客戶實際使用模型的情況,同時強調公司致力于識別潛在危害。

  從媒體機構到金融機構的內容生產(chǎn)商都意識到,他們的信息對AI開發(fā)商的價值與日俱增。2023年,好萊塢演員和編劇發(fā)起罷工,以保護其創(chuàng)作免受AI技術侵害。《紐約時報》和主要唱片公司正在起訴AI公司,理由是后者使用受版權保護的作品來訓練數(shù)據(jù)。對此,AI公司辯稱對公開材料進行訓練屬于合法的合理使用。

  在近期一次投資者電話會議上,標普全球公司首席執(zhí)行官馬蒂娜·張強調:“大型語言模型的質量和規(guī)模取決于其訓練數(shù)據(jù)的質量和數(shù)量,而我們恰恰擁有海量優(yōu)質數(shù)據(jù)?!眱H在過去一年,OpenAI就與多家內容提供商達成協(xié)議,包括News Corp.、Condé Nast、Hearst、Reddit、《人物》雜志出版商Dotdash Meredith和Axel Springer。

  科技公司正在探索使用“合成”數(shù)據(jù)集(即AI自行創(chuàng)建的內容)來訓練模型。理論上,這既能滿足AI公司對數(shù)據(jù)的巨大需求,又能規(guī)避從網(wǎng)絡抓取信息所涉及的法律、倫理和隱私問題。但研究人員警告,如果用AI生成的內容而非人類創(chuàng)作的內容來訓練模型,可能會導致模型“崩潰”。

  2023年一項關于模型崩潰的研究表明,當模型僅用少量自身生成的內容重新訓練后,其生成的人物圖像就開始出現(xiàn)扭曲。

  投資者、數(shù)據(jù)中心運營商、能源公司等各類企業(yè)正在向AI供應鏈的各個環(huán)節(jié)投入數(shù)千億美元。各大銀行和私人金融機構都在積極爭取預計高達1萬億美元的AI基礎設施支出份額。Alphabet、亞馬遜、Meta和微軟在2024年的資本支出預計將共計超過2000億美元。標普500公用事業(yè)板塊指數(shù)在過去一年上漲22%,而專注于數(shù)據(jù)中心的房地產(chǎn)投資信托基金Equinix自2022年底以來市值近乎翻倍。英偉達股價在過去兩年飆升近700%,躋身全球最具價值公司之列。

  然而,歸根結底,沒人能確定AI的繁榮是否會持續(xù)。部分華爾街分析師已開始預測熱潮即將結束。投資者質疑大型科技公司的巨額投入能否實現(xiàn)預期的AI盈利。對于投入AI的數(shù)百億美元投資來說,最大的威脅或許在于全球頂尖模型開發(fā)商及其供應商對效率的過度追求。

  芯片設備制造商應用材料公司首席執(zhí)行官加里·迪克森去年 11 月告訴投資者,一些人工智能公司的目標是在五年內實現(xiàn)計算效率的“100 倍提升”。他說,其他公司則希望在 15 年內實現(xiàn) 1萬倍的提升。迪克森表示,效率“正在成為行業(yè)統(tǒng)一的驅動力”。