市場研究機(jī)構(gòu) IoT Analytics 遴選出了 2024 年度 AI 領(lǐng)域內(nèi)最值得關(guān)注的十大事件,全面梳理了這一年的行業(yè)趨勢與挑戰(zhàn)。
2024 年,AI 浪潮依舊兇猛地奔涌向前,未見頹勢,悄然重塑著世界的輪廓,書寫了一個(gè)個(gè)創(chuàng)紀(jì)錄的革新性事件。
這一年,無論是英偉達(dá) (NVIDIA)、博通 (Broadcom) 等基礎(chǔ)設(shè)施供應(yīng)商,還是微軟 (Microsoft) 等云服務(wù)提供商,其 AI 業(yè)務(wù)的收入均實(shí)現(xiàn)了強(qiáng)勁增長。這一年,英偉達(dá)多次超越蘋果和微軟,成為全球最有價(jià)值的公司。市場研究機(jī)構(gòu) IoT Analytics 面向 GenAI 市場的研究數(shù)據(jù)顯示,英偉達(dá)的數(shù)據(jù)中心 GPU 收入在 2024 年增長了 142%,使其市值突破 3.5 萬億美元。
也是在這一年,OpenAI 和 xAI 在融資輪中均籌集了超過 60 億美元,同時(shí),科技股集中的納斯達(dá)克指數(shù)首次突破 20,000 點(diǎn)……
觀察到 AI 發(fā)展熱潮的持續(xù)升溫,市場研究機(jī)構(gòu) IoT Analytics 遴選出了 2024 年度該領(lǐng)域內(nèi)最值得關(guān)注的十大事件:
2024 年 2 月 14 日,微軟宣布,來自俄羅斯、中國、朝鮮和伊朗的國家級黑客一直在使用 OpenAI 的工具來改進(jìn)其攻擊能力。
微軟表示,這些組織使用 AI 的方式各不相同。例如,俄羅斯 GRU 通常使用大型語言模型 (LLM) 來研究「可能與烏克蘭常規(guī)軍事行動有關(guān)的各種衛(wèi)星和雷達(dá)技術(shù)」。與此同時(shí),有報(bào)道稱朝鮮黑客使用 LLM 生成用于魚叉式網(wǎng)絡(luò)釣魚 (spear-phishing) 活動的內(nèi)容,而伊朗黑客則使用這些模型編寫更有說服力的電子郵件。
作為全球首個(gè)正式、全面的人工智能監(jiān)管法規(guī),其根據(jù)(濫用)人工智能可能造成的潛在危害,將人工智能分為四個(gè)風(fēng)險(xiǎn)類別,從而為歐盟境內(nèi)使用人工智能制定了規(guī)則:
允許的最高風(fēng)險(xiǎn)級別,歐盟人工智能法案的大部分內(nèi)容都集中在對這一類系統(tǒng)的監(jiān)管上,其包括但不限于:
* 「歐盟人工智能法案」附錄三中列出的使用場景,例如允許的生物識別操作和關(guān)鍵基礎(chǔ)設(shè)施等。
高風(fēng)險(xiǎn) AI 提供商必須滿足運(yùn)營要求,如建立風(fēng)險(xiǎn)管理系統(tǒng)、進(jìn)行數(shù)據(jù)治理、提供證明合規(guī)的技術(shù)文檔等。
這一類別在法案中所占篇幅較小,且透明度要求也較為寬松。簡而言之,這些系統(tǒng)的開發(fā)者和提供者必須確保終端用戶知曉他們正在與人工智能進(jìn)行交互。
這類應(yīng)用不受監(jiān)管,包括歐盟市場上的大多數(shù) AI 應(yīng)用,如 AI 電子游戲和垃圾郵件過濾器。
盡管歐盟的「人工智能法案」被譽(yù)為同類中的首創(chuàng),但其他國家要么已經(jīng)啟動了監(jiān)管人工智能的立法程序,要么便是提供了與現(xiàn)行法律相一致的指導(dǎo)方針,但其目的并不像歐盟的「人工智能法案」那樣具有約束力。
例如,日本政府于 2024 年 4 月發(fā)布了「商業(yè)人工智能指南 1.0」,這是一項(xiàng)基于現(xiàn)行法律的自愿性指南,旨在鼓勵(lì)負(fù)責(zé)任地開發(fā)和使用人工智能。與此同時(shí),巴西參議院于 2024 年 5 月提出了第 2338/2024 號法案,這是該國首個(gè)旨在監(jiān)管人工智能(包括算法設(shè)計(jì)和技術(shù)標(biāo)準(zhǔn))的法案,并于 2024 年 12 月被通過。
在美國,雖然尚未出臺聯(lián)邦層面的監(jiān)管法規(guī),但在 2024 年,至少有 24 個(gè)美國州、波多黎各、美屬維爾京群島和華盛頓特區(qū)提出了 AI 相關(guān)法案。至少有 31 個(gè)州、波多黎各和美屬維爾京群島采納并實(shí)施了這些決議。
英偉達(dá)承諾,Blackwell 系列將在性能和能效方面實(shí)現(xiàn)巨大提升,bwin必贏官網(wǎng)入口預(yù)計(jì)性能比 H 系列有顯著的改進(jìn),包括每秒處理查詢次數(shù)提升 6 倍,以及每個(gè) GPU 每秒輸出的 token 數(shù)量提升 30 倍。
然而,Blackwell 系列的發(fā)布出現(xiàn)了延遲。據(jù)報(bào)道,2024 年 8 月,英偉達(dá)公司告訴云服務(wù)提供商,備受期待的 B200 AI 芯片(最初預(yù)計(jì)于 2024 年第四季度發(fā)布),將推遲到 2025 年發(fā)布,原因是 「在生產(chǎn)過程中異常晚地 」發(fā)現(xiàn)了一個(gè)設(shè)計(jì)缺陷。
雖然英偉達(dá)首席財(cái)務(wù)官 Colette Kress 在 2024 年 11 月的季度財(cái)報(bào)電話會議上向投資者保證,GPU 已全面投產(chǎn),且有報(bào)道稱英偉達(dá)有望在 2024 年 12 月發(fā)布 B200,但關(guān)于 B200 或 B100 發(fā)布的消息至今仍未公開出現(xiàn)(截至 2025 年 1 月 8 日)。
本質(zhì)上,根據(jù)英國競爭和市場管理局 (CMA) 的說法,微軟收購了 Inflection AI 的大部分資產(chǎn),CMA 認(rèn)為這樣的交易屬于其合并控制管轄范圍,即使 Inflection AI 作為一個(gè)獨(dú)立實(shí)體繼續(xù)存在(只是有了新的領(lǐng)導(dǎo)層和員工)。不過,CMA 補(bǔ)充道,盡管一些人將這筆交易稱為「準(zhǔn)合并」,但它并未帶來「實(shí)質(zhì)性削弱競爭的可能性」,同時(shí)指出,如果類似情況引發(fā)競爭擔(dān)憂,CMA 將對其進(jìn)行監(jiān)管審查。
監(jiān)管機(jī)構(gòu)質(zhì)疑此類交易是否會造成不公平的市場環(huán)境。微軟收購 Inflection AI 的案例只是其中之一,2024 年初,美國聯(lián)邦貿(mào)易委員會 (FTC) 宣布,將針對亞馬遜 (Amazon) 對 Anthropic、谷歌對 Anthropic、以及微軟對 OpenAI 的數(shù)十億美元投資(每筆投資都導(dǎo)致大公司獲得小公司的大量股份)展開調(diào)查,旨在確認(rèn)這些公司是否在沒有合并或直接收購的情況下,獲得了對實(shí)體的實(shí)際控制權(quán),從而避開監(jiān)管機(jī)構(gòu)的審查,并造成不公平的市場競爭局面。
雖然「準(zhǔn)合并」和「收購」并不是新概念,但隨著 AI 競賽的持續(xù)升溫,它們似乎越來越頻繁地出現(xiàn),全球監(jiān)管機(jī)構(gòu)雖然并沒有阻止這些交易(到目前為止),但似乎也已經(jīng)開始注意到了這一點(diǎn)。
在對 80 億參數(shù)和 700 億參數(shù)的 LLaMA 3.1 模型(分別為 LLaMA 3.1 8B 和 LLaMA 3.170B)進(jìn)行的類似基準(zhǔn)測試中,這兩個(gè)模型在 12 項(xiàng)測試中有 11 項(xiàng)超越了谷歌、Mistral 和 OpenAI 的同類競品。值得注意的是,雖然 Meta 對這兩個(gè)較小模型執(zhí)行了與 405B 版本相同的 15 項(xiàng)測試,但其中有 3 項(xiàng)測試未包含其他對比模型的數(shù)據(jù)。
2024 年 8 月 27 日,瑞典支付公司 Klarna 宣布已削減數(shù)百個(gè)崗位,并表示隨著 AI 接管客戶咨詢業(yè)務(wù),預(yù)計(jì)未來裁員規(guī)模將進(jìn)一步擴(kuò)大。此次事件之所以被視為最典型的 AI 替代人力的案例,主要是因?yàn)樵摴久鞔_表示,其基于 AI 的聊天機(jī)器人可完成 700 名員工的工作量,且將平均問題解決時(shí)間從 11 分鐘縮短至 2 分鐘,AI 在這個(gè)案例中完全取代了人工。此外,Klarna 還宣布,未來一段時(shí)間內(nèi)將暫停除工程師外的所有崗位招聘。
2024 年 7 月,美國稅務(wù)軟件公司 Intuit 宣布將裁員 1,800 人,以集中精力開發(fā)「Intuit Assist」等 AI 工具,并明確表示這些裁員并非出于節(jié)約成本的考量。同時(shí),Intuit 表示將在工程、產(chǎn)品和面向客戶的領(lǐng)域(如銷售和市場營銷)招聘至少同等數(shù)量的員工,以支持其 2025 年的 AI 計(jì)劃。雖然 Intuit 的裁員規(guī)模更大,但該公司只是戰(zhàn)略轉(zhuǎn)向 AI,而 Klarna 已實(shí)現(xiàn)了 AI 替代。
不具備 AI 技能的科技從業(yè)者同樣面臨行業(yè)轉(zhuǎn)型壓力。上述 2 個(gè)案例顯示,AI 能夠接管客服等非技術(shù)崗位,同時(shí)大型科技公司在重新聚焦 AI 業(yè)務(wù)的過程中,也對技術(shù)崗位進(jìn)行了大幅裁減。2024 年科技行業(yè)失業(yè)率持續(xù)波動,6 月達(dá)到 3.7% 的四年高位后,9 月回落并維持在 2.5% 左右。
全球科技巨頭谷歌在多個(gè)團(tuán)隊(duì)(包括硬件和 Google Assistant 團(tuán)隊(duì))中裁減了超 1,000 名員工,以更加專注于其 AI 產(chǎn)品,如 Gemini GenAI(前身為 Bard)。谷歌首席執(zhí)行官 Sundar Pichai 指出,隨著谷歌繼續(xù)為 AI 重新分配資源,預(yù)計(jì)在整個(gè) 2024 年還會有更多的裁員(2024 年 12 月,Pichai 宣布削減 10%的管理職位)。
全球軟件和云服務(wù)巨頭微軟宣布,將在其混合現(xiàn)實(shí)和 Azure 部門裁員超 1,000 人,微軟戰(zhàn)略任務(wù)和技術(shù)執(zhí)行副總裁 Jason Zander 在一封公司郵件中表示,此舉是將更多精力投入到定義「AI 浪潮,并幫助其客戶在應(yīng)用 AI 上取得成功」。
跨國網(wǎng)絡(luò)硬件和軟件公司思科裁員約 7%,投資方向轉(zhuǎn)向 AI,包括用于云應(yīng)用和 AI 基礎(chǔ)設(shè)施的 AI 網(wǎng)絡(luò)建設(shè)。這是繼 2024 年 2 月裁員近 4,000 人之后的又一次裁員。
然而,AI 可能可能只是某些公司的「替罪羊」。值得注意的是,許多公司可能會把 AI 作為裁員的借口——相比直接承認(rèn)裁員是為了削減成本或提高利潤,將其歸因于 AI 聽起來不會那么負(fù)面。此外,將裁員歸因于 AI 還能激勵(lì)投資者,因?yàn)檫@意味著效率和生產(chǎn)力的提高。
2024 年 2 月,美國科技巨頭 Meta 公司首席執(zhí)行官 Mark Zuckerberg 分享了他的觀點(diǎn),他認(rèn)為裁員是后疫情時(shí)代現(xiàn)實(shí)的一種體現(xiàn),在這一流行病期間,公司為應(yīng)對不確定性而 「過度擴(kuò)張」,現(xiàn)在正試圖精簡公司規(guī)模以提高運(yùn)營效率。
大型 LLM 研發(fā)項(xiàng)目未能達(dá)到預(yù)期。2024 年 9 月,OpenAI 完成了一款新型大語言模型的首輪訓(xùn)練,該模型在公司內(nèi)部被稱為 Orion。OpenAI 希望它能像 2024 年 5 月發(fā)布的 GPT-4o 相較于 GPT-4 Turbo 那樣,實(shí)現(xiàn)跨越式進(jìn)步。然而,據(jù)報(bào)道,該模型目前未能達(dá)到預(yù)期效果,與現(xiàn)有模型的性能差距并不像 GPT-4o 相較于 GPT-4 Turbo,或 GPT-4 相較于 GPT-3.5 那樣顯著。
不過,OpenAI 并非唯一遭遇挫折的公司。谷歌和 Anthropic 似乎同樣未能滿足市場對其 Gemini 和 Claude 模型更新的預(yù)期,其新版本的發(fā)布也因此推遲。
新的數(shù)據(jù)限制推動了 LLM 開發(fā)范式變革。近年來,大語言模型公司對其模型取得重大突破的期待主要基于「scaling laws」——即更多的計(jì)算能力、更龐大的數(shù)據(jù)集和更大的模型,將帶來 AI 能力的躍升。
然而,2024 年出現(xiàn)了一個(gè)新問題:可用于訓(xùn)練 LLM 的新(人類)信息有限。早期的 LLM 主要依靠互聯(lián)網(wǎng)等來源進(jìn)行學(xué)習(xí),汲取數(shù)十年的人類知識。然而,過去兩年中,新增的可靠人類原創(chuàng)信息相對較少。
另一個(gè)問題則是在 LLM 公開發(fā)布后愈發(fā)明顯:AI「自我吞噬 (AI cannibalism)」。生成式 AI (GenAI) 已廣泛應(yīng)用于在線內(nèi)容創(chuàng)作,使得 LLM 逐漸攝入 AI 生成的內(nèi)容。這種循環(huán)攝入不僅進(jìn)一步減少和稀釋了人類原創(chuàng)內(nèi)容,還可能影響模型學(xué)習(xí)到的信息準(zhǔn)確性。
一些人質(zhì)疑 AI 的局限性,另一些人則重新思考進(jìn)步的意義。面對 LLM 突破受限、新數(shù)據(jù)不足等問題,AI 研究機(jī)構(gòu)似乎正在接受「scaling laws」并非真正普適的這一事實(shí)。AI 領(lǐng)域的一些人士認(rèn)為,各類模型正逐步趨近能力上限。然而,也有樂觀派認(rèn)為,「scaling laws」應(yīng)被視為動態(tài)的,需要適應(yīng)新的開發(fā)范式,因此在 AI 訓(xùn)練和開發(fā)過程中應(yīng)采取新的策略,例如「test-time scaling」。
新功能彌補(bǔ)了 LLM 進(jìn)展受限的問題。盡管 LLM 的發(fā)展可能趨于平穩(wěn),但 AI 公司仍在努力為現(xiàn)有模型增值。例如,OpenAI 于 2024 年 9 月推出了 o1 和 o1-mini 模型的預(yù)覽版,并在同年 12 月正式發(fā)布,同時(shí)還公布了即將推出的 o3 模型。o1 模型雖然處理查詢的時(shí)間較長,但其采用「思維鏈 (chain of thought)」的方式,在回答前先構(gòu)建并修正答案(類似于人類在解決復(fù)雜問題時(shí)分解思路的方式),從而提升推理能力和回答準(zhǔn)確性。
2024 年 10 月 8 日和 9 日,諾貝爾物理學(xué)獎和化學(xué)獎首次花落 AI 相關(guān)研究。2024 年諾貝爾物理學(xué)獎授予普林斯頓大學(xué)物理學(xué)家、榮譽(yù)教授 John J. Hopfield 和多倫多大學(xué)榮譽(yù)教授、前 Google 研究員 Geoffrey Hinton,以表彰他們利用人工神經(jīng)網(wǎng)絡(luò)開發(fā)機(jī)器學(xué)習(xí)技術(shù)。
亞馬遜在數(shù)據(jù)中心和 AI 方面投入巨資。在 2024 年 10 月 31 日的財(cái)報(bào)電話會議上,首席執(zhí)行官 Andy Jassy 表示,公司 2024 年的資本支出 (CAPEX) 將達(dá)到 750 億美元,其中 AWS 和 AI 所占份額最大。至此,亞馬遜在數(shù)據(jù)中心擴(kuò)建(包括物業(yè)和設(shè)備)方面的支出已達(dá) 226 億美元,同比增長 81%。
投資數(shù)據(jù)中心的不僅僅是亞馬遜。據(jù)估計(jì),到 2024 年,亞馬遜、微軟、Alphabet 和 Meta 等巨頭的 CAPEX 總額將超過 2,000 億美元。這些大型科技公司還宣布,它們計(jì)劃繼續(xù)增加 CAPEX,美國大型投資銀行摩根士丹利預(yù)測,2025 年超規(guī)模企業(yè)的 CAPEX 將超過 3,000 億美元。雖然這些支出大部分用于高端 GPU 和為容納 GPU 而建設(shè)的龐大數(shù)據(jù)中心,但也有配套成本,如運(yùn)行服務(wù)器的能源成本。
這些 AI 相關(guān)的科技公司正努力說服投資者,相應(yīng)的支出是對顛覆性技術(shù)的前期投資,類似于「如果你建造它,用戶自然會來」的模式——即基礎(chǔ)設(shè)施必須先到位,才能支撐未來的盈利產(chǎn)品運(yùn)行(比如,火車需要先鋪設(shè)鐵路才能運(yùn)行)。然而,人們對于收入能否匹配成本仍存疑。
例如,雖然建設(shè)數(shù)據(jù)中心(包括設(shè)施、服務(wù)器等)以及持續(xù)的能源開支,可以納入投資回報(bào)率 (ROI) 的計(jì)算,但數(shù)據(jù)中心并不會始終保持不變。GPU 制造商將持續(xù)研發(fā)更強(qiáng)大的芯片,企業(yè)可能需要不斷升級設(shè)備,以保持競爭力,bwin必贏官網(wǎng)入口應(yīng)對更先進(jìn)的 AI 計(jì)算需求。此外,計(jì)算能力的提升也將帶來更高的能源消耗,進(jìn)一步增加運(yùn)營成本。
此前,埃隆·馬斯克 (Elon Musk) 旗下的 xAI 在 2024 年 5 月完成 B 輪融資,募資 60 億美元,曾短暫成為當(dāng)年最大融資輪次。隨后,2024 年 11 月,xAI 再次宣布完成 C 輪融資,募資 60 億美元,公司估值升至 500 億美元。