如果說2023年是生成式AI元年,2024年是AI普及元年;那么在2025年,AI將迎來從廣泛應用到深度轉(zhuǎn)型的關(guān)鍵時刻——橫向提升生產(chǎn)效率、優(yōu)化業(yè)務流程;縱向在醫(yī)療、金融、制造、教育等多個領(lǐng)域扎根,推動根本性的技術(shù)革新與商業(yè)模式變革。
眼下,誰將成為下一個發(fā)展方向,實現(xiàn)人工智能在千行百業(yè)中從概念到落地?行業(yè)給出的答案是AI Agent。
Radical Ventures是AI獨角獸Cohere的首位投資者,該公司當前估值高達55億美元。2024年8月,Radical新募集了近8億美元資金,創(chuàng)建了同類中*的人工智能基金。其投資者包括谷歌前CEO Eric Schmidt的家族辦公室、“AI教母”李飛飛、諾獎得主Geoffrey Hinton以及一些加拿大養(yǎng)老基金,如CPP投資公司。
關(guān)于2024年,Toews預測了——微軟與 OpenAI 開始出現(xiàn)裂痕(微軟認了很多“干兒子”);Stability AI倒閉(年中已是強弩之末);商業(yè)閉源模型將持續(xù)*于開源模型(扛把子還是閉源);英偉達將成為云服務商(老黃還在努力);人工智能與版權(quán)糾紛(OpenAI有苦難言)........
關(guān)于2023年,Toews預測了——GPT-4在2023年初發(fā)布(3月算年初吧);訓練LLMs將逐漸開始耗盡數(shù)據(jù)(終于,IlyaSutskeve宣布數(shù)據(jù)快枯竭了);Google搜索老大的地位將面臨挑戰(zhàn)(蹦出好大一個PerplexityAI);人形機器人是個火熱賽道(不用多說,請看VCR)........
那么,2025年會發(fā)生哪些AI大事件?關(guān)于Scaling laws“終結(jié)說”,關(guān)于 OpenAI、Anthropic發(fā)展走向,關(guān)于特朗普&馬斯克關(guān)系對AI行業(yè)的影響等等,又將迸發(fā)出哪些耐人尋味的趨勢?我們對Toews的預測進行了梳理,并根據(jù)行業(yè)相關(guān)性,調(diào)整了順序。
為了Llama與OpenAI、Anthropic最新前沿模型處于同一梯隊,Meta每年要燒數(shù)十億美元。而2025年,將是Meta開始認真實現(xiàn)Llama盈利的一年。
2025年,AI愛好者、學者、個人開發(fā)者和初創(chuàng)公司能夠繼續(xù)享受免費;但大規(guī)模商業(yè)用戶可能必須付費了。
從技術(shù)上講,Meta如今已經(jīng)做到了這一點,即不允許*的公司——云超級計算機和其他月活躍用戶超過7億的公司自由使用Llama。
其實早在2023年,扎克伯格就表達過:如果你是微軟、亞馬遜或谷歌這樣的巨頭,打算轉(zhuǎn)售Llama ,那么你就應該分潤。
我們預測,2025年,Meta會大幅擴大付費使用Llama的企業(yè)范圍,將更多的大中型企業(yè)納入其中。
類似于摩爾定律,Scaling Law并非真正的“法則”,而僅僅是經(jīng)驗觀察。
問題就出在了這里。過去30天,一系列報告顯示,主要AI實驗室在擴展LLM時碰壁了。這可以解釋為何GPT-5發(fā)布一再推遲。
對于Scaling Law停滯的最常見反駁——測試時計算(test-time compute)能夠開辟一個全新維度。
也就是說,與其在訓練階段大規(guī)模擴展計算,不如在推理階段使勁。例如,OpenAI的o3通過“思考更長時間”,解鎖新的AI能力。
不過,還有一個更重要的觀點鮮有人提及。幾乎所有關(guān)于Scaling Law的討論——從2020年的原始論文到今天對測試階段計算的關(guān)注——都集中在語言領(lǐng)域。然而,語言并不是*重要的數(shù)據(jù)模態(tài)。
想想機器人技術(shù)、生物學、世界建?;蚓W(wǎng)絡代理。這些領(lǐng)域的Scaling Law尚未飽和;相反,它們才剛剛起步!
為這些數(shù)據(jù)模態(tài)構(gòu)建基礎(chǔ)模型的初創(chuàng)公司——專注于生物學領(lǐng)域的EvolutionaryScale、機器人技術(shù)領(lǐng)域的Physical Intelligence、世界模型領(lǐng)域的World Labs——正試圖識別并利用這些領(lǐng)域的Scaling Law,就像OpenAI當初做的那樣。
不要相信Scaling Law消失的傳言。它在2025年依然重要,但其活動中心將從LLM預訓練轉(zhuǎn)向其他戰(zhàn)場。
想象一下,你無需伸出手指操作網(wǎng)頁,也能完成所有瑣碎任務——管理訂閱、支付賬單、預約醫(yī)生、網(wǎng)購商品、預訂餐廳等等。只需向AI助手發(fā)出指令,這些任務便能被自動執(zhí)行。
說實話,Web Agent的概念已經(jīng)存在多年,但市場未出現(xiàn)一款可以正常運行的通用Web Agent。
隨著語言與視覺基礎(chǔ)模型的持續(xù)進步,以及推理時間計算在“第二系統(tǒng)思維”(System 2 thinking)方面取得的突破,Web Agent將迎來黃金時代。
題外話,為何專注AI Agent的初創(chuàng)公司Adept倒在了半山腰?問題不是方向,而是時機未到。(對于初創(chuàng)企業(yè),時機往往是成敗的關(guān)鍵。)
雖然Web Agent將在企業(yè)應用中展現(xiàn)其巨大價值,但短期內(nèi),*潛力的市場機會仍在C端。
目前為止,除了ChatGPT,真正成功破圈的C端AI應用寥寥無幾。未來Web Agent將改變這一局面,成為AI領(lǐng)域下一個“殺手級應用”。
隨著AI技術(shù)的多模態(tài)能力不斷提升,我們可以想象一個更具挑戰(zhàn)性的版本——語音圖靈測試——AI必須通過語音與人類互動,其流暢度和表現(xiàn)力足以讓你無法分辨對面到底是AI,還是真人。
1. 延遲:人類語音對話的即時性要求AI發(fā)出毫秒級響應,減少任何感知延遲。
2. 模糊輸入處理:AI能實時應對中斷、模棱兩可的指令,并優(yōu)雅地完成對線. 多輪對話記憶:長時間、多輪、開放式對話中,AI需具備強大的記憶與上下文理解能力。
4. 非語言信號解讀:AI需準確理解語音中的情緒信號(如憤怒、興奮、諷刺),并在自己生成的語音中表達這些細微差別。
目前,語音AI由語音到語音(speech-to-speech)模型等核心技術(shù)推動,已經(jīng)站上了變革關(guān)口。2025年,語音AI有望取得跨越式進展,并語音圖靈測試的實現(xiàn)奠定基礎(chǔ)。
開發(fā)前沿模型是一項艱巨的事業(yè)。首先,資金需求極為龐大。例如,OpenAI數(shù)月前融資65億美元,但很快又需要更多“金主爸爸”。其次,客戶忠誠度較低,用戶可以根據(jù)成本與性能無縫切換不同模型。
雖然OpenAI和Anthropic等公司不會停止研究前沿大模型。但在2025年,為了開發(fā)更高利潤率、更具差異化且用戶粘性更高的業(yè)務線,他們將大力推動推出更多自家應用和產(chǎn)品。
2025 年,OpenAI或Anthropic會推出企業(yè)搜索服務?或是客戶服務產(chǎn)品?也許是法律 AI?銷售AI?
在C端,他們可能會推出Web Agent、旅行規(guī)劃應用,或者可能是生成式音樂應用。
有趣的是,他們會與自己的重要客戶直接競爭——在搜索領(lǐng)域,與Perplexity競爭;在編程領(lǐng)域,與Cursor競爭;在客戶服務領(lǐng)域,與Sierra競爭;在法律AI領(lǐng)域,與Harvey競爭;在銷售領(lǐng)域,與Clay競爭……如此種種。
1965年,圖靈的合作者I.J.Good寫道:一臺超智能機器可以超越人類所有智力活動,包括設(shè)計更好的機器。這會導致“智能爆炸”,將人類智能遠遠拋在后面。
今年8月,Sakana AI 團隊亮出一位AI科學家,展現(xiàn)AI能夠完全自主地完成整個人工智能研究周期:
據(jù)悉,OpenAI、Anthropic等實驗室正在為“自動化AI研究員”投入資源,盡管尚未公開證實。
未來,當一篇完全由AI撰寫的研究論文首次被NeurIPS、CVPR或ICML接收,必贏官網(wǎng)首頁將成就AI領(lǐng)域的歷史性時刻。
首先是“瑟瑟發(fā)抖”的Sam Altman。出于馬斯克對OpenAI的新仇舊恨,特朗普政府可能對OpenAI不會那么友好。此外,特朗普政府可能會優(yōu)先支持馬斯克的公司:減少xAI建設(shè)數(shù)據(jù)中心的監(jiān)管障礙,幫助其在前沿模型競賽中占據(jù)優(yōu)勢;快速批準特斯拉部署robotaxi車隊等。
更重要的是,與特朗普身邊的許多其他科技*不同,馬斯克是“AI威脅論者”,他是為數(shù)不多支持“臭名昭著”加州SB 1047法案的巨頭。
這對OpenAI而言,至少是個利好消息;但對于特斯拉而言,則可能是一個不幸的訊號。而對關(guān)注AI安全的人來說,這將令人失望,因為特朗普政府很可能對AI監(jiān)管采取放任態(tài)度。
2023年,限制AI發(fā)展的關(guān)鍵資源是GPU;2024年,瓶頸已轉(zhuǎn)變?yōu)槟茉磁c數(shù)據(jù)中心的供給。
全球?qū)δ茉吹男枨蠹ぴ?,預計2023年至2026年間,數(shù)據(jù)中心的用電需求將翻倍。在美國,到2030年,數(shù)據(jù)中心的用電量可能占全國總用電量的10%,而2022年這一比例僅為3%。
核能是一個解決方案。然而,考慮到研發(fā)、項目開發(fā)及監(jiān)管所需的漫長周期,無論是傳統(tǒng)核裂變電廠、下一代小型模塊化反應堆(SMR),還是核聚變電廠,都無法在2030年前對這一問題產(chǎn)生實質(zhì)影響。
當前在地球上建設(shè)數(shù)據(jù)中心的*障礙在于電力;而太空中的計算集群可以享受免費、無限、零碳的全天候太陽能。
那么,如何在地球與太空之間高效地傳輸大量數(shù)據(jù)?激光等高帶寬光通信技術(shù)已取得一定進展。
作為Y Combinator的明星項目,一家名為Lumen Orbit的初創(chuàng)企業(yè)近期籌集了1100萬美元,計劃打造一個多千兆瓦的太空數(shù)據(jù)中心網(wǎng)絡,用于訓練AI模型。
Lumen 的CEO Philip Johnston表示,與其花1.4億美元交電費,不如花1000萬美元發(fā)射,直接用上免費太陽能。
2025年,或許會有更多初創(chuàng)公司加入這一賽道,甚至一些云服務巨頭也可能啟動探索性項目。
亞馬遜已具備Project Kuiper的相關(guān)經(jīng)驗,谷歌長期熱衷于投資此類大膽的創(chuàng)意,微軟在太空經(jīng)濟領(lǐng)域亦有所涉獵。當然,馬斯克的SpaceX也可能涉足這一領(lǐng)域。
目前為止,AI安全問題仍然完全停留在理論階段。2025年,一切將會發(fā)生變化。
需要明確的是,該事故不會涉及“終結(jié)者”式的殺手機器人,也很可能不會對任何人類造成任何形式的傷害。
或許,某個AI模型可能試圖悄悄地在另一個服務器上創(chuàng)建自己的副本以確保自身存續(xù);或許,某個AI模型可能會得出結(jié)論:為了*地推進自己被賦予的目標,它需要隱瞞自己能力的真實范圍,故意降低性能評估以避開更為嚴格的審查。
對此,Apollo Research已經(jīng)發(fā)布了重要實驗,證明當今的前沿模型能夠進行策略性欺騙;Anthropic最新研究也顯示,LLMs學會了“偽裝對齊”。
在人類面臨巨大的AI生存威脅之前,我們需要接受一個更平凡的現(xiàn)實:我們?nèi)缃衽c另一種形式的智能共享世界,這種智能有時可能是任性的、不可預測的和欺騙性的,就像我們?nèi)祟愖陨硪粯印?
如今在舊金山街頭,成千上萬的居民每天乘坐Waymo在城市中穿行,仿佛以前乘坐出租車或Uber。
自2023年8月推出以來,Waymo在舊金山的打車市場占據(jù)了驚人的22%市場份額,與Lyft相當(Uber市場份額為55%)。
轉(zhuǎn)眼間,Robotaxi已經(jīng)從一項研究項目,發(fā)展成了一個龐大的商業(yè)模式。
我們預測,Robotaxi將迅速突破灣區(qū),成為多個美國城市交通系統(tǒng)的重要組成部分。這個進程將比大多數(shù)人預期快得多。
2025年年底,我們預計會看到類似Waymo的無人出租車服務在至少5個主要市場中,占據(jù)兩位數(shù)的市場份額。必贏官網(wǎng)首頁
目前,Waymo已經(jīng)在洛杉磯、鳳凰城啟動了Robotaxi服務,預計這些市場的采用率將于明年迅速上升。奧斯汀、亞特蘭大和邁阿密也將緊隨其后。與此同時,Waymo的競爭對手Zoox即將在拉斯維加斯推出商用Robotaxi服務。