中國(guó)人工智能企業(yè)深度求索推出推理模型DeepSeek-R1,以O(shè)penAI十分之一的成本,達(dá)到比肩其最新模型GPT-o1的表現(xiàn)。
2.DeepSeek模型因其低成本、低能耗及開源設(shè)計(jì),被眾多業(yè)內(nèi)人士譽(yù)為激發(fā)人工智能創(chuàng)新的優(yōu)秀案例。
3.與此同時(shí),DeepSeek在架構(gòu)效率上的提升,使得其文字輸出更為流暢自然,bwin必贏官網(wǎng)入口符合漢語(yǔ)環(huán)境。
4.除此之外,DeepSeek采取完全開源的策略,將其大模型的代碼和模型參數(shù)開放,降低了中小企業(yè)部署AI的門檻。
如果回顧今年初我國(guó)乃至全球科技界的熱門話題,DeepSeek無(wú)疑是其中之一。1月20日,我國(guó)人工智能企業(yè)深度求索(DeepSeek)推出推理模型DeepSeek-R1,以O(shè)penAI十分之一的成本,達(dá)到比肩其最新模型GPT-o1的表現(xiàn),引發(fā)了一場(chǎng)圍繞DeepSeek的大討論。
就在2月10日至11日于法國(guó)巴黎舉行的人工智能行動(dòng)峰會(huì)期間,DeepSeek推出的人工智能模型因其低成本、低能耗及開源設(shè)計(jì),被眾多業(yè)內(nèi)人士譽(yù)為激發(fā)人工智能創(chuàng)新的優(yōu)秀案例。
DeepSeek之所以得到高度關(guān)注,與其技術(shù)創(chuàng)新和“高性價(jià)比”密切相關(guān)。
2024年12月底,DeepSeek發(fā)布V3模型,其性能與GPT-4o和Claude Sonnet 3.5等頂尖模型相近,但訓(xùn)練成本極低,整個(gè)訓(xùn)練在2048塊英偉達(dá)H800 GPU集群上完成,花費(fèi)約557.6萬(wàn)美。相比之下,訓(xùn)練GPT-4o等模型,至少要使用上萬(wàn)塊性能更為優(yōu)越的H100 GPU,訓(xùn)練成本達(dá)到約1億美元。
DeepSeek更為引人關(guān)注的是其在架構(gòu)效率上的提升。相比OpenAI的ChatGPT,DeepSeek采用混合專家模型,可將任務(wù)拆分給多個(gè)專用子模塊處理,資源利用率更高,大幅降低了大模型訓(xùn)練所需的算力要求。
而與海外大模型相比,DeepSeek訓(xùn)練數(shù)據(jù)以漢語(yǔ)為主,對(duì)復(fù)雜的漢語(yǔ)詞匯和語(yǔ)境處理更為精準(zhǔn),使其文字輸出更為流暢自然,符合漢語(yǔ)環(huán)境。同時(shí),它的邏輯推導(dǎo)過(guò)程透明,并支持針對(duì)特定場(chǎng)景的深度優(yōu)化。
在此基礎(chǔ)上,DeepSeek還采取完全開源的策略,將其大模型的代碼和模型參數(shù)開放,降低了中小企業(yè)部署AI的門檻。對(duì)此,美國(guó)云軟件企業(yè)賽富時(shí)公司的人工智能可持續(xù)發(fā)展主管鮑里斯·加馬扎伊奇科夫認(rèn)為,DeepSeek模型推動(dòng)了人工智能降低能耗的步伐?!八情_源的,其用戶不必預(yù)先訓(xùn)練一個(gè)類似大小的模型,而是可以從已有模型開始(研發(fā)),這樣可以節(jié)省大量能源。對(duì)全世界來(lái)說(shuō),這是一件非常好的事情,我希望看到更多像這樣的開源創(chuàng)新?!?
經(jīng)過(guò)近兩年的探索,基于大模型的生成式AI已經(jīng)在國(guó)內(nèi)各產(chǎn)業(yè)領(lǐng)域得到認(rèn)可。DeepSeek的持續(xù)破圈,再一次“點(diǎn)燃”了我國(guó)AI產(chǎn)業(yè)鏈。bwin必贏官網(wǎng)入口云服務(wù)廠商、互聯(lián)網(wǎng)平臺(tái)企業(yè)紛紛接入,AI應(yīng)用等產(chǎn)業(yè)鏈企業(yè)競(jìng)相使用。
不少產(chǎn)業(yè)鏈中上游企業(yè)爭(zhēng)相“搶灘”DeepSeek。此前,騰訊云、阿里云、百度智能云、火山引擎等國(guó)內(nèi)云計(jì)算企業(yè)已宣布對(duì)DeepSeek的支持。十余家國(guó)產(chǎn)AI芯片企業(yè)也相繼宣布,適配或上架DeepSeek模型服務(wù)。
與此同時(shí),包括汽車、金融、智能硬件等不少產(chǎn)業(yè)鏈下游企業(yè),也持續(xù)展開對(duì)DeepSeek系列模型的應(yīng)用探索。隨著需求與場(chǎng)景的不斷滿足,更多搭載輕量化AI模型的創(chuàng)新型智能硬件密集涌現(xiàn)。
其中,PC外設(shè)硬件的接軌速度較快,如部分“AI鼠標(biāo)”“AI鍵盤”,可一鍵拉起其提供的AI問(wèn)答頁(yè)面,其中包含基于DeepSeek-R1的深度思考選項(xiàng)。AI PC、AI手機(jī)同樣是這次DeepSeek浪潮的受益者,如聯(lián)想、華為等品牌,已在其AI智能體中接入了DeepSeek,提供“開箱即用”的AI功能。