DeepSeek的普惠效應(yīng)引發(fā)產(chǎn)業(yè)變革 如何高效部署成關(guān)鍵快訊

TechWeb.com.cn 2025-02-18 12:12
分享到:
導讀

助力DeepSeek模型推理性能提升30%+,DeepSeek模型發(fā)布即原生支持昇騰,昇騰通過并行推理優(yōu)化技術(shù)+專家負載均衡能力。

【TechWeb】DeepSeek作為AI領(lǐng)域的創(chuàng)新先鋒,正在通過工程創(chuàng)新和技術(shù)突破,顯著提升普惠優(yōu)質(zhì)AI的可獲得性,激發(fā)全產(chǎn)業(yè)的創(chuàng)新活力。

DeepSeek加速了AI技術(shù)的普惠化進程。通過工程創(chuàng)新,DeepSeek將訓練效率提升了2~3倍,推理效率提升了5~7倍,極大地縮短了模型開發(fā)和部署的時間成本,推動了從基礎(chǔ)研究到商業(yè)應(yīng)用的全產(chǎn)業(yè)鏈變革。

在企業(yè)端(To B),不分行業(yè),各企業(yè)以沖刺方式接入DeepSeek,獲取流量。自R1發(fā)布后的20天內(nèi)(截至2月12日),國內(nèi)外已有160多家企業(yè)集體接入DeepSeek。

在消費端(To C),用戶呈爆炸式增長,超級APP快速出現(xiàn),加速了LLM的全面普及。DeepSeek以現(xiàn)象級表現(xiàn)提升了社會對LLM的認知,促進了新商業(yè)模式的成型,實現(xiàn)了商業(yè)正循環(huán)。

DeepSeek正通過極致工程優(yōu)化,提升算力利用率,穩(wěn)定可靠的算力底座仍是模型創(chuàng)新的關(guān)鍵。

據(jù)了解,DeepSeek模型發(fā)布即原生支持昇騰,國內(nèi)70%客戶、伙伴基于昇騰快速上線。截至2月12日,80+ 客戶/伙伴基于昇騰已上線DeepSeek,20+適配測試中(預(yù)計兩周內(nèi)全部上線),昇騰助力20+省、25城市AICC啟動部署DS系列模型,全國超70%區(qū)域可獲取本地支持。

在訓練能力方面,昇騰超節(jié)點支持DeepSeek全系模型預(yù)訓練及微調(diào),支持DualPipe、跨節(jié)點All2All等DeepSeek核心優(yōu)化技術(shù),超大帶寬通信域更適合DeepSeek的流水線并行算法及冗余專家等能力。DeepSeek R1是強化學習RL模型,昇騰超節(jié)點是更適合DeepSeek V3/R1的解決方案。

在推理能力方面,昇騰通過并行推理優(yōu)化技術(shù)+專家負載均衡能力,助力DeepSeek模型推理性能提升30%+。DeepSeek小專家創(chuàng)新架構(gòu),帶來的是通信耗時及專家負載不均挑戰(zhàn),更多的小專家并行,引入極大的通信開銷,更多專家的數(shù)據(jù)負載難以均衡。

目前,昇騰聯(lián)合伙伴推出形態(tài)豐富的產(chǎn)品和解決方案(如:一體機、云服務(wù)、硬件+開源社區(qū)等)幫助企業(yè)快速部署,已覆蓋互聯(lián)網(wǎng)、金融、運營商、政務(wù)、教育等多個行業(yè)。(御風)

DeepSeek 模型 提升 創(chuàng)新 專家
分享到:

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控熑危?br> 3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。