ICC訊 近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入國(guó)家超算互聯(lián)網(wǎng)平臺(tái)。據(jù)介紹,DeepSeek-R1專注于自然語言處理,具備強(qiáng)大的文本生成能力;DeepSeek-V3聚焦于圖像生成,能夠生成高分辨率和細(xì)節(jié)豐富的圖像,適用于廣告、藝術(shù)創(chuàng)作等多個(gè)場(chǎng)景;DeepSeek-Coder是一款代碼生成模型,能夠協(xié)助開發(fā)者快速構(gòu)建程序,提高開發(fā)效率。
超算互聯(lián)網(wǎng)是以互聯(lián)網(wǎng)思維運(yùn)營(yíng)超算中心,并連接產(chǎn)業(yè)生態(tài)中的算力供給、應(yīng)用開發(fā)、運(yùn)營(yíng)服務(wù)、用戶等各方能力和資源,構(gòu)建一體化超算算力網(wǎng)絡(luò)和服務(wù)平臺(tái)。其目標(biāo)是緊密連接供需雙方,通過市場(chǎng)化的運(yùn)營(yíng)和服務(wù)體系,實(shí)現(xiàn)算力資源統(tǒng)籌調(diào)度,降低超算應(yīng)用門檻,并帶動(dòng)計(jì)算技術(shù)向更高水平發(fā)展,推動(dòng)自主核心軟硬件技術(shù)深度應(yīng)用,輻射帶動(dòng)自主可控產(chǎn)業(yè)生態(tài)的發(fā)展與成熟。
為促進(jìn)超算算力一體化運(yùn)營(yíng)、打造國(guó)家算力底座,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)去年4月正式上線,覆蓋科學(xué)計(jì)算、工業(yè)仿真、人工智能(AI)模型訓(xùn)練等各個(gè)領(lǐng)域。
科技日?qǐng)?bào)記者從國(guó)家超算互聯(lián)網(wǎng)平臺(tái)了解到,截至今年1月,平臺(tái)上已有各類算力商品超6500款,其中模型服務(wù)近240款,既有DeepSeek、Qwen等國(guó)內(nèi)開源大模型,也有Llama、Stable Diffusion、Gemma、Mistral、StarCoder、ChatGLM等國(guó)外開源模型。
對(duì)于DeepSeek的上線,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)相關(guān)負(fù)責(zé)人表示,先進(jìn)的國(guó)產(chǎn)AI技術(shù)與國(guó)家級(jí)綜合算力服務(wù)平臺(tái)融合,是加速國(guó)產(chǎn)AI技術(shù)生態(tài)發(fā)展與普及的前沿實(shí)踐,其將在市場(chǎng)、技術(shù)、創(chuàng)新、產(chǎn)品及用戶方面推動(dòng)AI技術(shù)生態(tài)創(chuàng)新及成果落地,促進(jìn)AI+的多樣化,推動(dòng)中國(guó)乃至全球AI市場(chǎng)的應(yīng)用落地和產(chǎn)業(yè)化進(jìn)程。通過國(guó)家超算互聯(lián)網(wǎng)平臺(tái),用戶無需本地下載,可在線部署、推理、定制化訓(xùn)練與開發(fā)DeepSeek等國(guó)內(nèi)外知名開源大模型,降低了AI技術(shù)使用門檻。與此同時(shí),算力服務(wù)的普惠性也得到提升,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)依托國(guó)產(chǎn)深算智能加速卡與全國(guó)一體化算力服務(wù)體系,為DeepSeek等模型提供豐富的異構(gòu)算力資源,為國(guó)產(chǎn)AI應(yīng)用與創(chuàng)新提供持續(xù)算力保障。
DeepSeek系列模型在性能上與世界頂尖的大模型不相上下,但在成本上卻具有顯著優(yōu)勢(shì)。DeepSeek系列通過算法優(yōu)化顯著降低計(jì)算資源消耗,結(jié)合國(guó)家超算互聯(lián)網(wǎng)平臺(tái)“普惠易用、豐富好用”的能力,使得更多企業(yè)和用戶能夠負(fù)擔(dān)得起AI技術(shù)的應(yīng)用,加速AI技術(shù)普及。
業(yè)界普遍認(rèn)為,DeepSeek模型在超算互聯(lián)網(wǎng)平臺(tái)的規(guī)模化落地,或?qū)⒏淖?strong>國(guó)內(nèi)AI行業(yè)依賴海外閉源模型的現(xiàn)狀。