ICC訊 近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入國家超算互聯(lián)網(wǎng)平臺。據(jù)介紹,DeepSeek-R1專注于自然語言處理,具備強大的文本生成能力;DeepSeek-V3聚焦于圖像生成,能夠生成高分辨率和細節(jié)豐富的圖像,適用于廣告、藝術(shù)創(chuàng)作等多個場景;DeepSeek-Coder是一款代碼生成模型,能夠協(xié)助開發(fā)者快速構(gòu)建程序,提高開發(fā)效率。
超算互聯(lián)網(wǎng)是以互聯(lián)網(wǎng)思維運營超算中心,并連接產(chǎn)業(yè)生態(tài)中的算力供給、應(yīng)用開發(fā)、運營服務(wù)、用戶等各方能力和資源,構(gòu)建一體化超算算力網(wǎng)絡(luò)和服務(wù)平臺。其目標是緊密連接供需雙方,通過市場化的運營和服務(wù)體系,實現(xiàn)算力資源統(tǒng)籌調(diào)度,降低超算應(yīng)用門檻,并帶動計算技術(shù)向更高水平發(fā)展,推動自主核心軟硬件技術(shù)深度應(yīng)用,輻射帶動自主可控產(chǎn)業(yè)生態(tài)的發(fā)展與成熟。
為促進超算算力一體化運營、打造國家算力底座,國家超算互聯(lián)網(wǎng)平臺去年4月正式上線,覆蓋科學計算、工業(yè)仿真、人工智能(AI)模型訓練等各個領(lǐng)域。
科技日報記者從國家超算互聯(lián)網(wǎng)平臺了解到,截至今年1月,平臺上已有各類算力商品超6500款,其中模型服務(wù)近240款,既有DeepSeek、Qwen等國內(nèi)開源大模型,也有Llama、Stable Diffusion、Gemma、Mistral、StarCoder、ChatGLM等國外開源模型。
對于DeepSeek的上線,國家超算互聯(lián)網(wǎng)平臺相關(guān)負責人表示,先進的國產(chǎn)AI技術(shù)與國家級綜合算力服務(wù)平臺融合,是加速國產(chǎn)AI技術(shù)生態(tài)發(fā)展與普及的前沿實踐,其將在市場、技術(shù)、創(chuàng)新、產(chǎn)品及用戶方面推動AI技術(shù)生態(tài)創(chuàng)新及成果落地,促進AI+的多樣化,推動中國乃至全球AI市場的應(yīng)用落地和產(chǎn)業(yè)化進程。通過國家超算互聯(lián)網(wǎng)平臺,用戶無需本地下載,可在線部署、推理、定制化訓練與開發(fā)DeepSeek等國內(nèi)外知名開源大模型,降低了AI技術(shù)使用門檻。與此同時,算力服務(wù)的普惠性也得到提升,國家超算互聯(lián)網(wǎng)平臺依托國產(chǎn)深算智能加速卡與全國一體化算力服務(wù)體系,為DeepSeek等模型提供豐富的異構(gòu)算力資源,為國產(chǎn)AI應(yīng)用與創(chuàng)新提供持續(xù)算力保障。
DeepSeek系列模型在性能上與世界頂尖的大模型不相上下,但在成本上卻具有顯著優(yōu)勢。DeepSeek系列通過算法優(yōu)化顯著降低計算資源消耗,結(jié)合國家超算互聯(lián)網(wǎng)平臺“普惠易用、豐富好用”的能力,使得更多企業(yè)和用戶能夠負擔得起AI技術(shù)的應(yīng)用,加速AI技術(shù)普及。
業(yè)界普遍認為,DeepSeek模型在超算互聯(lián)網(wǎng)平臺的規(guī)?;涞兀?qū)⒏淖?strong>國內(nèi)AI行業(yè)依賴海外閉源模型的現(xiàn)狀。