用戶(hù)名: 密碼: 驗(yàn)證碼:

消息稱(chēng)英偉達(dá)計(jì)劃Q2向中國(guó)市場(chǎng)推出特供版H20芯片

摘要:據(jù)媒體報(bào)導(dǎo),英偉達(dá)計(jì)劃于 2024 年第二季度開(kāi)始量產(chǎn)中國(guó)特供的AI 芯片,以遵守美國(guó)出口管制新規(guī),其中最強(qiáng)的型號(hào)就是 H20。英偉達(dá)對(duì)此拒絕置評(píng)。除了 HGX H20 之外,英偉達(dá)還計(jì)劃推出另外兩款符合美國(guó)限制的 PCIe 芯片 ——L20 和 L2,但具體信息不詳。

  ICC訊 據(jù)媒體報(bào)導(dǎo),英偉達(dá)計(jì)劃于 2024 年第二季度開(kāi)始量產(chǎn)中國(guó)特供的AI 芯片,以遵守美國(guó)出口管制新規(guī),其中最強(qiáng)的型號(hào)就是 H20。英偉達(dá)對(duì)此拒絕置評(píng)。

  除了 HGX H20 之外,英偉達(dá)還計(jì)劃推出另外兩款符合美國(guó)限制的 PCIe 芯片 ——L20 和 L2,但具體信息不詳。

  消息人士透露,H20 原定于去年 11 月推出,但該計(jì)劃由于“服務(wù)器制造商在集成該芯片時(shí)遇到了問(wèn)題”而被推遲。其中一位知情人士表示,初期產(chǎn)能十分有限,英偉達(dá)需要首先滿(mǎn)足主流客戶(hù)的訂單。

  根據(jù) SemiAnalysis 分析,H20、L20 和 L2 包含英偉達(dá)大部分用于 AI 工作的功能特性,但為了遵守新規(guī)則,這三款新品在算力方面有所削減;不過(guò)在 LLM 推理中依然要比 H100 快 20% 以上。

  IT之家查詢(xún)公開(kāi)資料獲悉,NVIDIA H100 Tensor Core GPU 采用全新 Hopper 架構(gòu),基于臺(tái)積電 N4 工藝,集成了 800 億個(gè)晶體管。與上一代產(chǎn)品相比,可為多專(zhuān)家 (MoE) 模型提供高 9 倍的訓(xùn)練速度。

  它配備第四代 Tensor Core 和 Transformer 引擎(FP8 精度),還具有高度可擴(kuò)展的 NVLink 互連技術(shù)(最多可連接達(dá) 256 個(gè) H100 GPU,相較于上一代采用 HDR Quantum InfiniBand 網(wǎng)絡(luò),帶寬高出 9 倍,帶寬速度為 900GB/s)等功能。

內(nèi)容來(lái)自:IT之家
本文地址:http://odinmetals.com//Site/CN/News/2024/01/10/20240110011313050436.htm 轉(zhuǎn)載請(qǐng)保留文章出處
關(guān)鍵字:
文章標(biāo)題:消息稱(chēng)英偉達(dá)計(jì)劃Q2向中國(guó)市場(chǎng)推出特供版H20芯片
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話(huà):0755-82960080-168   Right