产品列表
品牌专区
BOM询价
关于我们
10月17日,美国商务部工业与安全局(BIS)发布更新针对人工智能(AI)芯片的出口管制规定。该计划不仅限制英伟达等公司向中国出口先进的AI芯片,还可能阻碍ASML、应用材料、泛林和KLA等向中国销售和出口半导体制造设备。
与此同时,BIS周二还在《联邦公报》刊登了一份定于10月19日发布的行政措施,准备将13家中国公司添加到出口管制名单,即所谓的“实体清单”。其中包括北京壁仞科技开发有限公司、摩尔线程智能科技(北京)有限责任公司两家中国GPU企业。英伟达A100 / A800 / H100 / H800 / L40 / L40S / RTX 4090等产品都将受限美国商务部长吉娜·雷蒙多(Gina Raimondo)称,新措施填补了去年10月发布法规中的漏洞,并表示这些措施未来可能至少每年更新一次。她表示,美国限制的目标是阻止中国获得先进的半导体,这些半导体可能推动中国人工智能和精密计算机的突破。去年10月,美国对出口中国的AI芯片实施带宽速率限制。根据当时英伟达发布的公告,美国通知该公司向中国出口A100和H100芯片将需要新的许可证要求,同时DGX或任何其他包含A100或H100芯片的产品,以及未来性能高于A100的芯片都将受到新规管制。A100是英伟达2020年推出的数据中心级云端加速芯片,支持FP16、FP32和FP64浮点运算,为人工智能、数据分析和HPC数据中心等提供算力。H100是英伟达2022年推出的最新一代数据中心GPU,H100在FP16、FP32和FP64计算上比A100快三倍,非常适用于当下流行且训练难度高的大模型。当时国内高端场景基本采用英伟达的A100,不少主流厂商也预定了计划在2022年下半年发货的H100。然而美国政府去年10月发布的法规,让这些厂商在一些高端应用上面临无合适芯片可用的局面。不过之后,英伟达向中国企业提供了替代版本A800和H800,用以解决美国商务部的半导体出口新规。根据美国商务部去年10月的发布的法规,主要限制的是显卡的算力和带宽,算力上线是4800 TOPS,带宽上线是600 GB/s。英伟达新发布的A800的带宽为400GB/s,低于A100的600GB/s,H800虽然参数未公布,但据透露只约到H100(900 GB/s)的一半。这意味着A800、H800在进行AI模型训练的时候,需要耗费更长的时间,不过相对来说,也已经很好了。然而,尽管A800、H800对关键性能进行了大幅限制。但美国政府认为,H800在某些情况下算力仍然不亚于H100。为了进一步加强对AI芯片的出口管制,美国计划用多项新的标准来替换掉之前针对“带宽参数”(Bandwidth Parameter)提出的限制,尽管这已经大大降低了AI芯片之间的通信速率,增加了AI开发的难度和成本。根据新规,美国商务部计划引入一项被称为“性能密度”(performance density)的参数,来防止企业寻找到变通的方案,修订后的出口管制措施将禁止美国企业向中国出售运行速度达到300 teraflops(即每秒可计算 3亿次运算)及以上的数据中心芯片。新措施还旨在防止企业通过Chiplet的芯片堆叠技术绕过芯片限制。针对美国政府此次发布的新规,英伟达公司依规发布了8-K文件,对出口管制做出了解释。英伟达称,此次出口管制涉及的产品包括但不限于:A100、A800、H100、H800、L40、L40S 以及RTX 4090。任何集成了一个或多个以上芯片的系统,包括但不限于英伟达DGX、HGX系统,也在新规涵盖范围之内。此外,美国政府还将要求企业获得向40多个国家/地区出售芯片的许可证,以防止中国企业从海外其他国家和地区获得先进芯片。美国政府还对中国以外的21个国家提出了芯片制造设备的许可要求,并扩大了禁止进入这些国家和地区的设备清单。同时,美国还将13家中国公司添加到出口管制名单,其中,壁仞科技、摩尔线程两家GPU企业在列。发展国产GPU等大算力芯片势在必行美国政府此次对人工智能芯片的出口管制升级,对中国相关产业发展有何影响?中国主要的互联网大厂、云服务厂商基本都依赖英伟达的GPU。尤其是近年来随着ChatGPT的出圈,国内各大互联网公司、AI企业都在大力自研AI大模型产品,这更是加大了对英伟达GPU的需求。由于去年A100就已经被禁,今年上半年各大互联网厂商都在争相采购A800。不过从目前的情况来看,新规对各大厂商短期的影响倒是不明显。多家厂商对媒体表示,已经提前接到消息,不少厂商已经预先进行囤货。一家服务器厂商的内部人士表示,公司囤了足够的量。腾讯、百度等大厂也囤货充足。一家上市公司17日晚间发布公告称,其控股子公司向其供应商采购了75台H800及22台A800现货。该公司对媒体表示,已经在两周前就解决了这个问题。国内一些大模型创业企业也已经提前做了准备,比如智谱AI,该公司表示公司囤货充足。不过依靠囤货毕竟不是长久之计,有厂商表示,虽然吞了足够的量,不过未来还是有很大压力。美国此次新规的发布意味着其对我国算力的进一步遏制,这对如今备受重视的大模型的发展也将会有所限制。从长远来看,国产GPU等大算力芯片的发展才是关键。事实上,过去这些年美国不断升级出口管制,国内企业已经逐步倾向于采用国产芯片,国内的芯片企业也在政策的支持下,下游企业更多的采用下,技术和产品也得到更多迭代,发展越来越好。比如,智谱AI虽然屯了足够的芯片,同时它也为配合国产GPU发展,同步落地GLM(通用语言模型)国产芯片适配计划,可适配10余种国产芯片等。当前,国内已经有一些芯片可以支持大模型的训练和推理,长此发展下去,未来的性能、生态也一定会越来越成熟。从美国此次新规将壁仞科技、摩尔线程等公司列入实体清单,可以看出美国对中国GPU芯片快速发展的担忧。当然这也意味着,未来中国大算力芯片的进一步突破,也将面临着更大的困难,这需要设备、制造等产业链各环节的同步升级。
英伟达A100 / A800 / H100 / H800 / L40 / L40S / RTX 4090等产品都将受限
发展国产GPU等大算力芯片势在必行
美光科技Micron Technology, Inc.近日宣布领先业界推出基于 32Gb 单裸片的128GB DDR5 RDIMM 内存,具有高达 8.000 MT/s 速率的一流性能,可支持当前及未来的数据中心工作负载。该款大容量、高速率内存模块特别针对数据中心和云环境中广泛的任务关键型应用,例如人工智能 (AI)、内存数据库 (IMDB) 以及需要对多线程、多核通用计算工作负载进行高效处理的场景,满足它们对于性能和数据处理的需求。美光基于 32Gb DDR5 DRAM 裸片的 128GB DDR5 RDIMM 内存采用行业领先的 1β (1-beta)制程技术,相较于采用 3DS 硅通孔 (TSV) 技术的竞品,在以下方面得到显著提升:• 容量密度提升超过 45%• 能效提升高达 24%• 延迟降低高达 16%• AI 训练性能提升高达 28%美光副总裁兼计算产品事业群总经理 Praveen Vaidyanathan 表示:“我们非常自豪美光 128GB DDR5 RDIMM 为数据中心大容量、高速内存树立了新标杆,为日益增长的计算密集型工作负载提供所需的内存带宽和容量。美光将加速提供先进技术,为设计和集成大容量内存解决方案提供更及时的支持,从而促进数据中心生态系统的发展。”美光的 32Gb DDR5 内存解决方案采用创新的裸片架构,实现了卓越的阵列效率和更大的单块DRAM 裸片容量密度。电压域和刷新管理功能有助于优化电力传输网络,实现了所需的能效提升。此外,裸片尺寸的纵横比经过优化,有助于提高 32Gb 大容量 DRAM 裸片的制造效率。通过采用 AI 驱动的智能制造技术,美光的 1β 技术节点以公司历史上的最快速度实现了成熟的良率。美光 128GB RDIMM 将于 2024 年面向支持 4800 MT/s、5600 MT/s 和 6400 MT/s 速率的平台出货,未来还将支持高达 8.000 MT/s 速率的平台。AMD 高级副总裁暨服务器事业部总经理 Dan McNamara 表示:“美光 128GB RDIMM将为我们最新的第四代 AMD EPYC 处理器提供更大的单核心内存容量,32Gb单块DRAM 裸片能为AI、高性能计算和虚拟化等业务关键型数据企业工作负载提供更低的总体拥有成本。随着 AMD 推出下一代 EPYC 处理器助力算力提升,美光 128GB RDIMM 有望成为我们最主要的内存方案之一,通过提供大容量和出色的单核心带宽能力,满足内存密集型应用的需求。”英特尔内存与 IO 技术副总裁 Dimitrios Ziakas 博士表示:“我们期待美光基于32Gb 裸片的 128GB RDIMM 解决方案为服务器和 AI 系统市场带来更优的带宽和每瓦性能。英特尔正在基于云、AI和企业客户的总体拥有成本效益来评估该款针对关键型 DDR5 服务器平台的 32Gb 裸片内存产品。”美光32Gb DRAM 裸片拥有更高的带宽和能效,可构建符合 MCRDIMM 和 JEDEC 标准的 128GB、256GB 及更高容量 MRDIMM 产品解决方案,从而扩展更多内存产品组合。凭借行业领先的制程和设计技术创新,美光提供涵盖 RDIMM、MCRDIMM、MRDIMM、CXL 和 LP 等外形规格的一系列内存产品,助力客户轻松集成这些优化的解决方案,满足 AI 和高性能计算 (HPC) 应用对于高带宽、大容量和低功耗的需求。
DS560DF810 是一款具有集成信号调节功能的 八通道多速率重定时器。可扩展有损耗且存在串扰的远距离高速串行链路的长度并提升其稳定性。DS560DF810 中的每个通道均可独立锁定 19.6GBd 至 28.9GBd 连续范围内的符号速率(PAM4 和 NRZ),或任何支持的子速率。集成的 CDR 功能可重置抖动预算并重定时高速串行数据,是前端口光学模块应用的理想选择。这些特性可实现独立信道前向纠错 (FEC) 直通。此外, DS560DF810 还支持 CDR 自动通道速率切换,可在无需主机干预的情况下锁定多达五种不同的波特率和调制类型组合。DS560DF810 先进的均衡特性包括一个连续自适应时间线性均衡器 (CTLE)、RX 前馈均衡器 (FFE)、决策反馈均衡器 (DFE) 和一个可编程、低抖动、4 抽头 TX 前馈均衡器 (FFE) 滤波器。这些特性可实现有损耗互连的长度扩展,例如直连铜 (DAC) 缆以及具有多个连接器且存在串扰的背板。DS560DF810 配有位多路复用器和多路信号分离器齿轮箱,可在主机和模块间轻松实现 NRZ 至 PAM4 或 PAM4 至 NRZ 的转换。该齿轮箱可将一对速率高达 28.9GBd 的 NRZ 输入聚合为一个 28.9GBd PAM4 输出,也可将一个 28.9GBd PAM4 输入解聚为一对 28.9GBd NRZ 输出。DS560DF810 在 CDR 后的每对相邻通道之间都具有一个完整的 2x2 交叉点开关,可支持快速、灵活的通道切换以实现灵活的 PCB 路由,支持 2 到 1 多路复用和 1 到 2 多路分解以实现故障转移冗余,还支持 1 对 2 扇出以实现诊断监控。此外,PCB 上集成了物理交流耦合电容器(TX 和 RX),无需使用外部电容器。这些特性可降低 PCB 布线的复杂程度并节省物料清单 (BOM) 成本。诊断功能包括无损 PAM4/NRZ 垂直眼高监视器、2D PAM4/NRZ 眼图张开度监视器 (EOM)、具有错误注入模块的 PRBS 图形发生器、PRBS 错误校验器和片上温度传感器。这些特性可帮助测量链路裕量,并用于监测系统随时间推移的运行情况。DS560DF810 可通过 I 2C 或外部 EEPROM 进行配置。单个 EEPROM 最多可由 16 个器件共享。特性具有集成信号调节功能的通道多协议重定时器所有通道均可独立锁定 19.6GBd 至 28.9GBd 的 PAM4 和 NRZ 数据速率(包括 1/2 和 1/4 子速率)适用于高达 CEI-56G、以太网™ (400GbE)、光纤通道 (64GFC)、InfiniBand™ (HDR) 和 CPRI/eCPRI PCB、铜缆和光学应用CDR 自动通道速率切换可锁定多达五种不同的波特率和调制类型组合低延迟:26.5625GBd 时小于 2000ps(典型值)连续自适应时间线性均衡器 (CTLE)、RX 前馈均衡器 (FFE) 和决策反馈均衡器 (DFE) 搭配使用,可在 13.28GHz 下支持超过 30dB 的通道损耗集成 2x2 交叉点开关可调节 4 抽头 TX FFE 滤波器齿轮箱模式支持(NRZ/PAM4 位多路复用器/多路信号分离器、NRZ/PAM4 串行器/解串器)用于调试的片上眼图张开度监视器 (EOM)、PRBS 发生器和 PRBS 校验器双电源:1.8V 和 1.2V工作温度范围:-40°C 至 +85°C带有集成交流耦合电容器的 8.00mm x 13.00mm BGA 封装应用 • 有源电缆 (AEC)(QSFP-DD、OSFP)• 前端口 C2M 连接单元接口 (AUI) 抖动消除 • 背板 (KR) 和中板 C2C 连接单元接口 (AUI) 范围扩 展 • 通过 NRZ 和 PAM4 聚合和解聚实现速度加倍(齿 轮箱)参数封装简化版原理图
询价列表 ( 件产品)