AWS 推出了两款人工智能芯片--Trainium 和 Graviton
发布时间:2025-10-29 09:38:09

  在拉斯维加斯正在进行的 AWS re:Invent 大会上,AWS 推出了针对高性能 AI 工作负载的下一代Trainium 和 Graviton 芯片。根据 AWS 的说法,Graviton4 比 Graviton3 提供明显更好的性能、更多的内核和更多的内存带宽。Graviton 是专为云工作负载构建的人工智能芯片系列。

AWS 推出了两款人工智能芯片--Trainium 和 Gravitonxx

  第二个芯片 Trainium2 是一款高性能芯片,旨在在 Amazon Elastic Compute Cloud (EC2)  “UltraClusters”中大规模部署100,000 个独立芯片。这些 EC2 Ultracluster 旨在满足使用云的计算能力的可扩展需求。


  根据GitHub 上的 AWS 官方技术指南,该阵容中之前的芯片也以高效率和高性能为目标。例如,Graviton3E 由针对云原生工作负载优化的可扩展 Arm Neoverse V1 CPU 提供支持。Neoverse V1使用可扩展矢量扩展SVE,使Graviton3E能够适应不同的工作负载。与传统的单指令多数据 (SIMD) 架构相比,SVE 允许处理器在运行时而不是编译时适应不同的向量长度。


  向量可以被认为是并行处理的元素的集合。传统 SIMD 架构中向量处理指令的一个示例是Intel x86 指令 _mm256_add_ps 指令。该指令适用于固定大小的 256 位向量。或者,使用 SVE,计算中使用的向量的大小是在运行时动态确定的。对于需要较小计算的工作负载,可以使用较小的向量来提高能源效率。因此,AWS 称赞 Graviton 3E 的矢量处理性能提高了 35%,也就不足为奇了。


  AWS 创建 Graviton4是为了进一步提高 Graviton3E 的性能和可扩展性。Graviton4 由 Arm Neoverse V2 CPU 提供支持,Arm 表示该 CPU 可以使 Graviton3E 中使用的 Neoverse V1 的性能提高一倍。


  Graviton4还具有增强的安全功能。Neoverse V2 CPU底层采用ArmV9,由于其保密的计算架构,本质上比其前辈更加安全。除了拥有更大的 2 MB 二级缓存外,Graviton4 还实现了分支目标识别 (BTI),这是底层 Arm CPU 架构的另一个功能。这可以防止由于间接分支而执行不需要的指令,从而增强代码安全性。AWS 表示,Graviton4 的数据库速度提高了 40%,Web 应用程序速度提高了 30%,同时仍然强调安全性和可扩展性。


  人工智能或机器学习技术最重要的一个方面是训练,即使用一组数据“教授”人工智能的过程。AWS Trainium 专门针对通过云进行高性能训练计算基础设施。


  Trainium AI 加速器使用AWS NeuronCore 架构,每个加速器具有 32 GB 的带宽内内存,并提供高达 190 TFLOP 的计算能力。NeuronCore 具有用于张量多维数组计算、矢量处理和标量处理的独立引擎。


  AWS 表示,通过部署在 EC2 UltraCluster 中,Trainium2 的训练基础模型 (FM) 和大型语言模型 (LLM) 的速度比以前快四倍。AWS 还允许访问其他令人垂涎的人工智能芯片,例如 Nvidia GPU。一些 Nvidia 芯片,例如 GH200 Superchips,将可以通过 EC2 服务访问。



相关文章: Arbe 发布 48 RX x 48 TX 量产雷达处理器  Onsemi发布可提高电池续航时间40%的图像传感器  意法半导体宣布推出1200V耐压、车用SiC功率电源模块  直流屏是什么?直流屏的作用与原理  EMI屏蔽和光学粘合在先进医疗、国防显示技术中有双重作用  什么是位移传感器?位移传感器的原理与应用案例  读卡器是什么?读卡器是干嘛的?读卡器怎么用  固态光继电器应对高频、ATE 信号切换的方法  关于雷达和智能物联网的 11 个误解  中国电科获中国改革发展杰出贡献企业荣誉  3款高可靠性电路保护器件,更有效的过压保护  尽管地缘政治紧张局势存在不确定性,但RISC-V架构仍在继续发展  晶达光电即将推出 EN 50155 平板电脑  IGBT是什么意思?什么是 IGBT模块? IGBT工作原理和作用  LVDS是什么意思?lvds接口是什么接口?LVDS接口的特点  mhz是什么意思?mhz等于多少hz?mhz、khz、ghz换算  英国Pickering公司推出其首款高压表面贴装簧片继电器  Vishay将收购Nexperia的纽波特晶圆厂,预计将于2024年第一季度完成  英飞凌将1.2kV和2kV的SiC MOSFET半桥引入62mm模块封装  电感单位是什么?电感单位换算公式与关系  网线插座怎么接?墙壁网线插座接法  Broadcom 在业界首次将神经网络引入交换机  Synaptics的SYN43711芯片集成了WiFi6E 和蓝牙 5.3  OSTAR Projection Compact LED 系列增加 RGB 版本  电脑文件夹怎么设置密码?3分钟教会你如何给文件夹设置密码  什么是网关?网关是什么意思?网关和路由器的区别  ST推出STM32WL33xx系列新型低功耗、高灵活性无线MCU  超导体是什么意思?超导体的应用有哪些?  城域网是什么意思?城域网和广域网的区别  Alps Alpine推出了具有32 位 RISC CPU 的电容式传感器IC  PCC是什么意思?PCC和PLC、IPC的区别  英飞凌:新型 4.5kV 的IGBT模块可改变传输设计  网线的线序:交叉网线线序和直连网线线序图解  蝶眼传感器捕捉紫外线图像,生物仿生技术窥探光谱的新区域  RDS 推出紧凑、高性能 OLED 显示模块  stm32f103是什么电子元件?stm32f103的功能作用和应用领域  苹果凭借适用于Mac的M3处理器系列保持领先地位  联想悄然推出了一款运行 Android 系统的商用投影仪  排名前十的无晶圆厂第三季度营收达到 447 亿美元  瑞萨推出采用其自行设计的 32 位 RISC-V 内核的新 CPU  英特尔推出第5代 Xeon 处理器,负载性能提高了 36%  TWS是什么?TWS耳机是什么耳机?  Onsemi、三菱电机和 ST 各自扩大 SiC 产能  什么是涡街流量计?涡街流量计的工作原理解析  恩智浦半导体推出的全新汽车级无刷直流电机控制 MCU  适用于移动设备和可穿戴设备的4款电路保护器件  外网评测的2023年最佳SSD:从廉价SATA到极速NVMe的前15名  意法半导体推出新款低功耗、高灵活性无线MCU  技嘉 Wi-Fi 7 PCIe 卡让台式机拥有更快的无线连接  ST汽车级双运算放大器TSB182融合了中等电压和精度