GPU三巨头开启竞争新时代

近日 , 在AMD第二季度财报中 , 该公司确认了其具有第二代 CDNA 架构的下一代 Instinct MI200加速器的初始出货量 。据悉 , MI200配置了Aldebaran GPU , 这是一个双芯片处理器 , 采用了MCM封装 。该GPU开始出货 , 标志着AMD成为第一家向客户交付采用MCM技术的GPU公司 , 领先于竞争对手英特尔和英伟达(NVIDIA) 。
何为MCM?
【GPU三巨头开启竞争新时代】MCM是由同一器件中的多个Die(两个或更多)组成的电子封装系统 。它安装在基板上 , 衬底上的管芯由导线连接 。
与传统架构(如用于GPU的SLI和CrossFire)相比 , MCM可提供更高的性能 , 并减小组件的尺寸 。通过MCM封装系统 , 器件或模块可以克服重量和尺寸限制 , 并提供超过30%的效率 。
MCM的优点可以概括如下:更高的可靠性;更灵活地集成不同的半导体技术;通过减少阵列之间互连的长度来提高性能;尺寸更小;产品可快速上市;降低了复杂性并简化了设计 。
通常 , MCM模块有3种类型 , 具体取决于基板技术:MCM层压 ( MCM-L )、沉积 ( MCM-D ) 和陶瓷 ( MCM-C ) 。
以前 , MCM主要用于CPU , 最近逐步进入GPU领域 。
MCM用于GPU的优势和挑战
MCM GPU与传统带有多个GPU的显卡之间的最大区别在于 , 前者是一个单独的封装 , 后者是一个PCB板卡 , 前者的板载桥接器取代了两个独立显卡之间的Crossfire或SLI桥接器 。
传统的SLI 和 CrossFire需要 PCIe 总线来交换数据、纹理、同步等 。由于GPU之间的渲染时间会产生同步问题 , 因此在许多情况下 , 传统的双GPU显卡 , 即单个PCB上的两个芯片由它互连 , 每个芯片都有自己的VRAM 。SLI或CrossFire的能耗很大 , 冷却也是一个挑战 , 这些在很长一段时间内都困扰着工程师 。
MCM GPU就是为了解决以上问题而出现的 。不过 , MCM GPU并不完美 , 它同样面对着诸多技术挑战和难题 。
在进行MCM GPU设计之前 , 需要解决封装和互连方面的软件问题 , 因为两个或更多GPU , 无论多么紧密地连接在一起 , 要想在一起协同工作 , 并不是一件容易的事 。MCM作为能够用于并行处理的组件 , 其GPU之间使用不同的内存访问 , 设计的复杂性会成倍增加 。这需要开发人员在软件方面进行大量“修补” 。在消费级的PC应用方面 , 很少有游戏玩家实际运行多GPU设置 , 因为其回报很少 , 因此没有人愿意做这么多的软件工作 。不过 , 如果应用于数据中心和云计算 , 情况就不同了 , 这样的高性能计算应用对GPU提出了更高的要求 。虽然多芯片GPU系统还是新生事物 , 许多图形工作负载不能很好地扩展(有些甚至根本不能扩展) , 但每台服务器有多个GPU , 由于具有超级计算和数据中心的并行化性质 , 这就可以很好地扩展工作量 。
而如果能解决MCM GPU的瓶颈问题 , 回报将是诱人的 。这也正是MCM GPU首先出现在数据中心应用领域的主要原因 , 今后 , 随着技术的不断成熟 , 以及PC应用性能的提升 , 其在消费电子领域的应用也将会出现 。
三强争霸
在企业界 , 最早应用MCM技术的是IBM , 那是在上世纪70年代和80年代之间 , 主要用于该公司的POWER架构CPU 。而将MCM发扬光大的是英特尔 , 自然也是用于CPU 。2013年 , 该公司的22nm制程处理器Haswell就用到了该技术 。2014年 , 14nm制程的Broadwell 架构问世 , 这是一个SoC平台 , 它使用了“堆叠”基板架构 , 也就是MCM , 将多个阵列垂直堆叠在了一起 。
最近几年 , 英特尔开始研发独立的GPU , 也就是其Xe架构产品 , 为了顺应技术发展和应用需求 , 该公司开始将MCM应用于其最新的GPU产品 , 据悉是基于Xe HPC架构的Ponte Vecchio加速器 , 但具体问世时间还未确定 。