现如今到处都在讲整合。不景气的硬盘产业高度整合、上游DRAM厂也因为资金链问题频频发出整合动作,这不CPU和GPU两大芯片也在争先恐后的聊整合。在2010年初,Intel发布了Clarkdale核心的Core i3/i5处理器,正式将CPU和GPU合二为一。眼热的AMD也不甘示弱,终于发布了代号为“Llano”的高性能A系列APU加速处理器,将整合这一概念提升到前所未有的高度。
虽然在之前AMD的推土机热度一度增高,小道消息满天飞,相比之下大家对APU的关注就少了很多。不过这并没有影响APU的推进,至少APU还是可以领先推土机问世的,所以螳螂捕蝉黄雀在后,可能就是说的APU。
AMD的融合概念已经喊了好几个年头了,直到现在的APU上才算真正有点融合的意味,CPU和GPU真正开始共享内存,不过就是这一点融合也带来了严重的挑战——如何在资源共享的同时保证二者的性能互不受影响,而不会出现1+1<2的意外情况。下面是A系列APU(Llano)微架构示意图:
A系列APU(Llano)微架构
AMD A系列APU微架构由五大部分融合而成:CPU、GPU、北桥、内存控制器和输入输出控制器。如何用这些部件、尤其是CPU和GPU协调工作,AMD下了不少功夫:整合北桥芯片作为枢纽,CPU通过北桥访问内存;采用Fusion Compute Link来将北桥、GPU、IO连接在一起,同时在GPU和北桥之间搭建Radeon Memory Bus,目的是让GPU与内存进行高速数据交换,从而提升3D性能与并行计算性能。
从图上我们就已经注意到了,APU中GPU末端与北桥相连,可以通过北桥的直接访问DDR3内存,这就意味着CPU和GPU会同时共享内存带宽,而且GPU实际上是可以直接读取内存数据的,延迟要比过往模式要低。虽然AMD通过“Radeon Memory Bus”“Fusion Compute Link”来缓解GPU对带宽的渴求,但是问题关键在于内存可以提供的带宽不足。
单条4GB容量在64位系统被GPU占用
单条2GB容量同样被占用
在880G时代,GPU被整合在北桥也是共享内存,不过那时候的集显规格很低,最多仅有80SP流处理,所以没有太多的带宽要求。而如今APU的集成GPU已经可以和中端显卡媲美,所以和CPU争抢内存带宽的矛盾一下子暴露出来。