「大小核」武器曝光拿下谷歌云 3nm制程AMD最近有点彪悍

2022-08-31

  性价比无敌的AMD拿下谷歌云最新虚拟机!最新Zen5架构或将采用大小核设计?不知道一直在滑铁卢的英特尔怎么想。

  谷歌云服务近日宣布Tau虚拟机正式加入到旗下的Compute Engine虚拟机产品序列中。

  其中Tau最新的T2D虚拟机基于AMD最新的第三代EPYC(霄龙)处理器。

  对于云服务而言,诸如网络服务、容器应用管理、音视频转码、大规模Java应用等横向扩展工作负载一方面需要快速的处理能力来提升用户体验,而另一方面还需要尽量降低成本来提升服务的竞争力。

  T2D虚拟机采用了预定义的虚拟机结构,一台虚拟机最多有60个vCPU,一个vCPU分配4G内存,网络带宽最高达到了32Gbps。

  相比之前的虚拟机,采用AMD技术的T2D绝对性能提高了56%,性价比提升了42%(相比采用英特尔处理器虚拟机的更是提升了将近100%)。

  显然,性价比的提升几乎完全是AMD的功劳。AMD的EPYC(霄龙)服务器处理器自推出以来,从性能上来说对于蓝色牙膏厂产品基本是简单粗暴的碾压。

  针对AMD最新一代服务芯片开发的虚拟机服务,包括Snap、Twitter等公司已经进行了测试。多家公司也确认该服务能够提供两位数百分比的性能提升。

  从谷歌转投AMD阵营不难发现,AMD在x86处理器方面的表现,已经从普通玩家的喜爱渗透到科技巨头中去了。

  尤其是Zen架构出色性能,发展到现在的Zen 3之后,AMD处理器已经基本实现了在单核和多核性能上对英特尔的全面超越(跑分上)。

  市场份额方面在AMD桌面端也基本上和英特尔平起平坐。不过移动端还是英特尔的天下,不得不说,英特尔的OEM基本盘还是稳。

  在自己移动端的i9被M1按在地上摩擦之前,英特尔就率先推出了十分拉垮的Lakefield。而后英特尔又表示即将推出Alder Lake架构,从PPT来看性能倒是提升巨大。

  而AMD方面也似乎早已开始了研发,在2019年12月就提交了关于大小核的设计专利。

  AMD为任务的执行状态设定了多个阈值,并通过监控这些指标来决定如何给大核心和小核心直接分配任务。

  其中包括,处理器以最大速度运行的时间长度,内存以最大性能运行的持续时间等。

  在执行过程中,如果系统发现在小核心执行的任务达到了某个阈值,那么系统会重新将任务分配给大核心,反之亦然。

  据称,AMD采用大小核设计的APU处理器将会被命名为Strix Point,预计采用8个Zen5的大核心和4个Zen4的小核心,且都将基于3nm工艺。

  不过从目前的资料上来看,Zen4将基于5nm工艺制造,于是有其他传言表示,3nm制程的小核心架构将被称为Zen4D,是Zen4的增强版本。

  除此之外,AMD Strix Point APU还有一个新的 L4 缓存系统,它将作为系统级缓存工作。

  从理论上来说,这种机制可以将执行中的任务从迁移到更优化的处理器,从而使整体处理性能得到提高,但是这显然还需要依赖系统层面的支持。

  针对在x86架构上推广大小核技术,此前网上在芯片领域资深的媒体人黄烨锋进行了系统而专业的分析。

  在他看来,Intel(以及AMD)在这种非其传统强项的处理器产品中,遭遇的问题可能是形形色色的。

  其一是scheduler(调度)。不同核心之间需要密切合作在不同CPU设计间管理负载的调度元件,而X86架构的处理器此前并没有类似的技术。要知道Android和Arm在这方面可是有着比较长期的演进的,包括线程迁移对实际体验造成的影响;苹果就更不用说了;

  第二是处理器本身的性能。终极问题大概是,在性能和效率上Intel能否做到苹果M1那样的程度。

  M1芯片表现出的超高性能和效率,基本得益于以下三个要素:其一是超宽的处理器架构,其二是有针对性地添加一些专用单元,其三则是对自家封闭生态超乎寻常的掌控力(令其能够很随意地做出同一内存架构这样的东西)。

  对于像Intel、高通这样单纯赚取处理器利润的厂商,这种做法非常不经济(x86还存在变长指令不利于解码宽度拓宽这样的现实问题)。

  而采用ARM架构处理器的另一个优势在于可以打通PC和手机、平板电脑等便携设备之间的界限,就像苹果一样,能够让旗下生态系统中的设备可以实现无缝连接。

  得益于苹果这条「鲶鱼」的加入,以及AMD近两年的重新崛起,CPU市场的竞争局面重新变得有趣了起来。

  英特尔新上任的CEO Pat Gelsinger能否让这家步履蹒跚的蓝色巨人重新焕发活力?AMD与Intel未来与来势汹汹的苹果CPU会形成怎样的竞争局面?