鉴于第二代 AMD EPYC 处理器的强劲性能,包括苏妈在内的许多AMD高层都对其发展表达了乐观的态度。 在发布会后的采访中,AMD全球副总裁兼数据中心产品部总经理 Scott Aylor表示,未来AMD在数据中心市场会有两位数的增长,“我们相信会对市场产生巨大的推动力”。 因为在关键的时间点退出过数据中心市场,重返之后AMD的份额下跌到了可怜的境地。 来自权威分析机构IDC的数据显示,在今年第一季度,中国市场的服务器出货量达到了67万多台,其中基于英特尔处理器的有66万多台,而基于AMD平台的服务器数量竟不足一万台,市场占比约为1.5%。 可以说,AMD在对的时间选择了对的技术和工艺,打了一个时间差,让英特尔措手不及。
对于多芯片设计,最关键的因素就是提高不同模块之间的通信带宽和效率、降低延迟,AMD为此设计了Infinity Fabric总线,无论AMD CPU还是AMD GPU,互连互通都是基于这种新型总线。 另一方面,它可以灵活地配置产品规格和特性,针对不同市场提供最合适的产品,也能更好地提升峰值计算性能。 除了底层架构的大变,三代锐龙(以及新一代霄龙)还采用了chiplet多芯片设计。 虽然很多人称之为“胶水”,但是在如今摩尔定律前进迟缓、半导体技术提升艰难的情况下,这其实是非常明智的选择。 在发布会的主题演讲中,苏妈提到了这样一句话——Change the game in datacenter。
amdzen2: AMDZen2架構L3快取翻倍,64核EPYC處理器有256MB的L3快取
而锐龙9 7900X、锐龙7 7700X的测试数据是它们发布时,我们在另一款主板上测试的,时间较早。 当时其PBO设置显然还并不激进,所以它们的全核心满载频率反而还要低一些,FPU烤机频率分别为5150MHz、5055MHz。 当然后续锐龙9 7900X、锐龙7 7700X如使用新的BIOS,PBO设置较为激进的主板,其性能也会得到进步。 所以这里至少可以证明锐龙9 7900、锐龙7 7700的处理器多核心性能达到甚至小幅超过锐龙9 7900X、锐龙7 7700X刚发布时的性能。 需要注意的是,AMD处理器的标称TDP,以及标称工作频率都只是个参考数值,处理器在实际运行时会根据主板BIOS设置,如是否开启处理器性能加速与PBO(精准频率提升)这些功能进行调整。
- 与此同时,AMD一直有优势的多核性能上还会继续保持,锐龙3000上最大核心数翻倍到了16核32线程,随着核心增加多核性能也基本保持了线性增长,6核12线程的处理器CINBEBCN R20多核跑分是3678,12核24线程的锐龙3000就是7248分,基本上就是同步增长的。
- 在锐龙3000处理器上,IF总线进化到了第二代,在并行、延迟及能效上全面改进,总线位宽从256b升级到了512b以便支持PCIe 4.0,同时将Fclk与Uclk频率去耦合解锁以提高内存超频性能,并采取多种方式降低内存延迟、提高缓存速度以减少延迟带来的影响。
- 一方面,大小核心的设计使得处理器的制造工艺不必全部拘泥于7nm,在生产工艺和难度上的要求进一步降低;另外在分离之后,核心数量的增加就变得更为灵活,这一代产品提供了从8核心到64核心的超丰富选择,也正是得益于此。
同时对电脑用户而言,这样的功耗也不是一个很大的负担,何况处理器并不是一直处于满载状态。 而如果要将处理器的最大功耗限制在65W以内,也必将降低处理器的工作频率,在性能上会有很大损失。 接下来我们将重点对三款锐龙7000智酷版处理器的基准与应用性能进行详细测试。 就像前面所说,为释放它们的最大性能,我们会采用水冷散热器+开启PBO的组合对它们进行测试。
amdzen2: AMDZen2樣品抵達實驗室:8核心16執行緒加速4.5GHz
对CPU这种极其先进的逻辑芯片来说,任何重要的进步都离不开制程工艺的升级,14/12nm锐龙上的一些缺点,比如CPU单核频率还不够高等,AMD也不是不清楚,但他们也没办法了,GF的14/12nm工艺决定了上限了,不是想提频就提频的。 管理学中有个著名的说法——从优秀到卓越,这句话用来形容现在的AMD再合适不过了,14/12nm公司的锐龙处理器是优秀的处理器,但还有一些槽点没能解决,而现在的7nmm Zen 2架构目标是卓越,AMD从追赶者变成领导者的任务就要靠它了。 本文内容较长、而且涉及的专业名词、术语比较多,阅读也有一定的门槛,但我已经尽可能从简地解释了,对于喜欢DIY、感兴趣半导体技术的粉丝们,不妨找个安静的地方,好好地看一看,应该多少都能有点收获的。 不知不觉中AMD的锐龙处理器上市2年半了,2017年横空出世的Zen架构也发展了两代了,如今上市的是第三代锐龙——锐龙Ryzen 3000系列了,回头再看的时候发现当前的主力锐龙Ryzen X开始陆续下架了,正如很多人不记得锐龙7 1800X处理器下架一样。
- 当AMD华裔CEO Lisa Su博士一袭灰色职业西服出现在发布会现场的时候,现场报以热烈的掌声和尖叫声。
- 二级缓存保持每核心8-way 512KB不变,三级缓存则翻番到了每核心对应4MB,可以很好地提升游戏性能。
- 此外,AMD凭借IO核心分离还提高了内存的频率,之前的锐龙支持的内存频率不过2933MHz,现在可以轻松达到4000+,号称一键超频到4200MHz,高者可达DDR4-5133Mhz。
- 能效提升如此之多,新工艺新架构自然功不可没,也大大带动了频率,Zen、Zen+最高可以分别达到4.1GHz、4.35GHz,Zen 2则来到了4.7GHz(16核心的3950X),同时大大降低了达到最高频率所需的最大电压。
这里也可以解释为了降低延迟AMD为什么敢于大幅加倍L3缓存的原因了,每个CCX翻倍到16MB L3缓存后CCX核心面积依然减少一半左右,何乐而不为呢。 具体来说,就是图中上面2组CPU核心是7nm工艺制造,因为CPU核心对性能要求高,对功耗也敏感,提升工艺对CPU核心来说大有裨益,好钢要用在刀刃上。 在7nm节点,设计一款芯片的费用高达3亿美元,对AMD来说成本也是非常高的,这就需要厂商采用更好的方式来确保芯片的良率,芯片越大良率就越低,芯片越小良率就有可能越高。 尽管AMD成功地在锐龙3000处理器上使用了7nm工艺,但是说它是7nm芯片也有点不准确,实际上锐龙3000是7nm混合12nm工艺,这跟它的模块化设计有关。
amdzen2: AMDZen2樣品抵達實驗室:8核心16執行緒加速4.5GHz
在谈到第二代 amdzen2 AMD EPYC 处理器的时候,两人都给与了“Very very Good”的超高评价。 不过考虑到美国人说话一向比较夸张,最初我对他们的描述并不敢肯定。 “真的,我们测试过,至少提升25%”,Pak说这话时的兴奋溢于言表。 虽然在微架构设计层面有所不同,但整体看来AMD与英特尔都基于x86阵营,因此在生态上AMD也同样能搭上x86架构的顺风车,形成了生态伙伴“召之即来”的壮丽场面。 相比之下,曾同样与英特尔展开竞争的POWER和ARM都不具备这样的优势,自然在生态系统建设上也就处于劣势。 针对单颗处理器性能来说,ZEN2的性能是英特尔产品的两倍以上,我们可以看到即便是铂金版产品其实际得分也仅相当于32核心的中端ZEN2处理器水平,在中高端的48核心和顶尖的64核心处理器上,ZEN2目前还没有对手。
接下来我们要介绍的,就是本文的核心内容之一、AMD最新发布的产品——第二代霄龙处理器,研发代号为Rome(罗马)。 文章写到这里,已经超过了2500字,但是还没有切入产品正题(虽然产品技术特征并非本文重点)。 我之前考虑过是否将其分为上下两篇继续宁,但是考虑到评论的延续性和态度表达的重要性,最终还是整合在一起。 这在现在看来无疑是错误的决策,也让AMD将企业级市场仅存的份额拱手相送。 虽然就市场份额来说,AMD的占有率肯定不及英特尔,但当时x86平台取代传统小型机已成为行业趋势,如果AMD咬牙坚持下来,纵然在与英特尔的对抗中处于下风,但依然能够抢占从IBM小型机剥离出的不少份额,在数字上也不至于太过难看。 由此开始了英特尔近乎10年的黄金时代,当然对于AMD来说是却悲惨的。
amdzen2: AMDZen2架構L3快取翻倍,64核EPYC處理器有256MB的L3快取
但是现在,AMD在性能上再一次获得了领先,而英特尔下一代的10nm产品却刚刚萌芽,市场留给了AMD一个绝佳的时间差。 此时,AMD所需要实现的不仅仅是迎头赶上和超越,而是更进一步,走出自己的路。 具体到产品层面,ZEN2系列面向主流双路一共有14款产品,看起来并不多(年初英特尔发布的第二代至强可扩展处理器数量多达40余款),但是其规格覆盖了从8核心到64核心的超广阔范围。 更值得一提的是,在缓存容量上ZEN2带来了“海量”提升,动辄128MB的三级缓存无疑在大容量吞吐的时候受益多多,更遑论最高256MB的缓存。 改进的分值预测单元、更好的指令预取、重新优化指令缓存、更大的微指令缓存……等等项目的变化带来的是直接的性能翻倍与延迟的同时降低,这些都意味着ZEN2的脱胎换骨。 在上一代的ZEN架构中,这前端设计一直被认为是其软肋所在,还好AMD在这次更新上有了明显的进步。
至於為何是顯示卡部門先拿到樣品,據稱是Zen2處理器在連線方面有一些變化,AMD顯示卡必須在驅動方面跟上,Zen團隊其實也已經開始相關測試工作。 好訊息是,未經調校效能就已超越i7-8700K,而且AMD已經基本彌補了在IPC(每時鐘週期)方面與Intel的差距,也就是架構效能差不多追上了,所以後者才瘋狂提升頻率。 頻率一直是AMDZen架構的弱勢,特別是受制於GF14nm工藝難以做到太高,在和Intel的對比中很吃虧,現在有了新架構、新工藝,頻率大大提升是必然的,而且一般來說,工程樣品的頻率都很保守,即便如此都能做到4.0-4.5GHz,Zen2的最終頻率更值得期待了。 锐龙6000H/6000U系列已经拥有12个计算单元,锐龙7000系列也会有4个做“亮机卡”,Steam Deck更是有8个。 安全方面,Zen架构诞生后爆发了大量的安全漏洞威胁,幸运的是Zen对于Meltdown熔断等诸多漏洞以及部分Spectre幽灵漏洞天然免疫,补丁都不需要,同时可以通过固件更新、系统补丁等修复受影响的Spectre幽灵漏洞。 鉴于这些内容过于深奥,我们刚才先讲了新架构的效果,接下来就分享新架构的内部设计,只说一些最关键的、最容易理解的地方,感兴趣的可以细细研究架构图,或者等待后续的技术白皮书。
移动端已经升级Zen3+架构,桌面端马上迎来Zen4架构,但意外的是,AMD又把古老的Zen2架构拿了出来,重新“粉刷”一遍。 amdzen2 Zen 2则在设计之中就从硬件层面防御了Spectre幽灵漏洞,不但绝对保证安全,也不会因为打补丁而导致性能损失。 amdzen2 今天我们就来探究一番,当然CPU架构和制造工艺是极深的、极专业的,我们这里也只是浮光掠影地看一些毛皮,感受一下AMD激进的步伐。 2017年,AMD Zen架构横空出世,Ryzen锐龙、EPYC霄龙处理器在各个领域都大杀四方、一举扭转乾坤。
考虑到锐龙7 2700X以及Intel的酷睿i7-9700K处理器都是14nm工艺水平的,7nm的锐龙3000处理器在能效上有两代工艺的差距,官方称同性能下功耗降低了50%,能效上可以说是降维打击。 amdzen2 最后值得一提的是处理器的安全性,由于后发优势,Zen2架构在安全性、漏洞防护等问题上更具优势,Zen架构上就已经免疫了多个Spectre幽灵、Meltown熔断等变种漏洞,Zen2架构上进一步硬件免疫了幽灵漏洞变种,这点对消费级处理器来说影响不大,但对企业级用户来说很重要。 整数执行单元中,调度器从84个增加到了92个,物理寄存器从168个增加到了180个,从每周期6发射提升到了7发射,总体来说这方面的改进更多地是量变,进一步优化执行单元的效率及执行速度。
amdzen2: AMDZen2架構L3快取翻倍,64核EPYC處理器有256MB的L3快取
一个最明显的区别就是,ZEN架构从第一代的“四海一家”变成第二代的“八星伴月”。 从名为“巴塞罗那”的第一代四核心处理器开始,AMD就喜欢用地名对其命名,后续包括“上海”、“伊斯坦布尔”和“那不勒斯”等等产品都延续了这一方式。 而这一次,AMD对于第二代霄龙处理器的命名为罗马,不知是否取其“条条大路通罗马”的寓意。 但是在经过了多年的精心准备之后,Rome的表现实在是让我们觉得惊艳。
从产品性能角度,AMD并没有吹牛,的确是世界最强的x86处理器,也的确实现了性能上的翻身。 Spark是大数据应用的常见架构,在数字化、数据分析的今天,它的应用范围非常广。 结果是显而易见的,双方的多轮博弈,让我们更清楚的看到了不同时代顶尖处理器的性能成长。 不过对于客户来说,BenchMark成绩只能进行参考,具体的表现还要在实际的业务中才见分晓。
amdzen2: AMDZen2樣品抵達實驗室:8核心16執行緒加速4.5GHz
的确,在苏妈掌舵AMD五年以后,AMD在产品层面终于快要翻身了,可喜可贺。 Ryzen所用的Zen使用了CCX架構,每個CCX單元由4個CPU核心、L1、L2緩存組成,每個CCX共享8MBL3緩存。 理論上AMD增加到12-16核只需要增加1-2個CCX單元即可,而此前也有分析稱CCX架構設計靈活性很高,良率也很好。 当然,考虑到PCIe 4.0目前比较少支持,不追求极限性能的话大家完全可以选择X470、B450等平台,AMD之前也确认过了,除了PCIe 4.0支持之外,其他平台上锐龙3000处理器的性能也是一样的,不会受影响的。
在云计算的大潮下,基础设施建设服务提供商已经越来越步入后台,正如我们在用电的时候不会在乎它是否来自国家电网一样,数据中心的前端客户也不在乎计算能力是由哪家处理器提供的,英特尔不错AMD也挺好,甚至包括POWER、ARM等等也都可以接受,只要能够解决实际业务难题。 真正的将军从不在敌人设计好的战场与之决战,而是沿着自己的节奏稳扎稳打。 amdzen2 对于AMD来说,“击败英特尔”就像“国安永远争第一”一样,是一直追求的目标,但即便ZEN2获得了巨大的成功,以AMD的体量来说也不太可能对英特尔取而代之。 后记:在得知我参加第二代 AMD EPYC 处理器新品发布会后,许多行业内的小伙伴都通过微信、电话等方式进行询问,更有人直接要我表达对此事的看法。 其实在我看来大可不必,AMD不是洪水猛兽,英特尔也并非浪得虚名,市场的本质就是竞争,只是我们在处理器领域太久没有闻到硝烟而已。
amdzen2: AMDZen2架構L3快取翻倍,64核EPYC處理器有256MB的L3快取
同时锐龙7000智酷版处理器的售价也相对便宜一些,锐龙9 7900、锐龙7 7700、锐龙5 7600的首发售价分别为3199元、2299元、1549元。 而锐龙9 7900X、锐龙7 7700X、锐龙5 7600X现在的售价分别在3299元、2599元、1699元左右。 相反,AMD更需要实现的是利用这个时间差,在细分领域找到适合自己的业务,打造自己的生态圈。 去年年底,英特尔将业务发展定位成了6大支柱,包括制程、封装工艺、存储、互连、软件和安全,并视其为生命线。 由此看来,处理器虽然是英特尔的核心,却也并非是决定性的业务,而AMD显然也有自己的业务支柱,并不能简单套用这6个标准。