智能超頻(動態加速)這種技術最早是Intel在45nm Lynnfield上搞出來的,叫做Turbo Boost(中文名睿頻),Sandy Bridge上進化為第二代,可根據應用負載升降不同核心的頻率,從而兼顧對頻率、線程明暗度不同的應用與整體性能、功耗。 AMD Phenom II X6六核心首次引入自己的智能超頻技術Turbo Core,但還不是很完善。 amd推土機 AMD在推出推土机架构处理器后,市场反馈并不太好,但这毕竟只是第一代,也可能是市场和软件环境还没适应这个处理器中的新物种。 于是AMD在第二年便推出推土机小修小改的版本,Piledriver打桩机架构处理器。 与推土机相比,同为是模块化设计的“打桩机”核心改动主要体现在:1、新增FMA3、AVX1.1和F16C等新指令集;2、强化电源管理,降低产品功耗;3、一级、二级缓存优化;4、核心频率提高,TDP保持不变。 從理論上講,採用模組化設計的推土機核心具有一定的創新性,每個模組中用兩個整數單元和一個共享浮點單元,且整數單元都各自配備了一個調度器,以便實現 2 路線程,AMD 將這一多線程技術稱之為「CMT」。
【GF果然大坑】当然,Interlagos的目标频率应该接近3Ghz而不是2.3Ghz。 归功于33%额外的核心,农企许诺最多有50% 的提升,但我们最多得到了20%。 其中最主要便是这功耗的优化,这让处理器在相同电压下对比上一代有了10%左右的超频空间。
- 在最新的Intel CPU中,8路32KB的指令缓存显然不够大。
- 多数业内人士都认为推土机的分支预测器是一个K10的多层次的改进版。
- 在推土機中,每個前端配合一個模組,並負責為其中的兩個核心分配執行緒。
- 在著手設計下一代x86處理器核心的時候,AMD的工程師們認為必須實現核心功耗與面積的最佳化,而且PC套用的發展也讓工程師們必須尋找一條新的路子,能夠在不同核心之間實現峰值頻寬的最大化,並通過共享模組來充分利用每一平方毫米的核心面積。
- 從官方簡報中,王見王的規格表也不難看出,AMD企圖用多核心、高時脈壓制對手產品。
- 这样的设计造成的另一个结果就是,最吃浮点运算性能和单核性能的大多数游戏表现中,推土机甚至不如”肥龙2“,只能在SNB处理器后面吃尘,这在DIY市场是致命的,毕竟大多数DIY玩家都是为了游戏才去玩DIY硬件。
Intel 在推出世界上第一款基於 x86 架構的 8086 處理器之後,一直不肯將其授權給 AMD。 當時的 PC 製造商並不多,以 IBM 為主的 PC 製造商要求 x86 處理器能夠提供第二供應商,為了獲得 IBM 的訂單,Intel 不得不在 1982 年與 AMD 正式簽署協議,將 x86 授權給 AMD,同時也延長了與 AMD 的交叉許可協議。 首批基於Piledriver的處理器是核心代號「Trinity」的AMD A系列處理器(APU)行動版本和桌面版本;新FX和Opteron在2012年9月發布。 Turbo Core 2.0,和上代Turbo Core一樣可以根據處理器的負載狀態調整各處理器核心的時鐘頻率。 在處理器核心閒置時可以降低其時鐘頻率乃至關閉核心;處理器核心滿載時可以提升其時鐘頻率,處理器半數核心處於滿負荷時可以有1GHz的提升幅度,全部核心滿載時也有500MHz的提升幅度,但是時鐘頻率的提升會保持在處理器的TDP限制(俗稱「熱牆」或「工作溫度牆」)之下。 與上一代Turbo Core相比,Turbo Core 2.0可以使處理器核心關閉,而且可以調整各個核心的時鐘頻率,而首代Turbo Core則只能一次過調整半數核心的時鐘頻率而不能調整單個核心的,核心閒置也不能被完全關閉。
發布之前流傳的種種關於首款 Zen 架構 Ryzen 處理器的傳聞,也增加了玩家的期待。 今年 10 月底,AMD 宣布決定以 350 億美元通過全股票協議收購賽靈思(Xilinx),希望組建世界領先的高性能運算公司。 5 年前,當 Intel 收購另一家 FPGA 獨立廠商 Altera,也就是賽靈思的競爭對手時,更多的聲音是在呼喊「不如讓賽靈思收了 AMD」,當時賽靈思市值約 150 億美元,而 AMD 市值僅 30 億美元。 昨日微软发布了KB ,即传说中的推土机线程调度补丁,不过据实测结果来看,理论性能方面几乎没有什么变化,反倒是WinRAR性能大幅降低。 AMD近日公布了下一代处理器架构推土机的大量技术细节,不过还有一个问好萦绕在很多人心头:新架构是否会向Intel那样频频更换新接口而导致无法向下兼容?
amd推土機: 推土機微架構 本文重定向自 Bulldozer微架構
這個問題的答案其實很簡單,簡單來說就是之前的產品的效能太差,和對手的差距過大,產品不行,市場表現也就差了。 貌似AMD當年預測未來是強調多核心時代,結果n年後遊戲仍然只能利用一兩個核心……單個核心的效率就很重要,直接影響遊戲幀數。 不過值得注意的是 CMT 設計並不是第一次出現在處理器發展史中,早在 1996 年 DEC 就曾經在旗下的處理器上使用過類似的設計概念。
按照超微的說法,基於AMD Bulldozer微架構的處理器上,一個雙線程的的處理器上有一個Bulldozer模組(2個整數排程運算單元),一個4線程的處理器有兩個模組(4個整數排程運算單元),一個8線程的處理器上有4個Bulldozer模組(8個整數排程運算單元),如此類推。 功率大于120KW的履帶式推土機中,絕大多數採用液力-機械傳動。 這類推土機來源于引進日本小松製作所的D155型、D85型、D65型三種基本型推土機製造技術。 國產化後,定型為TY320型、TY220型、TY160型基本型推土機。 amd推土機 為了滿足使用者各種使用工作況的需求,我國推土機生產廠家在以上三個基本型推土機的基礎上,拓展了產品品種,形成了三種系列的推土機。
amd推土機: AMD推土機 FX-8100 8120 8300 8370 8320 FX8350 AM3+八核散片CPU
在操作系統和軟件程序完善之前,可以運行一下AMD提供的兩個XOP、AVX補丁程序,再跑分就會有明顯的不同。 每個推土機模塊內都有共享的兩個128位乘法累加單元,可以每個核心執行128位指令,或者每個模塊執行256位指令。 推土機的每個核心都有64KB一級資料快取、64KB一級指令快取、32-entry全關聯資料頁表快取、完整亂序載入/儲存單元,後者可以在每個時鍾周期內載入兩個128位或載入一個128位指令。
目前,我國生產的推土機的面板及駕駛室的布置與世界先進國家比還有很大差距。 針對我國已加入WTO,對國外設備的貿易壁壘逐漸取消,我們必須向國外先進企業看齊,對我們產品的面板造型、駕駛室內部舒適性等引起高度重視。 操縱系統逐漸向挖掘機、汽車行業靠近,以減輕駕駛員的勞動強度。 amd推土機 儀器儀表採用三級報警的電子監控裝置及故障自動診斷裝置,駕駛室採用密閉、帶空氣過濾裝置的空調駕駛室,並增加收錄機、甚至DVD等先進的電子設備,最大限度地滿足駕駛人員的人性化要求。 如果要說為什麼FX-6100這麼省電,主要是預設電壓大幅降低的原因,根據筆者實測結果得知,FX-8150處理器的預設電壓高達1.33V,但是FX-6100卻只要1.18V,正巧是兼顧省電與效能,電力效率較佳的工作電壓。
Zen架构引入了超线程,在单核性能上赶上了Intel的Core,对比推土机架构在IPC上有40%的提升,同时继承了推土机的模块化设计,引入CCX,即使是最低端的ryzen3也可以和ryzen7共用一个die,只需要通过屏蔽核心就可以区分产品定位,不需要额外设计核心,大幅提高了良率。 这样尽管在单核性能和制程不占优势下,也可以通过比Intel更多的核心和更便宜的价格赢得市场的青睐。 APU(美國AMD公司研發的加速處理器) APU中文名字叫加速處理器,是AMD“融聚未來”理念的產品,它第一次將中央處理器和獨顯核心做在一個晶片上,它同時具有高性能處理器和… “推土機”將採用32nm SOI工藝,採用了“模組化”的設計,每個“模組”包含兩個處理器核心。 推土機處理器 推土機處理器是Intel Nehalem開發的一種處理器,採用了“模組化”的設計,每個“模組”包含兩個處理器核心,每個核心具有各自的整數調度器和四個專有的管線… 需要特彆強調的是,推土機並不是簡單的全部或者半數核心以同樣的幅度加速,而是實現了真正的異步頻率,每個核心都可以有自己獨立的運行速度,利用任何監視工具都可以清楚地看出來。
amd推土機: 推土機架構特點
推土機是美國AMD公司徹底重新設計的CPU架構,於2011年10月正式推出,面向高端發燒級用户,擁有DDR3-1866MHz原生內存支持、XOP指令集、模塊化設計等多項新特性,全面取代羿龍II系列處理器。 AMD的處理器路線依舊是採用多核心以及高頻率來壓制對手的處理器,甚至搭配自家記憶體、顯示卡、主機板 組成所謂的4A平台來達成完整的效能組合。 雖然AMD沒有就此技術發布專用的監控工具,但事實上已經有很多硬體類工具提供了支持,既有AMD自家出品的監控超頻軟體OverDrive,也有第三方的TMonitor、HWiNFO32/64、SIV等等。 利用它們可以隨時查看每個核心的即時工作頻率,而且加速核心的頻率會以紅色顯示。
推土機的每個核心都有64KB一級數據快取、64KB一級指令快取、32-entry全關聯數據頁表快取、完整亂序載入/保存單元,後者可以在每個時鐘周期內載入兩個128位或載入一個128位指令。 從產品家族序列上看,推土機屬於AMD Family 15h。 從測試成績截圖裏面我們可以看到,玩家使用了31倍的倍頻,在此基礎上將外頻超頻到271.9MHz,達成了史上最高的8.429GHz,此時的電壓也達到了2.016V。 藉助液氮散熱,玩家成功將一顆還未發佈的FX-8150超頻到8.429GHz,這一紀錄已經打破了Intel單核賽揚創建的主頻紀錄,並且還獲得了吉尼斯世界紀錄。 從CPU-Z的認證頁面我們可以看到,用户採用了AMD頂級的八核FX-8150 CPU進行超頻,主板選擇了華碩的Crossshair V Fomula,基於AMD 890FX芯片組,並沒有採用最新的990FX芯片組主板,看來AMD 890FX也是推土機的最好搭檔之一。
amd推土機: 指令集
虽然这些低端APU产品在市场获得不少消费者青睐,但消费者选择它的原因大都是因为其高性能的核显,甚至民间不少网友笑称买APU是买GPU送CPU,买Intel的CPU则是买CPU送GPU。 为了把打桩机的性能发挥到极致,AMD当时甚至还推出了TDP高达220W,动态频率可达5.0GHz的核弹FX9590,但其可怕的功耗和散热供电要求,以及5.0GHz的单核性能仅相当于3.8GHz左右时的i7-4770K单核性能,都成为这款处理器走向主流市场,和让消费者选择它的掣肘。 搭载四个模块八个线程的高级桌面处理器有大量的整数线程富余,但大多数用户的工作量仍然没法被平均分配到八个线程上去(简单的说就是大多数程序多线程优化不好)。
Bulldozer架構針對主流伺服器、桌上型電腦、筆電的應用,提供高存取效能與高負載多執行緒的架構,並選擇以APU組態的高延展性來連結圖形處理器;Bobcat主攻低耗電的超輕薄電腦應用。 整數管線、一級資料快取等頻繁使用的功能在每個核心裏都有單獨的功能單元,預取、解碼、浮點管線、二級快取等功能單元則在兩個核心裏共享使用。 這種設計可以讓每個核心都能在需要的時候使用更大的、更高性能的功能單元,比每個核心都擁有自己獨立的小型功能單元更節省核心面積。 推土機是美國AMD公司徹底重新設計的架構,于2011年10月正式推出,面向高端發燒級使用者,擁有DDR3-1866原生記憶體支持、XOP指令集、模組化設計等多項新特徵,全面取代羿龍II系列處理器。 到 2019 年,AMD 的 Zen 架構升級到 Zen 2,採用台積電 7 奈米製程和小型 8 核心 Chiplet 設計。
MCF对LLC【LastLevelCache,最后一级缓存】的未命中率是一般测试的八倍! 显然,MCF是从推土机大幅提高的L / S单元中受益的代表。 据奥斯汀和微软的大学的研究人员,在libquantum中的预取请求是非常准确的。 如果您看看AMD自己的出版物,你会发现,有两个重大改进提高Bulldozer架构的单线程性能(相比以前的):改进的Turbo Core和大大改进的预读取。
采用模块化设计的好处是可以减少冗余电路,堆砌CPU核心更容易,这在当时真的是一个天马行空的创意。 事實證明 Zen 確實值得等待,Ryzen 處理器採用全新的 Global Foundries 14 奈米製程、擁有 8 核心 16 線程,IPC 性能提升 40%,而當時頂級的 Intel i7 6700K 只有 4 核心 8 線程。 同樣是 10 月,AMD 推出全新的 Zen 3 CPU 架構,並發布了用於 PC 的銳龍 5000 系列處理器,在依然使用 7 奈米製程的情況下,單核心性能反超 Intel 。 後來完整版的修補程式(KB 以及KB 更新檔)發布,不少效能測試結果顯示這些效能優化修補程式效用有限,無論是伺服器平台還是桌面平台,最多僅在某些項目上有15%的效能增長。
amd推土機: 快取、記憶體
更好的分支预测可能会降低5%的分支预测错误率,但并这不是故事的结束。 浮点单元内有分开的加法和乘法管线,用于在不进行乘法累积运算时应对更多样的混合指令。 但256位AVX指令集还是得分开在两个FMA单元上执行,并动用所有的浮点单元。 最终结果就是Ryzen系列处理器对比推土机系列处理器在ipc方面有着超过40%的巨幅提升。 AMD的CPU也在市场彻底失去了口碑,不管从市场还是性能表现等各个角度来讲,推土机架构都是十分失败的,甚至可以说被钉在了CPU历史的耻辱柱上,以至于直到今天AMD也不敢启用曾经象征AMD最高性能处理器的FX后缀,毕竟FX很容易让人联想到推土机系列处理器。 终于,在2006年,Core系列处理器一鸣惊人,首批推出的Core 2 Extreme 6800和Core 2 Duo E6300都显示出了无与伦比的效能。
2推土机的架构:模块化推土机架构:尴尬的“革新者“CPU的微架构与制作工艺直接决定了CPU的效能,优化微架构与更新制作工艺成为CPU厂商提升CPU效能的最重要途径,推土机架构便是当年AMD呕心沥血做出的CPU微架构。 AMD是一家富有冒险精神的公司,虽然他的营收规模仅为Intel的1/10,但其敢于在在HT总线、DDR内存、多核处理器等技术做创新,本世纪初凭借K8架构,其处理器在ipc和效能上大幅领先奔腾4,在这段时间里Intel被AMD“教做人”。 但Intel毕竟还是CPU界的大哥,丰厚的财力规模、海量的人才储备、巨大的业界影响力和与OEM核心伙伴坚固的关系都成为Intel翻盘的资本。 不過,半導體市場競爭殘酷,如果無法保證自家處理器的更新速度或者無法開發出具有創新性的產品,就很可能面臨被淘汰的風險,第一次取得輝煌之後的 AMD,也有陷入泥潭的 10 年。 從時間維度上看,這一系列 CPU 一直沿用至今,足以證明其創新性和前瞻性;從空間維度上看,當時 Intel 不久後推出的競品 1.13Ghz Pentium III 不僅沒有在性能上戰勝 Althon,還因為盲目拉高時脈而大規模緊急回收。
蘇姿丰同時認為在未來高性能運算都是 CPU、GPU 最重要的訴求,因此 AMD 之後便加大了在高性能運算方面的投資,放棄當時眾多晶片公司正在追逐的基於 ARM 架構的伺服器 CPU 的研發。 AMD也同步透露2012年將加入全新AMD Opteron 3000伺服器平台,主要鎖定超高密度、超低功耗的1路網路主機代管(Web Hosting)、網路伺服器(Web Serving),以及微型伺服器(Microserver)等應用領域。 其中將會先推出代號為「Zurich」的4至8核心架構的處理器系列,同樣採用推土機(Bulldozer)架構且對應AM3+插槽,並且預計將於2012上半年間出貨。 屆時每個“推土機”核心會支援Intel絕大部分的指令集(包括SSE4.1、SSE4.2、AES、CLMUL以及AVX),以及AMD自有的指令集(包括由SSE5拆分而來的XOP、FMA4、CVT16)。
但就是這樣的設計造成了單核效能的下降,尤其是很多應用並沒有針對這種模組化設計進行優化,造成了雖然核心數量很多但是並沒有卵用的尷尬境地。 到了2017年zen架構的釋出,終於是開啟了AMD崛起的篇章,其釋出的8核心的民用處理器讓Intel意識到了危險的味道,然後就釋出了8代酷睿進行反擊,可以說這麼多年Intel終於是放了回血。 Zen架構終於也是引入了超執行緒技術,並且終於在單核效能上也能喝Intel一較高下了,尤其超頻之後基本和Intel處於同一水平線之上。 可以說相比較推土機的架構整體效能提升了40%,同時繼承了推土機的模組化設計,引入了CCX技術,通過模組化設計,低端和高階的區分只需要遮蔽部分核心即可達到區分的目的,這樣就可以大大提高CPU的良品率,大大降低了成本。 看過電影X戰警的讀者們,應該都還有印象萬磁王有位手下叫做SABERTOOTH劍齒虎,這位仁兄的兇猛各位在電影中都見識過了,同樣的也可以在華碩推出的SABERTOOTH 990FX上面感受到如同猛獸的力量。
从某个层面上说,推土机和打桩机的失败是必然的,因为这种通过弱化单核心来达到更多核心数以实现宣传效果是非常愚蠢的,这个错误并非只有AMD犯过,移动市场的MTK几乎以同样的方式踩进了同一个坑。 我非常反对将AMD的失败归咎于CMP,CMP本身无错,错的是AMD每个L1D只绑定了2个整数单元。 比较有意思的是MTK的三簇集失败后,ARM推出DynalmQ技术,让共享L3成为多簇结构的正确选项。 但AMD却没有胆量再出一款四整数单元,L1D不绑定整数单元(将访存单元共用,此时存后端就无所谓哪个线程进行L1D访问,进而没有冲突)的CMP架构了。
如果面對價位稍低的Phenom II X4 970,FX-6100在多執行緒測試項目中互有勝負,但是單執行緒環境就一定是Phenom II X4 970比較快。 至於Intel陣營在這個價位帶當中,剛好沒有能完全對上的型號,目前市售最低階四核心Core i5-2400要價5,800元左右,而最高階雙核心Core i3-2130要價4,400元左右,一同較量並不適宜。 可惜編輯部臨時借不到這2款產品做交叉比對,僅能提供Core i5-2500數據參考。 AMD和Intel的市场份额 2011年全新的推土机架构发布,此时的AMD不仅仅市场份额大幅落后Intel,资金也捉襟见肘,AMD直接抛弃了自K6以来的架构路线,新的推土机架构无疑是承担着AMD绝地反击的希望。 推土机架构最大的特点引入模块化设计,方便扩展核心,每个模块拥有两个整数单元,共享一个使用率不高浮点单元。 但这样的设计后果是单核性能的倒退,尽管AMD有更多的核心,但是由于AMD号召力实在比不过Intel,导致大多数应用没有对模块化的推土机优化,甚至有用户称其为“假八核”将AMD告上法庭。
AMD桌面处理器目前的主力封装接口为AM3,首选搭配AM3插座主板,而之前的AM2+插座主板通过更新BIOS也能支持AM3处理器,只是损失高速HT总线等新特性。 上述三家推土機製造企業,代表了當今世界上履帶式推土機的最高水準。 國外其他幾家履帶推土機製造企業約翰迪爾、凱斯、紐荷蘭和德瑞斯塔,其生產技術水準也較高。 amd推土機 amd推土機 這樣,在工作裝置換向閥處于小開口節流調速過程中,油泵多餘供油可不經安全閥回油箱,直接從差壓閥溢流回油箱,使調速過程中系統壓力隻比工作壓力高一定值△P,從而達到減少液壓功率損耗,降低油溫之目的。
內存選取了海盜船的DDR3 1333內存,畢竟CPU超頻對內存要求都不會太高。 推土機大大改進了電源管理技術,在核心級別上支持CC6電源狀態,在模塊級別上可通過CC6支持二級緩存的電源門控。 在着手設計下一代x86處理器核心的時候,AMD的工程師們認為必須實現核心功耗與面積的優化,而且PC應用的發展也讓工程師們必須尋找一條新的路子,能夠在不同核心之間實現峯值帶寬的最大化,並通過共享模塊來充分利用每一平方毫米的核心面積。 Turbo Core 2.0,和上代Turbo Core一樣可以根據處理器的負載狀態調整各處理器核心的時脈速率。 在處理器核心閒置時可以降低其時脈速率乃至關閉核心;處理器核心滿載時可以提升其時脈速率,處理器半數核心處於滿負荷時可以有1GHz的提升幅度,全部核心滿載時也有500MHz的提升幅度,但是時脈速率的提升會保持在處理器的TDP限制(俗稱「熱牆」或「工作溫度牆」)之下。 與上一代Turbo Core相比,Turbo Core 2.0可以使處理器核心關閉,而且可以調整各個核心的時脈速率,而首代Turbo Core則只能一次過調整半數核心的時脈速率而不能調整單個核心的,核心閒置也不能被完全關閉。
因此,虽然L2缓存的延迟不是一个优势,我们肯定怀疑,这是一个主要因素。 他们成功拉近了与在分支预测领域有些丰富经验的Intel的差距吗? 推土机中2路64KB的指令缓存显然不是缓存两个线程的最佳选择。 当开启一个模块的两个线程时,命中率从极佳的97%(单线程)降到了平庸的95%。 启用同一模块的两个核心,比单核心性能提升了65%(2×0.71vs0.86),与农企所说的CMT80%提升低一些。
由香港SEO公司 Featured 提供SEO服務