cpu推土機(jī)什么意思
cpu推土機(jī)什么意思
推土機(jī)處理器英文名Bulldozer,是Intel Nehalem開發(fā)的產(chǎn)品。下面是學(xué)習(xí)啦小編帶來的關(guān)于cpu推土機(jī)什么意思的內(nèi)容,歡迎閱讀!
cpu推土機(jī)什么意思:
AMD"推土機(jī)"是代號(hào)Bulldozer(推土機(jī))的全新架構(gòu),"推土機(jī)"架構(gòu)最早是在2007年年中提出的,當(dāng)時(shí)計(jì)劃采用45nm工藝,2009年上半年發(fā)布,競(jìng)爭(zhēng)Intel Nehalem,不過可能是因?yàn)?5nm K10 Phenom系列進(jìn)展不順,新架構(gòu)被推遲了。
在AMD的發(fā)展規(guī)劃中在2009-2010年間都是45nm Phenom打天下,32nm工藝產(chǎn)品要到2011年才會(huì)發(fā)布,也就是"推土機(jī)"架構(gòu)。"推土機(jī)"是AMD徹底重新設(shè)計(jì)的核心,將成為AMD下一代高性能處理器技術(shù),用于客戶端和服務(wù)器領(lǐng)域,相比于Opteron 6100系列會(huì)增加33%的核心、大約50%的性能。
作為嶄新一代的處理器構(gòu)架,AMD"推土機(jī)"將采用32nm SOI工藝,這讓"推土機(jī)"相比"Magny-Cours"皓龍?zhí)幚砥骺梢栽诓辉黾庸牡那疤嵯略黾?3%的核心數(shù)量、增加50%的吞吐量。與AMD之前所有處理器都有所不同的是,"推土機(jī)"采用了"模塊化"的設(shè)計(jì),每個(gè)"模塊"包含兩個(gè)處理器核心,這有些像一個(gè)啟用了SMT的單核處理器。
每個(gè)核心具有各自的整數(shù)調(diào)度器和四個(gè)專有的管線,兩個(gè)核心共享一個(gè)浮點(diǎn)調(diào)度器和兩個(gè)128位FMAC乘法累加器。
相關(guān)CPU推土機(jī)架構(gòu)推薦:
Bulldozer(推土機(jī))架構(gòu)中的另一個(gè)新元素就是采用了基于集群的多線程技術(shù)。Bulldozer的內(nèi)核模塊是一個(gè)可以同時(shí)運(yùn)行兩個(gè)線程的處理組件,兩個(gè)內(nèi)核可以執(zhí)行兩個(gè)完全不會(huì)相互干擾的線程,有點(diǎn)類似于Intel的雙核處理器的超線程奇數(shù)。多簇式多線程技術(shù)盡管雙核、多線程和Bulldozer在線程并行執(zhí)行方面是相同的,但是內(nèi)核的分區(qū)卻截然不同。
多線程就是在一個(gè)單個(gè)的處理核心內(nèi)同時(shí)運(yùn)行多個(gè)工作線程的技術(shù),和CMP芯片多處理器技術(shù)不同,后者是通過集成多個(gè)處理內(nèi)核的方式讓系統(tǒng)的處理能力提升,市場(chǎng)上主流的多核處理器都是用了CMP技術(shù),而像Pentium 4、Core i7這樣的處理器帶的"超線程技術(shù)"則屬于多線程奇數(shù),而Bulldozer是基于集群化多線程架構(gòu),Cluster-Based Multi-threading:CMT,也稱多簇式多線程技術(shù)。
設(shè)計(jì)集群化在Intel的超線程方案中,采用的是復(fù)制處理器架構(gòu)狀態(tài)的方法來實(shí)現(xiàn)超線程,核心內(nèi)部并沒有增設(shè)一套額外的硬件執(zhí)行單元來處理多線程,只是增加了處理器中存儲(chǔ)線程有關(guān)數(shù)據(jù)的單元數(shù)量,病在硬件執(zhí)行單元空閑時(shí)將這些數(shù)據(jù)送往其中處理,一邊增加處理器執(zhí)行單元的利用率。這種設(shè)計(jì)有一定的缺點(diǎn),比如它只使用了一個(gè)指令窗口來負(fù)責(zé)兩個(gè)線程的調(diào)度、執(zhí)行和引退,效率并不高。
這就像是生產(chǎn)線只有一名管理調(diào)度人員,一個(gè)人很難同時(shí)處理兩個(gè)任務(wù),這樣有時(shí)候便會(huì)出現(xiàn)生產(chǎn)線故障,而處理器在碰到這種情況時(shí)性能澤輝出現(xiàn)明顯的下降。相對(duì)于傳統(tǒng)超線程或雙核技術(shù),Bulldozer這種設(shè)計(jì)集群化架構(gòu)的理念是讓雙核模塊在多線程運(yùn)算中更高效。Bulldozer每一個(gè)模塊中加入了額外的執(zhí)行單元,每一個(gè)模塊都具備可以將一個(gè)大任務(wù)細(xì)分為多個(gè)并行任務(wù)的能力,這些生產(chǎn)線可以按需要任意整合,不會(huì)對(duì)整個(gè)裝配線的效能造成影響。因此CMT技術(shù)的效能要高于傳統(tǒng)的多線程方案。
根據(jù)AMD介紹,單個(gè)"推土機(jī)模塊"可以達(dá)到80%左右的多線程性能提升,而且所用的晶體管數(shù)目似乎并不比Intel的超線程奇數(shù)更多,這是一個(gè)相當(dāng)鼓舞人心的成就。折疊產(chǎn)品優(yōu)勢(shì)全核心技術(shù)Turbo Core技術(shù)主要是指對(duì)于一些沒有完全消耗到最大程度的工作負(fù)載,去加快時(shí)鐘速度。在多種不同工作負(fù)載上,使用了Turbo Core可以最大增加500兆赫茲的性能。最重要的一點(diǎn),Turbo Core加速指的是所有核的加速,和有些核加速技術(shù)明顯不同,以往的核加速技術(shù)可能需要關(guān)閉一些核,只對(duì)部分核進(jìn)行加速。
采用Turbo Core技術(shù),最多可以使所有核增速500兆赫茲,如果再關(guān)閉一些核運(yùn)轉(zhuǎn)的情況下,加速將會(huì)超過500兆赫茲。同時(shí)我們還對(duì)內(nèi)存控制器進(jìn)行了進(jìn)一步優(yōu)化,從而提高內(nèi)存的吞吐量。除了每個(gè)核心獨(dú)享4個(gè)整數(shù)計(jì)算管線,在浮點(diǎn)運(yùn)算上,"推土機(jī)"采用了"FlexFP"技術(shù),兩個(gè)核心共享一個(gè)浮點(diǎn)調(diào)度器和兩個(gè)128位FMAC乘法累加器,可以進(jìn)行組合,每個(gè)時(shí)鐘周期可以完成兩次64位雙精度計(jì)算或4次32位單精度計(jì)算。如果一個(gè)核心沒有進(jìn)行浮點(diǎn)運(yùn)算,那么另一個(gè)核心可以占用這兩個(gè)128位的FMAC,在一個(gè)時(shí)鐘周期完成4次雙精度運(yùn)算或8次單精度計(jì)算,AMD將其命名為 AVX模式。這種技術(shù)保證了"推土機(jī)"的浮點(diǎn)運(yùn)算能力,在高性能計(jì)算中并不會(huì)因?yàn)?quot;共享"而犧牲性能。新接口和新工藝推土機(jī)處理器將采用Socket AM3+接口,942個(gè)針腳,不同于938個(gè)針腳的Socket AM3接口,其好處是可以支持DDR3-1600內(nèi)存和高級(jí)節(jié)能技術(shù),而且AM3+將是AMD的最后一代針腳柵格陣列(PGA)封裝,之后將改用觸點(diǎn)柵格陣列(LGA),等到Fusion融合處理器降臨的時(shí)候就會(huì)使用LGA AF1新接口,觸點(diǎn)多達(dá)1591個(gè),支持DisplayPort 1.2標(biāo)準(zhǔn)、PCI-E 3.0規(guī)范(32條信道)、四通道內(nèi)存。
加強(qiáng)型內(nèi)存控制器AMD首家推出集成內(nèi)存控制器,根據(jù)AMD在這一領(lǐng)域的經(jīng)驗(yàn)和非常好的技術(shù),又在這一代產(chǎn)品中全面提升了內(nèi)存控制器的性能。首先對(duì)內(nèi)存控制器在效率方面進(jìn)行了針對(duì)性的重新設(shè)計(jì)和完善,因此實(shí)現(xiàn)30%的內(nèi)存性能提升。在提升30%性能基礎(chǔ)上,讓內(nèi)存支持1600MHz頻率,可以獲得額外20%的性能。
兩項(xiàng)加起來,可以實(shí)現(xiàn)內(nèi)存控制器50%吞吐量提升同時(shí)支持AVX指令和SSE指令FLEX FP是AMD至今為止最有創(chuàng)新意義的浮點(diǎn)計(jì)算技術(shù),每一個(gè)模塊都有一個(gè)FLEX FP進(jìn)行浮點(diǎn)運(yùn)算。如果使用傳統(tǒng)128位編碼,意味著每個(gè)核會(huì)有單獨(dú)的浮點(diǎn)運(yùn)算單元。與友商相比,如果在128位編碼前提下,AMD所執(zhí)行的數(shù)量多一倍。如果是256位AVX編碼,Bulldozer可以把兩個(gè)浮點(diǎn)運(yùn)算單元放在一起執(zhí)行。所以在256位編碼執(zhí)行模式下,與友商比較,執(zhí)行的數(shù)量是一樣的。但是Bulldozer有一個(gè)非常大的優(yōu)勢(shì),就是可以同時(shí)執(zhí)行256位AVX指令和SSE指令。
而友商就不能做到這點(diǎn),他們只能在AVX或SSE中選擇其一,這樣的優(yōu)勢(shì)能夠讓Bulldozer在高性能計(jì)算、媒體編解碼以及在一些技術(shù)型運(yùn)算方面有更高的性能。更先進(jìn)的電源管理技術(shù)每個(gè)模塊內(nèi)第二個(gè)整數(shù)核心所需要的電路只占總核心面積的12%,從芯片級(jí)別上講這只會(huì)給整個(gè)內(nèi)核增加5%的電路。更多的核心、更少的空間,這顯然有利于提高單位功耗、單位成本的性能。
能耗大小是由被通電時(shí)鐘數(shù)量決定的,它取決于執(zhí)行一個(gè)普通指令(運(yùn)算)需要讓多少晶體管處于通電狀態(tài)。在最大時(shí)鐘供電的百分比下,正常應(yīng)用狀態(tài)和閑置狀態(tài)下,Bulldozer都具有非常好的能耗表現(xiàn)。
同時(shí)在各能耗單位上進(jìn)行了優(yōu)化,可以在各種單位下進(jìn)行電源關(guān)閉。高性能運(yùn)算能耗之所以高,主要是由于浮點(diǎn)運(yùn)算,而一般應(yīng)用運(yùn)算主要是在執(zhí)行單元消耗得最高。同時(shí)還有閑置狀態(tài)下,AMD的技術(shù)可以做到對(duì)于那些完全用不著的核,把電源完全關(guān)閉。
AMD產(chǎn)品有一個(gè)大轉(zhuǎn)型,AMD推出了新插槽,2011年推出的推土機(jī)可以使用2010年的插槽。而友商為推出新平臺(tái),同時(shí)推出了新插槽,這也使得AMD更占優(yōu)勢(shì)。