功耗優(yōu)化多過性能 ARM Cortex-A73解析
雖然目前智能手機和平板之類的設(shè)備已經(jīng)對極致性能沒有了太多的訴求,但VR又成了下一個著力點,近日ARM就在Computex 2016上公布了可以說是為VR設(shè)備的沉浸式體驗準備的Cortex-A73新架構(gòu),均對VR的性能和顯示需求做好了準備。
功耗優(yōu)化多過性能 ARM Cortex-A73解析
回顧一下前任A72,作為big.LITTLE架構(gòu)里的大核在今年的主流市場得到了廣泛應(yīng)用,驍龍650里有兩個,驍龍652里有四個,麒麟950/955里有四個,聯(lián)發(fā)科Helio X20/X25里有兩個,當(dāng)然考慮到各自的不同定位,工作頻率及制程工藝上的選擇都各有不同;從產(chǎn)品分布可以看出,今年的Cortex-A72并不如前任Cortex-A57那樣在高端市場吃香(驍龍810、Exynos 7420),三星用了半自主架構(gòu),而高通則徹底回到自主架構(gòu)。
A9~A73發(fā)展歷史回顧
拋開那顆著名的壽命極長、高能效比的Cortex-A7不說,Cortex-A9是對于ARM來說極為重要的里程碑,采用該架構(gòu)的平臺——諸如蘋果A5、三星Exynos 4210/4412、德儀OMAP 4430/4460都證明了A9的成功。
之后便是毀譽參半的Cortex-A15,性能相比之前突飛猛進的同時帶來了不小的功耗和發(fā)熱問題,比如Exynos 5250/5410都受其影響,再想想當(dāng)年的核彈Tegra 4什么的……
而看到這一問題的ARM也在隨后推出了著名的big.LITTLE架構(gòu),隨之誕生了全球首款真八核Exynos 5422,以及麒麟920等平臺。
隨著Cortex-A57的登場,ARM陣營正式邁入ARMv8 64位指令集時代,當(dāng)然這也是蘋果A7的功勞,與Cortex-A53結(jié)合的大小核架構(gòu)成為了隨后的主流,其中出現(xiàn)了4大4小、2大4小、不同頻率的兩組4小各種組合方式,并流傳至今;其中有人歡喜有人愁,三星靠Exynos 7420成功奪得眼球,而驍龍810則因為發(fā)熱問題成為了一代尷尬的旗艦。
在這些主流微架構(gòu)之外,還有2013年7月公布的Cortex-A12以及2014年2月公布的Cortex-A17,短命和不受待見沒讓其成為主流,只有MT6595這樣極少的平臺采用。
A17家族而非A72升級
而此次的A73并非是簡單的A72升級,這還要從ARM的家族劃分說起,A15、A57、A72屬于Austin家族(來源于ARM位于美國德州奧斯汀的設(shè)計中心),而A5、A7、A53則屬于Cambridge家族(名字來源于ARM總部英國劍橋),A12、A17以及剛剛公布的A73屬于Sophia家族(名字來源于歐洲最大科技園區(qū)索菲亞,也就是ARM法國CPU設(shè)計中心所在地)。
雖然命名上Cortex-A73看似是A72的升級,但是從技術(shù)層面講,它其實是A17的進化版本,整體微架構(gòu)、流水線、寬度設(shè)計都與之類似,反而和A72差別很大,并且,A73也沒有保留A72的三發(fā)射,而是采用了與之前的Sophia家族微架構(gòu)相同的雙發(fā)射。而ARM此次的宣傳顯然也是側(cè)重能效而非性能,對于前兩代動輒5W甚至10W的峰值功耗來說,ARM期待Cortex-A73能夠長效的保持高性能,而不是因為短暫高頻運行后發(fā)熱降頻,換句話說,要持久…
對比一下A73與A72的流水線圖,你就能發(fā)現(xiàn)設(shè)計思路上的顯著不同。Cortex-A72采用了15級以上的亂序流水線設(shè)計、128位預(yù)取指令、3發(fā)射解碼、每個時鐘周期分配最多5個微操作、滿足最多7個發(fā)射隊列進入8個執(zhí)行流水線。
而A73的設(shè)計頗似A17,流水線深度較A72有所減少,預(yù)取階段從A72的5級減少為4級,進入浮點流水線的微操作還經(jīng)過一個額外的取指階段,整個流水線只有11~12級。
由此可以看出A73的設(shè)計基于跟A17相同的邏輯,通過優(yōu)化流水線、資源和接口來在可實現(xiàn)的最小功耗水平上獲取最高的性能。ARM也表示他們還特別進行了32位/64位狀態(tài)下的平衡優(yōu)化。
性能提升上,ARM表示A73在所有重要的移動應(yīng)用上都具備超越A72的性能表現(xiàn),不過給出的對比倒是不多,比如BBench網(wǎng)頁載入測試性能相比A72提升10%,F(xiàn)FMEG解碼多媒體性能提升5%,內(nèi)存存取性能提升15%。
而更被看重的性能方面,整數(shù)應(yīng)用當(dāng)中A73有25%的功耗降低,浮點和二級緩存應(yīng)用當(dāng)中有30%左右的降低,ARM也表示在相同的頻率下,A73整體相對于A72有著20%的功耗降低。
10nm制程讓A73的尺寸在相同性能下比A72小25%,因此雙核A73的尺寸基本跟四核A53相同,特別是在如今眾多采用4+4 A53設(shè)計的處理器性能表現(xiàn)并不搶眼的情況下,這一組合有望被2xA73+4xA53的設(shè)計替代,在核數(shù)減少單線程性能大幅提升的同時保持相同的芯片面積。