找回密码
 注册
快捷导航
查看: 2176|回复: 11

盖棺定论 2013年手机处理器终极指南(下)

[复制链接] |自动提醒
阅读字号:

8073

回帖

84

积分

1678

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2011-12-2
发表于 2013-8-13 14:36:15| 字数 2,064| - 中国–广东–深圳 电信 | 显示全部楼层 |阅读模式

  在《2013年手机处理器指南•上》中,我们的主要内容实际上是回顾了过去,即2012年的产品。如今,距文章发布已经过去一个季度,市场环境有了不小变化,我们撰写了这篇《2013年手机处理器指南•下》,与各位一起,重新审视手机处理器的现状和未来。

【新技术研习社】2013年手机处理器终极指南(下)

 

  疯狂的核战争

  首先,我们要提出一个最基本的问题:智能手机的硬件规格近年来经历了爆炸式的增长,但我们(消费者)究竟从中得到了什么?

  这是一个回答起来轻松简单,但解释起来无比复杂的问题。

  从2007年iPhone发布开始,手机开始迈入真正的智能时代。处理器从最早的ARM11 400MHz一路飙升;2008年我们拥有了ARM11 533MHz;2009年进化到Cortex A8 400MHz;2010年则瞬间提升至Cortex A8 1GHz;2011年,双核Cortex A9 1.2GHz开始普及;2012年,四核Cortex A9 1.4GHz出现......智能手机处理器的运输能力几乎以每年2.5倍的速度在提升。如果以平台的寿命来看,ARM9平台大约拥有5年的寿命,ARM11为4年,在这之后,Cortex A8在主流市场坚持了一年半,而单核Cortex A9被直接跳过,双核Cortex A9一年、四核Cortex A9也是一年。

【新技研】2013年手机处理器终极指南(下)
业界实际的更新速度远超ARM的预计

  为何市场会出现如此强大的推动力,让企业可以集中全行业的技术和利润,去疯狂推动一台小小的手机疯狂升级?

  最主要的原因是因为手机本身的定位发生了变化,过去大家需要用PC实现的应用和功能,如今都开始往手机上转移,这是推动手机硬件爆炸发展的原动力。

  这样的需求转变给手机带来了无穷无尽的性能需求,也催生了手机的大屏化——我们需要呈现越来越多的信息,手机的屏幕自然就要同步增大。第一轮洗牌的赢家是苹果(必须承认的是,即便没有苹果,这个时代依然会到来,因为硬件性能的提升是客观存在且不会停止的)。

【新技研】2013年手机处理器终极指南(下)

  然而,硬件规格大幅提升之后,伴随而来的是同样大幅增加的功耗和发热。疯狂的硬件军备竞赛催生出了智能手机的黄金时代,也给整个行业埋下了定时炸弹,一场危机近在眼前。

  “安装飞机发动机的自行车”

  如果我们给奇瑞QQ轿车安装1000马力的发动机,可以获得与超级跑车相近的性能吗?答案是否定的,因为奇瑞QQ的车体根本无法承受这样的动力输出。

  同样的道理,我们把英特尔酷睿i7处理器装在手机上也没有意义,因为手机根本无力承担它的功耗。在这个层面上,我们是理性的,厂家也是理性的,至少在相当长一段时间内是这样。然而,这部分理性如今却在逐渐消失。

【新技术研习社】2013年手机处理器终极指南(下)

  一个被业内视为默认规则,而听起来又异常奇怪的现象是:2012年之后的旗舰智能手机,没有几台能让CPU做到长时间满负荷工作不降频。

  厂商不断地往手机里塞入更快、更强大的硬件,与此同时,却不得不限制它们的工作频率与工作时间。你看到的产品手册上赫然写着“四核1.7GHz”,但实际使用中你永远无法得到这样的性能。这方面的例子比比皆是,从Nexus 4冷柜跑分暴涨30%,到K3V2的GPU频率缩水6成,大多数旗舰手机都无法发挥出它应有的性能。

【新技研】2013年手机处理器终极指南(下)
来自Anandtech的著名测试:把Nexus 4扔进冰箱,结果跑分提升了20%以上!

  根据第三方测试,目前的旗舰手机能以最高频率工作的时间少则数十秒,多的也只有几分钟,之后便不得不降低频率以缓解发热。消费者听着“性能提升 xx%”的宣传,花费高额费用抱着“四核1.7GHz”的手机回家,却只能享受30秒的快乐,这难道不是一种讽刺?往一台手机里安装根本无法全速运行的 “强大”处理器,与开头提到的往奇瑞QQ上安装1000马力的发动机有什么区别呢?

  下面的表格是一个实例:LG为Optimus G Pro配备了强大的骁龙600处理器,但持续高负载工作3分钟后,实际性能却不如搭载了上一代APQ8064芯片的SONY Xperia Z。配置更高的新产品,在实际使用中却输掉了“性价比”,我们得到了配置,却没有得到性能。

【新技研】2013年手机处理器终极指南(下)
(骁龙600 vs APQ8064不同机型性能对比,本表格数据来自爱搞机)

  你也许会说,反正价格没有更贵,能不能全速没啥损失,但这样的观点也是错误的。记住:你永远是在为手机的标称性能埋单,而不是为实际性能埋单。八核手机即使只能发挥出四核手机的性能,它的价格也是“八核”级别的。硬件上所有的成本最终都会以各种形式转嫁在消费者身上。问题是:我们为什么要为发挥不出来的性能埋单呢?

  这样的趋势在2013年乃至更远的未来并没有缓解的迹象。作为消费者,我们必须要明确自己的立场:这种趋势是错误的,我们有必要制止它进一步恶化!否则我们所付出的金钱将只能换来几个纸面上的数字,而“安装飞机发动机的自行车”迟早有一天要到来。

  然而,指出错误很简单,纠正错误却很困难。如果无法得到一个对于正确的评价标准,那么对于未来的分析也就没有意义,这就启发我们去寻找一些不会被技术所改变的东西,作为衡量正确与错误的标准。

  接下来,我们将提出一个相对客观的评价标准,并以之为准绳,对2013-2014年市面上主流的手机处理器进行逐个分析。

8073

回帖

84

积分

1678

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2011-12-2
 楼主| 发表于 2013-8-13 14:36:15| 字数 2,167| - 中国–广东–深圳 电信 | 显示全部楼层

盖棺定论 2013年手机处理器终极指南(下)

  产品审查:Tegra 4与Tegra 4i

  虽然都属于Tegra 4家族,但是实际上Tegra 4和Tegra 4i的核心并不相同:前者基于Cortex A15,而后者基于改进版Cortex A9。对于后者我们不会多加论述,我们将主要关注前者。

【新技术研习社】2013年手机处理器终极指南(下)

【新技研】2013年手机处理器终极指南(下)

  如同Tegra3,Tegra 4也引入了nVIDIA自行设计的vSMP 4+1技术。因此对于Tegra 4的效率分析,将会分为两个部分:4核部分与附加单核部分。

  首先是4核部分。Tegra 4的所有核心都是典型的Cortex A15架构,工艺使用了TSMC 28HPL,因此对于这一部分的分析我们可以找到一个极好的参照物,那就是Nexus 10所配备的Exynos 5250。后者是一枚双核Cortex A15、32nm HKMG LP工艺、工作频率1.7GHz的SoC。根据已有的测试结果,Exynos 5250的CPU功耗为4W,也就是说单核功耗为2W。这项对于Exynos 4412的440/600mW而言是一个相当大的数值,这也意味着Cortex A15的性能必须要四倍于Cortex A9,才可以维持效率的一致。NV做到了吗?很明显,也很遗憾,没有。Cortex A15的性能提升幅度远远没有功耗提升幅度大,两者之间的差距导致了Cortex A15的每瓦特性能相对于Cortex A9来说有着至少一半的下降。

【新技研】2013年手机处理器终极指南(下)
采用A15架构的Exynos 5250单个CPU核心功耗约为2W,数据来自Anandtech

  那么回头来看看Tegra 4。由于核心是相同的,我们只需要对比工艺。TSMC 28HPL相对于三星32nm HKMG LP,究竟有没有性能和漏电方面的提升我们很难判断,但是大体上两者属于同一时代的同一水准工艺,相信差距并不会过大,我们假设台积电的28LP工艺总体能耗比三星降低30%——这已经几乎是同一代工艺可以存在的最大差距——这也远不足以抵消Cortex A15和Cortex A9近乎200%的差距,更何况Tegra 4的主频高达1.9GHz,这进一步降低了它的功耗可以低于2W/核心的可能性。这也就意味着,即便只有一颗核心工作,Tegra 4的功耗就已经逼近了4寸手机的散热功耗极限,而四核同时工作,如果不加限制,CPU部分的总功耗必将轻松突破8W。

【新技术研习社】2013年手机处理器终极指南(下)
Tegra 4功耗有多大NV很清楚,所以给自家的Shield游戏机装上了风扇!

  既然能耗比如此之低,那么技术有何改变、理论性能有何提升、在哪里提升就完全没有意义了。在手机上,Tegra 4的四枚Cortex A15所能发挥出的长期性能,除了极少数情况下,可以几乎肯定的说,将远不如一个设计优秀的四核Cortex A9处理器。

  那么辅助的拌核部分呢?NV没有公布拌核的细节资料,我们假设它工作在1GHz,由于HPL工艺带来的低漏电,预计可以让这枚核心的功耗降低到 0.6W左右,大约等同于一颗1.6GHz的Cortex A9。在这个工作条件下,Cortex A15的能耗比和Cortex A9比较接近,因此它们具备了接近的体效值。但是此时的Tegra 4,绝对性能只有四核Cortex A9的四分之一,体效值远远高于绝对性能,这也就意味着此时的Tegra 4会因为过慢而无法满足用户需求。

【新技术研习社】2013年手机处理器终极指南(下)
伴核要想省电,必须工作在更低的频率

  综上所述,Tegra 4不论在哪个模式下,所能提供的最大性能都难以超越四核心Cortex A9处理器,把这样一颗处理器做进手机唯一的意义也许只有一个——想方设法让手机坚持满载运行三分钟,跑出一个惊世骇俗的基准测试分数,给手机发烧友作茶余饭后跑分攀比的资本,就好比购买超级跑车上下班,除了炫耀以外没有任何意义。

  至于Tegra 4的GPU部分,由于目前资料较少,所以无法给出分析对比,希望读者海涵。

  当然我们也需要明白,Tegra 4的悲剧并不全是由于Tegra 4本身或是nVIDIA的技术实力导致的,究其根本,元凶还是Cortex A15核心过低的能耗比。这也决定了不仅是nVIDIA,其他任何试图在产品中引入标准Cortex A15架构的厂家,例如未来的华为海思K3V3,最终都将难逃“性能超不过A9”的魔咒。对于手机等便携式设备而言,Cortex A15毫无疑问是一个失败的设计,也无怪乎高通和苹果在几年前就决定放弃这个架构,自行以Cortex A9为基础发展自己的强化核心。这也从另一个方面看出,至少在目前可以看到的ARM产品中,Cortex A9依然是可以提供最强实际性能的产品,即便它已经问世超过了2年。

【新技术研习社】2013年手机处理器终极指南(下)

  最后提一下Tegra 4i。相信nVIDIA规划这样一个产品,也是因为NV实际上非常明白Cortex A15是一颗怎样的核心。因此,我们甚至可以理解为,Tegra 4i才是针对手机市场所推出的高性能产品。改进的Cortex A9 r3p1核心可以带来最多15%的同功耗性能提升,也就是更高的体效值与实际性能。但是Tegra 4i却如同骁龙800一般选择了HPM工艺,并且因为需要集成基带而无法在2013年上市,这对于Tegra 4i和nVIDIA而言无疑是彻头彻尾的悲剧,尤其是如今Cortex A12箭在弦上的情况下。如果说Cortex A15可以看作ARM在被成功冲昏了头脑之后的大跃进,那么后者就可以看作是ARM在大跃进失败后的反省之作,肩负了Cortex A9正统继任者的使命。对于它,我们在后面予以讨论,这里暂不多言。

回复 支持 反对

使用道具 举报

8073

回帖

84

积分

1678

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2011-12-2
 楼主| 发表于 2013-8-13 14:36:15| 字数 2,489| - 中国–广东–深圳 电信 | 显示全部楼层

盖棺定论 2013年手机处理器终极指南(下)

  关键之中的关键:半导体工艺

  通过改进处理器微架构来获得性能提升是最体面的方法,也是最难的方法。从40年前的英特尔4004,再到今天的酷睿i7,IPS(每周期指令吞吐量)也就是从1提升到2再提升到3的进步。再往上,就撞到了难以逾越的功耗之墙。

  如何打破这堵高高的墙壁?答案只有一个:更好的工艺。对于ARM而言尤其如此。5年前的ARM11处理器还在使用老掉牙的130nm普通CMOS工艺。而最近一到两年,由于无法从核心上榨取更多的油水,业界开始用越来越新的工艺制作最先进的ARM处理器,从45nm到32nm甚至现在的 28nm,ARM处理器在工艺上的进步速度要远超同期PC处理器。正是这些新工艺,支撑着ARM处理器在近几年内以每年200%的速度在提升。

【新技研】2013年手机处理器终极指南(下)

  但是提到工艺,我们就不得不再一次提到一个词:极限。没错,通过超量应用工艺,我们获得了超量的性能提升,但是工艺的储备并不是无穷无尽的,现在的我们已经走在了工艺的极限上。如果是传统的工程极限,随着新技术和新方法的发明,最终都可以实现突破,但是工艺面临的这道极限的背后是物理定律。

  在28nm以后,晶体管实在是太小了,小到我们必须重新梳理物理定律,才能准确掌握它的物理性质。随着半导体工艺线宽迈入20nm以下,集成电路中的某些结构已经开始迈入介观和微观之间的灰色地带。对于微观世界,也就是量子世界,人们目前所掌握的物理学,并不能给出太多具备足够工程价值的答案。

【新技研】2013年手机处理器终极指南(下)

  也许你很难想象,现代为处理器所使用的晶体管,其栅极漏电的很大一部分原因已经是量子隧穿效应。这是因为对于一个线宽只有30nm的晶体管而言,它的栅极绝缘材料的厚度只有不到2nm,也就是说,只有不到10层原子的厚度。而工艺最先进的英特尔,其量产晶体管的栅极绝缘层厚度已经不到1nm,只有5 层原子的厚度。在这样的规模下,宏观的物理定律已经有相当程度的失效,这个规模的晶体管会做出什么行为?更多的只能靠猜测,靠无数次的实验。

  当经典物理定律失效,人们需要在盲目的实验中找到解决方案时,进步的速度就变得不再可以预测。

【新技术研习社】2013年手机处理器终极指南(下)
单个晶体管的绝缘层厚度已经只有数十层原子

  2013年已经是28nm的时代,按照预测,2014年业界就将往20nm迈进。但是这一步能顺利走出去么?相信没人对此能有足够的信心。作为世界上最大的代工厂,台积电TSMC的工艺路线对于业界的影响力是最为巨大的,早在2009年,TSMC就已经宣布将要量产28nm逻辑电路工艺,但是实际情况是直到2011年底,TSMC都没能拿出哪怕只用于性能测试的样品芯片,而最终的量产一直到2012年6月才在跌跌撞撞中开始,前后延期达三年。那么,面对TSMC“2013年底量产20nm”的豪言壮语,你又能相信多少呢?

【新技研】2013年手机处理器终极指南(下)
台积电早先公布的路线图,回头来看雄心壮志基本停留在纸上

  TSMC的下一代20纳米工艺还面临一个问题——性能提升将非常有限。从官方演示文档中我们可以看到,TSMC的20nm规划中,针对移动设备的工艺——也就是LP、HPL和HPM——被整合成了一种,名为20SoC。它的性能,以TSMC官方的预计,仅能实现漏电比28HPM降低20%、性能比 28HPM提升15%的水平。希望各位注意,对比的对象是28HPM,而28HPM的漏电水平与28LP是接近的,也就是说从28nm到 20nm,TSMC只实现了20%的漏电降低。

  这是官方最乐观的预计,而实际情况可能要比这个悲观的多,一如TSMC对于28nm量产时间的预计一样。那么我们就可以得到一个自然而然的预计:20nm时代,我们除了更高的集成度,什么都得不到。这就意味着,以20nm工艺制造的芯片,固然可以通过规模的扩大而获得更大的理论性能,却几乎无法从工艺的进步得到单位功耗效率的提升。在目前手机处理器绝对性能已经超过体效值的大前提下,这样的结论几乎就已经宣布了,未来的产品不会为我们带来更快的实际性能。

【新技术研习社】2013年手机处理器终极指南(下)
英特尔在2012年开始量产3D晶体管,台积电至少要等到2015年

  那么更先进的工艺呢?例如16nm?根据目前的规划,TSMC将在16nm引入近年来半导体工艺中继HKMG后最大也可能是最后的进步,也就是3D 晶体管,又叫finfet。这个技术可以为单个晶体管带来40%的性能提升,同时降低30%的功耗,目前已由英特尔量产,而整个业界只有英特尔实现了量产,由此可见其技术难度水平。我们没有理由认为,TSMC对于finfet的引入会一帆风顺,外加16nm对于EUV的需求以及EUV产业目前的状况,至少在笔者看来,TSMC可以在2015年量产16nm finfet的概率几乎为0。至于GlobalFoundries或者三星,前者目前刚刚实现28nm的量产,虽然幻灯片已经写到了10nm,但是我们不应对其抱有太大的信心,而三星的产能过小,即便有良好的工艺,也无法支撑业界的需求,因此不需要投以太大的注意力。

【新技研】2013年手机处理器终极指南(下)

  这就意味着,2014年和2015年对于ARM而言会非常艰难。因为先进工艺在这两年将出现空窗期,而没有先进工艺的支持,ARM系产品的性能进步就只能停留在纸面。当然,也有一种选择,那就是提前在20nm上——就像英特尔所做的那样——引入finfet,但这会给本来就已充满变数的20nm工艺增添新的难度,最极端情况下也许会导致2014年的彻底空白。因此我们似乎必须接受2014到2015年的空窗期。

  那么,更先进,比16nm还先进的工艺呢?业界普遍认为,由于物理规律限制,目前常规晶体管的极限将在2nm左右到来,在这个规模下,基于宏观原理工作的硅基半导体晶体管将彻底无法运行。而考虑到工程实际情况,也许在10nm时就已经会遭遇无法解决的问题。所以保守来说,我们依靠了40年,并以之建立了辉煌信息产业大厦的硅基半导体工业,也许在10年内就会走到尽头,我们所剩下的工艺,乐观估计还有6代,悲观估计可能只有4代。之后,人们就必须要想办法去寻找新的原理,以新的材料制造新的器件。突破终将会到来,但是究竟需要多长时间?谁也没把握,因为基础物理已经80年没有进步了,半导体行业在打光手中所有牌之后的痛苦空白期到底有多长,没有人可以给出答案。

回复 支持 反对

使用道具 举报

8073

回帖

84

积分

1678

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2011-12-2
 楼主| 发表于 2013-8-13 14:36:15| 字数 2,454| - 中国–广东–深圳 电信 | 显示全部楼层

盖棺定论 2013年手机处理器终极指南(下)

  新架构,新希望?

  在前文中,我们将Cortex A15批得体无完肤,也许你要有疑问:既然A15在手机上表现如此糟糕,ARM为何还要设计出这么一个核心?答案非常简单:ARM高估了半导体工艺的升级与技术进步速度,Cortex A15实际上是为20nm工艺所设计的核心。

  让我们把时间倒回到2008年,TSMC在当时提出了未来5年半导体工艺路线图。如果一切都与图中的宣传精确吻合,我们在2010年就能用上 28nm处理器,而在2012年,也就是去年,我们将迈入20nm时代。按照这个进度,ARM在2013年将核心进化至Cortex A15就没有任何的问题。也许ARM的初衷是借助于20nm工艺良好的性能,可以强行将Cortex A15的实际功耗压缩到0.5W以内,获得两倍于Cortex A9的能耗比提升。这点从早期TSMC和ARM的演示文档中也可以看出来。而且,A15也的确做到了绝对性能提升两倍的设计目标。

【新技研】2013年手机处理器终极指南(下)
TSMC画的大饼

  只不过,工艺最终没能按照ARM所设想的发展下去。28nm跳票到2012年,20nm还在遥远的2014年,而且即便成功量产,其可以得到的性能提升也极为有限,一连串的意料之外造成了Cortex A15的尴尬定位。由于工艺的失算,Cortex A9事实上失去了后继产品:Cortex A7的能耗比虽然很高,但其性能太弱,甚至不如Cortex A8;Cortex A15虽然绝对性能翻倍,但是能耗比过低,两者都无法作为Cortex A9的继任者。即便ARM通过big.LITTLE技术将二者捆绑在一起,最终实现的总体效率也只能基本上和Cortex A9打个平手,所谓的继任者更多成了纸面上而不是性能上的。

  很明显,ARM被TSMC这个队友坑惨了。

  有趣的是,在ARM官方面临产品线问题的时候,反而是两家ARM IP的购买商——高通和苹果——给出了比Cortex A15更好的解决方案。它们都规避了Cortex A15过于臃肿的架构设计,把注意力集中在对Cortex A9的优化和提升上。不约而同的,它们都选择了保留Cortex A9的前端、扩充Cortex A9的后端,区别是高通的着眼点在于提升指令的理论吞吐量,苹果的工作重心在提升内存表现。当然,最终的结果我们看到了,高通的方案并没有对Cortex A9形成实质上的优势,苹果的方案则很难找到对比的标准,但是至少这两家的行动方向是正确的。

  因此在Cortex A15架构推出3年后的2013年,ARM痛定思痛,给出了自己针对这个问题的答案,那就是Cortex A12。

【新技研】2013年手机处理器终极指南(下)

  在设计规格上,ARM终于放弃了宏伟庞大的“200%性能提升”,转而只给Cortex A12定下了比Cortex A9快40%这样一个目标。这是一个相当现实的目标,尤其是考虑到Cortex A9的体系架构上的确存在一些过时的限制,让我们来看Cortex A12是怎么改的。

  首先,如同其他的ARMv7架构处理器一样,Cortex A12提升了二级缓存的性能,学习前辈Cortex A15和A7的先进经验,把二级缓存整合进多核心控制器,所有核心终于可以不用再通过一条可怜的64bit总线访问自己的缓存,这将大大缓解拥堵现象。其次,Cortex A12把NEON和vFP提升到了第四版,并且和Cortex A15一样引入了内部OoO(乱序执行)设计,指令执行时效率要比A9高很多。最后,A12的外部接口也从64bit AMBA 3升级到了128bit AMBA 4,带宽提升一倍有余。

【新技术研习社】2013年手机处理器终极指南(下)

  Cortex A12凭什么降低了功耗?主要是三方面,一方面是最大并发取指数从3降低到2,另一方面是大幅度缩减了指令派发队列,最后一方面是大幅度缩减了运算单元的数量。由于指令派发队列的意义在于可以支撑乱序执行,它所对应的寄存器资源和硬连接资源是非常庞大的,Cortex A15为所有8组8个运算单元设计了完整的8个独立指令队列,这无疑消耗了巨大的电力,而Cortex A12把这个数字缩减到了3。与此同时,Cortex A12的运算单元也减少到3组6个,即整数、存取和FP/NEON,每一组内包含两个运算单元,共享一个指令队列。

【新技研】2013年手机处理器终极指南(下)

  而Cortex A9就相当寒酸了,只有一个指令队列,支撑着2个整数ALU、一个存取单元和FP与NEON。仅仅依靠这样的改进,Cortex A12就几乎可以实现40%的性能提升,更不要说算上二级缓存、外部总线、以及更为前端的取指与解码部分——例如数据与指令部分重命名与分派彼此独立—— 的改进了。总体来说,Cortex A12是一个与Cortex A9相比性能提升40%、功耗维持不变的架构,它单凭一己之力拯救了ARM处理器摇摇欲坠的每瓦特性能,可以说是ARM的救星。A12唯一的问题只有一个 ——它最早也要等到2014年中才可能有产品,那时ARM很可能已经被英特尔大卸八块了。

【新技研】2013年手机处理器终极指南(下)

  如果我们把Cortex A12与高通Krait、苹果Swift放在一起看,可以发现一些比较有趣的地方。与ARM不同,高通Krait几乎保持了Cortex A9的前端设计,唯一的增强是取指部分的并发能力提升到3,后端则和Cortex A15一样堆积了数量巨大的执行器,具体来说是7个。这样的架构瓶颈来自于连接前端与后端的中间部分,导致Krait在实际应用中根本无法发挥其 3300DMIPS——只比Cortex A15低5.7%——的理论最高性能。至于苹果Swift,由于缺乏资料与有效的对比方式,在这里并不能给出太多的分析,但是苹果的优势在于硬件与软件之间可以做到完全的匹配,因此即便苹果对Cortex A9进行如高通一般的单方面增强,也可以依靠自身的操作系统进行针对性的优化并将其发挥出来。因此在这三个介于Cortex A9和Cortex A15之间的设计中,我们认为Cortex A12是最为平衡的设计。只是——如之前所说,我们恐怕无法在2013年看到它了,甚至在2014年都有可能看不到最终产品的上市。因此Cortex A12是否真的实现了ARM的设计目标,我们也只能等到2014甚至2015年才能看到结果。

【新技研】2013年手机处理器终极指南(下)

回复 支持 反对

使用道具 举报

8073

回帖

84

积分

1678

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2011-12-2
 楼主| 发表于 2013-8-13 14:36:15| 字数 2,214| - 中国–广东–深圳 电信 | 显示全部楼层

盖棺定论 2013年手机处理器终极指南(下)

  未来之路:ARM

  至此,我们已经把现在以及未来的产品、技术、架构等等方面都分析过了,以这些分析为基础,我们已经可以预测一下2013到2014年的技术与产品格局。

  由于新的Cortex A12很难在2014年之前问世,因此在2013年下半年到2014年中这段时间内,市场上的产品格局不会出现太大的变化。标准ARM阵营的企业,例如三星,依然会选择Cortex A15作为其旗舰产品,高通则会用Krait 400与之进行对抗,对抗的资本是超过2GHz的频率,一如当年Pentium 4时代的英特尔。对于Cortex A15这个架构而言,如果不搭配Cortex A7(或者nVIDIA的伴核),其功耗将是不论如何也无法被手机所承受的,因此可以预见,big.LITTLE将是所有试图整合Cortex A15的芯片制造商唯一且必须的选择。目前有传闻,LG和华为都在设计自己的Cortex A15 SoC,那么我们几乎可以肯定,它们必然会采用4+4或者2+2的设计,或者插入自行设计的第五个核心。具体设计取决于设计师认为双核Cortex A7是否够用。

【新技术研习社】2013年手机处理器终极指南(下)

  其他厂商方面,居于市场较边缘地位的厂家,也许会试图作出一些特立独行的搭配,以差异化的产品参与市场竞争。例如MTK已经宣布了一款八核Cortex A7的新产品,并宣称这颗SoC的所有八个Cortex A7核心都可以开启,是一枚真正的八核处理器,但是对于它的性能我们也许只能报以呵呵。除此以外,也许会有某些厂商推出四核Cortex A7配备超级GPU的类似于游戏机的芯片,以迎合目前手机娱乐化的市场需求,这样的产品也许也可以获得不错的实际体验。但是总体来说所,主流手机SoC在未来一年半内出现超过四核的可能性并不大,而且四核Cortex A9在CPU性能方面,一直到Cortex A12之前,都可以屹立在高端主流水准。因此对于那些手持Exynos 4412的用户,例如Galaxy S3的用户而言,如果你希望获得更强的CPU体验,那么你的升级日程完全可以推到2015年。

【新技术研习社】2013年手机处理器终极指南(下)

  所以在未来的一年半之内,我们不能对看到让人眼前一亮的新产品报以太多的期待。不论是三星、nVIDIA、高通,都会以维持现有产品架构为主。至于苹果,最大的可能是将A6处理器的双核Swift架构扩充至四核,但是以IOS的系统设计而言,这样的扩充有多大意义也很难说,或许硬件大战的后果是所有人都无法逃避的。

  而GPU部分,高通的产品在不解决能耗比问题之前,不论性能提升幅度有多巨大,都不具备太高的选择价值。而如果你是游戏重度玩家,那么Exynos 5 Octa在Android阵营里会是一个非常好的选择,前提是你需要有办法把CPU部分锁定在Cortex A7,否则Cortex A15巨大的功耗会抹杀掉你的大多数游戏体验。至于Mali400MP4,虽然老迈,但是运行一些非顶级大作的情况下依然拥有可以接受的性能,因此除非你是基准测试爱好者,否则Mali400MP4除了较低的得分以外,并不存在太多问题。

【新技研】2013年手机处理器终极指南(下)

  工艺方面,我们在2013年应该是不可能看到量产的20nm工艺的,不论台积电如何对此信誓旦旦,都不要报以太大的期待。 GlobalFoundries在目前刚刚量产28nm,且产能非常有限的情况下,对于20nm的任何宣传都可以完全无视。反而是三星的20nm存在一些变数,但是希望依然不大。

  由于代工厂无法像英特尔一样靠销售最终产品去吸收工艺的成本,因此目前所有代工厂都普遍希望在20nm节点引入EUV光刻工艺。但是EUV工艺一直以来的进度都非常缓慢,截止目前为止所实现的最大连续曝光功率只有40W,这个数字在2011年则是11W。在这个功率下,晶圆产出率只能达到每小时5 片,而满足量产需求的最低极限也需要60片,就正常情况而言,必须要达到100片每小时甚至更高的产量才可能获得正收益,与之对应的EUV光源功率需求就来到了大约400W。换句话说,目前EUV光源的功率距量产目标还有10倍的距离。

【新技术研习社】2013年手机处理器终极指南(下)

  从2011到2013年,光源功率的提升不到4倍,绝对功率提升不到30W,这就意味着10倍、350W的这样的需求缺口,称之为天堑似乎也不为过。更糟糕的是,即便EUV光源的功率解决了,EUV生态系统还面临着光刻胶的反应速率过低、反应程度过低等问题,这些问题甚至比提升EUV光源功率更加棘手。因此,对于业界曾经普遍希望的在2015年实现EUV光刻机的量产化,笔者认为实现的可能基本不存在。也就是说,16/14nm工艺上,全球代工厂都将被迫采用193nm三次曝光来实现。

【新技术研习社】2013年手机处理器终极指南(下)

  三次曝光会带来大量的问题,从成本到产量到良品率到曝光图案限制,无所不在。因此即便实现,对于芯片设计也会提出特殊要求,这对于那些希望将产品放在多个代工厂生产,或者希望中途更换代工厂的Fabless厂商而言,都会是一个极大的挑战。我们都知道苹果现在一直在坚决执行去三星化战略,但是在与 TSMC的合作还没真正开始时,就又传出了将在2015年重新回归三星代工并且签下三年长约的消息,这说明了TSMC的20nm工艺情况非常不乐观。往好的方面估计,苹果这样的举动意味着TSMC 20nm工艺的性能提升远小于——甚至会出现倒退。而最恶劣的估计则是TSMC的20nm工艺量产工作甚至无法在2014年完成。不论是哪个,都意味着这家全球最大代工厂,掌握着全球70%芯片命运的企业,将要陷入一段困难的时期,随之而来的则是整个业界,至少是ARM阵营的大停滞。

回复 支持 反对

使用道具 举报

8073

回帖

84

积分

1678

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2011-12-2
 楼主| 发表于 2013-8-13 14:36:15| 字数 4,015| - 中国–广东–深圳 电信 | 显示全部楼层

盖棺定论 2013年手机处理器终极指南(下)

  未来之路:英特尔

  历史告诉我们,一旦竞争双方之一陷入了停顿,就意味着另一方获得了绝佳的机会。对于2013到2014年的ARM而言,这个停顿尤其显得残酷,因为它们的竞争对手——英特尔,实在是太可怕了。英特尔不仅在半导体技术上拥有超过业界平均5年的领先优势,而且在高性能处理器设计上的经验也明显更加丰富。更可怕的是,这样的优势还在继续扩大。

【新技研】2013年手机处理器终极指南(下)

  就在即将到来的2013年第三季度,英特尔将要发布全新一代基于Silvermont核心的Atom处理器,代号Baytrail。这是Atom发布6年以来英特尔第一次对Atom家族的核心架构进行大刀阔斧的改变,你甚至可以认为英特尔完全重新设计了一颗CPU,Silvermont和过去的 ATOM根本没有什么联系。

【新技研】2013年手机处理器终极指南(下)

  这枚新核心拥有全乱序的流水线、双路并发取指设计、5组指令队列(英特尔称之为RSV)、6个执行器,最关键的是,在实现了所有 Cortex A15拥有的技术特性的同时,Silvermont的存取,即Load/Store单元内部也实现了乱序执行,而ARM至今只在Cortex A15上实现了存取并发。这将会是一个巨大的性能提升。

【新技研】2013年手机处理器终极指南(下)

  浮点与多媒体指令集方面,英特尔不出意外会在Baytrail上至少搭配SSE3,相比vFP与NEON而言,无疑要先进许多。至于工艺,则是所有 ARM制造商梦寐以求的22nm HKMG,而且英特尔已经在这个工艺节点上实现了finfet(3D晶体管),地球上独此一家,再无分店。

  GPU方面,英特尔会放弃PowerVR SGX系列,转而集成自行研发的GMA HD4000架构GPU。这也是一个能耗比相当高的GPU,可以在区区8W的功耗下实现超过40000分的3Dmark IceStorm图形性能,而且对于DX11拥有完整的支持。根据我们的猜测,在Baytrail产品上,英特尔会选择集成规模为GMA HD4000一半的GPU,即8EU。这样可以实现在低于Adreno 320功耗的前提下实现两倍于前者的DX9性能,以及超出所有其他嵌入式GPU的DX10/11支持。

  以英特尔的规划而言,Baytrail将成为一个家族,包括面向低端PC的Baytrail-D,面向平板的Baytrail-M与面向手机的 Baytrail-T,最多包含四核心,最高工作频率2.4GHz。根据英特尔的宣传,Silvermont的架构将能提供两倍于任何竞争对手的性能与四倍于竞争对手的能耗比表现,这无疑是非常恐怖的数字。

【新技研】2013年手机处理器终极指南(下)

  那么具体的性能和功耗呢?目前为止,我们所能看到的资料是一张泄露出的Baytrail规格与功耗图。其中面向平板的四核2.0GHz Baytrail-M,最大热设计功耗只有7.5W。这个数字和Tegra 4等基于Cortex A15的SoC、基于高频Krait的骁龙800基本持平,而Baytrail-M的性能要大大强过它们。

  面对手机的Baytrail-T由于工艺的不同与更低的频率,功耗将会更低,根据英特尔的规划,其最大热设计功耗将不超过3W。性能方面,根据目前唯一可比的测试结果,我们可以看到运行于区区1.1GHz的Baytrail芯片,Antutu测试的总分已经超过了43000分,相比之下频率高达 1.9GHz,功耗高达8W的Cortex A15旗舰Tegra 4的得分也只是刚刚突破40000。虽然分数不能绝对说明一切,但是至少这也给了我们一个一窥Baytrail实力的机会,结果自然是震撼无比。

【新技术研习社】2013年手机处理器终极指南(下)

  可以看到,结合了英特尔设计技术与最先进制造工艺的Silvermont核心,非常轻松的就获得了数倍于Cortex A15的能耗比,这也就是说,如果不考虑其他因素,搭配了Silvermont核心Atom的智能手机,其体效值将远远高于搭配ARM Cortex A系列任何核心的产品。毫不夸张的说,在2014年ARM面临困难的时候,也许基于Silvermont核心的新Atom或许是那些还想继续提升实际性能的厂家的唯一选择。

  但是放在英特尔面前的也不是唾手可得的市场。产品的强大从来不是决定市场的唯一因素,这点在Atom上表现的淋漓尽致。虽然Atom拥有着强大的性能,但是我们对于英特尔在未来一年半内的定位依然是“挑战者”而不是“颠覆者”。其原因主要有两方面,源自产品的与源自非产品的。

【新技术研习社】2013年手机处理器终极指南(下)

  从产品角度说,Atom与ARM基于两种不同的ISA设计,这会导致这两种处理器无法执行针对硬件所编译的同一底层代码。而在Android环境中,绝大部分的应用程序都包含了针对底层硬件平台所编译的NDK代码,这部分代码是无法在Atom上直接执行的。对此英特尔给出了虚拟转换的方案,即采用类似于模拟器的方式,实时的将ARM底层代码翻译成x86代码并执行。这样虽然解决了能否运行的问题,但是代价就是效率的极大降低,根据第三方测试,性能降低的幅度会高达70%以上,这足以抵消Silvermont相对于Cortex A系列提升的性能,导致配备Atom的Android设备实际性能不增反降。虽然英特尔一直在努力扩展自身在Android阵营的影响力,推出x86的 Android系统分支与针对X86的NDK编译器,但是愿意在产品中附带x86底层库的应用程序依然极少,而这并不是一个短期内可以解决的问题。

【新技研】2013年手机处理器终极指南(下)

  至于非产品方面的因素则源于英特尔的市场模式和地位。和X86不同,ARM阵营非常开放,任何公司都可以购买ARM IP,搭配其他的系统授权设计制造属于自己的SoC,但是英特尔不行。因此在芯片行业角度来看,x86代表着一个公司,而ARM代表着一个集体,三星、苹果、德州仪器、nVIDIA、高通等等等等,这些厂家已经组成了一个牢不可破的利益集团,英特尔仅仅依靠技术与性能很难将其击破。由于ARM阵营中,技术是分散在各个公司内部的,因此各个公司都可以根据自己的利益选择不同的产品设计,实现利益最大化,因此即便整体性能不如英特尔,也不影响盈利表现。但是一旦让英特尔在这个行业立足,甚至占据主导地位,由于英特尔封闭的授权模式与过于强大的技术实力,最终所有厂家都不得不向英特尔采购芯片——完整的芯片,无法根据自己意志进行组合与修改的芯片,只能从英特尔提供的有限种选择中挑一个最符合自己需求的。这样一来,手机市场将变成另一个PC市场,一个由英特尔完全控制并且占据大部分利益的市场。其他厂家由于无法具备等同于英特尔的技术实力,而无法拥有话语权,这样的市场格局自然是英特尔最为希望见到的,也显然是其他ARM阵营厂商所最为恐惧的。

【新技术研习社】2013年手机处理器终极指南(下)

  那么英特尔就没有机会了么?并非一定如此,因为随着ARM阵营开始追求最为顶尖的工艺,英特尔手中的工艺优势正变得越来越有重量,可以说在两三年前,英特尔想要打入手机市场几乎毫无胜算,但是目前却迎来了一个机会。英特尔所需要的是一个突破口,借助终端厂家对于性能的需求,以手中所向无敌的 22nm工艺作为砝码,强迫厂商接受自己的产品,并迅速借助巨大的性能优势,在ARM无法给出同等级别产品的情况下,逼迫其他厂家不得不跟进。我们认为,最理想的突破口就是苹果。

  事实上,这一轮硬件军备竞赛的始作俑者正是苹果公司,归根到底,iPhone超越同时代竞争对手的体验,其实是源于iPhone超越同时代竞争对手的硬件,尽管这个硬件也许不像Android阵营一样堆彻得那么明显。近年来,由于苹果已经丧失了硬件上的领先优势,因此我们可以看到iPhone曾经领先巨大的体验优势正在被Android阵营所蚕食。现在,哪怕是千元级的入门产品,其操作体验与流畅度方面都可以做到与iPhone的差距不超过常人的忍受范围。因此iPhone所剩下的优势更多是消费惯性、应用优势和习惯,这些东西相对来说都是不够稳固的。所以苹果需要更强大的硬件,超越同时代的硬件,去实现超越同时代的功能,也是其他竞争对手所无法提供的功能。因此英特尔的工艺就成了苹果最希望得到的东西。

  但是英特尔绝不可能仅仅安于作为一个代工厂,每年帮苹果制造一亿颗芯片——它的目标最终是整个行业。因此英特尔有可能利用手中先进工艺作为筹码,直接或者渐近的强迫苹果放弃自己基于ARM核心的A系列芯片,转而接受Atom,最终以苹果作为突破点,切入手机行业。当然,苹果也明白一旦接受英特尔的要求,自己也就相当于被捆上了英特尔的战车——未来将变得无路可退。

【新技术研习社】2013年手机处理器终极指南(下)

  到目前为止,苹果还没有选择与英特尔合作,大多数安卓厂商也有类似的考虑。但是当时间一年一年过去,如果TSMC真的无法拿出有竞争力的工艺,任凭英特尔利用手头的22nm甚至未来的14nm工艺将其他同业者抛得越来越远,又有谁能保证所有厂家都能坚持住不被英特尔先进的工艺所诱惑,投入它的怀抱呢?要知道,只要作出这样的选择,立刻就可以拥有超越其他竞争对手数倍的每瓦特性能,而这样一个诱惑随着ARM阵营性能停滞时间的积累,只会越来越大。

  当然,这些都是遥远的猜测,如果只看2013到2014年,那么我们认为,平板会是英特尔首先可能获得突破的平台。与手机不同,平板可以容忍稍高的功耗,因此英特尔在高性能处理器领域的设计领先优势会发挥出更大的作用,更重要的是,Atom是一枚x86处理器,兼容30年来所有针对PC所设计的应用(虽然不一定适合平板操作),而且Baytrail-M从最乐观的角度来看,可能拥有等同于Core 2 Duo时代处理器的性能,这也就意味着Baytrail-M可以满足几乎90%的日常PC应用需求,这远远不是当年上网本可以相提并论的。因此从这个角度而言,最早在2013年底,就可能出现10英寸、9毫米、600g、续航10小时、性能达到5年前高端笔记本水平的平板电脑,可以运行几乎所有的 Windows程序。对于本身用途就相对匮乏的Android平板而言,这不会是一个好消息。而平板是ARM阵营试图将ARM处理器带入更高一级应用平台的跳板,在这个平台上遭遇如此强大的竞争对手,对于ARM而言也不会是一个好消息。

回复 支持 反对

使用道具 举报

8073

回帖

84

积分

1678

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2011-12-2
 楼主| 发表于 2013-8-13 14:36:15| 字数 801| - 中国–广东–深圳 电信 | 显示全部楼层

盖棺定论 2013年手机处理器终极指南(下)

  写在最后

  要说这部分是结语,其实并不准确,因为我们的结论基本已经在前文中说完了。最后我们能给出的,是对各位未来几年的消费选择的一些建议,权当参考吧。

  首先是手机。手机的处理器的实际性能在未来一到两年内很难看到实质性的进步,但是毕竟手机是一个有机的整体,处理器并非构成消费诉求的唯一。屏幕、摄像头、设计、材质,甚至是任何一个小小的功能改进,都有可能让你产生购买欲望。

【新技术研习社】2013年手机处理器终极指南(下)

  因此,我们的建议是:如果你遇到一台手机,第一眼就觉得它是你的真爱,那就不要管它是用什么CPU了,果断入手就可以了。但如果你希望得到更强的性能,那么我们的建议是,暂时打消升级的念头,等到2015年再静观其变。

  事实上不仅是CPU,在屏幕、通信等等方面,目前的手机也已经走到了体验或者技术的极限,未来几年内出现重大突破的可能性都不大。所以除非你是硬件发烧友,追求最新最好,否则我们也许可以相信,经过五年的马拉松,我们终于有足够的理由停下来休息一会儿了。

【新技术研习社】2013年手机处理器终极指南(下)

  另一方面,平板电脑会成为未来一段时间内竞争最激烈的领域。因为英特尔Baytrail的加入,标准版Windows 8.1与Atom搭配的平板总算与Android平板和iPad有了正面竞争的能力。届时的选择会千变万化,我们完全可以坐等厂商推出的新产品,从中选择最适合自己的。顺带一提,由于ARM芯片的困境,Surface RT已经不再具备产品意义上的价值,这点对于微软而言也许会显得比较悲剧。

  至于具体的产品,我们可以很负责的说,从现在开始,所有的跑分天王都将沦为“只能跑分的天王”,不论厂家多么宣传我的产品具备多高的性能,多大的提升,只要你还是一个理性的消费者,都应该选择理性对待。

  写到这里,笔者的心情也很复杂,甚至不知道应该如何结束这篇文章。那么就让我们重复一下两年前的那段话,作为对这一个系列的收尾吧:“手机行业这列火车,正在厂家与消费者的共同催促下,向着近在咫尺的悬崖加速狂奔,我们大家都是罪犯。”

回复 支持 反对

使用道具 举报

9406

回帖

78

积分

6856

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2009-9-18
月全勤勋章铜牌荣誉勋章(注册8年以上会员)
发表于 2013-8-13 16:15:01| 字数 6| - 中国–香港 上海汇丰银行有限公司 | 显示全部楼层
好长~~~~
回复 支持 反对

使用道具 举报

1902

回帖

0

积分

3096

资产值

入门会员 Rank: 1

注册时间
2007-7-29
发表于 2013-8-13 17:58:59| 字数 26| - 中国–重庆–重庆 电信 | 显示全部楼层
我只觉得我的XT926的骁龙8960双核已经很不错了
X31\T43\P1610\8730W-DC\8760W DC2\X230\M7720
P525\XT926\N5100\9900\摩托XPRO
回复 支持 反对

使用道具 举报

115

回帖

16

积分

1986

资产值

白金会员 Rank: 3Rank: 3Rank: 3

注册时间
2009-7-14
发表于 2013-8-13 19:15:03| 字数 13| - 中国–湖南–常德 联通 | 显示全部楼层
现在的手机处理器也太强大了
T480s
X230
回复 支持 反对

使用道具 举报

5万

回帖

348

积分

14万

资产值

至尊会员III Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2008-12-13
年全勤勋章2020银牌荣誉勋章(注册10年以上会员)年全勤勋章2022铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2013-8-13 19:23:04| 字数 3| - 新加坡 | 显示全部楼层
太长了
X62 5500U; 10G RAM; 64G Msata
Retina MBP ME865
回复 支持 反对

使用道具 举报

12万

回帖

981

积分

21万

资产值

版主 Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6

注册时间
2010-9-27
年全勤勋章2023年全勤勋章2017年全勤勋章2018年全勤勋章2019年全勤勋章2020年全勤勋章2021银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章年全勤勋章2022年全勤勋章2024
发表于 2013-8-23 15:12:03| 字数 4| - 中国–湖北–武汉 电信 | 显示全部楼层
图全挂了
手机卡交流qq群739432372
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Powered by Discuz! X3.5 © 2001-2023 Comsenz Inc

GMT+8, 2025-1-20 03:47 , Processed in 0.137509 second(s), 42 queries , Gzip On, OPcache On.

手机版|小黑屋|安卓客户端|iOS客户端|Archiver|备用网址1|备用网址2|在线留言|专门网

返回顶部