272985201 发表于 2011-1-23 17:13

【转帖】2011年MID主控展望——后A8时代与A9的到来处理器(前篇ARM知识1-15更新)

手机芯片总结(感谢作者nbnb001 )目前,几乎所有的智能手机和MID,使用的都是ARM芯片。
这种芯片相比Intel公司的芯片,指令集较简单,所以功耗低、成本低,特别适用于移动设备。随着性能不断提高,它已经开始装备上网本和平板电脑。
它的名字ARM,指的是英国芯片设计公司ARM Holdings。这家公司自己不制造芯片,专门授权其他公司制造。因此,市场上有多家公司生产多种ARM芯片。再加上,ARM公司目前主要授权三个系列的芯片设计----ARM 9、ARM 11和Cortex,所以就造成普通消费者感到眼花缭乱,不知道如何选择。各种ARM芯片之间到底有什么区别?
今天,我在imp3.net上看到一篇文章,对这个问题做出了最详细的回答,不仅介绍了芯片知识,而且还有助于读者分辨和选择适合自己的移动设备。我把它转贴在下面。

==========================================================================================
ARM9系列
经典的ARM9核心,较小的核心面积带来较低的成本,提供约1.1DMIPS/MHz的性能。
相对比较省电,但难以冲击更高的频率,因此整体效能有限。

威盛WM8505/WM8505+
65nm工艺
ARM926E 300MHz/400MHz,Linpack 1-1.25MFlops(1.6系统)
RAM: 128M DDR2,16bit
只有个JPEG硬解,视频支持很弱,无3D加速
代表机型:国美飞触1代,山寨VIA平板
个人观点:
价格低廉大概是这个方案的唯一优点了……也不知道国美是怎么忽悠把这个机器卖到999元的……
ARM9 300MHz,自然不用指望有多好的性能,上网都勉勉强强吧。超频的400MHz版本,发热又比较大,性能提升又实在有限。视频能力很弱,也不能当MP4用,最多只能当个Android入门机器玩玩。
淘宝售价低至500-600元,7寸屏。如果不是囊中羞涩到一定程度,实在不推荐这个芯片的机器。
真要入门的话,收个二手的智器Q5也比这个好。
性能★☆☆☆☆
视频★☆☆☆☆

---------------------------------------------------
瑞芯微RK2808
65nm工艺
ARM926E 600MHz,Linpack 2-2.5MFlops(1.5系统)
RAM: 128M SDRAM,32bit
视频子系统:Ceva MM2000,基于550MHz的DSP
多格式,RV,H.264,VC-1,H.263,MPEG4最高720p,流畅576p
无3D加速
代表机型:蓝魔W7,爱可视7HT,山寨apad等
个人观点:
RK2808也算是上市得比较早的机器,从五月份上市到现在,瑞芯微也做了很多宣传。
600MHz的ARM9,性能偏弱,好在瑞芯微的系统优化做的不错,1.5的系统还是做的比较完善和稳定的,实际速度也不错。
一般的上网,开启网页的速度能让人接受,应付文字为主的网页问题不大,然而对于图片稍多的网页,拖动就会有明显的不流畅。
RK2808带有独立的DSP,因此视频性能获得了明显的提升,支持格式也较为丰富。720p以下的视频均能流畅解码,720p视频中,对RMVB,MPEG4的支持不错,H.264只能到2Mbps的码率。此外VC-1只能保证480p流畅。视频性能足以满足一般用户的需求。但是跟MP4相比,RK2808 Android的视频流畅度稍逊,总有掉帧感。
RK2808的软肋在于采用SDRAM,最大只能支持128MB,对于2.0以上的系统,RAM成为了一个瓶颈。此外缺乏3D加速,也注定了与2.1以上的动态桌面和华丽特效无缘,也无法运行需要使用3D加速的游戏。
蓝魔W7是少有采用电容屏的国产mid,触控感受给我留下了深刻的印象,瑞芯微做电容触控还是有自己的一套的。遗憾的是,瑞芯微放弃了RK2808 Android2.1系统的开发,于是由于系统的原因,这个电容屏也没能支持多点触摸。不过爱可视已经公布了旗下采用RK2808主控的爱可视7HT的Android核心源代码,于是民间工作者可以发挥下作用,进一步发挥RK2808的余热。
目前7寸的山寨RK28机型,价格低至700元,作为入门机型具有一定的价值。
性能★★☆☆☆
视频★★★☆☆


------------------------------------------------------
瑞芯微RK2818
65nm工艺
ARM926E 624MHz,Linpack 3MFlops+(2.1系统)
RAM: 256M DDR2,32bit
视频子系统:Ceva MM2000,基于600MHz的DSP
多格式,RV,H.264,VC-1,H.263,MPEG4最高720p
(此部分待进一步确认!就目前看似乎没有)
3D加速: ARM Mali-55
架构:TBR,只有PS部分,顶点处理通过软件由ARM实现
特性:OPENGL ES1.1,OPENVG
三角形生产率:1M
像素填充率:100M
代表机型:蓝魔W9,W11,原道N6,台电T720
个人观点:
RK2818改进了内存控制器,支持DDR2颗粒,最大到512MB,
就目前上市的机型看,RK2818的3D部分使用的Android Pixelflinger渲染器,这是一个软件渲染器,通过ARM核心来软件渲染3D画面。所以速度上会比较慢,只能玩一些简单的3D游戏,复杂的3D游戏帧率只有个位数,不具有实用性
得益于内存的加大,系统响应,网页浏览和文档阅读性能都有明显的提升。
视频能力和RK2808完全一样。此外,RK可能利用视频系统中DSP的可编程性,进一步开发如3D视频,人脸识别等功能,为产品增加卖点。
此外RK2818通过了Adobe的PDF认证,使用自带的阅读器阅读PDF速度很快,达到“彩屏电子书”水平,但功能上尚不够丰富,有待进一步改进。
7寸电阻屏的产品售价在799-999之间,电容屏产品超过1000,支持多点触摸。山寨的7寸电阻屏最低599-699.
性能★★★☆☆
视频★★★☆☆



---------------------------------------------------------
==========================================================================================================
ARM11
同样经典的ARM11核心,提供约1.2DMIPS/MHz的性能。
加长的管线可以冲击更高的频率(1GHz),但与此同时功耗的增加也比较显著。


Telechips TCC8902
65nm工艺
ARM1176JZF-S 540MHz/720MHz,Linpack 2.3/3.5MFlops(2.1系统)
RAM: 256M DDR2,32bit
视频子系统:ARM Mali-VE6,基于硬解
多格式,RV,H.264,VC-1,H.263,MPEG4最高1080p,1080p流畅
3D加速: ARM Mali-200
架构:TBR,PS+VS
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:16M
像素填充率:275M
代表机型:智器V系列,酷比U6,一些山寨平板
个人观点:
TCC8902的机型,去年年底由智器首先推出。开始该方案的Android不太完善,bug较多,经过大半年的努力,现在已经基本完善,目前已经是mid的主流方案之一。性能也处于主流水平,足以应付绝大部分应用。但ARM11的处理能力对于带有图片的复杂网页依旧不够,拖动并不流畅。
TCC8902带有一颗比较强劲的3D加速器,因此各种动态3D UI也能很好支持。但似乎驱动并不完善,此外使用率也不及PowerVR SGX系列和高通Adreno系列高,因此软件优化不够,实际表现不如前两者。
视频能力很强,支持多格式的1080p,也能真正做到1080p流畅。
智器的产品还带有linux和ce系统,是玩机一族的好选择。特别V3售价699元,很有性价比。
性能★★★☆☆
视频★★★★★



-------------------------------------------
三星S3C6410
65nm工艺
ARM1176JZF-S 666MHz/800MHz,Linpack ~3.5MFlops(2.1系统)
RAM: 128M DDR/256M mDDR,32bit
视频子系统:三星,硬件解码
支持720×480下的H.264 BP
3D加速: 三星自有
架构:未知
特性:OPENGL ES1.1
三角形生产率:--
像素填充率:--
代表机型:智器Q系列,魅族M8,三星i5700
个人观点:
第一代mid,智器Q系列采用的芯片,另外三星i5700也采用了该芯片。
Q系列RAM有点小,不过得益于非官方固件,Android从1.5到2.2都能跑,加上linux和CE,可玩性挺高。二手的价格又便宜,确实是玩机入门的好选择。
性能★★★☆☆
视频★☆☆☆☆





-------------------------------------------
盈方微IMAPX200
65nm工艺
ARM1176JZF-S 1GHz,Linpack ~9.8MFlops(2.1系统开启JIT,不开估计在4-4.5)
RAM: 256M DDR2,32bit
视频子系统:On2 Hantro 8190,硬件解码
多格式,RV,H.264,VC-1,H.263,MPEG4,VP6最高1080p
3D加速: VIVANTE GC600
架构:IMR,统一渲染
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:19M
像素填充率:375M
代表机型:卓尼斯epad,国美飞触2代
个人观点:
真假A8事件的主角,结果证明还是ARM11。频率被拉到了1GHz,有Cortex-A8 500-600MHz的水平了,理论上性能还是不错的。
视频硬解的规格还挺高,不过据说1080p还是有掉帧,估计软件优化的还不够。
VIVANTE的3D加速器其实用的也挺多的,就看驱动是不是能跟上了。

从芯片的角度说,硬件规格还是挺强大的,不过出来的晚,软件很多都不成熟,没跟上。
另外据说芯片功耗挺大,所以中小尺寸的不好做。加上卓尼斯的无线网卡用的USB的模块(非SDIO),功耗就更大了。
性能★★★☆☆
视频★★★★☆


-------------------------------------------
高通MSM7201
65nm工艺
ARM1136J-S 528MHz,Linpack ~2-2.5MFlops(1.6系统)
RAM: 128/256M mDDR,32bit
视频子系统:高通QDSP5000
支持720×480以下H.264 BP
3D加速: Adreno 130
架构:IMR,固定功能管线
特性:OPENGL ES1.1
三角形生产率:4M
像素填充率:133M
代表机型:G1 G2 G3之类的
个人观点:
被HTC用烂了的芯片……性能实在不咋地,不过软件完善,加上低分屏,手机们还是很流畅。
其改进版MSM722x,给ARM11增加了256KB的L2缓存,增加了硬件VFP,3D加速改用与QSD8x50相同的Adreno 200,总体性能有一定提升,但是受到ARM11本身的性能限制,与Cortex-A8的主控性能尚有明显差距。
性能★★☆☆☆
视频★☆☆☆☆



=================================================
Cortex-A8
ARM首款超标量CPU,双发射顺序结构,带来2.0DMIPS/MHz的效能。
普遍带有256KB的L2缓存,加上600MHz-1GHz的高频率,相对ARM9和ARM11有显著的提升。
Cortex-A8标配Neon单元,通过SIMD指令集大大加强浮点性能,可以实现不少DSP的功能。
与此同时,相对高昂的授权费用和较大的核心面积,使得Cortex-A8 SOC的成本相对较高,作为定位中高端的产品出现。


高通QSD8x50
65nm工艺
Scorpion 1GHz,Linpack 7-7.5MFlops(2.1系统)
RAM: 256/512M mDDR,32bit
视频子系统:高通QDSP6000
支持720p H.264,但一般只有480p H.264流畅(BP或者MP)
通过软件解码能勉强支持480p多格式流畅
3D加速: Adreno 200(AMD Z430)
架构:IMR,统一渲染架构
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:22M
像素填充率:133M
代表机型:google N1, Dell streak
个人观点:
最早的1GHz芯片,性能挺强劲,高端手机标配。
浏览网页什么的自然不用说,系统也巨流畅。
3D的Adreno 200不算强,因为高通的占有率挺高,游戏厂商都会做相应的优化,基本不用担心有游戏跑不了。
视频通过DSP解码,高通的DSP虽然强劲,但是也只能到720p,实际也就576p以下能流畅。而且高通只做了H.264的codec,并且大部分厂商只支持baseline profile。有些机型能支持High Profile的解码,以及WMV的解码,不过兼容性有待提升。
得益于Cortex-A8附带的Neon核心,处理器的浮点性能大大加强,可以通过软件解码处理各种编码的视频。不过性能还是有限,在1GHz高主频的CPU上,480p能基本流畅,不过高码率的片段,还是会掉帧甚至卡顿。
此外该芯片集成了基带,所以拿它做的东西,肯定是可以打电话的,于是价格也不会太便宜。
性能★★★★★
视频★★☆☆☆


--------------------------------------------------
德州仪器OMAP3430/3530
65nm工艺
Cortex-A8 550/720MHz,Linpack ~4.5(550MHz)/5.9(800MHz)(2.1系统)
RAM: 256M mDDR,32bit
视频子系统:IVA2+,基于C64x+ DSP,430MHz
多格式,但除去爱可视,很多厂商都没做解码
通过软件解码,配合超频,能勉强支持480p多格式流畅
3D加速: PowerVR SGX530
架构:TBR,统一渲染架构
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:8M(降频到110MHz)
像素填充率:190M(降频到110MHz)
代表机型:moto milestone,爱可视5,维智A81
个人观点:
一款比较经典的芯片,Cortex-A8的性能自然不用多少,虽然频率不如Snapdragon,但同频率下效能更高(800MHz的TI测试得分与1GHz的Snapdragon接近),当然同频下比Snapdragon要耗电(1GHz的Snapdragon的Scorpion核心耗电与600MHz的TI Cortex-A8接近,ARM部分满载约300mW)。
3D部分使用非常主流的PowerVR SGX530,性能不错。由于SGX系列被苹果采用,软件的支持非常好,大量从ios平台上移植的游戏和应用都能充分发挥这颗芯片的性能,实际表现比高通的Adreno200更加出色。
视频部分,TI集成了一个相当强劲的DSP C64x+。还记得蓝魔T10 MP4吗,采用TI出品的DM6441主控,使用514MHz的C64x+ DSP可以实现大部分720p的流畅解码,和480p 各种规格H.264的解码。遗憾的是,似乎除了爱可视,大部分厂商没有进一步的开发这颗DSP(或者没有向TI购买codec),导致此芯片的视频能力停留在比较低级的水平,仅支持H.264 BP MP4播放。
于是,就只能像QSD8x50一样,通过软件进行解码,适当超频后,同样能勉强支持480p多格式的解码。不过高码率的片段,掉帧和卡顿是必然的。
性能★★★★☆
视频★★☆☆☆

-----------------------------------------------------------

三星S5PC100
65nm工艺
Cortex-A8 667/800MHz
RAM: 256M mDDR,32bit
视频子系统:PowerVR VXD370
多格式,H.264,VC-1,MPEG4最高1080p
3D加速: PowerVR SGX535
架构:TBR,统一渲染架构
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:28M(理论值),实际10M
像素填充率:280M(理论值)
代表机型:touch3,3GS
个人观点:
恐怕是大家最早接触的A8之一,被苹果采用,大量使用在iPhone 3GS和iPod touch 3gen上。不过在A8的芯片当中,性能比较一般,目前已被新一代的45nm S5PC110取代。虽然之前也听说有方案商要推出基于S5PC100的Android平板,但预计难以成为主流。
性能★★★★☆
视频★★☆☆☆(苹果)

-----------------------------------------------
飞思卡尔i.MX515
65nm工艺
Cortex-A8 800MHz/1GHz
RAM: 256/512M DDR2,32bit
视频子系统:硬解
多格式,H.264,VC-1,MPEG4,RV最高720p(但似乎不少开发商都没做RV的硬解支持)
通过软件解码能勉强支持480p多格式流畅
3D加速: Adreno 200(AMD Z430)
架构:IMR,统一渲染架构
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:27M(频率比高通高)
像素填充率:166M
代表机型:山寨i.mx515
个人观点:
炒的很火的一款芯片,呼声很高,但迟迟不出机器(于是被戏称“飞思卡尔推销他们永远买不到的芯片”)
不过据最新消息,10月底国内方案商搭载Android 2.2的i.MX515的平板终于能上市了。
同样基于Cortex-A8,具有与高通Snapdragon类似的性能,网络浏览,文档阅读等日常应用自然不在话下。

3D部分和QSD8x50一样,但频率有提升,此外采用DDR2内存,获得更大的带宽,3D加速性能会有进一步的提升。

视频部分据说是通过一个流处理器实现的,支持多格式的720p解码,甚至支持WMV7、WMV8等冷门格式,值得期待。

目前山寨已有产品上市,售价在1300左右。8寸电阻屏。RV不能硬解,只能软解实现。
性能★★★★★
视频★★★★☆
-----------------------------------------------------------

三星S5PC110/S5PV210
45nm工艺
优化的Cortex-A8 800MHz/1GHz,512K L2,Linpack 8-8.5(1GHz)(2.1系统)
RAM: 512M mDDR2,32bit
视频子系统:PowerVR VXD370
多格式,H.264,VC-1,MPEG4最高1080p
通过软件解码能勉强支持480p多格式流畅
3D加速: PowerVR SGX540
架构:TBR,统一渲染架构
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:90M
像素填充率:1000M
代表机型:三星i9000,Galaxy Tab
采用类似的A4芯片的有iPad、iPod touch4、iPhone 4
个人观点:
毫无疑问,S5PC110(代号HammingBird)是目前最强的Cortex-A8芯片,没有之一。S5PV210和S5PC110只是封装上的区别,本质上并没有多少的变化。前者封装尺寸较大,适用于平板和上网本,后者的小尺寸封装适用于手机。其变种Apple A4芯片,只是将其中的PowerVR SGX540改成了SGX535,3D性能稍有降低。此外,负责视频硬解的VXD370被改成了VXD375,具体的区别尚不明确。

Hummingbird的Cortex-A8经过了三星的改进,同频率下具有更高的效能(+10%-20%),同时配置了512K的L2缓存,是其他Cortex-A8的两倍(Apple A4更是配备了640KB的L2缓存)

3D部分配置了主流而强劲的SGX540,实测性能领先其他Cortex-A8产品1倍以上,基本不用担心有游戏玩不了。

视频解码部分,苹果比较吝啬,依旧是720p H.264 MP4解码。不过三星的Galaxy S可以支持多种格式多种封装的解码,包括热门的MKV封装。不过并不支持RMVB的硬件解码,只能通过软解实现480p。

这颗芯片的强劲性能显然是定位高端的。三星的Galaxy Tab的具体价格也不得而知。11月或12月,国内方案商的S5PV210产品可能会上市,让我们拭目以待。
性能★★★★★★
视频★★★★☆

-----------------------------------------------
德州仪器OMAP3630/3640
http://pic.baike.soso.com/p/20110123/bki-20110123165730-618846289.jpg









45nm工艺
Cortex-A8 800MHz/1GHz
RAM: 512M mDDR2,32bit
视频子系统:IVA2+,基于C64x+ DSP,430MHz
多格式,但除去爱可视,很多厂商都没做解码
通过软件解码能勉强支持480p多格式流畅
3D加速: PowerVR SGX530
架构:TBR,统一渲染架构
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:14M
像素填充率:280M

代表机型:moto droidx,droid2,爱可视新发布的那一串机器
个人观点:
基本就是OMAP3430的45nm版本,并没有太多改进。得益于频率的提升,性能进一步加强,同时由于DDR2内存的采用,3D部分的性能也得以完全释放,达到了前作OMAP3430的2倍。
性能★★★★★
视频★★☆☆☆


=================================================


Cortex-A9新一代的Cortex-A9核心在Cortex-A8的基础上改进,同样是超标量结构,乱序双发射,效能提升到2.5DMIPS/MHz。此外普遍采用对称双核心配置,两个相同的核心共享1MB的L2缓存,总体性能达到了Cortex-A8的2倍以上,性能十分强劲。
不过值得注意的是,在Cortex-A9上,Neon单元不再是标准配置。厂商可以选择传统的VFP单元以换取功耗和核心面积的优化。

NVidia Tegra2
40nm工艺(TMSC)
Cortex-A9 1GHz双核 + VFP
RAM: 512M/1G DDR2,32bit

视频子系统:硬件解码
多格式,H.264,VC-1,MPEG4最高1080p
软件解码性能未知

3D加速: GeForce ULV
架构:IMR,PS+VS
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:~90M
像素填充率:~1000M

代表机型:微星Harmony,万利达Zpad、东芝Folio
个人观点:
Cortex-A9,虽然已经上市在即,也算是次世代的配置了吧。几乎2倍于A8的性能,任何Android的应用,在如此强悍的硬件配置前,没有不流畅的理由。

3D加速部分,其实与Tegra1一致,还是2PS+2TMU的配置,基于GeForce6的架构。2倍的提升一方面得益于核心频率的提升,另一方面,DDR2的大内存带宽给了很大帮助。然而效能与Hummingbird的SGX540处于同一水准,并没有太多的超越,这并非内置图形核心的限制,而是32bit DDR2所能提供的内存带宽的限制。尽管如此,Tegra2的3D性能还是处于量产SOC中的顶尖水平。

视频部分支持多格式的1080p硬件解码,但是没有提供对RMVB的支持。有强悍的双核A9,软解视频应该不是问题,但是Tegra2缺少Neon模块SIMD的浮点加速,对软解效能会有多大影响,目前尚不能得知。

此外,Tegra2也集成了专门的音频解码模块,以最大限度的解放ARM,降低功耗。内置一个ARM7用于全芯片的功耗管理。

万利达的zPad本月就能上市,强悍的性能伴随的不便宜的价格(2500+),在乎体验的用户可以尝试一下。另外,Tegra2的产品多为10寸,7寸及以下的并不多,不知道是什么原因。
性能★★★★★★★★★★
视频★★★★☆



德州仪器OMAP4430/4440
45nm工艺
Cortex-A9 1GHz/1.3GHz双核 + Neon
RAM: 512M/1G+ DDR3,64bit

视频子系统:IVA3,高清硬件解码单元 + C64x+ Lite DSP
多格式1080p,DSP部分提供可编程性
3D加速: PowerVR SGX540
架构:TBR,统一渲染架构
特性:OPENGL ES2.0/1.1,OPENVG
三角形生产率:未知
像素填充率:未知
代表机型:
个人观点:
真正成熟的A9 SOC,64bit的DDR3内存提供4倍于目前顶级SOC(32bit DDR2)的带宽,想必图形性能会有显著的提升。

1080p硬件解码单元,同时和Tegra2一样搭配了专用音频处理单元。此外,TI继续保留了Neon单元用于浮点加速。视频解码已经不需要C64x+ DSP参与,但TI还是将它适当精简后保留了下来,利用它的可编程性加速一些固化硬件单元不能处理的应用。

此外,TI同样配置了2个Cortex-M3处理器,用于整个SOC的任务调度和功耗管理。可以说,这是一款非常值得期待的产品,但是距离上市恐怕还有相当的时日。
性能★★★★★★★★★★★★
视频★★★★☆+





2011年MID主控展望——后A8时代与2011年MID主控展望——后A8时代与A9的到来处理器
前言:
有部分网友让我更新下前篇内容,考虑到新一代处理器出来的也够多了,是该更新一下。不过新处理器的规格好多都没有公布,因此不少内容也只能凭借个人的推测写写,仅供参考了。
欢迎讨论,有错误请指正,谢谢各位

1.一些背景介绍

1.1 ARM核心
ARM核心是主控SOC中的重要部分,系统的日常应用都由ARM核心来完成,因此ARM核心的效能很大程度上跟用户体验有关。ARM公司一般用DMIPS/MHz来标称ARM核心的性能。DMIPS是Dhrystone Million Instructions executed Per Second的缩写,反映核心的整数计算能力。但Dhrystone算法代码本身比较叫,可以完全放到Cache中执行,因此反映的只是核心能力,并不能反映缓存、内存I/O性能。

能支持智能系统的ARM核心有以下几类:


ARM9:指令集ARMv5,5级流水线,1.1DMIPS/MHz
ARM10E:指令集ARMv5,intel获得授权后发展的,如PXA270,PXA210系列,6/7级流水线,1.35DMIPS/MHz
ARM11:指令集ARMv6,8级流水线,1.25DMIPS/MHz

Cortex-A8:指令集ARMv7-A,13级整数流水线,超标量双发射,2.0DMIPS/MHz,标配Neon,不支持多核
Scorpion:指令集ARMv7-A,高通获得指令集授权后在A8的基础上设计的。13级整数流水线,超标量双发射,部分乱序执行,2.1DMIPS/MHz,标配Neon,支持多核
Cortex-A9:指令集ARMv7-A,8级整数流水线,超标量双发射,乱序执行,2.5DMIPS/MHz,可选配Neon/VFPv3,支持多核
Cortex-A5:指令集ARMv7-A,8级整数流水线,1.57DMIPS/MHz,可选配Neon/VFPv3,支持多核

Cortex-A15:指令集ARMv7-A,超标量,乱序执行,可选配Neon/VFPv4,支持多核

× 目前只有指令集ARMv7-A的核心才能在Android2.2上支持Adobe Flash。
× Neon是什么?Neon是ARM核心附带的浮点SIMD引擎,可以把它当一个DSP用,可以把它理解为桌面CPU上的SSE,SSE2。合理的利用可以增强处理器在游戏、多媒体中的表现,当然需要软件支持。标准的Neon宽度是64bit。A9的Neon相对A8略有升级。
如果不使用Neon,就只能有CPU自带的VFP进行浮点运算。标准A8的VFP没有管线化,速度是比较低的。A9的VFP管线化后,效能有明显提升,但还是不如Neon。

× 超标量:A8 A9 A15都是超标量结构,他们具有两条流水线,一个周期可以发射最多两条指令进行执行。因此同频效能比ARM9 ARM11等高的多。

× Cortex-A5是Cortex-A家族中的小弟,功耗较低,单位功耗的效能很高,用于代替ARM9和ARM11占据低端市场。
Cortex-A15是最新发布的,作为高端产品出现,目前资料不多。

× Scropion是高通根据Cortex-A8修改的。关键的特点是同频下比A8节能30%,或者同功耗的频率高25%。
Scorpion具有部分A9的特性,如乱序执行,管线化的VFP,支持多核。此外,Scorpion的Neon SIMD引擎(高通称之为VeNum)宽度为128bit,是A8和A9的两倍,能提供更强劲的浮点运算支持,并且在不需要的时候可以关闭一半变成64bit以节省能源。总体上,Scorpion是具有部分A9特性的A8,高频率节能浮点加强版。


1.2 工艺与频率、功耗
这三者是密切相关的,当然频率与SOC的后端设计也有很大关系。
根据参考文献,45nm工艺可以比65nm节省30%的能耗。
45nm Scorpion在1.0GHz、1.2GHz和1.5GHz下的典型功耗是350mW、420mW和650mW,其中1.5GHz下已经需要加压,功耗上升更多。根据以上信息我们可以推测出

Cortex-A8虽然性能强劲,但不是省油的灯。于是新一代mid主控在45nm、55nm下动辄1.2GHz的主频,能耗有点让人担心。
当然,如果采用的GP工艺,可能会好些。同样制程的工艺,可以分为LP和GP。
LP是Low Power,降低漏电,使得芯片在闲置状态下的能耗最低。
GP是General Purpose,可以在相同的满载能耗下达到比LP更高的频率,但是闲置状态下功耗高。

国际大厂用于手机的SOC一般都采用LP工艺,以降低待机功耗,毕竟手机大部分时间都在待机。



1.3 视频的“硬解”与“软解”
在Android下,个人认为硬解就是通过芯片自带的加速器进行解码,无论用的是DSP还是硬布线的解码器。
软解就是通过软件使用ARM核心进行解码,ARM作为一个通用核心做视频解码,自然效能不会太高,并且依赖软件的算法,一般普遍使用的就是FFMPEG对ARM进行优化,调用neon等。

不过就我个人的使用经验而言,1GHz的Cortex-A8处理器,使用rockplayer,vplayer等基于FFMPEG的软件解码,只能勉强解码480p的视频。对于848×480,24分钟100M左右的RMVB视频,大部分时间都无法达到满帧,在遇到高码率的动态场景时,帧数降到个位数,会有很明显的卡顿掉帧。
在Tegra 2的A9平台上表现稍好,仍不能满帧。估计是播放软件无法完全利用2个核心,如果两个核心充分利用,解决480p RMVB应该没有问题。

总体而言,1GHz A8处理器软解RMVB基本是RK27 MP4的水平。如果你的眼睛比较挑剔,就要注意了。一些A8软解720p RMVB流畅的说法,基本都是不实际的。


1.4 3D性能与内存带宽
待补充

yghaoua 发表于 2011-1-23 17:24

太长了,
不读只顶。

arexiang 发表于 2011-1-23 18:27

学习了,对各类核心有了系统的认识。

yanjie 发表于 2011-1-25 10:52

留个脚印。。。

longwayhome 发表于 2011-1-25 16:30

好帖

athlonxing 发表于 2011-1-25 16:33

专业,太长了,留个脚印。

lcd 发表于 2011-1-26 14:40

学习了。

不过看了半天 也不知道那个性价比好些

kar 发表于 2011-2-16 02:37

NVidia Tegra2
看好此U
如果价格能下来一定能火!

272985201 发表于 2011-5-12 02:32

4核明年就出来
页: [1]
查看完整版本: 【转帖】2011年MID主控展望——后A8时代与A9的到来处理器(前篇ARM知识1-15更新)