2011年MID主控展望——后A8时代与A9的到来

青争2013 · 发表于 2011-2-14 16:10

马上注册家电论坛，众多有奖活动等你来参与！

您需要登录才可以下载或查看，没有账号？注册

x

本文部分图片来自网络
部分图片和资料参考
http://www.anandtech.com/print/4098
http://www.qualcomm.com/document ... core-snapdragon.pdf
前篇
http://bbs.imp3.net/therad-894970-1-1.html
前言：
有部分网友让我更新下前篇内容，考虑到新一代处理器出来的也够多了，是该更新一下。不过新处理器的规格好多都没有公布，因此不少内容也只能凭借个人的推测写写，仅供参考了。
欢迎讨论，有错误请指正，谢谢各位

1.一些背景介绍
1.1 ARM核心
ARM核心是主控SOC中的重要部分，系统的日常应用都由ARM核心来完成，因此ARM核心的效能很大程度上跟用户体验有关。ARM公司一般用DMIPS/MHz来标称ARM核心的性能。DMIPS是Dhrystone Million Instructions exec uted Per Second的缩写，反映核心的整数计算能力。但Dhrystone算法代码本身比较叫，可以完全放到Cache中执行，因此反映的只是核心能力，并不能反映缓存、内存I/O性能。
能支持智能系统的ARM核心有以下几类：

ARM9：指令集ARMv5，5级流水线，1.1DMIPS/MHz
ARM10E：指令集ARMv5，intel获得授权后发展的，如PXA270，PXA210系列，6/7级流水线，1.35DMIPS/MHz
ARM11：指令集ARMv6，8级流水线，1.25DMIPS/MHz
Cortex-A8：指令集ARMv7-A，13级整数流水线，超标量双发射，2.0DMIPS/MHz，标配Neon，不支持多核
Scorpion：指令集ARMv7-A，高通获得指令集授权后在A8的基础上设计的。13级整数流水线，超标量双发射，部分乱序执行，2.1DMIPS/MHz，标配Neon，支持多核
Cortex-A9：指令集ARMv7-A，8级整数流水线，超标量双发射，乱序执行，2.5DMIPS/MHz，可选配Neon/VFPv3，支持多核
Cortex-A5：指令集ARMv7-A，8级整数流水线，1.57DMIPS/MHz，可选配Neon/VFPv3，支持多核
Cortex-A15：指令集ARMv7-A，超标量，乱序执行，可选配Neon/VFPv4，支持多核
× 目前只有指令集ARMv7-A的核心才能在Android2.2上支持Adobe Flash。
× Neon是什么？Neon是ARM核心附带的浮点SIMD引擎，可以把它当一个DSP用，可以把它理解为桌面CPU上的SSE，SSE2。合理的利用可以增强处理器在游戏、多媒体中的表现，当然需要软件支持。标准的Neon宽度是64bit。A9的Neon相对A8略有升级。
如果不使用Neon，就只能有CPU自带的VFP进行浮点运算。标准A8的VFP没有管线化，速度是比较低的。A9的VFP管线化后，效能有明显提升，但还是不如Neon。

× 超标量：A8 A9 A15都是超标量结构，他们具有两条流水线，一个周期可以发射最多两条指令进行执行。因此同频效能比ARM9 ARM11等高的多。
× Cortex-A5是Cortex-A家族中的小弟，功耗较低，单位功耗的效能很高，用于代替ARM9和ARM11占据低端市场。
Cortex-A15是最新发布的，作为高端产品出现，目前资料不多。
× Scropion是高通根据Cortex-A8修改的。关键的特点是同频下比A8节能30%，或者同功耗的频率高25%。
Scorpion具有部分A9的特性，如乱序执行，管线化的VFP，支持多核。此外，Scorpion的Neon SIMD引擎（高通称之为VeNum）宽度为128bit，是A8和A9的两倍，能提供更强劲的浮点运算支持，并且在不需要的时候可以关闭一半变成64bit以节省能源。总体上，Scorpion是具有部分A9特性的A8，高频率节能浮点加强版。

1.2 工艺与频率、功耗
这三者是密切相关的，当然频率与SOC的后端设计也有很大关系。
根据参考文献，45nm工艺可以比65nm节省30%的能耗。
45nm Scorpion在1.0GHz、1.2GHz和1.5GHz下的典型功耗是350mW、420mW和650mW，其中1.5GHz下已经需要加压，功耗上升更多。根据以上信息我们可以推测出

Cortex-A8虽然性能强劲，但不是省油的灯。于是新一代mid主控在45nm、55nm下动辄1.2GHz的主频，能耗有点让人担心。
当然，如果采用的GP工艺，可能会好些。同样制程的工艺，可以分为LP和GP。
LP是Low Power，降低漏电，使得芯片在闲置状态下的能耗最低。
GP是General Purpose，可以在相同的满载能耗下达到比LP更高的频率，但是闲置状态下功耗高。
国际大厂用于手机的SOC一般都采用LP工艺，以降低待机功耗，毕竟手机大部分时间都在待机。

1.3 视频的“硬解”与“软解”
在Android下，个人认为硬解就是通过芯片自带的加速器进行解码，无论用的是DSP还是硬布线的解码器。
软解就是通过软件使用ARM核心进行解码，ARM作为一个通用核心做视频解码，自然效能不会太高，并且依赖软件的算法，一般普遍使用的就是FFMPEG对ARM进行优化，调用neon等。
不过就我个人的使用经验而言，1GHz的Cortex-A8处理器，使用rockplayer，vplayer等基于FFMPEG的软件解码，只能勉强解码480p的视频。对于848×480，24分钟100M左右的RMVB视频，大部分时间都无法达到满帧，在遇到高码率的动态场景时，帧数降到个位数，会有很明显的卡顿掉帧。
在Tegra 2的A9平台上表现稍好，仍不能满帧。估计是播放软件无法完全利用2个核心，如果两个核心充分利用，解决480p RMVB应该没有问题。
总体而言，1GHz A8处理器软解RMVB基本是RK27 MP4的水平。如果你的眼睛比较挑剔，就要注意了。一些A8软解720p RMVB流畅的说法，基本都是不实际的。

1.4 3D性能与内存带宽

2. 新一代主控简介
更新：2011/02/11
==========ARM11========================
VIA WM8650
猜测为65nm工艺
ARM11 600MHz，300MHz DSP，支持720p硬件解码
256M DDR2，位宽未知
GPU未知
VIA的新一代芯片，WM8505的升级版。ARM核心从ARM9 300/400MHz升级到ARM11 600MHz，并且能进一步提升到800MHz，性能基本达到RK2818和TCC8902的水平。视频能力从基本没有提升到720p硬件解码，虽然相对TCC的1080p解码有差距，但也达到了RK28的水平。
软件方面，终于提供了Android 2.1的支持，相比上一代的WM8505只能支持Android 1.6有了进步。但是在A8/A9主控搭载Android 2.2/2.3逐渐普及的趋势下，这款方案又将过时，只能作为低端入门的选择。据报道，售价将在550元以下。
==========Cortex-A8========================
Freescale i.MX515

65nm工艺，其中ARM核心为GP工艺，视频解码部分为LP工艺
Cortex-A8 800MHz， 256K L2 Cache
512M DDR2，32bit
视频子系统：硬解
多格式，H.264，VC-1,MPEG4，RV最高720p（大部分开发商都没做RV的硬解支持），实测可播放部分1080p视频
GPU： Adreno 200（AMD Z430)
三角形生产率：27M
像素填充率：166M

当然，i.MX515不算什么新芯片了，鉴于其产品上市不久，就一起说说吧。国内的515产品基本都是山寨产品，似乎缺乏原厂支持，开发都靠山寨开发商。于是就有固件保密啊之类的新闻，一旦山寨开发商转向RK2908，后续支持也让人担心。GPU性能虽然很一般，但与高通手机芯片的GPU一致，软件支持度不错，但由于山寨平板采用了800*600的分辨率，这方面可能存在一定的兼容性问题，此外游戏中重力感应等也需要一定的调试。视频能力除了缺少RV硬解，其他够用。Android 2.2系统配合A8核心在网络浏览和Flash支持上都问题不大。但目前山寨产品的续航还存在问题，使用和待机时间较短。此外软件上的bug也不少。
随着新一代的S5PV210，RK2908和TCC8803上市，此方案的产品将进一步进入千元以内，成为最低价的A8产品。

Rockchip RK2908

55nm工艺，猜测为GP
Cortex-A8 1GHz/1.2GHz， 512K L2 Cache
512M DDR2/DDR3，猜测为32bit
视频子系统：硬解，猜测为Ceva MM3000
多格式，H.264，VC-1,MPEG4，RV，AVS，VP8最高1080p
GPU： Vivante GC800（有待确认）
三角形生产率：最高60M
像素填充率：未知，推测600M
最近红红火火的RK29，瑞芯微没少打广告，大有秒杀高通苹果之势。瑞芯微宣传的亮点，就是高主频A8核心，1080p以及WebM视频支持以及高性能的GPU。总体来说，芯片规格还是很不错的。
自然，凭借1.2GHz的高主频，得分比1GHz的产品高是正常的。不过呢，在三星、TI等厂家使用45nm工艺制作的芯片，标称频率普遍为1GHz的情况下，RK的55nm芯片能标称1.2GHz，想必是用了GP工艺才能到如此高的频率，尽管如此，相信功耗的代价同样也不小。好在RK29是主攻MID市场的，MID不像手机有大量的时间在待机，牺牲点待机功耗也问题不大。只是如果上市芯片个个加压跑1.2GHz，我想功耗方面有所牺牲，对于55nm的RK29来说，1GHz还是比较合适的频率吧。
RK29支持VP8 WebM。能支持这个编码的视频模块，一是google自家的on2的视频解码硬核，另一家是Ceva的MM3000。考虑到RK29还标称支持AVS，那么只剩下Ceva MM3000了。想起RK28用的Ceva MM2000，这次继续用Ceva的视频解码可能性也是挺大的。
之前的消息是，RK29的3D部分使用了Vivante的GC800.GC800是盈方微IMAPX200系列使用的GC600的更高阶版本，在40nm GP工艺下可以达到575MHz的工作频率，提供57M的三角形生成率和575M的像素填充率。只是RK29使用的55nm工艺是否能让GC800运行在如此高的频率？抑或是使用了更高阶的GC1000？或者最高60M仅仅是GC800的“最高”？这些我们都不知道，等真正的产品上市。
RK29可谓是对RK28的一次全面升级，从ARM核心上，视频解码上和3D加速上。但是RK29的真正对手不是三星之类的，恐怕是后面的TCC8803.RK在Android系统软件方面的积累是有目共睹的，相信凭借软件开发实力，联合众多厂商能在下一轮产品的市场中占据大头。

Telechips TCC8803

45nm工艺
Cortex-A8 1GHz/1.2GHz
512M DDR2/DDR3，32bit
视频子系统：硬解，猜测为ARM Mali-VE6
多格式，H.264，VC-1,MPEG4，RV最高1080p
GPU：已知主频320MHz，猜测为Mali-400
三角形生产率：未知，推测为30M
像素填充率：未知

TCC8803是TCC89xx系列的升级版。采用的ARM核心升级到Cortex-A8，主频1GHz，45nm工艺。由于Telechips跟ARM关系不一般（TCC89xx开发板貌似就是ARM Mali的参考板），猜测TCC88xx中会继续使用ARM提供的图形核和视频模块。
因此，很可能继续使用与TCC89xx相同的Mali-VE6，提供优秀的全高清解码支持。唯一的消息是解码能力提升到了1080p 50fps，大概得益于频率的提升吧。
GPU部分，唯一的消息是主频320MHz。由于Mali-T604发布没多久，采用的可能性较小，很可能是Mali-400 MP，三角形生成率30M，像素填充率为275M乘以片段引擎个数（1-4个）。不过320MHz对于45nm来说频率并不高。
传言山寨供应商将把TCC8803拉到很低的价格，Telechips原厂也来势汹汹，激烈的竞争不可避免。不过原厂毕竟远在韩国，不知道这次的支持度如何，还是又得靠山寨开发商撑起天下？

Samsung S5PC110/S5PV210

45nm工艺，LP
Cortex-A8 1GHz，512K L2 Cache
512M DDR2，64bit，或者32bit DDR2 + 32bit oneDRAM
视频子系统：硬解，PowerVR VXD370
多格式，H.264，VC-1,MPEG4最高1080p
GPU：PowerVR SGX540
三角形生产率：90M
像素填充率：1000M
代表产品：三星Galaxy Tab，魅族m9
上一篇文章已经介绍过，已经量产芯片中的最强A8，同时配置的GPU SGX540极其强悍，唯一能与之匹敌的就是nVIDIA Tegra 2的GPU了，而软件支持度上SGX系列更有优势。总体来说是一颗全面且强悍的芯片。
目前山寨产品已经上市，有些零碎的消息，也有些争议，具体表现还有待确认。只是山寨方案商的软件总是有那么点让人不放心。
而Galaxy Tab定价较高，等待普及版的出现，以及小尺寸的Galaxy Player。试玩Tab后整体很流畅，但部分细节还有待三星进一步优化。

TI OMAP3620/30/40

45nm工艺， LP
Cortex-A8 800MHz/1GHz，256K L2 Cache
RAM: 256/512M mDDR2，32bit
视频子系统：IVA2+,基于C64x+ DSP，430MHz
多格式，但除去爱可视，很多厂商都没做解码
MPEG4可达720p，其余格式在480p水平
3620只带IVA2，解码能力更低，最高480p
GPU：PowerVR SGX530
三角形生产率：14M
像素填充率：280M
代表产品：爱可视43 70 101，moto的droidX droid2手机，B&N nook color
基本就是OMAP3430的45nm版本，规格看来比较一般。不过采用此产品的厂商软件开发都做的不错，重点说说爱可视70，虽然RAM只有256M，实际使用流畅度挺高，视频部分480p解码也基本够用，但是RMVB分辨率被限制在720*576实在令人苦恼。总体来说，此方案的产品完善度都不错，基本上都是正规大厂产品，使用上可以放心，但价格都不低。

ZiiLABS ZMS-08

45nm工艺， LP
Cortex-A8 1GHz，256K L2 Cache
RAM: 512M DDR2，32/64bit
视频子系统：基于干细胞计算阵列，多格式1080p

GPU：基于干细胞计算阵列
三角形生产率：未知
像素填充率：1000M
代表产品：创新ziio 7 10

创新搞的玩意，前一代是ZMS-05，除了自家开发用的蛋蛋，没啥产品出现。
A8 1GHz，没有独立的视频处理、图像处理、音频和GPU模块，全部通过48个SIMD阵列的编程实现。可编程的阵列具有很强的计算能力，通过软件实现各种功能，并且很容易实现升级。目前只有些测试分数，qudrant的得分还是相当高的，产品尚未上市。
===============Scorpion==============
Qualcomm MSM8255

45nm工艺，LP
Scorpion 1GHz，256K L2 Cache
512M DDR2，64bit
视频子系统：硬解多格式，720p
GPU：Adreno 205
三角形生产率：41M
像素填充率：245M
代表产品：HTC desire HD（手机）
虽然这是款手机芯片，也拿过来一起说说。高通的新款芯片，45nm工艺频率不变，相对能耗更低些。主要的特点是内存位宽增加到64bit，配合升级的GPU，3D图形性能有了很大进步，已上市芯片中仅次于三星Hummingbird（S5PC110）和Tegra2，在一些测试中还能接近三星S5PC110。
==============Cortex-A9====================
AMLogic AML8726-M

65nm LP工艺，中芯国际
Cortex-A9 800MHz，128K L2 Cache，Neon
512M DDR2，32bit
视频子系统：硬解多格式，MPEG4，VC-1，H.264，RV等，最高1080p
GPU：ARM Mali-400
三角形生产率：25M
像素填充率：250M
代表产品：蓝魔W10
即将上市的一款产品，其产品的工程机已经频频亮相，也有部分媒体的评测已经放出。
使用65nm工艺的单核Cortex-A9，属于Cortex-A9中的中端配置，考虑到A9核心2.5DMIPS/MHz的性能，相比Cortex-A8核心2.0DMIPS/MHz，这颗A9理论上具有和1GHz A8类似的性能。虽然L2缓存较小，但在实际使用中，个人感觉不出影响，流畅度令人满意，达到市面上高端A8的水平。
视频部分为AMLogic自家的硬解模块。AML的MP4产品性能大家有目共睹，实际使用发现视频性能也相当强悍，支持格式丰富，同时应付高码率的蓝光原碟也毫无压力。
AMLogic还为之配备了独立的音频DSP模块，可以降低音频解码时ARM核心的负担，实测7.1声道的蓝光LPCM也能流畅解码。
此外，该芯片还集成了GPS基带，支持SATA接口，在高清机方面也可以应用。
GPU部分为ARM的Mali-400，但似乎只配置了一个片段引擎，故像素填充率为250M，相比Snapdragon一代和OMAP3系列还是要高的，但跟三星Hummingbird等高端主控还是有差距。
W10上市价为1199，目前看来此方案售价不会太高，赶在RK29和TCC8803之前上市，凭借芯片原厂的优化，也将会是山寨i.MX515和山寨S5PV210的有力对手。

nVIDIA Tegra 2 250

40nm工艺，LP
双核Cortex-A9 1GHz，1MB L2 Cache，无Neon
512M/1G DDR2，32bit
视频子系统：硬解多格式，MPEG4，VC-1，H.264等，最高1080p
但对H.264的支持并不完善

GPU：GeForce ULV
三角形生产率：90M
像素填充率：1200M
代表产品：东芝AS100 万利达zpad moto XOOM
目前唯一量产并且产品大量上市的双核A9处理器，先进的40nm工艺。A9双核性能确实强悍，实际使用表现也相当出色。
GPU部分，根据nVIDIA在CES上的展示（http://www.anandtech.com/show/40 ... s-and-design-wins/1），规格相对Tegra1基本上翻倍了。采用了4个pixel shader和4个vertex shader，NV称之为8核，实际要说只能算4核吧……

图形核心内部增加了大量的缓存，其中包括一些新一代桌面GPU才有的技术，例如像素缓存，这是nVIDIA在Fermi（GF100)才引入的配置。

此外，Tegra 2的GPU具有更高的可编程性，不仅可以实现OPEGL，也可以实现Adobe Flash的一些渲染，用于加速Flash。大概这就是Tegra 2设备需要使用特别的Flash插件的原因吧。

NV自己的测试显示Tegra 2的GPU有明显优势。不过普遍认为实际表现中，Tegra 2的GPU比SGX540快那么一点点。总的来说，Tegra 2的GPU和SGX540依旧是目前市面上最快的GPU。虽然目前软件支持上，Tegra 2还不如SGX系列，但随着nVIDIA的努力推广和厂商、Google的认同，Tegra 2的GPU前景还是挺不错的。
[img] [url=http://bbsimg.pcpop.com/UpLoadImages/2011/2/14/0x0/733d24b6-295b-4cb8-a000-de89b48532f9.jpg[/img]http://bbsimg.pcpop.com/UpLoadImages/2011/2/14/0x0/733d24b6-295b-4cb8-a000-de89b48532f9.jpg[/img[/url]]

一个令人遗憾的地方是，Tegra 2仅仅具有32bit位宽的DDR2控制器，相比之下，它的竞争对手都搭配了64bit（双32bit）的DDR2控制器。但是NV声称他们擅长设计GPU，即使在较低的内存带宽下也能很好的发挥性能。NV不采用双通道设计的原因是为了保持省电。
Tegra 2采用具有桌面特性的GPU的另一个好处是可以具有完全的Flash加速，这点在刚才已经提过了。

视频部分，规格上VC-1，MPEG4等都是支持的挺好的，但是H.264的支持比较一般，虽说是1080p，但是规格有很大限制。
Tegra 2 can cope with numerous standards. First of them is H.264 with sub standards Baseline Profile (B frames) — 1080p/20Mbps, Main Profile (B Frames, CAVLC) — 1080p, Main Profile (B Frames, CABAC, no weighted prediction) — 720p/6Mbps and High Profile (B Frames, CABAC, no weighted prediction).
Tegra 2 also supports High Profile (B Frames, CABAC, no weighted prediction), MPEG-4 (Simple, B frames and ASP Profiles) — 1080p/8Mbps, H.263 (Profile 0) — 720×576/4Mbps, DiVX (DiVX 4/5) — 1080p/8Mbps, XviD (XviD Home Theater) — 1080p/8Mbps, MPEG-2 (Main Profile @ Main Level) — 720×576/10Mbps, VP6 (simple and advanced profile) — 720p30/2Mbps, Sorenson (simple and advanced profile) — 720×576/4Mbps, JPEG up to 80 Mpixel per second.

总结下，H.264就是
Baseline Profile (B frames) — 1080p                   /20Mbps,
Main Profile (B Frames, CAVLC) — 1080p
Main Profile (B Frames, CABAC, no weighted prediction) — 720p       /6Mbps
High Profile (B Frames, CABAC, no weighted prediction）分辨率和码率未知
但实际测试，800×600的H.264 HP，硬解还是有所掉帧，848×480的能基本流畅。
因此，Tegra2看常见720p MKV BDrip基本是不太可能的了，实测掉帧明显。
配备了A9双核，理论上软解视频也有优势，但是目前尚未有一款
软解播放器可以很好的利用Tegra 2 的双核，相信如果双核性能得以发挥，软解通吃480p视频（包括RMVB）应该问题不大。
音频部分使用了硬件解码，支持AAC-LC, AAC+, eAAC+,  AMR-WB,AMR-NB, WMA7, WMA8, WMA9, and WMA10,  MP3, PCM/WAV and SBC. Tegra 2 encodes AAC-LC,  AMR-WB, AMR-NB,  PCM/WAV and SBC
Tegra2集成了大量专有的处理单元，因此NV省去了A9的多媒体浮点加速的Neon协处理器，使用了VFPv3浮点单元。
总的来说，Tegra 2抢占了上市的先机，量产出货领先其他芯片商至少半年，得到了厂商和Google的支持，因此优势还是比较明显的。
TI OMAP4430/4440

45nm工艺，LP
双核Cortex-A9 1GHz，1MB L2 Cache，Neon
DDR3，64bit
视频子系统：硬解多格式，MPEG4，VC-1，H.264等，最高1080p
附带精简的C64x+ DSP用于新格式的解码

GPU：PowerVR SGX540
三角形生产率：90M
像素填充率：1000M
代表产品：黑莓playbook
参数看来，在我心中是一款比较完美的A9产品，同样强悍的双核A9 1GHz，64bit DDR3高带宽有助于图形性能的进一步提升。
1080p硬件解码单元，同时和Tegra2一样搭配了专用音频处理单元。此外，TI继续保留了Neon单元用于浮点加速。视频解码已经不需要C64x+ DSP参与，但TI还是将它适当精简后保留了下来，利用它的可编程性加速一些固化硬件单元不能处理的应用。
此外，TI同样配置了2个Cortex-M3处理器，用于整个SOC的任务调度和功耗管理。可以说，这是一款非常值得期待的产品，但是距离上市恐怕还有相当的时日。
Samsung Orion

32nm工艺，LP
双核Cortex-A9 1GHz，1MB L2 Cache，Neon
DDR3，64bit
视频子系统：未知，1080p
GPU：ARM Mali-400 MP
三角形生产率：30M
像素填充率：1100M
三星的新芯片，32nm工艺，强悍的A9双核。不过这款产品更像是向ARM示好的样品，三星没有使用S5PC110中的强大的SGX540 GPU，而是使用了ARM的Mali，相比之下三角形生成率并不如前者。目前也处于样片阶段，离产品上市还有很长一段时间。
因为这款产品的GPU在A9级别中相对平庸，猜测三星不会放着强悍的SGX系列不用，有可能会推出不止一款A9芯片。
1
评分人数

ak47hcooh: You rock !~~~金币 + 5 个

我想劫个色 · 发表于 2011-2-15 21:59

这个文章转了不少地方了 A8 A9的机器还没看到几个

[MP3] 2011年MID主控展望——后A8时代与A9的到来

马上注册家电论坛，众多有奖活动等你来参与！

论坛禁止先款交易推荐论坛中介

绝大多数被骗都是因为先款

英式花园之香氛旅行

特价商品每日更新

查看今日新帖

浏览过的版块

[MP3] 2011年MID主控展望——后A8时代与A9的到来

马上注册 家电论坛，众多有奖活动等你来参与！

论坛禁止先款交易 推荐论坛中介

绝大多数被骗都是因为先款

英式花园之香氛旅行

特价商品每日更新

查看今日新帖

浏览过的版块

马上注册家电论坛，众多有奖活动等你来参与！

论坛禁止先款交易推荐论坛中介