守望雷亚 发表于 2022-2-18 13:01

【转帖】【科普】intel 10代酷睿移动版性能测试-4c/6c/核显等详评

本帖最后由 守望雷亚 于 2022-2-18 13:36 编辑

结合【科普】美丽的谎言——8代Intel低压4核性能测试,【科普】8代低压4核CPU性能探索和intel 10代酷睿移动版性能测试以及intel 11代酷睿移动版性能测试(Tigerlake-U)观赏最佳
让您对八代、十代、十一代的低压四核酷睿的性能和表现有一个系统且直观的理解

笔记本这两年处理器进步飞跃,随着Ryzen架构的到来,这个市场也终于变得活跃了起来。不过本次文章系列不是介绍AMD的,而是一个5位数命名的新产品:intel Cometlake-U和intel Icelake-U本次点评将分为三篇,前两篇讲4核/6核的Cometlake,最后一篇讲Icelake【0】前言说实话这两年intel在笔记本上蛮拼的,一下子挤出来了太多牙膏,8代U一来就直接强上了4核低压(KabyLake Refesh-U),等了一年又更新到Whiskeylake,然而名字上还叫8代,这一次低压U平台直接跨越了9代,起名5位数。https://pic1.zhimg.com/80/v2-c714b66c296ebefaf2e7de08f4c8dc60_720w.jpghttps://pic3.zhimg.com/80/v2-9d33c8af9979f128b40d4bfee6134772_720w.jpg这次新上市的10代U总体分两部分,Cometlake-U/Y和Icelake-U/Y,命名上带有“G”是后者,纯数字的是前者,两者架构和工艺均不同,前者是一脉相承的Skylake内核+14nm,后者是全新的Sunny Cove内核+10nm,不可以一并而论。既然是老的内核,单核效率就没啥可期待的了,整体不会有本质改变,新系列拼的应该是硬规格(核心数/缓存容量/频率),以及能耗比。
处理器的性能,不只是硬规格和内核效率决定的,对于笔记本平台来说,近年来随着intel愈发疯狂的提频堆规格,功耗配置已然成为了限制性能的最大因素这是一篇探索8代4核低压CPU性能潜力的文章,不同的功耗配置会让同一款CPU展现出完全不同的性能表现。因此,这次的点评,不再是拘泥于简单的测试,而是探索一些更本质的东西,让大家对性能的理解更深刻一点。另外,本次的性能点评是基于不限制功耗以及忽略机器散热瓶颈的结果,偏向于理论,如果消费者想要套在实际的机型上,需要对比折算损失。
【1】参数介绍下图是intel官网4核CometLake-U与Whiskeylake-U的对比https://pic1.zhimg.com/80/v2-c290925d22319c82190f6c4f1f11f274_720w.jpg可以看到,与上一代低压U相比,新的CometLake 4核变化并不明显,默频都是对应相等的,最大频率对应增加0.3GHz,内存增加到2666MHz,其他部分(PCH/核显)都是持平的,没有提升。实际上,目前的CometLake只是V1版本,官方宣传支持LPDDR4/4x的是V2版本,以后才能看到;新的PCH支持新的雷电3以及AX网卡;还有一些琐碎的东西,确实本质提升的不多。
下面看看实际参数截图(i7的忘了截图)https://pic2.zhimg.com/80/v2-284162ae39445bf98316c4787cbb0e75_720w.jpg内核代号(Kaby Lake-U/Y)暴露了本质https://pic2.zhimg.com/80/v2-be299ad4e65be2026eea23ee7475f3a1_720w.jpg用的是QS版测的,QDF是QSBG,i710510U的QDF是QSBF,Codename也表明了这是V1版本的CometlakeCometlake
https://pic3.zhimg.com/80/v2-2436423cf7842004f65dea651b6f4152_720w.jpg10210U的睿频是42x/41x/39x/39x,10510U是49x/48x/43x/43x,i7版的单双核频率很激进。至于PL1/PL2设定,这个取决于机器实际供电/散热设计决定,TDP默认15W,可up至25W,用DPTF可以更高,图中这种是比较极端的设定了。这里插一句,自从四核的8250U/8550U来了以后,各家OEM已经不再是按照intel默认的方案了,原来双核的基本都是15W/25W(PL1/PL2),8550U是15W/44W,8565U是15W/51W。更大的功耗意味着更强的性能,但也要量力而行。
【2】性能探索先放10210U的满频R15/R20测试结果https://pic4.zhimg.com/80/v2-14364bd09457fbe2c379b498c5d18f6f_720w.jpghttps://pic3.zhimg.com/80/v2-a35d8700a586e0b9f8f643f7afb5fb82_720w.jpg作为对比,9300H的跑分如下https://pic3.zhimg.com/80/v2-c83960f2c0c7daf253e5aec9784b4066_720w.jpghttps://pic3.zhimg.com/80/v2-2ece7a8a83c00faf97d38556cb3e36ca_720w.jpg9300H全核4.0GHz,换算成3.9GHz的话就是836/2048左右,这意味着10210U与8300H的性能是几乎等同的(在功耗散热不受限的前提下)前文讲到,新的Cometlake并没有换内核,同频下基本上没有什么变化是意料之中的所以,直接比较性能可能不那么直观,下面改为定频放开功耗限制来看新一代CPU的功耗与之前平台的对比
每个频率下功耗实际是这样的:https://pic3.zhimg.com/80/v2-8f8c4e036ebd33b81129e4a50a039002_720w.jpg将每个频率段的平均功耗和跑分汇总:https://pic4.zhimg.com/80/v2-73adaef6751aca6acd3243838d20a5ab_720w.jpgPS:CPU代指Package Power,IA就是IA Power,两者区别是前者包括了GT(核显)Uncore(非核心功耗,比如缓存和内存控制器),单核效率就是跑分除以频率,能耗比是跑分除以功耗可以看到,随着频率上升,跑分也是等比提升的,但效率会稍微差一点,而能耗比降的就很多了,说明高频需要的功耗会越来越大,高频高性能是有代价的。
单看Cometlake可能没啥感觉,咱们比比同频下,老平台是啥表现:(CFL-H就是i5-8300H,WHL-U就是i7-8565U,第二张曲线图是以WhiskeyLake-U与CometLake-U的功耗为基准,看CoffeeLake-H的功耗增加的幅度是多少)https://pic1.zhimg.com/80/v2-ceae0bb35af53518b880a87ddb061e08_720w.jpghttps://pic3.zhimg.com/80/v2-b5d045a51ec6bf67f6d2cf4d25359156_720w.jpg不比不知道,虽然同频下Cometlake没提升,但同频率下的功耗是实打实的降低了很多!在3.9GHz这样的高频下,8300H的功耗比10210U甚至高出了38%!而WhiskeyLake对比之下就知道,低压U能耗比和同时代的标压U相比,也只是低了5-8%功耗而已!(二)—— CometLake-U 6核
新一代CometLake-U 4核版本在能耗比方面有了巨大进步,但intel并没有止步于此,Cometlake-U还有一款更让人期待的型号,它就是本篇文章的主角,i7-10710U,第一个低压6核的型号。它的性能会像期待的那样好么?
【1】参数介绍先看看官网的参数,与4核版本以及上一代标压6核的对比:https://pic2.zhimg.com/80/v2-0a0e04f6a7c1ade14df3cee6894c070d_720w.jpg虽然10710U除了核心数增加到6核以外,其他特性上并没有什么特殊的地方,但价格相比4核版的10510U也只是贵了34刀而已,是相当有性价比啊低压6核的真容是这样的:https://pic4.zhimg.com/80/v2-72419a25949b48c0a37125d1717ca123_720w.jpg而4核的10510U张这样:https://pic3.zhimg.com/80/v2-ec12f3c3129deb2fe0c12cfab9363296_720w.jpg看得出来,6核的die变长了一些,原先能印3行的字符缩减成了2行,整体封装大小没有变,也就是说pin脚是兼容的。不同的die意味着它是一个相对全新的处理器系列,于是参数识别软件就成了这样:https://pic3.zhimg.com/80/v2-5ce9d04dc09412353b5aa5018825d7da_720w.jpg除了名字,核心代号插槽工艺TDP啥的全都显示不出来,总线速度也是错的,也就缓存和核心能准确读取出来了……https://pic2.zhimg.com/80/v2-f57b06ed566642436f5ca807750d10a5_720w.jpg用HWINFO打开,这个似乎影响不是很大,QS版的10710U QDF码为QT85也识别准确了。codename一栏表明10710U仍然是V1版本的Cometlake,同样也不支持AVX512指令集。AIDA64也阵亡了,PL1/PL2以及turbo ratio设定都读不出来,只能在BIOS里读取有用信息了https://pic3.zhimg.com/80/v2-38b0f478f5c40d4fae6f05784904a22a_720w.jpg(这是解锁版BIOS,正常也看不见)i7-10710U的睿频是47x/47x/41x/41x/39x/39x,单双核频率很激进,后面的频率就跟8750H差不多了。PL1/PL2设定也是厂商自己可调整,这台机器设定为35W/64W,之后会解锁到78W进行测试。
【2】性能测试先看看6核的10710U满睿频的性能https://pic1.zhimg.com/80/v2-f6c7ef3d7d6a0724037041aef029e7b4_720w.jpghttps://pic2.zhimg.com/80/v2-53b26cf0250e35a227e4ff7116487bd9_720w.jpg由于R20跑分时间较长,机器持续不了那么高功耗,故降电压70mv进行测试。作为对比,我们看看CFL-H refresh架构的i7-9750H的跑分https://pic1.zhimg.com/80/v2-813b26ec361dcfa20c5a1d92d87e72b8_720w.jpghttps://pic3.zhimg.com/80/v2-ae2aa6a39b21f2a2c79fc9ef45191d36_720w.jpg9750H全核睿频是4GHz,折算下来跑分是1257cb/3101cb,R15两者接近,R20是实在跑不过了,看后台log就发现即便降了70mv也还是撑不住那么久的高频……6核的Cometlake毕竟没有改内核,同频率下也是跟8750H趋同的,这点跟上篇文章的结论一致。接下来是重头戏,定频测功耗https://pic3.zhimg.com/80/v2-ba38872eb0cbec2ffd80ca87182db9ee_720w.jpg新增一列CFL-H的R15跑分对比同频跑分互有输赢,说明性能是等同的,验证前面的结论。单核效率上高频下会有衰减但很微弱,而能耗比就比较显著了,最高频下能耗比最低。
下面看看与CFL-H的同频功耗对比https://pic1.zhimg.com/80/v2-b409ac4384cbffc0d49e5169648bb570_720w.jpghttps://pic4.zhimg.com/80/v2-169e1d9d50c80691e6ed564b28901b17_720w.jpg与上篇文章一样,6核的Cometlake能耗比同样很惊人,但幅度有所下降,这个问题放后面谈。在低频下,10710U仅比9750H低4W不到,但随着频率加大,这个差距越来越大,最后在满频下差距达到了16.5W,这个发热的差距还是蛮大的,毕竟压65W和80W的机器形态都会有较大差别。综合来看,10710U比9750H的功耗要低11-20%左右,并且频率的越大幅度越大,这意味着新的14nm+++制程,确实改善了CPU的发热(应该是靠更低的电压来实现),这对于笔记本这种散热设计有限的PC来说,是一个非常利好的消息。
前一篇有人很关心电压的高低,在此说明一下,intel给的官方默认值是能够保证稳定运行的,并且对于笔记本来说,绝大部分厂商都会遵循intel的规范来设计,所以结果是趋同的,极个别体质差异过大的不具有参考意义。同样,降压来实现同条件对比也是没有实际意义的,因为降压不确定能否稳定,稳定了也不代表能够复制,即便证明了同电压同功耗,也不能说明什么,内核不变都是可以预估到的,对于实际消费者来说,能用得到的才是真。请不要以台式的思路来看待笔记本的设计
【3】同功耗性能对比为了能够对新的6核低压U有更方便的认知,这次加上不同功耗下10710U与9750H之间跑分和实际运行频率的比较注:锁功耗是把PL1和PL2均设置为目标值,以便查看实际稳态运行时的性能差距https://pic3.zhimg.com/80/v2-059b57af1b2e54aa817d4c439ddb84b2_720w.jpghttps://pic2.zhimg.com/80/v2-b39f0bcc2ebe20e9c87b3e2135d3f54d_720w.jpg
可以看到,15W下的两者跑分都比较低,到了25W后均有较大的提升(超过200cb),而越往后提升越小;CML-U62每个档位都比CHL-H62高一些,且差距越来越大,先开始就只有160-200MHz的差距,最后达到了300-400MHz,跑分也有100cb的差距。光看6核对比可能还不够,现在看看上篇文章里4核Cometlake的跑分和功耗:https://pic2.zhimg.com/80/v2-75267aba05891a5f4185fee9e2f297f1_720w.jpg10710U在15W时跑分是623cb,刚好在10210U前两档跑分之间,平均一下就是20W,也就是说15W的10710U性能上约等于20W的10210U;25W的跑分刚好等于满频的10210U成绩,那么就是说25W的10710U性能上约等于43W的10210U。这个对比也是很有意义的,这意味着高规格的处理器,在同样的散热条件下,可以实现更高的性能,而低规格的只能靠更高发热去弥补。更令人寒心的是,实际上同样散热规格的机器,6核的i7能够跑到的最大和稳定功耗都要比4核的i5/i7高一些https://pic2.zhimg.com/80/v2-67e2bd56524742427989665952b03921_720w.jpg上图就是实测值,i7没有到结尾是因为已经跑完了,可以看到i7在最后比i5多了6W多,这意味着又能再多点性能出来,同功耗就已经很占优势了,低规格高频确实不如高规格低频好(当然这是在多核优化到位的前提下)值得一提的是,这种现象在标压CPU上更为严重,i5-8300H/9300H要比i7-8750H/9750H热的多。使用Y7000 2019机器,散热极限可以解90W的i7,但对于70W的i5都很费劲。细心观察的网友可以去看一下各家游戏本的散热测试,双烤下i5能达到的功耗普遍都比i7低,功耗越高差距越大。第二章的时候提到6核的Cometlake功耗降低幅度没有4核那么大,实际上本质原因是标压的4核不是原生的,而是6核阉割而来,能耗比不如原生的好,这也是为何标压i5那么热的原因。
(三)—— IceLake-U 核心篇前两篇的处理器,名字上虽然也是10代U,但其实还是老内核+小改工艺,今天要介绍的才是正统“全新架构+制程”的10代CPU——Icelake。千呼万唤始出来,intel早在2015年前就说10nm制程要量产,结果一直delay,除了中间做了一颗很特殊的8121U外,直到今年5月份官方发布才算真正的大规模上市,真的是让消费者等了太久……那么等了这么久,到底值不值得呢?整理数据时发现新的CPU值得说的地方有点多,一篇文章不够写,所以这次先讲核心部分(传统IA core)的变化,下一篇介绍核显部分的变化。【1】参数照例先看看intel官网中的信息https://pic3.zhimg.com/80/v2-036c4de1fcdc2a0f2c280ca8557c708a_720w.jpgIceLake分为U和Y两类,U是低压系列,Y是超低压系列,前者TDP是15W/28W,后者是9W,后者常见于平板或者无风扇散热的笔记本中。28W的CPU目前官方未列出,初步猜测是苹果MBP定制款,默认TDP下肯定比15W的好一些。新的处理器名字中带有“G”,跟CometLake稍有区别,实际上结尾的“Gx”是代指核显规格的,G7是完整规格64EU,G4是阉割了一刀变48U,G1则是砍半只有32EU。价格上,IceLake和CometLake差不多,32EU的i5同价,48EU的贵了12刀,64EU贵了23刀,i7只有G7版,比4核的CometLake贵了17刀,但刚好又比6核的10710U便宜17刀。接近的价格意味着这两个系列的产品未来就会相互厮杀,买哪个取决于它们的差异。
频率方面,IceLake全家频率都低的惊奇,官网看不到全核心睿频,需要看当时发布的信息https://pic4.zhimg.com/80/v2-0364a87327f9079105f6ef480bdeefbf_720w.jpg全核心睿频只有3.3-3.6GHz,默频更是最低只有1.0GHz,看看隔壁的CometLake,10210U都可以全核心3.9GHz了,怎么看都感觉10nm还不够成熟,上不去频率……不过默频低是可以理解的,新的核心把核显规模翻倍了(32EU也是完整规格阉割下来的),并且集成了雷电3,这些毫无疑问要吃一部分功耗,而TDP仍然维持15W,所以默频就低了。
现在总结一下全新架构的IceLake有哪些新东西:
[*]10nm新制程+Sunny Cove新架构;
[*]核显分为3组,后缀G7的是64EU(可能是GT3架构),后缀G4的是48EU(可能是GT3阉割),后缀G1的是32EU(可能是GT2架构),不带eDRAM;
[*]TDP都是15W,可上调至25W;
[*]内存支持LPDDR4/x 3733MHz或DDR4 3200MHz;
[*]支持802.11ax(WIFI 6)的CNVI;
[*]支持AVX512;
[*]CPU集成雷电3(不是PCH)。
核显不带eDRAM是个遗憾,不过想想15W的功耗如果再分点恐怕默频连800MHz都保不住了,这玩意还是算了吧……雷电3是终于加进来了,这个东西有好有坏,之后再说。https://pic3.zhimg.com/80/v2-b81c136912a0bf6b20410db6330c26a2_720w.jpg这就是IceLake-U的真容了,CPU因为放进去了那么多新东西,die直接变成了长方形,当我联想到了当年的Crystalwellhttps://pic2.zhimg.com/80/v2-2bf5769e9e3d738ff7d1d002cf321c75_720w.jpg图为i7-4750HQ,最早一代Iris Pro核显有那么点像,但实际不是一回事,4750HQ左侧的那个是128M的eDRAM,而1065G7左侧的那个是PCH。https://pic2.zhimg.com/80/v2-18b76226ad55d45e7ba5bd31b7e6fe2d_720w.jpgi5-6267U外观早期Iris Pro都是带eDRAM的,所以低压U也会有,然后就是上面图片那样拥有3个die,左中右依次是PCH、CPU+iGPU、eDRAM(64M)https://pic3.zhimg.com/80/v2-bda0436a6a2e1131b5c55d4697c4d842_720w.jpgi3-8121U外观最后看下第一款10nm处理器i3-8121U的真容,也是方形的,但仔细对比就会发现当年的CannonLake要小一圈,到底是少了雷电3还是核显规模就不得而知了,毕竟8121U仅为双核且屏蔽核显。
【2】截图这次借来两台icelake机器(之前还借了一个,但是散热不好就把数据扔了),i5和i7各一个。https://pic3.zhimg.com/80/v2-84628e072f1845ba4e6a2ec298f4be9a_720w.jpgCPU-Z照例还是不能识别,软件更新有点慢https://pic4.zhimg.com/80/v2-c17d2ba9663780321b2fcdc2a2327dfb_720w.jpghttps://pic1.zhimg.com/80/v2-d0a7c70780ae388df076cc9b4109a570_720w.jpgHWINFO识别完全,但是QDF码有误,1065G7写的是QSD2实际是QSQS。右侧显示了核显的名字,64EU的叫Iris Plus 940,32EU的叫UHD 920。https://pic3.zhimg.com/80/v2-5495d9f1e0dcd9acab8cd9a4d2a9948e_720w.jpghttps://pic1.zhimg.com/80/v2-d1a4bd9b09c379c8099c2ffec047cea8_720w.jpg与10710U不同的是,AIDA64能够读取IceLake的相关信息,TDP=15W,TDC=129A,PL2可达51W,1065G7的睿频是39x/38x/35x/35x,1035G1的睿频是36x/36x/33x/33x。
从参数截图可以看出,i5和i7的规格除了核显和2M L3缓存外,就只是频率的差异,然而频率相差很小,3个规格的i5估计CPU方面是基本等同的,那么是否意味着,实际性能也是相近呢?
【3】性能测试跟之前测试一样,功耗解锁+散热最强,先看看满频的icelake性能https://pic3.zhimg.com/80/v2-d1dd7a363454832aae4af36adc3519ee_720w.jpghttps://pic4.zhimg.com/80/v2-93d9ff158a0ea24072aef999abe859bf_720w.jpg3.5GHz的1065G7跑出了867/2166cb的成绩,这已经堪比4.0GHz的9300H了……10210U毫无疑问被碾压了
现在测一下定频下的功耗和跑分https://pic4.zhimg.com/80/v2-b22f557e3fc83c5f393ebc8f6f959ceb_720w.jpg

这个结果很有意思,i5在同频下,IA部分的功耗始终比i7的高一些,然而跑分上却要少10来分,这个结果说明intel确实是按照体质来分型号的,i7的能耗比要更好一点。除此以外,icelake的CPU总功耗与IA功耗的差值(即核显+Uncore功耗)明显要高于Cometlake,并且1065G7的差值要大于1035G1。这个原因主要是雷电芯片,而i7比i5大是因为核显翻倍了。
鉴于i5和i7有体质差异,笔者重新测试了Cometlake和Coffeelake的性能(用10510U和9750H屏蔽俩核心)https://pic3.zhimg.com/80/v2-fbf69aec15e0d8424d5f65ef69d68fc6_720w.jpg比之前的成绩确实都要好一点了,功耗上也同步变化,可以看到标压U在同频下确实要更好一点,高频下达到了0.1GHz的差距,但也不算很大。把数据汇总,对比https://pic3.zhimg.com/80/v2-6520d93fc73472942901e25339962bc2_720w.jpghttps://pic1.zhimg.com/80/v2-7a4e4749d3e83ecdbc90f7cb5eb5c468_720w.jpg在同频对比下,IceLake的功耗明显较高,甚至在低频下比CFL-H还热,看起来似乎10nm能耗比不行。是这样吗?错!不要陷入逻辑怪圈,前两篇对比同频下功耗的一个重要前提,是两者架构上接近,单核效率等同,而IceLake显然不满足,这个时候同频比较意义就不大了,应该要同性能比较才有意义。
根据R15跑分,每50cb一档,相邻两组定频数据线性比例折算功耗,重新制作图表https://pic2.zhimg.com/80/v2-4321cee46436bcd690f84eaca46e118d_720w.jpghttps://pic2.zhimg.com/80/v2-56ed905cdacbb8914c8dc544976a2e79_720w.jpghttps://pic2.zhimg.com/80/v2-00fde42cbb1355a9647a90f8da2dfa91_720w.jpg

这回的才是真正的“能耗比对比”,ICL-U的表现和刚才的截然相反,能耗比除了低频下Uncore功耗高导致比CML-U总功耗高一点以外,其他都是胜出的,跑分越高差距越明显icelake还是有那么些东西的,显然单核效率提升了很多,把刚才的图表换为频率对比,就更直观体现了:
https://pic2.zhimg.com/80/v2-fd3ec757f099661ae6fd9186052a5ed9_720w.jpg

都是低压U比较,ICL的IPC提升了15%左右,跟intel之前宣传的数值一致,差不多就是3.5GHz的i7-1065G7约等于4GHz的CML-U,考虑到标压i5体质比测试的i7差,也约等于4GHz的i5-9300H。
【4】定功耗测试&预估根据上一章测试的结果来看,IceLake在3.5GHz下跑R15也就40W左右,更高的受限于频率无法测出。intel没有给更高的频率,可能是10nm良率问题。如果假设良率较好,频率可以往上加到4GHz+,IceLake-U会有什么表现呢?假设条件:
[*]单核效率维持不变
[*]能耗比线性下降,按照IA部分计算能耗比
[*]Uncore功耗线性增加
https://pic3.zhimg.com/80/v2-29a406c812bcb4b6fed59f938121b15a_720w.jpg在4.2GHz下,IceLake的性能约等于3.2GHz的6核Cometlake-U/Coffeelake-H,对应功耗为38/45W,可惜IceLake也得需要66W才能达到这样的水平,核心的差距是没办法靠这点IPC提升来抹平的。
按照功耗定档,可以对比出同样散热设计的机器中性能的差异:https://pic2.zhimg.com/80/v2-59b3b78fb522d7fcb888487ae055f349_720w.pnghttps://pic2.zhimg.com/80/v2-4c92f4078252fd5952fb385c48dc71fd_720w.jpg

可以看到,在15W/25W的情况下,IceLake的性能还是要低于Cometlake的,但在35W时发生了转变,45W/55W预估值大幅领先。这意味着,IceLake需要超过25W的散热设计,才能够体现出新架构带来的优势,难怪intel把默认频率定的如此之低,TDP=15W的机器是不适合上IceLake的。
(四)—— IceLake-U 显卡篇
Icelake除了10nm+新内核的架构变化外,还有一个重要的提升,就是它再一次提升了核显规模,最高64EU。上一篇文章表明,新架构的处理器是有IPC提升的,那么核显部分是否也会有惊喜呢?
【0】高性能核显——Iris锐炬系列发展史从第一代酷睿i系列处理器开始,intel就打算将显卡这门业务绑定到CPU中来,实现取代中低端独显or板载集显的方案。第一代酷睿双核i3和i5仅将核显的die与CPU封装在一个基板上,还不能严格意义上的“核显”
https://pic2.zhimg.com/80/v2-10b1ef168c95acaa46a3e5741c7c075d_720w.jpg
i3-390M,一代神U由于两个die的工艺不同(核显45nm,CPU32nm),第一代的核显比CPU大了很多,放在一起有点喧宾夺主的味道……第一代核显仅有12个流处理器,也不是后来的GT1/2架构,性能上很弱鸡约等于几代以前的低端独显,所以也没有掀起很大的波澜。
到了第二代SNB后,情况发生了变化。首先核显完成了与CPU的die融合,其次显卡架构完成了革新,移动酷睿全线配备最高规格的HD3000,意图显然是想要吃掉低端独显本的份额。https://pic1.zhimg.com/80/v2-e3e0a7421af9963b042f99f50a8163e4_720w.jpg

HD300012个EU,基频650MHz最大睿频可达1.3GHz,这性能确实比上一代强很多,实测可以跟MHD5470相提并论了,基本上满足日常的需求。https://pic3.zhimg.com/80/v2-b45a6072360cd9478f6270c3b70645ea_720w.jpg第三代IVY处理器将制程提升到22nm,核显也升级到16EU的HD4000,这个性能就更强了,直接叫板同时代的入门独显GT520M,“拔掉独显以提升性能”就是从这个时候开始出现的。
前三代核显完成了飞跃式进步,第四代intel开始尝试将核显范围扩大,做到中端显卡的性能,于是乎Iris系列就诞生了。之前的核显是GT2架构的,Iris核显则是GT3,规模直接翻倍,来到了40EU,这也直接导致核心的外观出现了变化。https://pic4.zhimg.com/80/v2-881db8339f4910d98b667814f9745743_720w.jpg

左侧为搭载HD5200的4980HQ,右侧为HD5100的4558UGT3有两种,左侧的是带有128M eDRAM(也就是L4缓存)的标压四核,右侧是不带eDRAM的低压双核(上面的是PCH)。核显占了很大的面积,右侧这个die长度比标压4核配HD4600都长了。https://pic2.zhimg.com/80/v2-ebc93495d0943881f0097224d9a45f1d_720w.jpg

Iris Pro 520040EU,最高频率1.25GHz,规模上翻倍了,按照HD4000的性能可以预估到HD5200大概是GT650M的性能。https://pic2.zhimg.com/80/v2-d07657997d0de9fa2c068c5e4d435e21_720w.jpg

HD5200的3D11跑分3D11跑分成绩,HD5200图形分超过了2000,相比于24EU的HD4600高了约75%,比核心规模的差距还大,这个成绩已经和GT650M D5差不多了,当时确实让所有玩家大吃一惊。不过这个成绩是有代价的,正常45W的CPU是跑不出来的,甚至放到60W也不一定。

https://pic2.zhimg.com/80/v2-a2575cdd54076cb5488a5c6cee75cfd1_720w.jpg用GPU-Z的小渲染,HD5200都可以到39W的高功耗,游戏里跑个40W完全不在话下,这个发热已经不输GT650M了。实际很多年前我评测过一款机器,叫惠普ENVY-15 小苍本,搭载的就是这款CPU,测试的结果就是游戏性能和跑分有差距,并不能真正达到650M水平,发热却有的一拼。标压U都如此,低压就不说了,第一代锐炬显卡华而不实,规格到了,发热却崩了。
时间来到了第五代。这一代很特殊,它是第一代14nm,但架构上没有大改,台式U没有更新(除了带Iris的型号)。https://pic1.zhimg.com/80/v2-3a73d7c446b4784bb443f74d1fb03240_720w.jpg

i7-5950HQ14nm减少了上一代所需要的die尺寸,但还是方的https://pic4.zhimg.com/80/v2-e3b3ac1215400304d72daea46be6fc3f_720w.jpg

Iris Pro 6200GT3/3e的规格从40EU提升到48EU,但是频率从最大1.25GHz降到了1.15GHz,估计是考虑到了TDP的原因。https://pic4.zhimg.com/80/v2-b7d409ff4f3b13d3c06548b2dbb580a7_720w.jpg

这是超频至1.25GHz的成绩,1.5GHz的HD5200图形分是1741,折算一下默认比默认提升了19%,差不多就是规格的幅度,128M的eDRAM还是挺有用的,没让内存带宽成为瓶颈。这里的性能对比依旧是解锁功耗的,实际功耗不清楚降了多少,但肯定还是很热。
5代U的时间比较短暂,6代Skylake很快就来了。这一代使用了全新架构,直到今日的Cometlake都还是Skylake改,可见意义有多大。https://pic4.zhimg.com/80/v2-de99b4b99028087de777e03dcf2cfbd7_720w.jpgi7-6770HQ外观https://pic2.zhimg.com/80/v2-18b76226ad55d45e7ba5bd31b7e6fe2d_720w.jpg

i5-6267U外观
这一代的核心外观再次发生变化,标压变成了长条形,低压多了64M的eDRAM,并且和GT2架构24EU的其他CPU不共用die(实际上4代和5代低压U,4200U/5200U这种只有24EU的GT2是拿GT3屏蔽而来的,并非原生)https://pic2.zhimg.com/80/v2-34291e3364d72cde90deec0adbacff0d_720w.jpgIris Pro 580https://pic3.zhimg.com/80/v2-308a448c60d4018373e538a29242e276_720w.jpg

Iris Pro 550这一代核显多了个GT4的Iris Pro 580,夸张的72EU规格,但频率进一步调低,只有950MHz了(6970HQ为1.05GHz,E3-1585V5为1.15GHz)。HD580只在标压U上有,低压U还是保持48EU的GT3,改名叫Iris 550。小渲染负载分别是20W和17W,比HD5200低了很多。有关Iris 550的表现,以前在知乎是有发过文章的,可以参考:孤独凤凰战士:【高性能核显】i5-6267U&Iris 550性能表现278 赞同 · 96 评论文章https://pic2.zhimg.com/v2-580f70f9878013279d870ba1a0f3a129_180x120.jpg
https://pic3.zhimg.com/80/v2-11ebeab478d33ffd0dbfa14fda72a78e_720w.jpg

P580跑分HD5200是2071分,HD550是2678分,P580是4057分,性能幅度刚好是100%和50%,已经超过低功耗版MX150的跑分了,GT4确实厉害。根据刚才的功耗对比,P580实际功耗应该在30W以内,这个能耗比确实比初代40EU的Iris好多了,但intel进步的同时NV和AMD也在进步,MX150低功耗版仅12W功耗,标准版也不过25W,相比之下能耗比还是不占优……
intel意识到GT4已经脱离了原本的目标,到了7代之后就果断砍掉了,GT3的48EU缝补一下接着出https://pic1.zhimg.com/80/v2-4d6fe1bb7294f54fe59168e268ea962c_720w.jpg

i7-7567U外观7代GT3叫Iris Plus 650,规格不变频率增加到1.15GHz,3D11 P分图形2794,典型的挤牙膏。
到了8代,因为低压升级到了4核,GT3的CPU也有了新的变化https://pic4.zhimg.com/80/v2-e644840761d3ee39ea95f953d7903d4f_720w.jpg

i7-8559U外观核心变长了,eDRAM从64M增加到128M,最大频率也增加到1.2GHz,看起来是要再强行续一波。https://pic1.zhimg.com/80/v2-55282d93b3d12ac59c935c47bbddfd84_720w.jpg

Time Spy成绩Time Spy图形分668,相比之下HD650是561,P580是845,HD550是534。HD655比HD650高了19%,比P580低了21%,刚好介于两者之间,也算是有一定提升吧,只是规格的差距是没办法追平的,尽力了。
至此,10代U之前的iris系列核显已经介绍完毕,1-4代酷睿是从崛起到巅峰,6代之后明显开始挤牙膏,不知不觉就到了10代,一下挤了很多牙膏。
【1】参数介绍先看一下icelake的命名规则https://pic1.zhimg.com/80/v2-1bc4af7f2cb1a4d1b4fba03f5cbd5c34_720w.jpg相比于cometlake,icelake的后半段有差别,5位数字里夹了个“G”。4位数字里前两位代表10代U,第三位是同一个家族下高低端,会随着i3/i5/i7提高,最后一位代表TDP大小,0结尾的是9W的icelake-Y,5结尾就是TDP15W的正常低压U,8结尾的是TDP28W的高性能版本。“G”后面跟的数字是代表核显规格的,icelake目前有3个核显规格,G1/G4/G7,G1是32EU,G4是48EU,G7是64EU,这一代都没有搭载eDRAM(也就是L4),但内存规格支持到了最大3733MHz(LPDDR4x),也算是一个弥补。本次测试我只借到了G1和G7版本。https://pic1.zhimg.com/80/v2-d0a7c70780ae388df076cc9b4109a570_720w.jpgi5-1035G1截图这是1035G1的截图,右上角为核显规格。可以看到G1版本的核显叫UHD Graphics 920,架构是 Ice Lake-U GT2 32EU LM。https://pic3.zhimg.com/80/v2-67d4c9d04626b02667cbef612b9f2a26_720w.jpg

i7-1065G7截图这是1065G7的截图,G7版本的核显叫Iris Plus Graphics 940,架构是 Ice Lake-U GT2 64EU ,居然也是GT2的,上一章的Iris核显都是GT3以上的,到了icelake直接把GT2堆到了64EU的规格。不过这样也就不难理解为啥没有eDRAM了,GT2的定位确实也不够格上这玩意。(intel的官方文档也写的是Icelake-U42/Y42,第一位数字代表核心,第二位就是核显架构了,说明icelake核显只有GT2,没有GT3)其他软件都GG了(GPU-Z、AIDA64),只能先靠这个看一下了……
整理一下目前酷睿2代以后的核显规格及名称,不是全部的,低端的奔腾/赛扬以及atom系列的没有统计进来,仅供参考https://pic3.zhimg.com/80/v2-9cb6279c9ae628f299c13c9c04307a66_720w.jpg24EU的GT2挤了4代(还不算9代),GT3几乎每年一变,GT4仅存在一代就消失,之后被替换为了kabylake-G就是带Vega显卡的那个,但这个也只是存活了一代后就停止更新了,高端核显的尝试似乎并不顺利,icelake改为GT2架构扩增,不使用eDRAM,是否有出人意料的结果呢?【3】性能测试这次只比较核显和低端入门级显卡的性能,手头的数据不全,部分结果可能不准https://pic2.zhimg.com/80/v2-de551a0fd98b91f43fa3dde9d88b58f9_720w.jpghttps://pic1.zhimg.com/80/v2-81345d6f0b571dfd87d28a5d4b0db908_720w.jpg

说实话这个结果还是比较惊艳的,32EU的UHD920一下子块赶上了之前48EU带eDRAM的性能,64EU的iris Plus 940也赶上了曾经最高规格的GT4e跑分,说明新的核显确实达到了这个规格下的水平,并且凭借10nm+新架构还优化了效率。横向与其他显卡比较,Iris Plus 940比vega 10(3700U核显)跑分高了15.8%,比低功耗版MX150高了9.2%,这个成绩也是不错的,相比于标准版的MX150/250也差了14.3-20.3%,也就是介于低功耗版和标准版MX150的中间。当然相比于最低端的GTX显卡1050 3G,Iris Plus 940还是太弱了,翻倍也够不到。
从跑分来看,icelake核显还是挺厉害的,但是正如第一章所描述的那样,intel的高端核显历来都是发热大户第一代40EU轻松吃掉40W,上图测试的显卡绝大部分也都是放开功耗跑出来的。而实际轻薄本中,功耗不可能无限制的去跑,也这是为何Iris一直都没办法普及的原因之一。那么icelake是否解决了高规格高发热的问题呢?
咱们看看几个跑分场景下CPU功耗的曲线图https://pic1.zhimg.com/80/v2-79c1657a42adb6989fa8ae698f5752a4_720w.jpghttps://pic1.zhimg.com/80/v2-60aeefc1220a7e22a112e4834ce22580_720w.jpghttps://pic2.zhimg.com/80/v2-50fa6cfec0cc13a93fd5f363b9c769f9_720w.jpghttps://pic2.zhimg.com/80/v2-b124cf572b3522e09f7fa067b4c5999d_720w.jpghttps://pic4.zhimg.com/80/v2-e98ae42d625173664b76d6601cc4cf6f_720w.jpghttps://pic3.zhimg.com/80/v2-33a0abfa88f421dd0b421ff26538a5d2_720w.jpghttps://pic1.zhimg.com/80/v2-849f867eeb80f9d170a0e4f8832e9dd4_720w.jpghttps://pic3.zhimg.com/80/v2-e01ae423be813f211816e9c10bb136f6_720w.jpghttps://pic1.zhimg.com/80/v2-92fca3b005e3ca42543c92caf272a5a4_720w.jpg

可以看到,Iris Plus 940在跑分场景下,GT的功耗都在10-13W左右,一直没有超过15W,跑分中频率是一直保持1.1GHz的。这个结果真的很令人吃惊,64EU竟然只需要13W左右就可以喂饱了!CPU整体功耗大部分也在20-25W之间(除了物理和结合测试),整体的发热不算很大。
咱们再来看看32EU的UHD920表现https://pic1.zhimg.com/80/v2-0ab4fc750db5e3dbe93939980687835c_720w.jpghttps://pic2.zhimg.com/80/v2-ff136fd9193a47ee238eef18dd1f5ad1_720w.jpghttps://pic1.zhimg.com/80/v2-8aa2a621edafb4afde515a0f52a87ac4_720w.jpghttps://pic4.zhimg.com/80/v2-a99958ea1ff42a55d5dcdbcf7648b673_720w.jpghttps://pic4.zhimg.com/80/v2-a0d1a11d20522c4de9181466d5239787_720w.jpghttps://pic2.zhimg.com/80/v2-6b1e29f2c03ea99ba54337f278458249_720w.jpghttps://pic1.zhimg.com/80/v2-ac9cb3b67fd7af92961a76f3a97dc8e0_720w.jpghttps://pic1.zhimg.com/80/v2-41f9ca22dde5b708cba95a567248452c_720w.jpghttps://pic3.zhimg.com/80/v2-71d5c656c30fdf63a150d1cece38c4e2_720w.jpghttps://pic3.zhimg.com/80/v2-586cc49e1d0384824307f7ae596a2a22_720w.jpg

果然,UHD920也是相当凉快,只需要6-8W的GT功耗,1035G1的整体功耗也因此控制在了15-20W之间,控制的也是很优秀的。看完功耗表现,下面该试试实际游戏的测试了。
【4】游戏测试测试软件的性能不等于实际游戏性能,因为跑分中CPU的负载并不高,无法完全体现混合负载下的表现。1.求生之路2分辨率选择1080P,抗锯齿选择8x MSAA,其他特效最高,关闭垂直同步https://pic4.zhimg.com/80/v2-519dd35e2bdbe411e217c63480ba3457_720w.jpghttps://pic1.zhimg.com/80/v2-75f733a26917f5e308880d9098c8fabc_720w.jpg帧数统计https://pic4.zhimg.com/80/v2-32253df230d230f43a7e824516bd4773_720w.jpghttps://pic2.zhimg.com/80/v2-67591f7744e3800cec15c49d5e65dfed_720w.jpgL4D2是个比较老的游戏了,对显卡的负载不是很高。最高画质下,Iris Plus 940的性能显然不理想,仅仅是低功耗MX150的60%性能,UHD920更是只有40%的性能,跟跑分的情况相差非常大。
2.巫师3:狂猎分辨率选择1080P,开启第二档画质,关闭垂直同步https://pic3.zhimg.com/80/v2-1ba34be8b289fc1f3f91bd7cc5d1a6e6_720w.jpghttps://pic4.zhimg.com/80/v2-df8058f99e9a8ed074cd7fe20a111627_720w.jpg帧数统计https://pic3.zhimg.com/80/v2-db8f0a3ad5d7cbf733f51281bb96ef9a_720w.jpghttps://pic4.zhimg.com/80/v2-783e4d8e9aecd92521425190bf550263_720w.jpg巫师3也是个比较老的游戏了,但是对显卡的要求还是不低的。中画质下,Iris Plus 940仅能维持20帧,无法流畅运行。但这次低功耗版的MX150也差不多了,有意思的是MX250帧数也不如MX150高。
3.看门狗2分辨率选择1080P,画质调节选择低,0%额外细节,关闭垂直同步https://pic1.zhimg.com/80/v2-b2b16f84e03658be6beb3594930069f0_720w.jpghttps://pic4.zhimg.com/80/v2-53febd214c8471bc9103459f4aad212f_720w.jpg帧数统计https://pic3.zhimg.com/80/v2-85c8e69ac0194becdc8022fc53d5a01e_720w.jpghttps://pic2.zhimg.com/80/v2-bdf574f8f96309345d85f42ec49a1a41_720w.jpg看门狗2是个优化比较差的游戏,CPU/显卡/内存都很吃。低画质下,Iris Plus 940帧数仅23帧不到,是低功耗版MX150的76%性能,无法流畅运行。就测了这么三款游戏,已经发现一些问题了。Iris Plus 940在游戏中并不能展现出跑分的水平,只要游戏里比较吃CPU,就会跟独显拉开显著的差距,游戏里CPU负载越小,性能缩水的幅度也就越少。
最值得一提的是,这里面MX250的数据,跟Iris Plus 940是同一个机器跑出来的,可以消除其他所有差异影响,我们可以从这两张显卡的对比中发现一些问题。跑分中,Iris Plus 940是MX250的79.7%的性能,在三个游戏里这个幅度变成了46%、82.7%、62.8%,除了巫师3都有损失,恰好这俩游戏都比较吃CPU,跟刚才的结论一致。
越吃CPU性能越差,是不是因为游戏里CPU的表现有差异?下面来看看游戏中的功耗曲线https://pic4.zhimg.com/80/v2-483330ade578ac87d1e10eb2d5eb7917_720w.jpghttps://pic2.zhimg.com/80/v2-670a06a37bb3660ba6ba3ab24ba69669_720w.jpgL4D2中,使用核显时CPU频率并没有损失,仍然保持满睿频。CPU整体功耗在33W左右,其中IA部分18W,GT部分9.5W。而使用独显时,CPU也还是满频,CPU整体功耗有24W,其中IA部分给了18W左右,跟用核显是一样的。
https://pic1.zhimg.com/80/v2-8452e66af0d0fe021aea425e373091c4_720w.jpghttps://pic1.zhimg.com/80/v2-5c99543212d9ac6e1f0a1f1c46867ea0_720w.jpg在巫师3中,核显玩游戏时CPU频率波动比较大,功耗在29W左右,其中IA部分占13W,GT部分占11W。使用独显时,频率相对稳定了些,CPU功耗15W,IA部分11W,CPU的负载相比L4D2小了不少。
https://pic2.zhimg.com/80/v2-376975acfd4c8d6b1f1e5c7b06778019_720w.jpghttps://pic4.zhimg.com/80/v2-671f1eda12a56ab92ca18f67cd076f93_720w.jpg在看门狗2中,使用核显时CPU也还是满频,功耗33W,其中IA部分占16W,GT部分占10.5W。使用独显时,CPU功耗20W,IA部分占15W。
三个游戏里,CPU的IA部分使用核显与使用独显差异不大,看来CPU本体是尽力的。这说明就是核显本身的性能问题了。个人推测,核显是要跟CPU一起占用内存带宽的,使用核显玩游戏,内存带宽就比较捉急了,一旦游戏需要CPU时,这部分的瓶颈就会体现出来差异。各个段落总结(一)
说实话当我测完这一系列数据后,我自己也是很震惊的虽然表面看起来Cometlake既没有改内核,也没有改工艺,单纯提频还不一定有效果,更像是挤牙膏的结果,结果实际测试一对比,Cometlake真香!最后一张发的图的意义非常重大,这意味着,在同样的散热条件下,新的平台可以提升15-20%的性能,同功耗可以达到的频率更多,真正的加量不加价!在3.9GHz高频下,10210U比8565U功耗低了12W多(R15),如果新的机器散热做的再好点,轻薄本的性能甚至不输标压的i5-8300H,想想还真是有点恐怖啊……期待OEM交给消费者一张满意的答案(二)i7-10710U是第一款低压6核处理器,虽然标称TDP 15W,但如果只给他15W可就委屈了这个规格了。Cometlake-U 6核根据前面的测试结果,至少25W以后才会有较好的性能(也就是比4核标压强)。加上14nm+++的制程优化,6核低压U如果机器散热做的好点,确实可以在性能上比肩标压6核处理器了。

当然这不是说标压U就可以被低压U替代。低压U的一个短板在于,它的CPU没有16条直连的PCIe,想要接显卡只能靠OPI总线连接的PCH实现,最大4x。此外标压也有8核版本了,低压U再强也很难弥补硬规格上的差距,当然追上MBP里的9880H还是可以的(顺带10510U也可以努力干2018版的8950HK)https://pic3.zhimg.com/80/v2-8614e49bc591ea2b5a5095a8b312de5e_720w.jpg

我就是喜欢黑MBP的散热,不服忍着核心部分低压6核的天花板很高了,在某种程度上可以说轻薄本确实可以去想办法做成设计师专用的类型,就看OEM愿不愿意搞定64W的散热了。(三)真正的新架构+新工艺,带来的提升确实是显而易见的,3.5GHz就能顶原来4GHz的效能。此外,新增的功能比如内置雷电3,支持AVX512等,也为新的笔记本带来更多的价值但消费者需要注意的地方还是有的:1.目前IceLake所能达到的频率普遍不高,即便效率提升也无法弥补天花板太低的情况;

2.根据前面的测试结果倒推,i5-1035G1的性能是比不过i5-10210U的,然而两者价格一致;

3.TDP低于25W的机器,IceLake能耗比低于Cometlake;

4.IceLake没有6核。

新的笔记本马上就要来了,如果你在意的是雷电3或者图形性能,那么icelake还是有它独特的意义的,如果是在乎CPU本身的性能,希望消费者能够看懂此文章,再做决策。


(四)
这里再归纳一下文中的结论:1.64EU的Iris Plus 940在跑分中达到了过往的旗舰GT4e水平,即便没有eDRAM,靠3733MHz的内存也可以弥补一下;

2.跑分里超过了低功耗版的MX150,同样也比3700U的核显vega 10强;

3.虽然历代Iris核显规格高功耗大,但Icelake凭借新制程新架构,将64EU的发热降到了13W左右,达到了轻薄本的散热范围内;

4.游戏中没有跑分那么理想,越吃CPU的游戏性能损失越大;

5.实际游戏里,CPU需要30W左右的散热,这个功耗也不算很低,如果散热不能达到,性能会进一步缩水。

本篇文章详细阐述了icelake核显方面的表现,总的来看,进步还是有的,可惜还没有达到理想中的那样好。内存带宽永远是制约核显性能的关键因素,曾经的功耗问题解决了,那么这个问题能否也会改善呢?

本次全新系列处理器点评到此结束,感谢大家的阅读



守望雷亚 发表于 2022-2-18 13:35

占个二楼

补充内容 (2022-2-18 19:10):
https://zhuanlan.zhihu.com/p/79332497

zhangyongtao 发表于 2022-2-18 19:07

友情提醒 转帖的话 最好带上原文章链接 ,以免引起不必要的版权问题

守望雷亚 发表于 2022-2-18 19:28

本帖最后由 守望雷亚 于 2022-2-18 19:33 编辑

zhangyongtao 发表于 2022-2-18 19:07
友情提醒 转帖的话 最好带上原文章链接 ,以免引起不必要的版权问题
各个帖子都已贴,谢谢提醒

luanma150980 发表于 2022-2-22 10:12

记号intel核显
页: [1]
查看完整版本: 【转帖】【科普】intel 10代酷睿移动版性能测试-4c/6c/核显等详评