【原创】破解T61的硬改性能巨增谜团——视频编码软件ShanaEncoder多平台纵向性能测试
本帖最后由 hljgyr 于 2023-1-9 15:09 编辑原帖在此 https://www.ibmnb.com/forum.php?mod=viewthread&tid=2026133
测试视频:https://pan.baidu.com/s/1IomcOcJY9uDR9aoD2Zo0Wg?pwd=1jjj 提取码: 1jjj
ShanaEncoder5.3:https://pan.baidu.com/s/1a6CCnsQCyGuxT5NWNTyvWg?pwd=6gb8 提取码: 6gb8
防蝇补丁:
本贴下面用户”51qcs"发表的所有以恶意灌水为目的的不负责言论均与本人立场无关,此用户及其多个马甲在本论坛劣迹斑斑,多次蓄意混淆视听,请屏幕前的吃瓜群众注意甄别
首先感谢作者ltmfly老哥非常深入实用的超频经验分享和这款轻量高效的编码软件推荐
帖子里面老哥总结了t9300硬改超频到3.2g后令人激动的性能跃升:
1. 在ShanaEncoder软件(基于FFmpeg开发)中,相比2.5ghz的默频t9300(处理耗时295秒完成4548帧,编码速率15.4fps), 硬改t9300性能提升达到53%(看后面测试远远不止这些)。
2. 硬改后t9300单核编码速率21fps,对比E580, 单核超越2.7ghz的i3-7130u,并达到5800h(35fps)的60%; 双核编码速率33fps,达到2C4T规格i3-7130u(43fps)的77%;
3. 硬改后t9300性能提升幅度是频率提升幅度的174%
看罢让我这个仓鼠系垃圾佬既兴奋又羡慕,可惜手边的w500和w700年事已高,硬改啥的不禁折腾,就怕落个晚节不保
不过嘛,拿throttlestop啥的超个倍频陪u界后辈们玩玩还是没问题的,某君看了这帖之后,不也鸡血上身跟着喊了几十次它超到3.7g性能比t9300翻一番了嘛,堪称科学奇迹,我愿称它为超频的神
所以,直接4g主频走起...只可惜,测试结果(性能提升只相当于频率提升的70%)实在有点让老家伙们尴尬,我也是百思不得骑姐...
那么,本日最大难题出现了,对于t9300这代800FSB的初版45nm处理器,硬改266外频,内存刷533之后究竟埋藏了多大潜力,以至轻松秒掉软超的x9100,甚至可以越级挑战skylake全家桶?
期待各位硬改大拿们分析解惑
当然,我也不能光做伸手党,白嫖大拿们的经验心得
正巧这段时间为了尽好作为一名光荣垃圾收藏佬的职责,一直在不断完善各代平台各档位频率性能及能耗比的纵测
所以,这个软件也顺理成章的加入了我的评测行列,不妨把一些测试过程结果放出来供参考,抛砖引玉
首先是测试环境及界面设置,软件版本为ShanaEncoder5.3,选用的是一段10年前以cpu杀手著称的4k-120fps 测试视频:
关闭所有的硬件加速选项,采用默认的输出及编码格式(720p_H264),输出帧总计5520帧,编码完成后通过日志查询编码时长并计算平均帧数
一致性测试及验证:
1.参考原帖视频简介(i5-4690s 72-79fps),以76fps作为其性能基准,将i7-4940mx关闭超线程并设置最高频率3.5ghz以模拟i5-4690s性能,
测试得i7-4940mx(4c4t_3.5ghz)对该视频的编码性能为48.8fps
2.将76/48.8=1.557作为性能折算系数
3.将i9-10980hk限制线程数(2c4t)及最高频率(2.6ghz,考虑u系列处理器难以维持最高频率,此时cpu功耗11w非常接近E580的残血性能释放)后测试得27.7fps,
将5900HX限制最高频率(4.4ghz)后单线程运行测试得22.3fps,
分别乘折算系数后,其值为43.1fps和34.7fps
4.对比原帖实测i3-7130u的43fps,5800H的35fps,折算值与原帖实测值误差在1%以内,因此,1.557的折算值得到验证,后续测试结果也据此进行折算,方便与原帖测试结果相比较
penryn平台初步测试结果如下:
上表为原测试结果,下表为折算结果,后面论述均以折算结果为准。
w700、w500及后面其他平台基本都属于纯净测试平台,仅安装最新版win10操作系统、必要测试软件及驱动,测试过程中清空所有后台程序
首先,可以看到,qx9300和t9900在双核2.5g频率下,成绩都超过了原帖中默频t9300,而qx9300相比t9900受益于12MB缓存,领先幅度更大,对比默认的t9300领先幅度达到了18%,看得出缓存和更高的FSB频率起到了不小的作用
然而好景不长,3.2g频率上,软超后的qx9300和提0.5倍频折算后t9900的表现却只有22fps左右,和原帖中硬改超频t9300的33fps相距甚远,差距甚至达到了50%
继续提升频率,qx9300在4ghz频率下的双核成绩也仅有26.5fps...此时w700散热系统承受了巨大考验,核心功耗超过70w,核心温度接近95°C
原帖中硬改t9300跑出的双核33fps,至少对我的core2平台来说,是遥不可及的成绩,按照目前的软超模式,保守需要双核5ghz频率....
那4核全开呢,3.06ghz下,终于来到了36.8fps。这是什么概念?硬改后的3.2ghz t9300,性能几乎赶上了2颗t9900......
只能说,这绝对称得上是匪夷所思级别的性能
那么,是否存在一种微小的可能性,我的这两套老平台凑巧都遇到了渣硬件优化,一旦到了新平台,提升就会更明显呢?
不多啰嗦,直接开测上数据,一目了然。
折算结果一栏基本可以完全对应原帖中成绩,标斜数据是推测值,现有条件暂时完成不了测试
拿到结果后,首先我更疑惑了,虽然性能同步增幅表现强过w700,但是几乎所有新平台(除了11代H45这个不到4g主频缓存永远拖cpu后腿的奇葩)的性能增幅都不及频率增幅,这就意味着,硬改t9300似乎真的是激活了某种黑科技...
但值得欣慰的是,新平台的超线程和核心规模守住了多线程性能方面的绝对优势,保住了颜面。4g频率下表现最好的是11800h,超过同频5900hx接近30%,但是付出了多45%功耗的代价
能耗比这块儿amd确实是吃到了足够的制程优势,至少对标11代之前,是intel望尘莫及的存在..以100fps左右为标准吧,根据完成的其他测试,5900HX只需要24w不到,同代10980hk功耗却近乎翻番
说完多核,回到单核性能,这颗硬改的t9300依旧是个巨大的麻烦.....在表里面与它成绩最接近的是4g主频的3920xm,而这是安了ddr3-2133超频条加上m2硬盘加速过的双卡18寸笔记本平台,我想不到哪里出现了系统瓶颈使得它的ipc被t9300秒杀...
换言之,这颗神奇的硬改t9300,ipc超过了haswell8%,达到了skylake和zen3的87%,tigerlake的76%(由原帖内容换算得到,根据后续详细分析,此结论可信度存在疑问),而我弱小卑微又可怜的qx9300,ipc不过skylake和zen3的51%,tigerlake的44%
听w500,w700上面的老家伙们牢骚发完,按照原帖跟帖内容初步列了几个可能造成差距的原因
1.FSB提升,但是提升后的FSB也仅达到qx9300的水平,依旧不能解释如此巨量的ipc提升;
2.对cpu进行了加压,这个也说不通,因为至尊版cpu超频本来就是根据电压调节的,在超频平衡点外多余的电压除了增加系统稳定性和功耗外,我没有测到任何性能上的大幅度提升
3.内存改533后延迟降低,这也是原帖老哥最后总结的原因,不过我觉得延迟和频率是互斥的关系,低延迟可以增加性能的话,高频率同样可以,但是ivbi7+ddr3_2133平台的惨败告诉我事情没有那么简单,所以我把几个平台内存参数也一齐列出了,等懂哥解惑
4...剩下的非玄学原因我暂时想不出了,我当然也不会失心疯地说这是颗被战赢君开过光的t9300
总之吧,作为工作中天天跟各种数据打交道的搬砖工,对数字有着职业性的敏感,而在其中面对常识难以解释的现象,难免也会刨根问底一番
本贴绝非引战,望各位友善交流(战赢佬除外),期待各位硬改高手答疑解惑
再次对ltmfly老哥致以敬意
————————————————
1月7日更新:
硬改提升了缓存和延迟表现,确实是提升性能的方式,我也针对性找了一些资料,不过目测是AMD平台上面的游戏帧数测试,未必能完全代表该平台和该软件情况
这张图信息量很大,我们两两对比着看,就能梳理出一些东西来:
https://www.ibmnb.com/data/attachment/forum/202301/07/112205fodnx7mrp8j07md2.jpg.thumb.jpg
结论如下:
1.对比测试2,3 提升20%主频获得性能增益13.3%;
2.对比测试1,2以及7,8提升内存时序获得性能增益6.5%左右;
3.对比测试3,4 提升内存频率50%获得性能增益15%;
4.对比测试4,6以及5,7提升缓存频率33%获得性能增益11%-12.4%;
5.对比测试5,8 同时提升33%缓存频率及内存时序,获得性能增益18.7%;
6.对比测试1,6 同时提升20%主频,33%缓存频率以及50%内存频率,获得性能增益51%
生搬硬套过来,先不考虑amd芯片缓存和ddr4内存与core2时代的二缓以及ddr2内存是否具备可比性;
假设硬改平台同步提升了内存时序和缓存频率,不考虑内存频率降低的debuff,总增益至多在20%左右;
再结合主频提升28%,1.28*1.2=1.536这个数字就非常熟悉了,原帖首先阐述的结论就是,综合提升到原先的153%,数值上可以说几乎完全吻合。
而谜团就在于此,原帖的测试中,双核默认15fps硬改后达到了33fps,性能提升120%;单核按照已有测试的核心效率(这是芯片物理规格决定)折算后为8fps,硬改后达到21fps,性能提升162.5%!!!
这仅是相同cpu仅进行28%超频时单纯的性能提升幅度,没有记错的话,哪怕从奔腾D到酷睿2都没有如此夸张的提升
所以原帖里面达到默频153%性能,和文中后面测试数据中超过100%甚至150%性能提升显然是矛盾的,所以我现在也开始关心原帖里的测试是否可以复现,或者这个提升幅度是否能在理论测试软件里有所体现;
————————————————
1月9日更新:
近几日随着对缓存和内存对整体性能增益的不断讨论,围绕着一系列资料和测试结果出现了一个很有意思的数字:20%
如果不是数字上的巧合,那么,这个数字或许就是解开谜团的关键所在了
或者说,多个偶然之间,一定存在着某种必然:
1)根据原帖结论,t9300经过硬改超频,性能是默频的153%,考虑到28%的主频提升,主频外的额外性能提升为19.5%
2)在对qx9300的首次测试中,qx9300_1066FSB@2.53ghz+ddr3_1066组合在测试中超过默频t9300_800FSB+ddr2_667组合18%;
3)在对qx9300@3.2ghz及2.53ghz测试中,综合单核、双核成绩,在频率提升26.5%的情况下,性能提升22%。换言之,相比频率-性能线性增加的状态,以thinkpad w700为基础的测试平台损失了20.5%的相对性能提升;
4)根据其他资料分析,同时提升33%缓存频率及内存时序,在对缓存及内存延迟敏感项目中可获得性能增益18.7%;
根据这四条线索,结合上面的一系列测试,经过简单梳理不难得出如下推论:
1.对于CORE2处理器,针对FSB和内存的硬改并不能从根本上提升芯片内部算力,算力仍然是IPC和频率决定!
2.相比现代计算平台(SNB及后续各代),CORE2平台性能受限于前端总线(FSB)设计,在缓存及内存效率上存在先天不足,导致对缓存及内存带宽需求极大的密集数据流计算(如视频转码或游戏等)中,出现明显的性能瓶颈,具体表现在频率和性能提升无法线性对应,且频率、核心数越高,损耗越大。
第二条基本是玩家内共识,有大量羿龙2cpu(如x4 955)在较新游戏和日常应用中表现强于酷睿2(如q9550)的案例
3.硬改方案在提升频率的同时,同步提升了cpu的数据交换能力,可以使cpu在特定频率区间内面对上述数据流计算任务时,提升其性能上限,如图中黄线到灰线的水平,但依旧无法跨越性能天花板(性能同步频率线性提升,如蓝线所示);
所以基于上述推论,我可以大胆提出下面猜想:
1.原帖中单核21fps,双核33fps的表现超出了理论性能上限,应该是受到了测试环境不一致的影响,预计的双核编码成绩应该在23fps左右,略高于w700平台22.1fps的成绩,但差距不会过大(5%以内,仅取决于内存参数间差异)。
2.原帖中对平台已经进行过深度硬件超频,潜力近乎耗尽,但如果有条件继续升高主频,或同等环境下换用四核处理器,1066FSB和ddr2_533低延迟内存组合依旧会出现带宽瓶颈,除非继续进行优化(可能性近乎为0),高频段(3.2ghz-4ghz)的性能增益依然会产生较大衰减,最终在4g频率左右接近w700平台的水平。
当然,所有的猜想需要一个真实的硬改平台加以验证,才能完成完美的逻辑闭环
不过分析至此,基本尘埃落定,酷睿2依旧是那颗酷睿2,它是那个intel孤独求败时代的见证,历经岁月沉淀,依然能在2023年的今天,撸起袖子,甩开膀子,向后辈们展示自己曾经年轻过的肌肉。
但是,无论过去如何,今天的它终究抵不过时代的巨浪,未来依旧属于年轻人,新陈代谢是这个世界得以维继并繁荣的根基。
最后预热一下,这篇帖子只是针对单个视频编码软件的分析,作为判定酷睿2及其他平台性能表现的依据必然略显单薄,想了解更多理论测试结果的同好们,可以期待我预计年后完成的13年间10代平台的综合性能纵测,三十余项,3000多组测试数据,相信会给51上的同好们带去更多信息和收获。
我来学战蝇君
贴国际象棋
hljgyr 发表于 2023-1-6 19:49
原帖在此 https://www.ibmnb.com/forum.php?mod=viewthread&tid=2026133
首先感谢作者ltmfly老哥非常 ...
超频的同时应该是把缓存频率也超了
如果跑的东西比较依赖延迟/缓存性能的话,
那Core 2 跑出出乎意料的结果也不是不可能 硬改超的是整个平台,性能肯定不是软超能比的…吧哈哈哈 这就是硬改超频的一个特色……可以把整套平台的性能拉上去
就像以前775超频,拉高外频可以明显提升平台性能,但与此同时北桥承受的压力也会巨大
以及或许跟老平台优化有点关系,有的游戏和软件就是破电脑跑的比新电脑快……{:1_245:}
不过无论怎么说,我是不会再用core2当日常用机了,绝对性能不够,体验就是拖泥带水 有台x61 T9900也可以这么超吗 {:1_245:} 本帖最后由 hljgyr 于 2023-1-9 14:57 编辑
果然把那个脏东西招过来了,所以论坛黑名单功能没恢复之前不放全部测试的结果绝对是明智的
提示下战赢佬,如果你没有硬改fsb,硬刷内存频率,没有用硬改pm965,pm45平台亲自测试过,无论是跑分软件还是应用软件,来证明文中或者你所宣称的指数级别性能增幅,建议你闭嘴
一是别人的劳动成果和你没有任何关系,二是你的意淫和嘴嗨不会对现实世界的物理原则和电路电气特性产生任何影响,你说十倍一百倍一万倍都行,没有人会在乎你,只会把你当成疯子和傻子,忠言逆耳,好自为之
^g^^g^^g^^g^ hljgyr 发表于 2023-1-7 12:23
果然把那个脏东西招过来了,所以论坛黑名单功能没恢复之前不放全部测试的结果绝对是明智的
提示下战赢佬 ...
我一直就觉得君君的所有Core2测试都站不住脚就是这样
游戏从来都是只发两个截图还就只有巫师3和奇点灰烬,奇点灰烬实机运行视频从来没有,好不容易发两个巫师3的视频,那画质那帧率我都不知道怎么就称之为能玩的
甚至现在他说换了DX12卡,天天逮着人家说玩不了DX12就是垃圾,可是也没见他上一个实物甚至是自己的电脑的GPUZ图,也不知道这是张什么卡
唯一有点参考价值的就是CPUZ,确实CPUZ至少Core2能跑出这个分,但君君也从来没用过自己的机器上过实机运行图,所谓的拷机不出红线也没有一个带实机测试的视频,每次回复的Core2图片用谷歌搜图一搜基本都能找到是别人的图
总之,坛子里从Core2用过来的老本友应该不少,对Core2平台的认知和理解也不浅,都知道他就是一小丑看个乐呵 郑中秋中指指 发表于 2023-1-7 13:07
我一直就觉得君君的所有Core2测试都站不住脚就是这样
游戏从来都是只发两个截图还就只有巫师3和奇点灰烬 ...
前T8100用户
只能说日常办公挺流畅 战赢君说的那些根本不存在 郑中秋中指指 发表于 2023-1-7 13:07
我一直就觉得君君的所有Core2测试都站不住脚就是这样
游戏从来都是只发两个截图还就只有巫师3和奇点灰烬 ...
想不到一个ID为51qcs(谐音“我要去吃屎”)的网友引起你这么大的关注{:1_272:}
此君想起这么恶俗的ID骂这个网站,想不到谐音上呵呵了。此君之前还有ID“51cnn”和“51cnm”,真的是腐烂的狗嘴吐不出象牙 签名机,顶你 hljgyr 发表于 2023-1-6 19:49
原帖在此 https://www.ibmnb.com/forum.php?mod=viewthread&tid=2026133
首先感谢作者ltmfly老哥非常 ...
支持探索(虽然我不愿动硬件),友情提醒几点:
1、楼主拿来类比的其他CPU的fps帧数,是否都是输出1280*720下的成绩?分辨率直接影响fps;
2、楼主编码软件需要安装,太麻烦,建议考虑<x264_FHD_Benchmark v1.0.1>绿色版,很多评测平台也在用这个,方便横向对比;
懒得装编码软件,倒是用8代CPU软解(锁定2.6G)跑了一遍楼主发的视频:1280(软平均70)、1920(软平均70)、3840(软50硬60);
(同时建议考虑换个场景跳跃不大的风景类视频,获取fps更平均)
不过即便软解,GPU还是有很大负荷的(potplayer显示),那么前面的编码软件是否受核显影响?
查了下ShanaeEcoder支持GPU加速的,盗图如下;类比数据来源情况太复杂,烧脑,楼主自行考虑吧~
先把软件保存到网盘再说..^y^^y^ COCAIN 发表于 2023-1-7 14:07
支持探索(虽然我不愿动硬件),友情提醒几点:
1、楼主拿来类比的其他CPU的fps帧数,是否都是输出1280* ...
更正:
找了个绿色版 ShanaEncoder,确保<OpenCL加速>没有勾选;其他默认;
参照楼主晒图中1098HK 2C4T 设定在2.6G主频跑,4C8T下(没找到在哪设)功耗要上22w,得到51.1fps@4C8T(11w仅能保持1.75G,耗时2分41秒,折算34fps@4C8T)
上面那个10980HK的成绩可信;
(供楼主自己研究吧,太累不玩了)
本帖最后由 hljgyr 于 2023-1-7 20:24 编辑
COCAIN 发表于 2023-1-7 14:07
支持探索(虽然我不愿动硬件),友情提醒几点:
1、楼主拿来类比的其他CPU的fps帧数,是否都是输出1280* ...
其他平台测试都是按照帖子里面说的方式设置的,因为默认配置不需要额外设置参数,操作方便些,保证测试条件的一致性是纵向评测的基石;
关于核显是否参与,在设置中我确认没有勾选任何硬件加速选项(这也是软件默认配置),同时测试前我也会预选跑一遍,打开任务管理器确认显卡没有额外负载;
原帖里面楼主也说硬件解码确实能提速不少,但是他对比后认为软件解码效果更好
x264_FHD_Benchmark 应该是HWBot出的那个是吧,我之前测试过的是x265_1080p的项目,作为理论测试(跑分)部分中的一项,ShanaEncoder是作为实际应用部分测试的
关于x265_1080p的性能,根据我的数据,core2与10代的同频差距更大,超过了3倍
10210u爆掉墙 内存频率如图
全程最低55fps,最高62fps
10代移动酷睿限制多,加上机器是戴尔,一条板载一条SODIMM,内存数据不好看
不过发现了两个有意思的现象:
1.在3890mhz的情况下速度是60fps整,3350mhz下速度是57fps,速度差值几乎可以忽略
2.这个软件对于QSV支持很差,3D部分动video部分完全不动,如果播放的话,win11播放器可以把核显videodec.可以占用到70%
另外,4K120的炮姐真的爽啊{:1_241:}不过文件也是真的大。现在超炮这个企划好像也没动静了。。。。 特技的头发 发表于 2023-1-7 20:48
10210u爆掉墙 内存频率如图
全程最低55fps,最高62fps
10代移动酷睿限制多,加上机器是戴尔,一条板载 ...
测试的时候自然没有开QSV。开了最高速度反而掉下55帧 不转265没意义 51qcs 发表于 2023-1-8 15:51
楼主发现了新大陆!硬改core2特别强,ipc超过了haswell8%,达到了skylake和zen3的87%,tigerlake的76%
6