【转帖】optiplex 5080值得期待

omnivorous 发表于 2020-5-2 20:05

本帖最后由 qianxideyu 于 2020-5-2 20:18 编辑

板载2.5千兆网卡，比较给力啊。
不过这一代还是没有avx512，遗憾。

qianxideyu 发表于 2020-5-2 20:19

AVX512，传闻需要12核心才能完全发挥出来，或者改善架构！

omnivorous 发表于 2020-5-2 22:58

qianxideyu 发表于 2020-5-2 20:19
AVX512，传闻需要12核心才能完全发挥出来，或者改善架构！

和核数没关系！
和内存带宽或许有点关系。

qianxideyu 发表于 2020-5-3 07:20

omnivorous 发表于 2020-5-2 22:58
和核数没关系！
和内存带宽或许有点关系。

之前英特尔发过一个说明，后来又给删了！也不知道avx512到底何时全部支持

Jasl-光誓 发表于 2020-5-3 22:29

本帖最后由 Jasl-光誓于 2020-5-3 22:35 编辑

10 代 2.5G 网卡有硬件缺陷 {:1_245:} 桌面等火箭湖吧，看了资料是把 10nm Tiger Lake 的架构给放大到用 14nm 工艺生产，该有的都有了就
倒是 Precision 7x50 外媒有泄露宣传图了，很有料哦~

卖货郎 发表于 2020-5-5 19:16

帮顶了。。。学习学习

omnivorous 发表于 2020-5-6 04:05

Jasl-光誓发表于 2020-5-3 22:29
10 代 2.5G 网卡有硬件缺陷桌面等火箭湖吧，看了资料是把 10nm Tiger Lake 的架构给放大到用 14 ...

火箭胡有avx512？另外11代和10带是不是一样的接口和芯片组？

Jasl-光誓 发表于 2020-5-6 04:34

本帖最后由 Jasl-光誓于 2020-5-6 04:47 编辑

omnivorous 发表于 2020-5-6 04:05
火箭胡有avx512？另外11代和10带是不是一样的接口和芯片组？
传言是火箭湖（11代）兼容 10代（彗星湖）的芯片组，毕竟这十代刚加了几百个针脚，可能够 PCIe 4.0 用了。新芯片组肯定要发的，毕竟要支持 PCIe 4.0。

消息源：https://www.tomshardware.com/new ... xe-graphics-pcie-40
笼统的讲就是 Skylake 改不动啦，AMD 移动版都锤爆 I 家桌面版了，今年底要发 10nm Ice Lake 架构 Xeon，估计 10nm 桌面级产能还没爬上去，全部产能都先给它了，消费级就把 Tiger Lake 的 Widow Cove 给放大到 14nm 背水一战一把。
刚看到这个感觉挺诡异的，但是我工作缘故跟 Intel 咨询了一些新平台特性，印证了泄露消息的一部分内容。

新的 2.5G 网卡有硬件层面缺陷的新闻 CB 就有，看新闻要 11 代平台上彻底修复了。

说来看论坛都在说 AVX512，好奇现在啥软件能利用到 AVX512 了

大D-Daring 发表于 2020-5-6 09:58

Jasl-光誓发表于 2020-5-6 04:34
传言是火箭湖（11代）兼容 10代（彗星湖）的芯片组，毕竟这十代刚加了几百个针脚，可能够 PCIe 4.0 用了 ...

avx512看着高大上嘛其实没几个人会用，用它的一般也是多路平台
2.5g网卡缺陷怎么说？

Jasl-光誓 发表于 2020-5-6 14:02

本帖最后由 Jasl-光誓于 2020-5-6 14:06 编辑

大D-Daring 发表于 2020-5-6 09:58
avx512看着高大上嘛其实没几个人会用，用它的一般也是多路平台
2.5g网卡缺陷怎么说？
https://www.chiphell.com/forum.p ... a=page%3D1&mobile=1

...但是根据Intel最新发给主板厂商、OEM PC厂商的安全通稿，i225系列网卡存在缺陷，“封包间隙”(IPG)不稳定会发生波动，进而导致数据包丢失，网络性能下降，可能会损失1-10Mbps的数据。

比较奇怪的是，这个问题还和路由器、交换机品牌有关，搭配网件、水星、Aquantia的时候会出现，而搭配思科、华为、Buffalo、Aruba的时候就没事。

糟糕的是，这个缺陷存在于硬件层面，无法通过补丁修复，唯一不是办法的办法就是在驱动中手动将网速模式设为千兆，也就是降级使用。

Intel正在开发i225网卡的新步进版本，预计今年下半年完工，与下一代桌面酷睿平台Rocket Lake-S同步投产。
===

Intel 网卡的硬件缺陷传统艺能了，不是第一次。而且这 Linux 的 Wifi 驱动坏了快一年了，手贱上了 Ubuntu 的 HWE 内核，刚好命中 Intel 改坏驱动的那个内核版本（5.3），从 5.3 修到 5.7 了还没修好，逼我给每个房间都加装交换机...

大D-Daring 发表于 2020-5-6 14:45

本帖最后由大D-Daring 于 2020-5-6 14:46 编辑

Jasl-光誓发表于 2020-5-6 14:02
https://www.chiphell.com/forum.p ... a=page%3D1&mobile=1

...但是根据Intel最新发给主板厂商、OEM...
这么高科技的炫富让我措手不及
这个bug如果是吃鸡决赛圈出现就很醉人了

omnivorous 发表于 2020-5-6 17:19

本帖最后由 omnivorous 于 2020-5-6 17:23 编辑

Jasl-光誓发表于 2020-5-6 04:34
传言是火箭湖（11代）兼容 10代（彗星湖）的芯片组，毕竟这十代刚加了几百个针脚，可能够 PCIe 4.0 用了 ...
因为搞计算机的人占据了it媒体的舆论主流，于是avx512无用论甚嚣尘上。

双精度浮点基本都是非计算机专业的人在用。计算机专业领域中计算量最大的机器学习，基本上是单浮点+半浮点组合，而且现在大部分跑在GPU上面。

但工程计算，基础科研，基本都是双浮点，这个英伟达优化的不好。
而且工程计算容易溢出，一但溢出就转向CPU处理了，所以GPU效率往往不高。
或者是模型太大，显存装不下，GPU的效率也会很低。
所以大比例仍然在CPU上面跑。

比如：avx256 vs. avx512，ANSYS实际平均快40%

大D-Daring 发表于 2020-5-6 17:34

omnivorous 发表于 2020-5-6 17:19
因为搞计算机的人占据了it媒体的舆论主流，于是avx512无用论甚嚣尘上。

双精度浮点基本都是非计算机专 ...

这种时候就不是家用或者移动平台表演的时刻了呀
多核多路对avx512的支持就非常重要了
说到这里为什么amd专业场合还是很少见。。

omnivorous 发表于 2020-5-6 21:12

本帖最后由 omnivorous 于 2020-5-6 21:18 编辑

大D-Daring 发表于 2020-5-6 17:34
这种时候就不是家用或者移动平台表演的时刻了呀
多核多路对avx512的支持就非常重要了
说到这里为什么am ...
连谷歌用的都是攒的服务器。

工程计算小集群根本没必要专用服务器+Xeon，普通机性价比更高，等ddr5来了以后，这种情况会更多。
唯一需要一点高成本的是交换机和网卡。

avx512早就有了，一直不下放，3通道内存也不下放，就是怕影响高端xeon的市场。
现在是被amd逼得，否则就没有卖点了。

大D-Daring 发表于 2020-5-6 21:18

omnivorous 发表于 2020-5-6 21:12
连谷歌用的都是攒的服务器。

工程计算小集群根本没必要专用服务器+Xeon，普通机性价比更高，等ddr5来 ...

AVX512功耗太大目前不好解决
多通道内存和多pci通道是市场策略
Google攒机和一般人diy根本不是一个概念的 Google是自己开发的服务器，硬件都是定制的！

omnivorous 发表于 2020-5-6 21:25

本帖最后由 omnivorous 于 2020-5-6 21:37 编辑

大D-Daring 发表于 2020-5-6 21:18
AVX512功耗太大目前不好解决
多通道内存和多pci通道是市场策略
Google攒机和一般人diy根本不是一个概 ...
我上面没说清楚，真实的情况是，谷歌大量使用普通PC做集群。谷歌的算力占全球总算力的20%，youtube流量占全球网络流量的一半，全买大服务器的话，谷歌早就破产了。

flops/$的比值，普通PC远高于大型服务器。

Jasl-光誓 发表于 2020-5-6 22:57

本帖最后由 Jasl-光誓于 2020-5-6 23:09 编辑

omnivorous 发表于 2020-5-6 21:25
我上面没说清楚，真实的情况是，谷歌大量使用普通PC做集群。谷歌的算力占全球总算力的20%，youtube流量占 ...
还是服务器的，只不过没人用小型机了（十几年前小机就卖不动了）。

我合伙人 ex-Googler，G 家芯片选择上 Xeon 为主吧，现在 AMD 的占比多了（一方面 CPU 确实 Yes，另一方面 GPU 上老黄太蛮横），CPU、GPU 会有一些是定制型号（比如 Stadia 用的 GPU 是 AMD 给定制的跟游戏机类似），机器和机房都自己定制的。
还有一些自研硬件，比如你用 GCP 最垃圾的机器生成 4096 位质数只需要十几秒，同级别 AWS 的机器要一宿，我们推测有硬件随机数发生器。

顶级 IT 公司基本都是这样了，具体路线会有差异，Google 结合定制 ASIC，微软上 FPGA，国内华为搞自己的鲲鹏。

omnivorous 发表于 2020-5-7 00:15

Jasl-光誓发表于 2020-5-6 22:57
还是服务器的，只不过没人用小型机了（十几年前小机就卖不动了）。

我合伙人 ex-Googler，G 家芯片选 ...

程序员关心的永远是整数性能，这大概就是amd为什么如此yes的原因了。

Jasl-光誓 发表于 2020-5-7 00:33

本帖最后由 Jasl-光誓于 2020-5-7 03:45 编辑

omnivorous 发表于 2020-5-7 00:15
程序员关心的永远是整数性能，这大概就是amd为什么如此yes的原因了。
说 CPU 厂商忽视基础科研行业的需求更说得通，毕竟要不是 Intel 决定把 Tiger Lake 放大成火箭湖，原定时间表是明年才会在消费级领域支持 AVX512 的（其实真正可买到实物得是后年了）。
既然现在大家都没有 AVX512，AMD 价格便宜、核多、IO 性能好，绝大多数应用都是 IO 密集的，为啥不 Yes 呢？
如果说 HEDT，Intel 方最高 28 核有 AVX512，AMD 方最高 64 核且 IO 更快，那完全就是各取所需的问题了。

还有几个灵魂问题：如果 AMD 也做出来 AVX512 了呢？Intel 除了 AMD 还有哪个像样的竞争者？如果 Intel 垄断了对终端用户/企业是有害还是有利？

====

我似乎没提到整数吧？就拿网站领域为例，现在浏览器都强制网站 HTTPS 了，AVX512 这种先进的 SIMD 对于 SSL 相关的算法还是有巨大提升的，临时搜了一把，看到有数据基于 AVX512 的 SHA 算法相比 AVX2 可以提升 8 倍性能。

但能用最好，没有无所谓，因为 Google 搞了专门的硬件、微软上 FPGA，效果可以比 AVX512 强，普通的小团队可以直接用 GCP、AWS、Azure 获得好处，OpenSSL 这种基础库自身也在能力范围内改进算法，还不会被 Intel 掣肘。

这说白了就是基础研发投入的问题。

ANSYS 前几天我的水群有几个研究爆炸和流固耦合的朋友扯到了，他们提了一句（我总结下大意）“求解器很多年不更新了，底子还是90年代初的算法，这几年提升了收敛性和效率也没啥突破，理论也没啥突破”

我合伙人过去在 Google 做中文语音识别的，他们当时训练模型市面上的显卡没有能塞得下原始数据的，怎么办？计算任务分解，几千台云主机实例 CPU 并行运算，最后合并出结果。

最近因为疫情，国外那个 Folding@Home 让平民捐献自己计算机的限制算力参与计算新冠病毒蛋白质折叠的项目火了，这是基础科研吧？几乎所有的家用机都没有高级配置，但是得益于分布式算法，实现了接近超级计算机的效果。

程序员还是很擅长改进算法和工程方式的（写业务多无聊），回到开头 HTTPS 的问题，没有先进指令集支持，难道就弃疗了么？随便搜一篇“程序员”克服困难的路子 https://cloud.tencent.com/developer/article/1005610。

你用的仿真或者计算软件也都是程序员写出来的，没有突破很可能就是厂商研发投入不足。

当然了，AVX512 既然要来了，肯定还是可以用起来先受益，程序员对高性能硬件也很向往，但一个指令集并不是什么万灵药。

页: [1]

专门网's Archiver

【转帖】optiplex 5080值得期待