Paleshell's Cornfield🌽
528 subscribers
948 photos
19 videos
13 files
230 links
A reader lives a thousand lives before he dies
The man who never reads lives only one
Download Telegram
AMD Adrenalin 23.9.2 发布,不少人注意到从这个版本开始,Polaris/Vega 和 RDNA 的驱动分开了。对于旧架构显卡(以及基于 Vega 的核显)的用户显然不是好消息,这可能意味着 RDNA 架构前的 GPU 的驱动支持已经时日不多了。580 价格也许也会受其影响。
https://www.youtube.com/watch?v=bY6K_1Z74S0
Iceberg 又回来做 console killer 了!这次的目标是 250 英镑的 XSS(或 300 刀,或瞄了一眼拼多多全新 1650)。他用的是工作站升级,国内似乎不那么流行。CPU 从 E5-1620V3(4C8T)升级到 E5-2640V3(8C16T)!我前段时间给家里装的就是 2640V3,涨价挺多,当然他显然应该不了解 B 站满大街的 X99 鸡血,我测过性能提升和频率提升(全核 2.8 到 3.4)差不多。GPU 用的 2060 显然比我好多了,虽然显存少点,但 N 卡显存压缩还是不错的。580 即使理论算力比 XSS 强一些,实际性能应该要差不少。
Paleshell's Cornfield🌽
前几天看了极客湾折腾 Switch 那期,在 Switch 上运行 PC 游戏,于是我也想折腾一下我手头闲置的安卓设备。 首先是一台闲置的 Redmi 6,联发科 Helio P22,8 核 A53,GPU 还是 PowerVR 的。然而这个机型似乎比较冷门,我只找到了 Redmi 6 Pro 刷 Linux 的教程,后面找 MIUI 国际版也比较费劲。于是就改成随便试试刷机,找闲置 SIM 卡绑定账号,解锁 Bootloader,然后刷入 MIUI 国际版,感觉确实比国内版正常一点。然后发现这个 PowerVR…
在手机上运行 Spirit of the North!最近在折腾 box64droid,至少在我的手机上比 exagear 快很多,但能正常运行的游戏还是很有限。用 Unity 的游戏似乎都不行,3dmark 最多只能跑 2001 SE,老滚 5 最多能到 BGS 字幕然后卡住。只有 SotN 这个要求挺高的 UE4 游戏居然能运行,虽然只开了 800*600,分辨率缩放开到很低,但好歹能运行,虽然有些存档读取也会卡住。
Paleshell's Cornfield🌽
AMD Adrenalin 23.9.2 发布,不少人注意到从这个版本开始,Polaris/Vega 和 RDNA 的驱动分开了。对于旧架构显卡(以及基于 Vega 的核显)的用户显然不是好消息,这可能意味着 RDNA 架构前的 GPU 的驱动支持已经时日不多了。580 价格也许也会受其影响。
上回 23.9.2 驱动已经把 RDNA 和更老的架构分开了,这次 23.9.3 直接就不支持 RDNA 以前的架构了……希望只是暂时的。另外,我之前用 23.9.2 外接 580,发现只要控制面板调了电压或风扇设置,进游戏或过一会儿必定白屏。一开始我怀疑是显卡问题,回家台式机也有一样的问题。经过测试,这个 bug 似乎是 23.9.1 引入的,大概是因为引入了 Anti-lag+ 之类的新东西导致的,希望能修好。于是我只好用 23.8.2 来测试显卡。顺便预告一下,我打算做下一个外接显卡的视频了,已经测了 12 个游戏更详尽的数据,敬请期待。
大概是 ACM 看多了……#copilot
在外接显卡测试中,我想到能不能监测 PCIe 带宽,于是找到了 Intel PCM(AMD 似乎没有类似的功能)。发现了 x99 的又一个优势:支持 PCIe 带宽监测的性能计数器,虽然只支持 socket 级别,没法区分设备(显卡),但下一代 Skylake 的服务器平台现在应该还很贵,而上一代 x79 看起来应该不支持。消费级平台就不用想了,E3 应该也算在内。文档是 VTune 的,不过和 PCM 应该是一样的。
https://www.intel.com/content/www/us/en/docs/vtune-profiler/user-guide/2023-1/input-and-output-analysis.html#PLATFORM-LEVEL
如何在 Excel 中做出类似左图的堆叠+多系列条形图呢(图源:极客湾 4060 评测)?如果不考虑边缘,用减法公式+堆叠条形图就行。但问题是堆叠条形图只支持单系列数据(另一维是堆叠),而在一般的评测中显然需要多系列(游戏*设备)。问 new bing 无果,找了半天,发现只用 Excel 只能 hack,也就是加上一些空白数据「伪装」成多系列……要不就得自己写 matplotlib 之类的,我也不太熟悉。
Paleshell's Cornfield🌽
初步成果!
通过更多的 hack 加上了 label!
提示:ghost 序列(堆叠条形图不支持标签显示在上方)和标签选项—单元格中的值
今天更新了 hwinfo64,发现加入了 Intel PresentMon 支持,其中最重要的指标就是 GPU Busy 了,号称继 frametime 之后最重要的新指标,简单来讲就是 GPU 的帧渲染时间,各厂商通用。然而我上次装了 PresentMon 根本没法启动,这次又下了个 v0.5 beta 倒是没问题,不过还是挺难用的。当然 hwinfo 显示这些指标不依赖外部 PresentMon 安装。
然后我试图让它加入 RTSS,发现最多只能 1s 更新一次,用来画图绝对不够。于是我发现最新的 RTSS 7.35 beta 也已经加入了新版 PresentMon 支持,同时发现 RTSS 也有自带的 OSD,编辑起来也比 Afterburner 方便。只需要启用并双击 OverlayEditor 插件,载入 PresentMon 的样式就能试玩,不过要用得先禁用 Afterburner 的 OSD。效果如图所示,看起来很 NB。不过 RTSS 开发者也提到 PresentMon 有延迟而且延迟不固定,于是只好加了一个固定的 3s 延迟,来避免 PresentMon 指标卡顿……
Paleshell's Cornfield🌽
通过更多的 hack 加上了 label! 提示:ghost 序列(堆叠条形图不支持标签显示在上方)和标签选项—单元格中的值
周末用 Matplotlib 重做了统计图,因为我想要每个游戏一张图,而且还有一些游戏有额外数据,Excel 实在太麻烦了(
不用问,又浪费了很多时间,于是视频就咕到下周了。
最近在看去年下载但没看的一些论文,试图寻找 GPGPU 的历史开端,主要是消费级显卡这边的,因为希望能在考古中复现。GPGPU 在可编程着色器(DX8)出现后才有的吗?按常理感觉确实如此,而且在 DX10/CUDA 以前,GPGPU 小众且难用,即使有 Brook 之类的先驱。然而我去年找到的这些论文把 GPGPU 又提前了很多,只需要支持 multitexturing 和 texture combiner(或 blending),但其实 multi-pass 应该也行,如果有 stencil 和 alpha test 则可以做初步的条件分支了。
LARSEN, E. S., AND MCALLISTER, D. 2001. Fast matrix multiplies using graphics hardware. In Proceedings Supercomputing 2001. 这篇用纹理的 modulate 操作实现数值乘法,再做 N 次叠加就完成了矩阵乘法,感觉非常厉害,但仔细看看,早期大家应该都这么做。以前我看到 GeForce 3,没仔细看文章就认为肯定用了 shader 嘛,不然为什么用 GF3,但实际上它只用了(应该是)DX6 级别的操作。最大的问题就是精度只有 8 位(单通道)以及运算是饱和的。
M. S. Peercy, M. Olano, J. Airey, and P. J. Ungar. Interactive multipass programmable shading. In Computer Graphics, SIGGRAPH Annual Conference Proceedings 用固定管线的 OpenGL 1.2 实现可编程的 RenderMan,基本思想也是用纹理当存储,通过 multi-pass 实现复杂的程序逻辑。由于需要做到通用,也需要用到一些编译技术。
所以,可编程着色器看起来并不是那么具有开创性了,只是把原来需要绕几个弯才能用的功能直接暴露出来而已,当然这个绕几个弯的效率可能不一定高(但矩阵乘法那篇还是用 GF3 勉强超越了 SSE 加持的奔腾 4)。2000 年以前,人们能在局限的硬件上做出丰富的效果(图形/通用),可惜这些技巧大多随着色器的普及而消失在历史中,如今就比较难找到了。不过网站和 SDK 可能会消失,学术论文一般还是能找到的,只可惜没代码。
另外推荐一个 pre-shader 的 Advanced Graphics Programming Techniques Using OpenGL.