Phoronix CN
68 subscribers
61 photos
786 links
开源新闻,硬件资讯等
这里不转发硬件测评

Phoronix 的中文镜像 更新不及时 [非官方]
如果需要获取及时信息请前往 phoronix.com
Download Telegram
PostgreSQL 迎来批量模式和其它异步 I/O 改进

上周 PostgreSQL 合并了对 IO_uring 的支持, 该支持可提供 "大幅提升" 性能来提升这款流行的开源数据库服务器的性能
在周末, PostgreSQL 的异步 I/O (AIO) 代码合并了一些额外改进, 包括引入一种新的批处理模式, 该模式同样可提升性能

在 IO_uring 支持几天前合并后, 周日又合并了 PostgreSQL 的几项额外 I/O 改进
最新的活动包括为缓冲管理器提供异步 I/O 读取支持, 以便异步读取到缓冲池中
随后还提交了额外的代码, 以开始实际使用该异步 I/O 读取支持

接着提交了代码以引入并使用可选的批处理模式支持
这种批处理模式支持允许以更大批次提交 I/O, 从而比逐一提交具有更高效率
这可以帮助提高 PostgreSQL 对许多小读取操作的性能
由于相关语义的原因, 批处理模式支持是一个选择性功能

本周末为 Postgres 完善 I/O 改进的最后一步是由于克服了先前的限制, 在所有系统上启用了 I/O 并发

这些针对 PostgreSQL 数据库服务器的 I/O 改进正为九月发布的 PostgreSQL 18 版本做准备

#FreeSoftware #PostgreSQL
原文链接
Redis 分支 Valkey 8.1 版本发布 - 转向 AVX2 以提升性能

自从 Linux 基金会及其合作伙伴宣布 Valkey 作为 Redis 的一个分支以来, 已经过去了一年多
继去年 9 月发布 Redis 8.0 之后, 这款内存键值数据库的 Valkey 8.1 版本今日发布

Valkey 8.1 作为该 Redis 分支的一个小幅升级版本发布
相比 Valkey 8.0, 该版本在性能, 可靠性和可用性方面都有所提升

Valkey 8.1 的一项新性能优化是通过 x86 SIMD 指令优化 bitcount 命令的性能
目前, 该优化主要是利用高级矢量扩展 2 (AVX2) 加速 bitcount

添加 AVX2 优化的 bitcount 命令的拉取请求显示, 在处理较大数值时有明显的加速效果

Valkey 8.1 还包括其他性能优化, 例如使用更高效的哈希表存储键、支持 I/O Threads 的 TLS, 以及其他优化

Valkey 8.1 GA 版本的下载及更多详细信息请访问 GitHub

#FreeSoftware
原文链接
ZLUDA 持续开发 PyTorch 支持, 关注 32 位 PhysX 支持

ZLUDA 开源项目用于 "在非 NVIDIA GPU 上运行 CUDA", 目前仍在开发中
旨在使 AMD GPU 和其他硬件厂商能够运行类似 GeekBench 和 AI 工作负载的 CUDA

ZLUDA 项目希望今年能够支持 PyTorch, 并计划支持 32 位 PhysX
因为 NVIDIA 在最近推出 RTX 50 Blackwell 时已经停止对上游 32 位 PhysX 库的支持

ZLUDA 主要开发者 Andrzej Janik 发布了一篇新博客文章, 总结了今年第一季度的开发工作
PyTorch 仍然是 ZLUDA 开发的首要任务, 目标是在今年下半年使其正常运行

现代 ZLUDA 中的 PhysX 并不是重点, 但由于 NVIDIA 在 GeForce RTX 50 / Blackwell GPU 上停止支持 32 位 PhysX, 这一思路略有变化
有人认为 ZLUDA 可以 "拯救" 32 位 PhysX 支持, 使其在 AMD 和 NVIDIA GPU 上均能运行
不过这并非主要任务, 因此理想情况下需要更多对 PhysX 感兴趣的开源开发者参与

ZLUDA 还在致力于改进 LLVM 单元测试及其他改进

对 ZLUDA 当前状态感兴趣的人可以通过 GitHub 项目网站查看 Q1 2025 进展报告

#FreeSoftware #ZLUDA #CUDA
原文链接
FEX 2504 为在 ARM64 上运行 x86_64 Linux 可执行文件带来更多优化

FEX 2504 已发布其最新月度功能更新, 这款开源模拟器允许在 AArch64 Linux 主机上运行 x86/x86_64 二进制文件
作为 QEMU 和 Box64 的替代方案, 它持续专注于新的性能优化, 以进一步提升这款 x86_64-on-ARM64 模拟器的吸引力和高速潜力

FEX 2504 带来了对 Windows PE Volatile Metadata 的初步元数据支持, 针对游戏 Slay the Spire 的音频修复以及其他性能优化
Volatile Metadata 是 Microsoft MSVC 2019 的一项功能, 使编译器生成可以被 Microsoft 的 Prism ARM64 模拟器使用的 "volatile" 元数据, 从而避免昂贵的 x86 内存模型模拟
FEX 现在支持这一功能, 并且与 Wine 配合使用可能带来更多性能提升

过去一个月 FEX 的部分性能优化集中在更好地优化 SHA256, 支持 Arm FEAT_FRINTTS 扩展, 改进各种 AVX 处理以及其他多种修复和针对性性能调整

通过 FEX-Emu.com 可下载 FEX 2504 并获取更多关于这次月度模拟器更新的信息

#FreeSoftware
原文链接
Blender 正在寻求帮助测试其成熟的 Vulkan 后端

随着 Blender 4.4 的最新发布, 它为其 Vulkan 后端带来了许多改进, 但仍被视为实验性

他们希望今年使其 Vulkan 渲染器达到生产就绪水平, 为此需要社区在测试方面提供更多帮助

Blender 正在鼓励有兴趣的用户使用当前的 Blender 4.5 alpha 版本测试 Vulkan 后端

Blender 开发者正在验证 Vulkan 后端, 以使其成为官方支持的后端, 最近他们重点提升了其性能

在这个目前处于实验阶段的后端中, 用于绘制用户界面和处理 EEVEE 的是 Vulkan 而非 OpenGL, 但这一变化并不涉及在 Cycles 引擎中使用 Vulkan API

有兴趣在 Blender 4.5 开发版本中测试当前 Vulkan 后端的用户可以在 devtalk.blender.org 上了解更多当前状态并提供反馈

#FreeSoftware
原文链接
PostgreSQL 合并了对 NUMA 感知性的初始支持

PostgreSQL 开源数据库服务器最近经历了一系列令人振奋的变革...
PostgreSQL 18 最近合并了 IO_uring 支持, 同时利用 AVX-512 加速 CRC32 计算, 实现最高 3x 性能提升
今天合并到 PostgreSQL 的还有对 NUMA 感知性的初步支持, 用以提升多节点/插槽服务器上 PostgreSQL 的性能

在即将于九月发布的 PostgreSQL 18.0 版本之前, 基础 NUMA 感知性已合并到 PostgreSQL Git 中
如果使用 "--with-libnuma" 配置选项进行构建, 则初步实现了仅限 Linux 的 NUMA 感知性
其他操作系统的 NUMA 感知性可能会在以后添加

正如在关于 PostgreSQL 的 NUMA 感知性支持讨论中所提到的, 该工作基于去年著名微软工程师 Andres Freund 在 PGConf EU 上的演讲

对于多插槽服务器而言, 这种 NUMA 感知性应能帮助降低延迟
-- 有望实现非常显著的改善, 它还可以帮助在靠近 PCIe 连接的存储或更好处理 CXL 内存的 NUMA 节点上执行数据库 I/O

在为 PostgreSQL 添加了基础 NUMA 感知性之后, 已经推出了 pg_shmem_allocations_numa, 用于提供共享内存在 NUMA 节点之间分布的信息
以及 pg_buffercache_numa, 用于提供各个缓冲区在 NUMA 内存节点上的信息

在今年晚些时候发布的 PostgreSQL 18 版本之前, 观察这种 NUMA 感知性能调优到何种程度将十分有趣
无论如何, 看到 NUMA 感知性支持最终进入主流开源 PostgreSQL 数据库服务器令人振奋

#FreeSoftware #PostgreSQL
原文链接
OpenSSH 10.0 发布以更好地抵御量子计算机的攻击

OpenSSH 10.0 现已面世, 此款广泛使用的 SSH 客户端/服务器 实现包含诸多改变, 其中包括为应对未来量子计算机可能的攻击提供更佳防护

OpenSSH 10.0 取消了对已被弃用十年的弱 DSA 签名算法的支持, SSH 守护进程 (SSHD) 还将负责协议用户认证阶段的代码移至新的 "sshd-auth" 二进制文件中以更好地隔离预认证攻击面

在安全方面, OpenSSH 10.0 还修正了 "DisableForwarding" 针对 X11 转发的功能, 因为事实证明其未能按文档所示禁用 X11 转发和代理转发

为了在量子计算环境中提供更佳防护, OpenSSH 10.0 现默认采用混合后量子算法 mlkem768x25519-sha256 进行密钥协商, 该算法目前被认为能够防范量子计算机可能的攻击且较之前默认算法更快

OpenSSH 10.0 还新增了一个用于验证 FIDO 认证证明的在研工具, 此实验工具位于 regress/misc/ssh-verify-attestation 目录下供测试使用, 但默认并未安装

关于今天 OpenSSH 10.0 版本诸多更改的详细信息, 可参阅邮件列表公告OpenSSH.com 提供的下载

#FreeSoftware
原文链接
Pinta 3.0 图像编辑程序发布, GTK4 移植

在这款流行图像编辑器 GIMP 3.0 通过 GTK3 移植及其他诸多改进最终发布一个月后, Pinta 3.0 现已发布
请注意, Pinta 是受 Paint.NET 启发的开源图像编辑程序
在 Pinta 3.0 发布中, 该图像编辑器已移植至 GTK4 及 libadwaita

Pinta 是一款相对简单的图像编辑器, 其灵感来源于 Windows 平台上的 Paint.NET 程序
Pinta 3.0 最大的变化是移植到 GTK4 工具包并使用 libadwaita, Pinta 仍然采用 C# 编程语言编写

Pinta 3.0 还带来了 macOS 的 ARM64 安装程序, 各种新的图像效果
支持导出为 PPM 文件, 支持在调整图像大小时采用最近邻采样, 支持 Windows 上的 WebP 图像文件以及其他许多改进

通过 Pinta-Project.com 下载及了解更多关于 Pinta 3.0 发布的详细信息

#FreeSoftware
原文链接
LibreSSL 4.1 版本发布: 现代 AMD 和 Intel CPU 上 SHA-1/SHA-256/SHA-512 速度更快

LibreSSL 4.1 于今日发布, 作为这个 SSL/TLS 库项目的最新版本, 该项目十年前由 OpenBSD 从 OpenSSL 分叉而来

LibreSSL 4.1 引入了新的 SHA-1, SHA-256 和 SHA-512 x86_64 汇编实现, 适用于现代 AMD 和 Intel 处理器 这些新的用于 x86_64 的 SHA-1/SHA-256/SHA-512 实现利用了 SHA-NI 指令(如果可用)并重用了旧的 Perl 生成的汇编代码

LibreSSL 4.1 还为 AArch64 提供了新的 SHA-256 和 SHA-512 实现, 利用了 ARM 加密扩展 (CE)

LibreSSL 4.1 的另一项 CPU 改进是引入了对 LoongArch 64 位中国 CPU 架构的实验性支持

LibreSSL 4.1 还带来了错误处理改进, 许多错误修复, 为 AMD64 和 AArch64 重做的 CPU 能力检测以及各种其他改进

关于今日 LibreSSL 4.1 发布的下载和更多详情请访问 LibreSSL.org

#FreeSoftware
原文链接
Redis 8.0 发布: 现在采用 AGPLv3 三重许可

去年, Redis 采取了备受批评的举措, 将其许可协议改为 Redis Source Available License v2 和 Server Side Public License v1 (SSPL)
此举受到开源社区的广泛谴责, 并导致 Linux 基金会将其分支为 Valkey, 同时还出现了像 Redict 这样的其他分支
在此后的几个月里, 许多 Linux 发行版已从 Redis 切换到 Valkey
现在 Redis Labs 今天宣布, 随着 Redis 8.0 版本的发布, 他们正在许可协议中加入 AGPLv3

在这场软件许可协议的混乱一年后, Redis 决定为今天发布的 Redis 8.0 版本添加 OSI 批准的 AGPL 许可协议
今天合并到 Redis Git 的内容在保留 RSALv2 和 SSPLv1 作为选项的同时, 添加了 AGPLv3

有关此变化的详细信息可通过 Redis.io 博客获取

#FreeSoftware
原文链接
FEX 2505 发布: 针对在 Linux AArch64 上运行 x86_64 二进制文件进行了许多修复

FEX 2505 今天发布, 作为这款用户空间软件的最新版本, 它能够以极高的速度在 ARM64/AArch64 Linux 主机上运行 x86_64 二进制文件, 许多游戏和应用程序正通过此模拟器取得巨大成功

FEX 2505 带来了针对与更新的 FUSE 库版本一起使用的修复, 内存泄漏修复, 一些系统调用修复, 各种 x87 怪癖修复, 多块 JIT 改进以及各种其他代码清理和错误修复
FEX 也在继续努力支持 WINE ARM64EC

可通过 FEX-Emu.comGitHub 下载并获取有关 FEX 2505 模拟器发布的更多详细信息

#FreeSoftware
原文链接
Llamafile 0.9.3 带来了对 Qwen3 和 Phi4 的支持

Llamafile 作为有趣的 Mozilla 项目, 持续推进, 该项目允许从单个文件轻松分发和运行 AI 大型语言模型 (LLMs) , 并以跨平台和跨供应商硬件的方式进行
Llamafile 0.9.3 今天发布, 为这个 Mozilla Ocho 项目带来了更多增强功能

Llamafile 0.9.3 带来了对处理 Phi4 和 Qwen3 模型的支持
为了在 Llamafile 包中支持 Phi4 和 Qwen3 模型, 需要基于 Llama.cpp 的更改进行各种修改

Llamafile 0.9.3 版本还修复了其较新的 LocalScore 组件的问题
LocalScore 是一个新的 Mozilla Builders 项目, 用于本地 AI LLM 基准测试
Llamafile 0.9.3 的 LocalScore 更改采纳了我提出的一些增强基准测试的请求

此外, 本次更新还带来了一些文档更新和其他次要增强功能
可通过 GitHub 获取 Llamafile 0.9.3 的下载和更多详细信息
鉴于本次发布中合并的更改应该解决了我在之前注意到的一些障碍, 我也将开始在不同硬件上尝试一些 LocalScore AI 基准测试.

#FreeSoftware
原文链接
Rust Coreutils 0.1 发布, 性能大幅提升 - 可媲美或超越 GNU 速度

Ubuntu 25.10 计划默认搭载基于 Rust 的 Coreutils "uutils", 这对 GNU Coreutils 的这个替代品来说是重要的一年
为了进一步推进项目目标, 今天发布了 Rust Coreutils v0.1

在两个月前发布的 Rust Coreutils 0.0.30 之后, 现在是 Rust Coreutils 0.1
版本号提升到 v0.1 里程碑, 此版本带来了 "显著的性能提升" 以及 SELinux 支持和改进的 GNU Coreutils 兼容性

在性能方面, wc, ls, cat, tail, seq 和其他 Coreutils 命令现在与 GNU Coreutils 提供的性能持平或更高
这使得 Rust Coreutils 更具吸引力, 因为它不仅用 Rust 编写以确保内存安全, 而且还能开始超越基于 C 的 GNU Coreutils

Rust Coreutils 0.1 为 cp, mkdir, ls, install 和其他常用命令添加了 SELinux 集成

Rust Coreutils 0.1 通过了 GNU 测试套件中的 522 项测试, 高于之前版本的 507 项

有关 Rust Coreutils 0.1 所有重大更改的更多详细信息, 请访问 GitHub

#FreeSoftware
原文链接
Box64 v0.3.6 带来更好的 AVX 处理, 为 Windows 可执行文件提供易失性元数据

FEX 2506 发布仅几天后, 该开源模拟器就支持 x86_64 二进制文件在 ARM64 (AArch64) 主机上运行, 而 Box64 也为其目标相似的开源项目发布了最新的功能更新

Box64 仍在继续发展, 它是一款用户空间 Linux x86_64 模拟器, 不仅支持 ARM64, 还支持 RISC-V 64 位和 LoongArch CPU 架构
Box64 凭借其原生系统库集成, 还可以运行许多游戏和 Windows 应用程序, 并通过 Proton/Wine 进行

Box64 v0.3.6 支持直接从 Box64 源代码库构建 WowBox64 wowbox64.dll 库, 以帮助与 Hangover 集成, Hangover 是基于 Wine 的下游, 可以利用 Box64 和其他模拟器进行跨架构运行

Box64 v0.3.6 现在还允许在 Microsoft Windows 可执行文件中使用 Volatile Metadata, 用于 Wine x64
利用 Volatile Metadata 支持允许仅在需要时应用强内存排序, 并有助于整体性能

今天的 Box64 版本还带来了更好的 x87 / SSE / AVX 处理, 封装了更多的库, 以及针对 ARM64 / LoongArch64 / RISC-V RV64 的许多修复
此外还有许多其他的小修补, 都旨在提高性能

可通过 GitHub 下载和获取 Box64 v0.3.6 版本的更多详细信息

#FreeSoftware
原文链接