Phoronix CN
50 subscribers
57 photos
393 links
开源新闻,硬件资讯等

Phoronix 的中文镜像 更新不及时 [非官方]
如果需要获取及时信息请前往 phoronix.com
Download Telegram
Raspberry Pi HEVC 解码器 Linux 驱动程序更新以尝试集成到主线内核

去年底, 树莓派 HEVC 解码器驱动程序的上游提交工作开始了, 旨在让 H.265/HEVC 加速解码在树莓派 4 和树莓派 5 单板计算机上通过主线内核正常工作
将近半年后, 这项工作仍在进行中, 但昨天带来了这个驱动程序的第三个版本

这个树莓派 HEVC 解码器驱动程序的 v3 补丁系列已经发布, 用于让 H.265 视频解码在这些流行的 ARM 单板计算机上通过 V4L2 接口工作
这个驱动程序最初是受树莓派公司委托编写的, 并且已经在他们使用树莓派操作系统的下游内核中投入使用, 而将代码提交到主线内核的努力仅从去年才开始, 这是他们整体努力的一部分, 旨在增强这些流行的 ARM 主板在主线内核中的支持

随着 v3 补丁系列的发布, 更新了设备树绑定, 确认了这些驱动程序进行的额外测试, 以及其他一些小的改动
驱动程序本身没有真正基础性的变化, 所以希望它已经接近准备好进入下一个内核合并窗口的阶段

对这些更新的树莓派 4/5 HEVC 解码驱动程序补丁感兴趣的人可以在内核邮件列表中找到它们

#RaspberryPi
原文链接
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
SCALE 1.3 新增 BFloat16 及其他新特性, 支持在 AMD GPU 上编译 CUDA 应用程序

Phoronix 去年报道的一个新软件项目是 SCALE, 用于原生编译面向 AMD GPU 的 CUDA 应用
这个基于开源 LLVM 代码库构建的 CUDA "洁净室" 实现持续强劲发展, 本周发布的是 SCALE 1.3, 提供了更多功能和硬件支持, 用于编译面向 AMD GPU 执行的 CUDA 软件

SCALE 继续由 Spectral Compute 开发, 并且完全独立于 AMD
SCALE 的目标仍然是成为一个 GPGPU 编程工具包, 用于原生编译面向 AMD GPU 的 CUDA 软件, 同时不要求修改 CUDA 程序本身
这个兼容 nvcc 的编译器以及 SCALE 及其运行时的其他元素持续改进, 以增强为 AMD GPU 构建的 CUDA 软件的可能性

随着新的 SCALE 1.3 发布, 他们将代码库从基于 LLVM 17 构建转移到现在的 LLVM 19
他们还增加了对 ROCm 6.3.1 上游版本的支持

新的硬件支持包括 Radeon RX Vega "GFX902" 图形处理器
此外, SCALE 的企业版现在支持具有 GFX908, GFX90A, GFX940 和 GFX942 目标的 AMD Instinct 加速器

SCALE 1.3 的其他一些变化包括一个新的 "scaleenv" 环境命令, 以便更轻松地使用 SCALE, 支持 BFloat16 指令, 支持模拟 warp 大小为 32, 对非 CMake 构建系统的兼容性改进, 以及各种库改进
SCALE 库支持新的多 GPU API 和各种其他新增功能
兼容 NVCC 的编译器也看到了各种兼容性增强

SCALE 1.3 现在还提供官方的 Rocky Linux 9 软件包, 以及他们现有的 Ubuntu 软件包和通用 tarball

希望了解更多关于 SCALE 1.3 软件发布信息的人可以访问 SCALE-Lang.com

#AMD
原文链接
System76 发布 COSMIC Alpha 7 桌面 - 接近 Beta 版的最后一步

继二月份发布 COSMIC Alpha 6 之后, System76 今天发布了 COSMIC Alpha 7, 这是他们为这个开源的, 用 Rust 编写的桌面环境计划中的最后一个 Alpha 版本, 该环境围绕其 Pop!_OS Linux 发行版的需求而设计

COSMIC Alpha 7 是他们进入 COSMIC 桌面 Beta 阶段之前的最后一个计划版本
这是一个漫长的旅程, 但他们终于离这个围绕 Rust 和 Wayland 构建的引人入胜的开源桌面的 Beta 和稳定版本更近了

COSMIC Alpha 7 带来了工作区改进, 添加了各种辅助功能, 例如高对比度模式和颜色过滤器, 工具提示现在在整个 COSMIC 中都可使用, 兼容全局快捷键, 缩放优化, 快捷键改进, 以及数十个错误修复

关于今天发布的 COSMIC Alpha 7 的更多详细信息请访问 System76 博客

#Desktop
原文链接
Intel 更新其 PyTorch 扩展, 支持 DeepSeek-R1 和新优化

Intel 今天发布了新版本的 Intel Extension for PyTorch, 以便为 PyTorch 应用优化, 使其受益于 Intel 的硬件
随着 Intel Extension for PyTorch v2.7 版本的发布, 它支持新的大型语言模型 (LLM) 以及各种性能优化和其他增强功能

Intel Extension for PyTorch 2.7 版本增加了对流行的 DeepSeek-R1 模型支持, 包括在现代 Intel 至强硬件上启用 INT8 精度
更新后的 Intel 扩展还支持最近发布的微软 Phi-4 模型, 包括 Phi-4-mini 和 Phi-4-multimodal

Intel Extension for PyTorch 2.7 还普遍包含了对其大型语言模型支持的各种优化, 包括性能优化
此外, 关于处理多模态模型和 DeepSeek-R1 的文档也得到了改进
该扩展也基于 Intel oneDNN 3.7.2 神经网络库进行了重构

有关此扩展如何帮助在现代 Intel 处理器上加速 PyTorch 的下载和更多详细信息, 可以在 GitHub 上找到

#Intel
原文链接
Intel Linux 图形驱动程序补丁更新以支持 DRM Panic

去年合并到 Linux 内核的一个有趣新特性是 DRM Panic 基础设施, 这样 Linux 在遇到问题时可以显示一个类似于 Windows "蓝屏死机" 的错误屏幕
随着后续内核版本的发布, 它已被扩展以添加二维码错误消息和其他改进
但 DRM Panic 确实需要不同 DRM 驱动程序的支持/配合, 到目前为止英特尔显卡尚未获得支持

在过去一年里, 随着这个 DRM Panic 基础设施获得新特性, 像 Fedora 这样的发行版对此表现出兴趣, 并且更多的上游 DRM 内核驱动程序已经进行了必要的更改来启用对其的支持
在较新的内核中, 已经支持 AMD 显卡使用 Nouveau 的 NVIDIA 显卡, 以及其他较小的 DRM 驱动程序也支持它
但英特尔 i915/Xe 内核驱动代码却显著缺席

去年开始出现了为 Intel 提供 DRM Panic 支持的补丁, 这项工作仍在进行中
Red Hat 的 Jocelyn Falempe 今天发布了第七版补丁, 用于为 Intel 显卡硬件启用 DRM Panic 支持
这些补丁已在不同的 Intel 显卡硬件上进行了测试, 从带有 Haswell 和 Comet Lake 的 iGPUs 到 Raptor Lake 和 Lunar Lake

这些 v7 补丁中有更多的修复, 希望它们能很快被上游接受, 以便在 Intel 显卡硬件上使用 DRM Panic

#Intel
原文链接
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
GCC 15.1 发布, 附带 COBOL 编译器及其他多项改进

GCC 15.1 刚刚发布, 成为 GNU 编译器集合最新的年度功能发布
这个首个稳定的 GCC 15 版本带来了 COBOL 编译器前端, 许多 C 和 C++ 语言支持改进, 对新 CPU 和 ISA 能力的支持, 更好的 Rust 编程语言支持, 调试增强功能, 以及更多内容

GCC 15.1 提供了 COBOL 语言前端, 各种可用性增强功能, 许多针对 gccrs 的 Rust 编程语言改进, 将其默认 C 语言版本更改为 C23, AMD Zen 5 "znver5" 目标改进以及其他新的 AMD Zen 目标优化, 支持英特尔 Xeon 7 Diamond Rapids 目标, 支持新的仅限 512 位版本的英特尔 AVX10.2, 更多英特尔高级性能扩展 "APX" 的启用, 移除了 Xeon Phi 支持, 增强了 OpenMP 卸载功能, 以及从硬件支持到语言特性的许多其他变化

针对 AMD 图形处理器的 AMDGPU 后端现在也支持标准 C++ 库 (libstdc++), 对通用设备提供实验性支持, 并已淘汰 Fiji GPU 支持
类似地, GCC15 中的 NVIDIA NVPTX 后端也支持 libstdc++

GCC 中较少提及的 D 和 Modula-2 语言前端以及 Fortran 前端也进行了大量工作

Fedora 42 已经成为首个在生产环境中搭载 GCC 15 的主要 Linux 发行版, 它使用了接近最终版本的 GCC 15 构建

可以通过 gcc.gnu.org 下载并获取有关 GCC 15.1 稳定编译器版本的更多信息
我很快会在 Phoronix 上发布更多 GCC 15 编译器性能基准测试

#GNU #GCC
原文链接
Intel 启用超低延迟调度 "ULLS" 以支持 Lunar Lake GPU 计算

上周 Intel 发布了适用于 Windows 和 Linux 的 GPU 计算 Compute Runtime 的更新, 支持 OpenCL 和 Level Zero API, 今天他们发布了一个新的预览版, 为一项全新的功能做准备:用于 Lunar Lake Xe2 图形的超低延迟调度 "ULLS"

Intel 工程师一直在致力于超低延迟调度 "ULLS" 这项功能, 以允许将工作直接提交给 GPU, 绕过部分驱动程序开销, 并帮助降低计算内核的延迟
ULLS 也被称为直接提交 (Direct Submission), 在今天的预览版中, 它默认在 Linux 上为 Lunar Lake 图形启用
其他供应商也在开发类似的功能, 例如带有用户模式队列的 AMD Linux 驱动程序

Compute Runtime 还支持 ULLS Light 的概念, 即没有 VM_BIND 内核接口的超低延迟调度
ULLS Light 已在 Meteor Lake H 和 Arrow Lake H 等部件上得到支持

按照今天的预览版发布, Lunar Lake 直接提交/ULLS 预计将成为定于五月发布的 Compute Runtime 25.18 官方计算运行时版本的一部分

Intel Lunar Lake 在 Linux 上持续获得支持改进, 可以提供相当不错的单线程性能和出色的能源效率
Lunar Lake SoC 已被用于有趣且高质量的笔记本电脑设计中, 例如最近在 Linux 下测试的联想 ThinkPad X1 Carbon Gen 13 Aura
此外, 对于那些希望获得 IntelCompute Runtime 官方 GPU 计算支持的用户来说, 与 AMD ROCm 等非官方支持移动部件相比, 它是一个不错的选择

那些希望尝试这项默认启用以帮助改善 Lunar Lake 硬件延迟进而提升性能的新功能的用户, 可以通过 IntelCompute Runtime 25.13.33276.19 找到预发布版本
我很快就会进行一些 ULLS 对比基准测试

#Intel
原文链接
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM