Продолжая тему активности участников нашего чата, предлагаю посмотреть лекцию об оптимизации от Булата Зиганшина:
🎞 Устройство процессоров (2020)
В описании к видео есть список книг.
Спасибо, друзья, всем, кто принимает активное участие в жизни нашего сообщества!
Лучший подарок от вас — рекомендация канала и чата своим друзьям, коллегам и подписчикам (у кого они есть)🙂
Кого ещё нет в нашем чате, категорически рекомендую присоединиться.
#оптимизация #видео #cpu
В описании к видео есть список книг.
Спасибо, друзья, всем, кто принимает активное участие в жизни нашего сообщества!
Лучший подарок от вас — рекомендация канала и чата своим друзьям, коллегам и подписчикам (у кого они есть)
Кого ещё нет в нашем чате, категорически рекомендую присоединиться.
#оптимизация #видео #cpu
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Intel анонсировала 2 новых расширения
1️⃣ APX (Advanced Performance Extensions) со следующими новыми фичами:
— дополнительные 16 регистров общего назначения R16-R31, называемые расширенными регистрами общего назначения,
— трёхоперандные инструкции для многих целочисленных операций (
— новые условные инструкции для чтения/записи и сравнения (
— оптимизированные операции сохранения регистров (
— прямой 64-битный переход (
➡️ Новость на русском (3Dnews)
➡️ Новость на английском (Phoronix)
➡️ Информация и спецификации на сайте Intel (англ), со ссылками на спецификации AVX10, см. ниже.
2️⃣ Эволюция векторных инструкций — AVX10 (AVX10.1, AVX10.2 и т.д. — да, теперь вместо флагов для отдельных расширений будет номер версии). Обещают поддержку функциональности AVX-512, вроде как даже без потери производительности. AVX10 будут работать как на P-ядрах, так и на E-ядрах (но на последних только с 256-битными векторами и только в версии AVX10.2). AVX-512 развиваться не будет, но останется в серверных процессорах для совместимости со старыми приложениями.
➡️ Новость на русском (3Dnews)
➡️ Новость на английском (Phoronix)
🟣 Вы же уже в курсе существования расширений AMX (Advanced Matrix Extensions) в серверных процессорах Sapphire Rapids? Если нет, читайте на сайте Intel (и на Phoronix).
🟣 Некоторое время назад Intel также анонсировала новую упрощённую архитектуру — X86-S. Наиболее заметные (но далеко не единственные) отличия от текущей архитектуры Intel 64 — отсутствие 16-битных и 32-битных режимов (последний останется только в режиме совместимости, как сейчас при работе в 64-битном Long Mode). Читайте на сайте Intel (и на Хабре).
P.S. Кому лень поштучно качать спецификации с сайта Intel, приглашаю заглянуть в наш чат и забрать всё оттуда (включая июньские мануалы Intel SDM и свежие PDF-ки по оптимизации от Agner'а Fog'а)😉
— дополнительные 16 регистров общего назначения R16-R31, называемые расширенными регистрами общего назначения,
— трёхоперандные инструкции для многих целочисленных операций (
add rax,rcx,rdx
),— новые условные инструкции для чтения/записи и сравнения (
cfmovcc
, setcc.zu
, ccmp
, ctest
, а также атомарная инструкция cmpccxadd
),— оптимизированные операции сохранения регистров (
push2
/pop2
),— прямой 64-битный переход (
jmpabs
).P.S. Кому лень поштучно качать спецификации с сайта Intel, приглашаю заглянуть в наш чат и забрать всё оттуда (включая июньские мануалы Intel SDM и свежие PDF-ки по оптимизации от Agner'а Fog'а)
Please open Telegram to view this post
VIEW IN TELEGRAM
Новый выпуск Intel 64 and IA-32 Architectures Software Developer's Manual (сентябрь 2023).
Также новые:
— Intel Architecture Instruction Set Extensions and Future Features;
— Intel and IA-32 Architectures Optimization Reference Manual (теперь в 2-х томах);
— Intel APX (2.0).
И прочее...
Ловите, чтобы не включать VPN (5 июльских манов А.Фога качаем тут) 😉
P.S. Заглядывайте также в наш чат, который Булат Зиганшин периодически скидывает свежие интересные материалы!
Также новые:
— Intel Architecture Instruction Set Extensions and Future Features;
— Intel and IA-32 Architectures Optimization Reference Manual (теперь в 2-х томах);
— Intel APX (2.0).
И прочее...
Ловите, чтобы не включать VPN (5 июльских манов А.Фога качаем тут) 😉
P.S. Заглядывайте также в наш чат, который Булат Зиганшин периодически скидывает свежие интересные материалы!
Intel
Manuals for Intel® 64 and IA-32 Architectures
These manuals describe the architecture and programming environment of the Intel® 64 and IA-32 architectures.
👍1
Запускает cuda-приложения на AMD GPUs: https://github.com/vosen/ZLUDA
Независимые тесты аж в двух приложениях: https://www.phoronix.com/review/radeon-cuda-zluda/3
Независимые тесты аж в двух приложениях: https://www.phoronix.com/review/radeon-cuda-zluda/3
GitHub
GitHub - vosen/ZLUDA: CUDA on non-NVIDIA GPUs
CUDA on non-NVIDIA GPUs. Contribute to vosen/ZLUDA development by creating an account on GitHub.
🎉1
Чувак обнаружил баг в SRW Locks, тянущийся минимум с Висты до наших дней, и приводящий к некорректной работе std::shared_mutex в MSVC STL: "SRWLOCK can deadlock after an exclusive owner has released ownership and several reader threads are attempting to acquire shared ownership together"
https://www.reddit.com/r/cpp/comments/1b55686/maybe_possible_bug_in_stdshared_mutex_on_windows/
https://www.reddit.com/r/cpp/comments/1b55686/maybe_possible_bug_in_stdshared_mutex_on_windows/
Reddit
From the cpp community on Reddit: Maybe possible bug in std::shared_mutex on Windows
Explore this post and more from the cpp community
🔥2
NVidia представила новое поколение серверных GPU. Техпроцесс старый, так что я ожидаю новой микроархитектуры, поскольку предыдущей Volta стукнуло уже 7 лет.
https://nvidianews.nvidia.com/news/nvidia-blackwell-platform-arrives-to-power-a-new-era-of-computing
https://www.anandtech.com/show/21310/nvidia-blackwell-architecture-and-b200b100-accelerators-announced-going-bigger-with-smaller-data
https://3dnews.ru/1101915/nvidia-predstavila-samiy-moshchniy-protsessor-v-mire-blackwell-b200-kotoriy-otkroet-put-k-gigantskim-neyrosetyam
https://nvidianews.nvidia.com/news/nvidia-blackwell-platform-arrives-to-power-a-new-era-of-computing
https://www.anandtech.com/show/21310/nvidia-blackwell-architecture-and-b200b100-accelerators-announced-going-bigger-with-smaller-data
https://3dnews.ru/1101915/nvidia-predstavila-samiy-moshchniy-protsessor-v-mire-blackwell-b200-kotoriy-otkroet-put-k-gigantskim-neyrosetyam
NVIDIA Newsroom
NVIDIA Blackwell Platform Arrives to Power a New Era of Computing
Powering a new era of computing, NVIDIA today announced that the NVIDIA Blackwell platform has arrived — enabling organizations everywhere to build and run real-time generative AI on trillion-parameter large language models at up to 25x less cost and energy…
Оказывается, зелёные потоки в виде либы есть и под питон: https://habr.com/ru/companies/tochka/articles/798577/
Что, впрочем, не так и удивительно - к С/С++ они тоже прикручиваются либой. Проблема как всегда в том, что дальше во всей программе нужно использовать только совместимые с конкретной библиотекой мьютексы и т.д., иначе при локе у вас будет задействован целиком поток ОС
Что, впрочем, не так и удивительно - к С/С++ они тоже прикручиваются либой. Проблема как всегда в том, что дальше во всей программе нужно использовать только совместимые с конкретной библиотекой мьютексы и т.д., иначе при локе у вас будет задействован целиком поток ОС
Хабр
await anywhere, взгляд на третью сторону медали: sync vs async vs …
Любое решение имеет срок жизни, даже самое классное, надёжное и современное. /Json Statement/ Сегодня я расскажу как одно из наших решений сделало свой последний вздох, что привело к небольшому факапу...
AMD представила настольные процессоры на Zen5. Выпуск начнётся уже в июле, цены пока не объявлены.
Что НЕ изменилось по сравнению с Zen4: число ядер, частоты, размеры кешей, чипсет(ы).
IPC выросла в среднем на 16%. SIMD engines расширены до 512 бит, и вероятно производительность в AVX-512 вырастет на десятки процентов.
Энергопотребление снизилось в 1.5 раза (170 -> 120, 105 -> 65 W). CCD теперь выпускается на 4 нм (в Zen4 было на 5 нм), и похоже что всё улучшение техпроцесса было пущено на обуздание энергопотребления ядер. С +16% IPC они и так должны быть конкурентны с Raptor Lake.
IOD по прежнему выпускается на 6 нм, и в нём всё то же RDNA2 видеоядро. Так что есть подозрение, что его, как и чипсет, не обновили, и более медленная, чем у Raptor Lake, работа с DDR5 памятью останется бичом и этого поколения Zen.
(завтра дополню пост неофициальной инфой об улучшениях в м/а Zen5)
Что НЕ изменилось по сравнению с Zen4: число ядер, частоты, размеры кешей, чипсет(ы).
IPC выросла в среднем на 16%. SIMD engines расширены до 512 бит, и вероятно производительность в AVX-512 вырастет на десятки процентов.
Энергопотребление снизилось в 1.5 раза (170 -> 120, 105 -> 65 W). CCD теперь выпускается на 4 нм (в Zen4 было на 5 нм), и похоже что всё улучшение техпроцесса было пущено на обуздание энергопотребления ядер. С +16% IPC они и так должны быть конкурентны с Raptor Lake.
IOD по прежнему выпускается на 6 нм, и в нём всё то же RDNA2 видеоядро. Так что есть подозрение, что его, как и чипсет, не обновили, и более медленная, чем у Raptor Lake, работа с DDR5 памятью останется бичом и этого поколения Zen.
(завтра дополню пост неофициальной инфой об улучшениях в м/а Zen5)
AnandTech
AMD Unveils Ryzen 9000 CPUs For Desktop, Zen 5 Takes Center Stage at Computex 2024
During AMD's Computex 2024 kick-off keynote, AMD's CEO, Dr. Lisa Su, officially unveiled and announced the company's next generation of Ryzen processors. Today marks the first unveiling of AMD's highly anticipated Zen 5 microarchitecture via the Ryzen 9000…
🔥2
Свеженькие мануалы по процессорам, оптимизации, библиотекам.
А также их машинные переводы на русский (если вдруг кому надо). Плюс машинные переводы некоторых книг и спецификаций.
#документация
А также их машинные переводы на русский (если вдруг кому надо). Плюс машинные переводы некоторых книг и спецификаций.
#документация
❤5
👍12🔥3