[Из песочницы] Ускоряем умножение матриц float 4x4 с помощью SIMD
#C #Assembler #c #SIMD #vectormath IV
https://habr.com/post/418247/
#C #Assembler #c #SIMD #vectormath IV
https://habr.com/post/418247/
t.me
Ускоряем умножение матриц float 4x4 с помощью SIMD
Уже немало лет прошло, как я познакомился с инструкциями MMX, SSE, а позже и AVX на процессорах Intel. В своё время они казались какой-то магией на фоне x86...
Небольшой обзор SIMD в .NET/C#
#NET #C #SIMD #векторизация #алгоритмы IV
https://habr.com/post/435840/
#NET #C #SIMD #векторизация #алгоритмы IV
https://habr.com/post/435840/
t.me
Небольшой обзор SIMD в .NET/C#
Вашему вниманию предлагается небольшой обзор возможностей векторизации алгоритмов в .NET Framework и .NETCORE. Цель статьи познакомить с этими приёмами тех, кто...
Ускоряем неускоряемое или знакомимся с SIMD
#Assembler #C #C #Высокаяпроизводительность #Процессоры #simd #sse IV
https://habr.com/ru/post/440566/
#Assembler #C #C #Высокаяпроизводительность #Процессоры #simd #sse IV
https://habr.com/ru/post/440566/
t.me
Ускоряем неускоряемое или знакомимся с SIMD
Есть класс задач, которые нельзя ускорить за счёт оптимизации алгоритмов, а ускорить надо. В этой практически тупиковой ситуации к нам на помощь приходят разрабо...
Умножение матриц: эффективная реализация шаг за шагом
#C #Алгоритмы #Машинноеобучение #Обработкаизображений #матричноеумножение #SIMD #кэшпроцессора IV
https://habr.com/ru/post/359272/
#C #Алгоритмы #Машинноеобучение #Обработкаизображений #матричноеумножение #SIMD #кэшпроцессора IV
https://habr.com/ru/post/359272/
t.me
Умножение матриц: эффективная реализация шаг за шагом
Введение Умножение матриц — это один из базовых алгоритмов, который широко применяется в различных численных методах, и в частности в алгоритмах машинного обуч...
Новая библиотека x86 SIMD интринсиков — immintrin debug
#БлогкомпанииIntel #Высокаяпроизводительность #Assembler #x86 #avx512 #simd IV
https://habr.com/ru/post/450964/
#БлогкомпанииIntel #Высокаяпроизводительность #Assembler #x86 #avx512 #simd IV
https://habr.com/ru/post/450964/
t.me
Новая библиотека x86 SIMD интринсиков — immintrin debug
С каждым новым поколением процессоров Intel, появляются новые и все более сложные векторные инструкции. Хотя длина вектора (512 бит) в ближайшее время расти не б...
Сверточный слой: быстрая свертка по методу Шмуэля Винограда
#C #Алгоритмы #Обработкаизображений #Машинноеобучение #сверточныйслой #методВинограда #SIMD IV
https://habr.com/ru/post/477718/
#C #Алгоритмы #Обработкаизображений #Машинноеобучение #сверточныйслой #методВинограда #SIMD IV
https://habr.com/ru/post/477718/
t.me
Сверточный слой: быстрая свертка по методу Шмуэля Винограда
Введение Данная статья является продолжением серии статей описывающей алгоритмы лежащие в основе Synet — фреймворка для запуска предварительно обученных нейрон...
[Из песочницы] Очередная статья про wc
#Высокаяпроизводительность #Программирование #C #с #simd #холивары IV
https://habr.com/ru/post/489898/
#Высокаяпроизводительность #Программирование #C #с #simd #холивары IV
https://habr.com/ru/post/489898/
t.me
Очередная статья про wc
Всем добрый день. Недавно на Хабре появилась статья Побеждая C двадцатью строками Haskell: пишем свой wc от @0xd34df00d. Автор, известный своей симпатией к функц...
Шпаргалка по SIMD-инструкциям, теперь и для .NET Core
#NET #C #SIMD #intrinsics #векторизация #avx IV
https://habr.com/ru/post/507074/
#NET #C #SIMD #intrinsics #векторизация #avx IV
https://habr.com/ru/post/507074/
t.me
Шпаргалка по SIMD-инструкциям, теперь и для .NET Core
Ни для кого не секрет, что в дотнет завезли интринсики. Я писал об этом и до того, как они появились и после. Плюс ещё посты на Хабре, например этот. И всё, каза...
Vector API в Java: краткий обзор и тестирование
#Java #сезонjava #java #simd #projectpanama IV
https://habr.com/ru/post/679492/
#Java #сезонjava #java #simd #projectpanama IV
https://habr.com/ru/post/679492/
Хабр
Vector API в Java: краткий обзор и тестирование
Некоторое время назад попалась на глаза статья про Vector API в Java. Прочитал, заинтересовался. Наконец, недавно дошли руки посмотреть, что же это такое и как работает. Результаты немного...
Приёмы высокоуровневой векторизации на примере Card Raytracer
#Высокаяпроизводительность #C #Работас3Dграфикой #C #оптимизация #simd #avx IV
https://habr.com/ru/post/685228/
#Высокаяпроизводительность #C #Работас3Dграфикой #C #оптимизация #simd #avx IV
https://habr.com/ru/post/685228/
Хабр
Приёмы высокоуровневой векторизации на примере Card Raytracer
Хочу рассказать о том, как занимался оптимизацией card raytracer - минимального рейтрейсера, код которого умещается на визитке. Точнее, это развёрнутая для лучшей читабельности версия, которая в...
[Перевод] Можно ли доверить компилятору оптимизацию вашего кода?
#БлогкомпанииTimewebCloud #C #Rust #Компиляторы #timeweb_статьи_перевод #SIMD #архитектурапроцессора IV
https://habr.com/ru/companies/timeweb/articles/759326/
#БлогкомпанииTimewebCloud #C #Rust #Компиляторы #timeweb_статьи_перевод #SIMD #архитектурапроцессора IV
https://habr.com/ru/companies/timeweb/articles/759326/
Хабр
Можно ли доверить компилятору оптимизацию вашего кода?
Существует три уровня понимания того, как работает SIMD (ну, по крайней мере, на данный момент я нахожусь на 3-м уровне): Компиляторы умны! Они автоматически векторизуют весь код! Компиляторы тупы,...
Теоретическая и реальная производительность Intel AMX
#Высокаяпроизводительность #C #Алгоритмы #Обработкаизображений #Искусственныйинтеллект #AMX #SIMD
https://habr.com/ru/articles/807033/
#Высокаяпроизводительность #C #Алгоритмы #Обработкаизображений #Искусственныйинтеллект #AMX #SIMD
https://habr.com/ru/articles/807033/
Хабр
Теоретическая и реальная производительность Intel AMX
Введение AMX (Advanced Matrix Extension) - это модуль аппаратного ускорения умножения матриц, который появился в серверных процессорах Intel Xeon Scalable, начиная с 4 поколения (архитектура Sapphire...
Сказ о том, как мы искали новые векторные расширения на ARM
#БлогкомпанииSmartEngines #Программирование #Машинноеобучение #Процессоры #SIMD #armv8 #SVE
https://habr.com/ru/companies/smartengines/articles/811527/
#БлогкомпанииSmartEngines #Программирование #Машинноеобучение #Процессоры #SIMD #armv8 #SVE
https://habr.com/ru/companies/smartengines/articles/811527/
Хабр
Сказ о том, как мы искали новые векторные расширения на ARM
Мы в Smart Engines активно занимаемся низкоуровневой оптимизацией нейронных сетей. Наши библиотеки работают на центральных процессорах, поэтому мы активно используем Single Instruction Multiple Data...
Я ускорил генерацию blurhash в 3̶6̶ 8̶7̶ 128 раз
#blurhash #simd #compilers #gcc #clang #pillow
https://habr.com/ru/articles/850114/
#blurhash #simd #compilers #gcc #clang #pillow
https://habr.com/ru/articles/850114/
Хабр
Я ускорил генерацию blurhash в 3̶6̶ 8̶7̶ 128 раз
Старую собаку новым трюкам не обучишь, вот и я взялся за старое. Blurhash — это компактный способ представления размытой превьюшки изображения в виде ASCII-строки. Разработан финской компанией Wolt...
[Перевод] Пошаговое повышение производительности алгоритма
#алгоритмы #производительность #simd #rust
https://habr.com/ru/articles/852974/
#алгоритмы #производительность #simd #rust
https://habr.com/ru/articles/852974/
Хабр
Пошаговое повышение производительности алгоритма
Недавно мне довелось работать над новым алгоритмом приближённого поиска ближайших соседей, который называется RaBitQ . Автор этого алгоритма уже предоставил достаточно скоростную реализацию на C++ . Я...