Habr.com

[Из песочницы] Ускоряем умножение матриц float 4x4 с помощью SIMD

#C #Assembler #c #SIMD #vectormath IV

https://habr.com/post/418247/

t.me

Ускоряем умножение матриц float 4x4 с помощью SIMD

Уже немало лет прошло, как я познакомился с инструкциями MMX, SSE, а позже и AVX на процессорах Intel. В своё время они казались какой-то магией на фоне x86...

5 views18:15

Habr.com

Небольшой обзор SIMD в .NET/C#

#NET #C #SIMD #векторизация #алгоритмы IV

https://habr.com/post/435840/

t.me

Небольшой обзор SIMD в .NET/C#

Вашему вниманию предлагается небольшой обзор возможностей векторизации алгоритмов в .NET Framework и .NETCORE. Цель статьи познакомить с этими приёмами тех, кто...

17 views18:15

Habr.com

Ускоряем неускоряемое или знакомимся с SIMD

#Assembler #C #C #Высокаяпроизводительность #Процессоры #simd #sse IV

https://habr.com/ru/post/440566/

t.me

Ускоряем неускоряемое или знакомимся с SIMD

Есть класс задач, которые нельзя ускорить за счёт оптимизации алгоритмов, а ускорить надо. В этой практически тупиковой ситуации к нам на помощь приходят разрабо...

17 views12:15

Habr.com

Умножение матриц: эффективная реализация шаг за шагом

#C #Алгоритмы #Машинноеобучение #Обработкаизображений #матричноеумножение #SIMD #кэшпроцессора IV

https://habr.com/ru/post/359272/

t.me

Умножение матриц: эффективная реализация шаг за шагом

Введение Умножение матриц — это один из базовых алгоритмов, который широко применяется в различных численных методах, и в частности в алгоритмах машинного обуч...

16 views12:15

Habr.com

Новая библиотека x86 SIMD интринсиков — immintrin debug

#БлогкомпанииIntel #Высокаяпроизводительность #Assembler #x86 #avx512 #simd IV

https://habr.com/ru/post/450964/

t.me

Новая библиотека x86 SIMD интринсиков — immintrin debug

С каждым новым поколением процессоров Intel, появляются новые и все более сложные векторные инструкции. Хотя длина вектора (512 бит) в ближайшее время расти не б...

18 views10:15

Habr.com

Сверточный слой: быстрая свертка по методу Шмуэля Винограда

#C #Алгоритмы #Обработкаизображений #Машинноеобучение #сверточныйслой #методВинограда #SIMD IV

https://habr.com/ru/post/477718/

t.me

Сверточный слой: быстрая свертка по методу Шмуэля Винограда

Введение Данная статья является продолжением серии статей описывающей алгоритмы лежащие в основе Synet — фреймворка для запуска предварительно обученных нейрон...

16 views22:15

Habr.com

[Из песочницы] Очередная статья про wc

#Высокаяпроизводительность #Программирование #C #с #simd #холивары IV

https://habr.com/ru/post/489898/

t.me

Очередная статья про wc

Всем добрый день. Недавно на Хабре появилась статья Побеждая C двадцатью строками Haskell: пишем свой wc от @0xd34df00d. Автор, известный своей симпатией к функц...

20 views15:15

Habr.com

Шпаргалка по SIMD-инструкциям, теперь и для .NET Core

#NET #C #SIMD #intrinsics #векторизация #avx IV

https://habr.com/ru/post/507074/

t.me

Шпаргалка по SIMD-инструкциям, теперь и для .NET Core

Ни для кого не секрет, что в дотнет завезли интринсики. Я писал об этом и до того, как они появились и после. Плюс ещё посты на Хабре, например этот. И всё, каза...

15 views18:01

Habr.com

Вышла Java 17

#Java #java #jdk #openjdk #sealed #simd #patternmatch IV

https://habr.com/ru/post/577924/

t.me

Вышла Java 17

Вышла общедоступная версия Java 17. В этот релиз попало более 2700 закрытых задач и 14 JEP'ов. Изменения API можно посмотреть по этой ссылке.
Ссылки на скачивание:

Oracle...

27 views16:45

Habr.com

Vector API в Java: краткий обзор и тестирование

#Java #сезонjava #java #simd #projectpanama IV

https://habr.com/ru/post/679492/

Хабр

Vector API в Java: краткий обзор и тестирование

Некоторое время назад попалась на глаза статья про Vector API в Java. Прочитал, заинтересовался. Наконец, недавно дошли руки посмотреть, что же это такое и как работает. Результаты немного...

36 views12:00

Habr.com

Приёмы высокоуровневой векторизации на примере Card Raytracer

#Высокаяпроизводительность #C #Работас3Dграфикой #C #оптимизация #simd #avx IV

https://habr.com/ru/post/685228/

Хабр

Приёмы высокоуровневой векторизации на примере Card Raytracer

Хочу рассказать о том, как занимался оптимизацией card raytracer - минимального рейтрейсера, код которого умещается на визитке. Точнее, это развёрнутая для лучшей читабельности версия, которая в...

41 views14:00

Habr.com

[Перевод] Можно ли доверить компилятору оптимизацию вашего кода?

#БлогкомпанииTimewebCloud #C #Rust #Компиляторы #timeweb_статьи_перевод #SIMD #архитектурапроцессора IV

https://habr.com/ru/companies/timeweb/articles/759326/

Хабр

Можно ли доверить компилятору оптимизацию вашего кода?

Существует три уровня понимания того, как работает SIMD (ну, по крайней мере, на данный момент я нахожусь на 3-м уровне): Компиляторы умны! Они автоматически векторизуют весь код! Компиляторы тупы,...

31 views10:30

Habr.com

Теоретическая и реальная производительность Intel AMX

#Высокаяпроизводительность #C #Алгоритмы #Обработкаизображений #Искусственныйинтеллект #AMX #SIMD

https://habr.com/ru/articles/807033/

Хабр

Теоретическая и реальная производительность Intel AMX

Введение AMX (Advanced Matrix Extension) - это модуль аппаратного ускорения умножения матриц, который появился в серверных процессорах Intel Xeon Scalable, начиная с 4 поколения (архитектура Sapphire...

32 views14:00

Habr.com

Сказ о том, как мы искали новые векторные расширения на ARM

#БлогкомпанииSmartEngines #Программирование #Машинноеобучение #Процессоры #SIMD #armv8 #SVE

https://habr.com/ru/companies/smartengines/articles/811527/

Хабр

Сказ о том, как мы искали новые векторные расширения на ARM

Мы в Smart Engines активно занимаемся низкоуровневой оптимизацией нейронных сетей. Наши библиотеки работают на центральных процессорах, поэтому мы активно используем Single Instruction Multiple Data...

40 views10:45

Habr.com

Я ускорил генерацию blurhash в 3̶6̶ 8̶7̶ 128 раз

#blurhash #simd #compilers #gcc #clang #pillow

https://habr.com/ru/articles/850114/

Хабр

Я ускорил генерацию blurhash в 3̶6̶ 8̶7̶ 128 раз

Старую собаку новым трюкам не обучишь, вот и я взялся за старое. Blurhash — это компактный способ представления размытой превьюшки изображения в виде ASCII-строки. Разработан финской компанией Wolt...

55 views21:45

Habr.com

[Перевод] Пошаговое повышение производительности алгоритма

#алгоритмы #производительность #simd #rust

https://habr.com/ru/articles/852974/

Хабр

Пошаговое повышение производительности алгоритма

Недавно мне довелось работать над новым алгоритмом приближённого поиска ближайших соседей, который называется RaBitQ . Автор этого алгоритма уже предоставил достаточно скоростную реализацию на C++ . Я...

38 views21:45

About

Blog

Apps

Platform