#cuda #c_plus_plus #thrust #codegems
Показывают, как оптимизировать куда-ядро (расчёт гистограммы и блок внимания).
https://www.youtube.com/watch?v=V89I4B1krZ8
Показывают, как оптимизировать куда-ядро (расчёт гистограммы и блок внимания).
https://www.youtube.com/watch?v=V89I4B1krZ8
YouTube
Григорий Алексеев | Custom CUDA Kernels: Practical Approaches to Low-Level Optimizations
Спикер: Григорий Алексеев, AI Team in perplexity.ai
Тема доклада: Расскажет об опыте написания собственного CUDA-kernel-а для оптимизации Flash Attention
Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в треке OptimalDL:…
Тема доклада: Расскажет об опыте написания собственного CUDA-kernel-а для оптимизации Flash Attention
Data Fest 2024: https://ods.ai/events/datafest2024
Презентацию к докладу Вы можете скачать в треке OptimalDL:…