Aspiring Data Science

Over the past decade, NVIDIA has been able to illustrate the effectiveness of its GPUs across the board for both deep learning training and inference. As these models become larger, the inherent need to scale up for training and scale out for deploying such…

48 viewsedited 05:28

#gpt #nvidia #tensorrt

"По оценкам NVIDIA, применение TensorRT-LLM позволяет вдвое увеличить производительность ускорителя H100 в тесте GPT-J 6B (входит в состав MLPerf Inference v3.1). При использовании модели Llama2 прирост быстродействия по сравнению с А100 достигает 4,6x. TensorRT-LLM уже включает полностью оптимизированные версии многих популярных LLM, включая Meta✴️ Llama 2, OpenAI GPT-2 и GPT-3, Falcon, Mosaic MPT, BLOOM и др."

https://servernews.ru/1092785

ServerNews - все из мира больших мощностей

Сила оптимизации ПО: NVIDIA вдвое ускорила исполнение языковых моделей на H100 с помощью TensorRT-LLM

Компания NVIDIA анонсировала программное обеспечение TensorRT-LLM с открытым исходным кодом, специально разработанное для ускорения исполнения больших языковых моделей (LLM). Платформа станет доступна в ближайшие недели.

109 viewsAnatoly Alekseev, 14:27

About

Blog

Apps

Platform