Machinelearning

🌟 AMD GPU Inference: CLI-инференс LLM на AMD.

Проект на Github, который предлагает запуск LLM на графических ускорителях AMD с помощью Docker-контейнера. Образ разработан для работы с моделями из Hugging Face, в первую очередь с семейством моделей LLama.

Для запуска необходимо иметь GPU AMD с поддержкой ROCm (версии 5.4.2 и выше) и установленный Docker.

Для адаптации логики инференса под свои нужды, внесите соответствующие изменения в файл run_inference.py с последующей пересборкой Docker-образа.

В проекте предусмотрен файл Aptfile, содержащий список необходимых пакетов ROCm (rocm-dev, rocm-libs, rocm-cmake, miopen-hip и rocblas) , устанавливаемых в Docker-контейнере.

▶️Локальная установка и инференс:

# Clone repo:
git clone https://github.com/yourusername/amd-gpu-inference.git
cd amd-gpu-inference

# Make the run script executable:
chmod +x run-docker-amd.sh

# Run the inference engine with a specified model and prompt:

# Replace "meta-llama/Llama-2-7b-chat-hf" with the HF model you want to use, and provide your own prompt
./run-docker-amd.sh "meta-llama/Llama-2-7b-chat-hf" "Prompt"

📌Лицензирование : Apache 2.0 License.

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #ROCm #AMD

Please open Telegram to view this post

VIEW IN TELEGRAM

👍24❤10🔥10

9.5K views16:31

Machinelearning

🌟 AMD Instella: открытая языковая модель, обученная на ROCm и оборудовании AMD.

Instella - полностью опенсорсная модель с 3 млрд. параметров, обученная с нуля на GPU AMD Instinct MI300X. Instella не только превосходит существующие LLM сопоставимого размера, но и показывает конкурентоспособную производительность по сравнению с Llama-3.2-3B, Gemma-2-2B и Qwen-2.5-3B.

Разработка Instella основана на опыте AMD с OLMo, на которой была доказана возможность обучения LLM на стеке AMD. В процессе создания Instella прошлые наработки были масштабированы для создания модели с 3 млрд. параметров. Она обучалась на 128 GPU MI300X с использованием 4,15 трлн. токенов. В процессе применялись методы FlashAttention-2, Torch Compile и FSDP с гибридным шардированием.

Процесс обучения Instella состоял из 4-х этапов, постепенно наращивая возможности модели от базового понимания естественного языка до следования инструкциям и соответствия предпочтениям человека.

Первый этап претрейна задействовал 4 трлн. токенов из набора данных OLMoE-mix-0924 (код, академические тексты, математика и общие знания). Второй этап - 57 млрд. токенов из датасетов Dolmino-Mix-1124 и SmolLM-Corpus (python-edu).

На третьем этапе проводилась SFT модели с использованием 8,9 млрд. токенов текстовых пар "инструкция-ответ". Наконец, для приведения модели в соответствие с предпочтениями человека был выполнен четвертый этап - DPO модели Instella-3B-SFT с использованием 0,76 млрд токенов.

Instella получила 36 слоев, каждый из которых имеет 32 attention heads и поддерживает длину последовательности до 4096 токенов.

Финальный вариант Instella-3B превосходит существующие открытые модели в среднем на 8,08%.

▶️ Состав релиза:

🟢

Instella-3B-Stage1 - претрейн-чекпоинт после первого этапа обучения;

🟢

Instella-3B - чекпоинт после второго этапа;

🟢

Instella-3B-SFT - версия модели после SFT;

🟢

Instella-3B-Instruct - финальная версия после DPO;

🟠

Instella-GSM8K-synthetic - датасет, использованный на 2 этапе обучения;

🟠

Код для трейна и инференса

📌 Лицензирование: ReasearchRAIL License.

🟡

Статья

🟡

Коллекция на HF

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #RoCM #AMD #Instella

Please open Telegram to view this post

VIEW IN TELEGRAM

👍61🔥20❤11🙏3

18.7K views08:40

About

Blog

Apps

Platform