Заместители

Вайб-ЛЛМинг! Hugging Face сделали AI агента, который сам обучает LLM модели

Теперь хватит минимальных навыков работы с кодом, чтобы обучить свою LLM.

Работает все чисто на промптах с минимальной подготовкой среды:
- Вы даёте агенту задачу дообучить модель на датасете: можно указать свой датасет или позволить ему найти подходящий самому.
Пример от HF. Вот таким промптом дается задача агенту:

Fine-tune Qwen3-0.6B on the open-r1/codeforces-cots dataset for instruction following.

- Агент подбирает железо для обучения исходя из размера модели и проверяет датасет.
В данном примере он подберет t4-small (наименьшая достаточная конфигурация, чтобы дообучить эту модель).

- Обучение запускается на облачных GPU от Hugging Face. Перед запуском агент покажет конфигурацию (GPU, ожидаемое время обучения, стоимость, репозиторий где будет сохранена обученная модель).

- Агент стартует обучение и делится дашбордом с прогрессом в реальном времени через Trackio.

- Чекпоинты отправляются в Hub (репозиторий моделей).

Как они так красиво все автоматизировали?

Hugging Face на текущий момент, пожалуй, крупнейшая международная платформа, которая предоставляет все сразу в одном месте:
- железо для обучение
- удобная платформа и библиотеки
- самая большая библиотека опенсорс моделей
- самая большая библиотека опенсорс датасетов.

И на этот фундамент они добавили Hugging Face Skills — суть Agent Context Protocol (ACP). На практике эти "скиллы" — это папки, в которых собраны инструкции, скрипты и ресурсы для использования ИИ-агентом под конкретный кейс. В каждой такой папке есть файл “SKILL.md” с YAML-фронтматтером (имя и описание) и далее текст с инструкциями, которым кодовый агент следует, пока этот скилл активен. И вот сделали такой скилл для обучения LLM моделей на платформе и мощностях HF.

На текущий момент Hugging Face скиллы совместимы с Claude Code, OpenAI Codex, Gemini CLI. И продолжают расширять совместимость.

😎

Почему это важно?

Проблема LLM моделей в том, что они либо знают "всё", но при этом слишком жирные и дорогие для on-premise. Либо они маленькие и не всегда подходят для узко специфических задач.

Решается эта проблема дообучением/файнтюнингом маленьких LLM-ок на конкретных датасетах под конкретные задачи.

И вот раньше делать это могли только спецы с глубоким пониманием матчасти и навыками в AI. Но теперь Hugging Face сильно ослабляет эти ограничения!

Теперь хватит минимальных навыков, которые можно освоить за вечер! Единственный нюанс: конкретно этот агент работает только с платным аккаунтом HF (тк использует платный запуск джобов). Но это не важно, тк это все равно существенно дешевле человеко-часов любого AI разработчика!

No code будущее все ближе 👀

Заместители

Please open Telegram to view this post