Gemma-4-26B-A4B-it — первая open-weight MoE-модель Google в линейке Gemma
👋 В каталоге immers.cloud появилась Gemma-4-26B-A4B-it — модель, которая делает ставку не на максимальный размер, а на эффективную архитектуру. При 25,2 млрд общих параметров на каждом токене активируется только 3,8–4 млрд, поэтому она даёт сильное качество без избыточных требований к инфраструктуре.
Что здесь важно:
▪️ Первая MoE-модель Gemma: около 97% качества плотной версии 31B при заметно меньших вычислительных затратах.
▪️ Контекст до 256K токенов: подходит для больших документов и многошаговых сценариев.
▪️ Гибридное внимание: 30 слоёв и sliding window на 1024 токена для более эффективной работы с длинным контекстом.
▪️ Мультимодальность: модель работает не только с текстом, но и с изображениями.
▪️ Фокус на агентные задачи: подходит для систем, где модель должна анализировать, планировать и выполнять последовательность действий.
▪️ Высокая практическая скорость: пользователи отмечают до 162 токенов в секунду на RTX 4090.
📲 Подробнее — в слайдах.
➡️ Тестируйте Gemma-4-26B-A4B-it в каталоге immers.
#ИИ_модели
Что здесь важно:
▪️ Первая MoE-модель Gemma: около 97% качества плотной версии 31B при заметно меньших вычислительных затратах.
▪️ Контекст до 256K токенов: подходит для больших документов и многошаговых сценариев.
▪️ Гибридное внимание: 30 слоёв и sliding window на 1024 токена для более эффективной работы с длинным контекстом.
▪️ Мультимодальность: модель работает не только с текстом, но и с изображениями.
▪️ Фокус на агентные задачи: подходит для систем, где модель должна анализировать, планировать и выполнять последовательность действий.
▪️ Высокая практическая скорость: пользователи отмечают до 162 токенов в секунду на RTX 4090.
📲 Подробнее — в слайдах.
➡️ Тестируйте Gemma-4-26B-A4B-it в каталоге immers.
#ИИ_модели
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤3👍3
Как выбрать конфигурацию под задачу
👋 Для разных сценариев нужны разные ресурсы.
Обучение, инференс, рендеринг и гейминг требуют разного подхода к выбору конфигурации.
В карусели разобрали:
— какие параметры важны в первую очередь;
— что учитывать под разные задачи;
— как не переплатить за лишние ресурсы.
📲 Смотрите карточки, чтобы понять, какая конфигурация подойдёт именно под ваш сценарий.
➡️ Выбирайте подходящую конфигурацию на immers.cloud.
Обучение, инференс, рендеринг и гейминг требуют разного подхода к выбору конфигурации.
В карусели разобрали:
— какие параметры важны в первую очередь;
— что учитывать под разные задачи;
— как не переплатить за лишние ресурсы.
📲 Смотрите карточки, чтобы понять, какая конфигурация подойдёт именно под ваш сценарий.
➡️ Выбирайте подходящую конфигурацию на immers.cloud.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4 3🔥1
Как организовать AI-инфраструктуру для двух проектов и снизить затраты?
👋 Цельс — medtech-компания, которая разрабатывает AI-решения для медицины. У команды было два направления: стейдж-среда для обработки медицинских изображений и отдельный LLM-проект с проверкой новых гипотез.
🔁 После переноса проектов в immers.cloud команда сохранила привычные процессы работы и получила инфраструктуру сразу под оба направления.
Что это дало:
— две AI-задачи в одной инфраструктурной логике;
— стейдж-среду, доступную 24/7;
— снижение стоимости примерно в 2–2,5 раза;
— возможность подключать дополнительные ресурсы под новые проекты.
📲 В карусели — разбор задач команды, конфигураций под каждый проект и итогового эффекта после переноса.
🚀 Разверните свой AI-проект в immers.cloud и получите выделенные GPU уже сегодня.
🔁 После переноса проектов в immers.cloud команда сохранила привычные процессы работы и получила инфраструктуру сразу под оба направления.
Что это дало:
— две AI-задачи в одной инфраструктурной логике;
— стейдж-среду, доступную 24/7;
— снижение стоимости примерно в 2–2,5 раза;
— возможность подключать дополнительные ресурсы под новые проекты.
📲 В карусели — разбор задач команды, конфигураций под каждый проект и итогового эффекта после переноса.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥3👍2 1
GLM-5.1 — open-weight модель для долгих агентных сессий
👋 В каталоге immers.cloud появилась GLM-5.1 — флагманская модель от Z.ai для агентной инженерии, длинного контекста и многошаговых задач, где важно не просто сгенерировать ответ, а последовательно планировать действия, обращаться к инструментам и улучшать результат.
Что важно:
▪️ MoE-архитектура: 744B общих параметров, 40B активных параметров на токен.
▪️ Длинный контекст: DeepSeek Sparse Attention помогает работать с контекстом до 203K токенов и снижает вычислительные затраты.
▪️ Обучение: объём предобучения увеличен до 28,5 трлн токенов, а для донастройки использовалась RL-инфраструктура slime.
▪️ Агентные сценарии: модель может разбивать задачу на этапы, обращаться к инструментам, анализировать результат и улучшать решение.
▪️ Практическое применение: кодинг, рефакторинг, оптимизация производительности, создание веб-приложений и автоматизация инженерных процессов.
📲 Подробнее — в слайдах.
➡️ Тестируйте GLM-5.1 в каталоге immers.cloud.
#ИИ_модели
Что важно:
▪️ MoE-архитектура: 744B общих параметров, 40B активных параметров на токен.
▪️ Длинный контекст: DeepSeek Sparse Attention помогает работать с контекстом до 203K токенов и снижает вычислительные затраты.
▪️ Обучение: объём предобучения увеличен до 28,5 трлн токенов, а для донастройки использовалась RL-инфраструктура slime.
▪️ Агентные сценарии: модель может разбивать задачу на этапы, обращаться к инструментам, анализировать результат и улучшать решение.
▪️ Практическое применение: кодинг, рефакторинг, оптимизация производительности, создание веб-приложений и автоматизация инженерных процессов.
📲 Подробнее — в слайдах.
➡️ Тестируйте GLM-5.1 в каталоге immers.cloud.
#ИИ_модели
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤5 4👍1