immers.cloud | Облако с GPU

Gemma-4-26B-A4B-it — первая open-weight MoE-модель Google в линейке Gemma

👋

В каталоге immers.cloud появилась Gemma-4-26B-A4B-it — модель, которая делает ставку не на максимальный размер, а на эффективную архитектуру. При 25,2 млрд общих параметров на каждом токене активируется только 3,8–4 млрд, поэтому она даёт сильное качество без избыточных требований к инфраструктуре.

Что здесь важно:
▪️ Первая MoE-модель Gemma: около 97% качества плотной версии 31B при заметно меньших вычислительных затратах.
▪️ Контекст до 256K токенов: подходит для больших документов и многошаговых сценариев.
▪️ Гибридное внимание: 30 слоёв и sliding window на 1024 токена для более эффективной работы с длинным контекстом.
▪️ Мультимодальность: модель работает не только с текстом, но и с изображениями.
▪️ Фокус на агентные задачи: подходит для систем, где модель должна анализировать, планировать и выполнять последовательность действий.
▪️ Высокая практическая скорость: пользователи отмечают до 162 токенов в секунду на RTX 4090.

📲 Подробнее — в слайдах.

➡️ Тестируйте Gemma-4-26B-A4B-it в каталоге immers.

#ИИ_модели

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5❤3👍3

625 views10:04

immers.cloud | Облако с GPU

Как выбрать конфигурацию под задачу

👋 Для разных сценариев нужны разные ресурсы.
Обучение, инференс, рендеринг и гейминг требуют разного подхода к выбору конфигурации.

В карусели разобрали:
— какие параметры важны в первую очередь;
— что учитывать под разные задачи;
— как не переплатить за лишние ресурсы.

📲 Смотрите карточки, чтобы понять, какая конфигурация подойдёт именно под ваш сценарий.

➡️ Выбирайте подходящую конфигурацию на immers.cloud.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤43🔥1

562 views10:02

immers.cloud | Облако с GPU

Как организовать AI-инфраструктуру для двух проектов и снизить затраты?

👋 Цельс — medtech-компания, которая разрабатывает AI-решения для медицины. У команды было два направления: стейдж-среда для обработки медицинских изображений и отдельный LLM-проект с проверкой новых гипотез.

🔁 После переноса проектов в immers.cloud команда сохранила привычные процессы работы и получила инфраструктуру сразу под оба направления.

Что это дало:
— две AI-задачи в одной инфраструктурной логике;
— стейдж-среду, доступную 24/7;
— снижение стоимости примерно в 2–2,5 раза;
— возможность подключать дополнительные ресурсы под новые проекты.

📲 В карусели — разбор задач команды, конфигураций под каждый проект и итогового эффекта после переноса.

🚀 Разверните свой AI-проект в immers.cloud и получите выделенные GPU уже сегодня.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥3👍21

582 views10:12

immers.cloud | Облако с GPU

GLM-5.1 — open-weight модель для долгих агентных сессий

👋 В каталоге immers.cloud появилась GLM-5.1 — флагманская модель от Z.ai для агентной инженерии, длинного контекста и многошаговых задач, где важно не просто сгенерировать ответ, а последовательно планировать действия, обращаться к инструментам и улучшать результат.

Что важно:
▪️ MoE-архитектура: 744B общих параметров, 40B активных параметров на токен.

▪️ Длинный контекст: DeepSeek Sparse Attention помогает работать с контекстом до 203K токенов и снижает вычислительные затраты.

▪️ Обучение: объём предобучения увеличен до 28,5 трлн токенов, а для донастройки использовалась RL-инфраструктура slime.

▪️ Агентные сценарии: модель может разбивать задачу на этапы, обращаться к инструментам, анализировать результат и улучшать решение.

▪️ Практическое применение: кодинг, рефакторинг, оптимизация производительности, создание веб-приложений и автоматизация инженерных процессов.

📲 Подробнее — в слайдах.

➡️ Тестируйте GLM-5.1 в каталоге immers.cloud.

#ИИ_модели

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6❤54👍1

654 views10:00

About

Blog

Apps

Platform