Как организовать AI-инфраструктуру для двух проектов и снизить затраты?
👋 Цельс — medtech-компания, которая разрабатывает AI-решения для медицины. У команды было два направления: стейдж-среда для обработки медицинских изображений и отдельный LLM-проект с проверкой новых гипотез.
🔁 После переноса проектов в immers.cloud команда сохранила привычные процессы работы и получила инфраструктуру сразу под оба направления.
Что это дало:
— две AI-задачи в одной инфраструктурной логике;
— стейдж-среду, доступную 24/7;
— снижение стоимости примерно в 2–2,5 раза;
— возможность подключать дополнительные ресурсы под новые проекты.
📲 В карусели — разбор задач команды, конфигураций под каждый проект и итогового эффекта после переноса.
🚀 Разверните свой AI-проект в immers.cloud и получите выделенные GPU уже сегодня.
🔁 После переноса проектов в immers.cloud команда сохранила привычные процессы работы и получила инфраструктуру сразу под оба направления.
Что это дало:
— две AI-задачи в одной инфраструктурной логике;
— стейдж-среду, доступную 24/7;
— снижение стоимости примерно в 2–2,5 раза;
— возможность подключать дополнительные ресурсы под новые проекты.
📲 В карусели — разбор задач команды, конфигураций под каждый проект и итогового эффекта после переноса.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥3👍2 1
GLM-5.1 — open-weight модель для долгих агентных сессий
👋 В каталоге immers.cloud появилась GLM-5.1 — флагманская модель от Z.ai для агентной инженерии, длинного контекста и многошаговых задач, где важно не просто сгенерировать ответ, а последовательно планировать действия, обращаться к инструментам и улучшать результат.
Что важно:
▪️ MoE-архитектура: 744B общих параметров, 40B активных параметров на токен.
▪️ Длинный контекст: DeepSeek Sparse Attention помогает работать с контекстом до 203K токенов и снижает вычислительные затраты.
▪️ Обучение: объём предобучения увеличен до 28,5 трлн токенов, а для донастройки использовалась RL-инфраструктура slime.
▪️ Агентные сценарии: модель может разбивать задачу на этапы, обращаться к инструментам, анализировать результат и улучшать решение.
▪️ Практическое применение: кодинг, рефакторинг, оптимизация производительности, создание веб-приложений и автоматизация инженерных процессов.
📲 Подробнее — в слайдах.
➡️ Тестируйте GLM-5.1 в каталоге immers.cloud.
#ИИ_модели
Что важно:
▪️ MoE-архитектура: 744B общих параметров, 40B активных параметров на токен.
▪️ Длинный контекст: DeepSeek Sparse Attention помогает работать с контекстом до 203K токенов и снижает вычислительные затраты.
▪️ Обучение: объём предобучения увеличен до 28,5 трлн токенов, а для донастройки использовалась RL-инфраструктура slime.
▪️ Агентные сценарии: модель может разбивать задачу на этапы, обращаться к инструментам, анализировать результат и улучшать решение.
▪️ Практическое применение: кодинг, рефакторинг, оптимизация производительности, создание веб-приложений и автоматизация инженерных процессов.
📲 Подробнее — в слайдах.
➡️ Тестируйте GLM-5.1 в каталоге immers.cloud.
#ИИ_модели
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤5 4👍1
С майскими праздниками!
🏖 Желаем вам восстановить силы, провести время в комфортном режиме и при необходимости спокойно продолжить работу с проектами.
☁️ Облачные GPU immers.cloud остаются доступны для запуска задач, тестирования моделей, инференса, рендеринга и других вычислительных нагрузок.
📅 График работы на майские
Техническая поддержка в чате продолжит работать в стандартном режиме — 24/7, без выходных, праздников и перерывов.
Мы остаёмся на связи, чтобы помогать с вопросами по инфраструктуре и поддерживать стабильную работу ваших проектов.
💳 Важно для юридических лиц
Из-за особенностей работы банков в праздничные дни платежи могут зачисляться с задержкой.
➡️ Рекомендуем пополнить баланс до 30 апреля включительно, чтобы избежать пауз в работе сервисов и непредвиденных ограничений из-за задержки платежа.
🍹 Пусть майские пройдут спокойно, а инфраструктура продолжит работать стабильно.
☁️ Облачные GPU immers.cloud остаются доступны для запуска задач, тестирования моделей, инференса, рендеринга и других вычислительных нагрузок.
📅 График работы на майские
Техническая поддержка в чате продолжит работать в стандартном режиме — 24/7, без выходных, праздников и перерывов.
Мы остаёмся на связи, чтобы помогать с вопросами по инфраструктуре и поддерживать стабильную работу ваших проектов.
💳 Важно для юридических лиц
Из-за особенностей работы банков в праздничные дни платежи могут зачисляться с задержкой.
➡️ Рекомендуем пополнить баланс до 30 апреля включительно, чтобы избежать пауз в работе сервисов и непредвиденных ограничений из-за задержки платежа.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6 6⚡4👍1🔥1
Как остановить тарификацию сервера
👋 Подготовили инструкцию на примере конфигурации с RTX 2080 Ti, чтобы было проще разобраться, из чего складывается стоимость сервера и какие действия в панели управления влияют на списания в immers.cloud.
📲 В слайдах:
— что входит в стоимость конфигурации;
— что меняется после Stop, Shelve и удаления сервера;
— в каких случаях продолжают тарифицироваться том и IP-адрес;
— как сохранить данные для Local и Volume-backed;
— что проверить, если общий расход не стал равен 0.
Инструкция доступна в формате видео:
📱 ВК
📱 YouTube
📺 Rutube
🌳 На сайте immers.cloud
📲 В слайдах:
— что входит в стоимость конфигурации;
— что меняется после Stop, Shelve и удаления сервера;
— в каких случаях продолжают тарифицироваться том и IP-адрес;
— как сохранить данные для Local и Volume-backed;
— что проверить, если общий расход не стал равен 0.
Инструкция доступна в формате видео:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5👏5 4🔥2❤1
💬 Собственный корпоративный чат на базе Rocket.Chat
👋 В immers.cloud добавлен новый готовый образ Rocket.Chat — корпоративной платформы для безопасного обмена сообщениями, командной работы и внутренних коммуникаций.
📁 Образ позволяет развернуть собственную независимую среду для коммуникаций: с каналами, видеозвонками и интеграциями.
☑️ Это подходит для компаний, которым важно не просто использовать мессенджер, а контролировать инфраструктуру, в которой работает командное общение.
Что входит в образ:
▪️ Ubuntu — операционная система для сервера;
▪️ Docker — среда для запуска приложения в контейнерах;
▪️ Rocket.Chat — корпоративная платформа для коммуникаций;
▪️ Nginx — веб-сервер для обработки входящих запросов.
🚀 Вся инфраструктура инициализируется автоматически при первом запуске. Это избавляет от сложной ручной настройки и позволяет бизнесу быстро получить собственную среду для коммуникаций.
После создания сервера перейти к Rocket.Chat можно через браузер: введите в адресной строке:
➡️ Запустить Rocket.Chat
➡️ Все готовые образы
📁 Образ позволяет развернуть собственную независимую среду для коммуникаций: с каналами, видеозвонками и интеграциями.
☑️ Это подходит для компаний, которым важно не просто использовать мессенджер, а контролировать инфраструктуру, в которой работает командное общение.
Что входит в образ:
▪️ Ubuntu — операционная система для сервера;
▪️ Docker — среда для запуска приложения в контейнерах;
▪️ Rocket.Chat — корпоративная платформа для коммуникаций;
▪️ Nginx — веб-сервер для обработки входящих запросов.
После создания сервера перейти к Rocket.Chat можно через браузер: введите в адресной строке:
http://ip-адрес_вашего_сервера
➡️ Запустить Rocket.Chat
➡️ Все готовые образы
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥5 3👍2
MiniMax M2.7 — модель для агентной разработки и сложных рабочих процессов
👋 В каталоге immers.cloud появилась MiniMax M2.7 — флагманская MoE-модель от MiniMax, ориентированная на агентные сценарии, работу с длинным контекстом, программную инженерию и автоматизацию задач с использованием инструментов.
Что важно:
▪️ Самоэволюция: MiniMax M2.7 участвовала в собственном цикле разработки: анализировала сбои, изменяла код, запускала оценки и проходила итерации улучшения без участия человека.
▪️ Инженерные задачи: модель показывает сильные результаты в сценариях работы с кодом, крупными репозиториями, логами, production-средой и инструментами разработки.
▪️ Прикладные сценарии: автономная разработка ПО, SRE-диагностика, офисная автоматизация, финансовая аналитика, R&D, агентные команды и создание интерактивных текстовых сценариев.
▪️ Запуск: доступны конфигурации для FP8 и INT4. Для запуска и тестирования можно использовать готовое окружение в каталоге immers.cloud без самостоятельной сборки инфраструктуры.
📲 Подробнее — в слайдах.
➡️ Тестируйте MiniMax M2.7 в каталоге immers.cloud.
#ИИ_модели
Что важно:
▪️ Самоэволюция: MiniMax M2.7 участвовала в собственном цикле разработки: анализировала сбои, изменяла код, запускала оценки и проходила итерации улучшения без участия человека.
▪️ Инженерные задачи: модель показывает сильные результаты в сценариях работы с кодом, крупными репозиториями, логами, production-средой и инструментами разработки.
▪️ Прикладные сценарии: автономная разработка ПО, SRE-диагностика, офисная автоматизация, финансовая аналитика, R&D, агентные команды и создание интерактивных текстовых сценариев.
▪️ Запуск: доступны конфигурации для FP8 и INT4. Для запуска и тестирования можно использовать готовое окружение в каталоге immers.cloud без самостоятельной сборки инфраструктуры.
📲 Подробнее — в слайдах.
➡️ Тестируйте MiniMax M2.7 в каталоге immers.cloud.
#ИИ_модели
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🏆4 4👍2🔥1