Компания Алибаба выпустила серию языковых моделей Qwen 3. Помимо того, что эта модель преодолела очередные рубежи бенчмарков, включая кодинг и другие сложные задачи, она интересна рядом технических новшеств.
Эти модели могут работать в режиме LRM — выполняя более сложные пошаговые цепочки рассуждений для решения сложных проблем. Или могут отдавать простые ответы быстро, как это делает обычная языковая модель. Таким образом, Qwen 3 представляет собой гибрид LLM и модели рассуждений.
Серия Qwen 3 включает версии от 0.6 до 32 миллиардов параметров, плюс большую модель Qwen3-235B-A22B с архитектурой Mixture-of-Experts, которая превзошла OpenAI o3-mini и Gemini 2.5 Pro на соревнованиях по программированию платформы Codeforces и AIME-бенчмарке.
Как уже было сказано, в серии Qwen 3 Алибаба реализовали MoE-архитектуру для большей эффективности моделей. Эта архитектура позволяет задействовать только часть слоев при инференсе, требуя меньше вычислительных ресурсов. Архитектуру MoE имеют модели Qwen3-30B-A3B и уже упомянутая Qwen3-235B-A22B.
Чтобы запустить модели Qwen 3 на immers.cloud, нужно использовать видеокарты с соответствующим объемом видеопамяти. Веса моделей выложены в форматах fp16 и fp8, кроме того, можно использовать квантизацию — например, bitsandbytes — при запуске модели на одном из популярных серверов, таких как vLLM, чтобы сэкономить видеопамять.
@ruslandevlive — мысли о современных AI/ML-технологиях
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👏4😱4❤3 1
Наш амбассадор Даня Грызлов собрал подробную инструкцию, как избежать всех типичных ошибок:
— Как запечь анимацию
— Что сделать с Shape Keys
— Как настроить FBX-экспорт
— И зачем использовать облачные GPU для тяжёлых сцен
Please open Telegram to view this post
VIEW IN TELEGRAM
👏4👍3🔥3 1
Сегодня, 9 мая, мы не только чтим память героев, но и прикоснёмся к наследию Победы с помощью современных технологий.
Патриотические образы, вдохновленные историей, можно не просто сохранить, но и воссоздать через генерацию изображений.
💡Попробуй создать свою визуальную историю Победы с помощью нашего образа для генерации: Ubuntu + Stable Diffusion + ComfyUI
Пусть память живёт не только в сердцах, но и в каждом кадре, который мы создаём.
Патриотические образы, вдохновленные историей, можно не просто сохранить, но и воссоздать через генерацию изображений.
💡Попробуй создать свою визуальную историю Победы с помощью нашего образа для генерации: Ubuntu + Stable Diffusion + ComfyUI
Пусть память живёт не только в сердцах, но и в каждом кадре, который мы создаём.
👍5❤3🏆2
Если вы обучаете нейросети или работаете с большими данными — это ваш шанс получить максимум мощности.
👉 Подключайтесь и работайте без ограничений!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4👏3 1
Имеет ли смысл создавать собственный LLM сервер?
Еще недавно, когда приложения, использующие AI, находились на ранней стадии своего развития, большинство разработчиков ограничивались использованием сторонних API — главным образом OpenAI. Исключение составляли те, у кого была возможность развертывания собственной дорогостоящей GPU-инфраструктуры.
Сейчас ситуация изменилась под влиянием двух факторов: появилось больше открытых моделей, способных конкурировать с OpenAI, и возросла доступность GPU в облаке.
У открытых моделей всегда есть альтернатива — самостоятельный деплой весов на LLM-сервер. Наша платформа immers.cloud стремится к тому, чтобы у разработчиков была возможность в полной мере воспользоваться преимуществами этого пути. Подробности — в карусели.
@ruslandevlive — мысли о современных AI/ML-технологиях
Еще недавно, когда приложения, использующие AI, находились на ранней стадии своего развития, большинство разработчиков ограничивались использованием сторонних API — главным образом OpenAI. Исключение составляли те, у кого была возможность развертывания собственной дорогостоящей GPU-инфраструктуры.
Сейчас ситуация изменилась под влиянием двух факторов: появилось больше открытых моделей, способных конкурировать с OpenAI, и возросла доступность GPU в облаке.
У открытых моделей всегда есть альтернатива — самостоятельный деплой весов на LLM-сервер. Наша платформа immers.cloud стремится к тому, чтобы у разработчиков была возможность в полной мере воспользоваться преимуществами этого пути. Подробности — в карусели.
@ruslandevlive — мысли о современных AI/ML-технологиях
👍4🎉3🏆3
🔥 Квантованная Qwen 3 — теперь вы можете запустить 235B модель всего на двух GPU H100!
Alibaba выпустила оптимизированные версии своих моделей, и теперь даже Qwen3-235B (234 млрд параметров!) работает с 40K контекстом на скорости ~40 токенов/сек — идеально для production.
💡 Листайте карусель выше — наш амбассадор Ruslan Dev рассказывает про форматы квантизации, требования к железу и как запустить модель в immers.cloud!
Alibaba выпустила оптимизированные версии своих моделей, и теперь даже Qwen3-235B (234 млрд параметров!) работает с 40K контекстом на скорости ~40 токенов/сек — идеально для production.
💡 Листайте карусель выше — наш амбассадор Ruslan Dev рассказывает про форматы квантизации, требования к железу и как запустить модель в immers.cloud!
@ruslandevlive — мысли о современных AI/ML-технологиях
❤4🎉4🏆3🔥1