Заметки LLM-энтузиаста
516 subscribers
143 photos
17 videos
1 file
174 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
Media is too big
VIEW IN TELEGRAM
Qwen3-Code: новый конкурент Claude Code 🚀

Alibaba выпустила Qwen3-Code — модель для программирования с 480 миллиардами параметров (35 млрд активных). Модель поддерживает контекст до 256K токенов нативно и до 1M через экстраполяцию.

Ключевые особенности:
• Mixture of Experts архитектура
• Обучена на 7.5 триллионах токенов (70% код)
• Поддержка агентных задач: кодирование, браузер, инструменты
• Производительность сравнима с Claude Sonnet 4

Инструменты разработки: 🛠

1️⃣ Qwen Code — CLI инструмент (форк Gemini Code)
2️⃣ Интеграция с Claude Code — через API совместимость (подробности в блоге по ссылке)
3️⃣ Поддержка в Cline

Результаты тестирования:
SWE-Bench Verified: выше Kimi K2 (которая при в 4-5 раз меньшей стоимости показывает результаты всего лишь немного хуже, чем Claude Sonnet 4), ниже Sonnet 4
• Хорошо справляется с задачами, где требуется использование внешних инструментов (tools)
• Более лаконичные ответы по сравнению с Kimi

Доступность и цены: 💰

Бесплатно: chat.qwen.ai
Дешево: Hyperbolic ($2), Parasail ($2-$3.5) - через openrouter.ai
Дорого: официальный API ($6-60 за 1M токенов) и из РФ не так то просто завести учетку на alibabacloud (нужна не только карточка иностранного банка, но и иностранный мобильный номер при регистрации)

Ограничения:
• Пока доступна только большая модель (480B)
• Контекст 256K (больше, чем у Claude)
• Спорные результаты бенчмарков от разработчиков

Установка Qwen Code:

npm i -g @qwen-code/qwen-code


Модель показывает хорошие результаты в задачах AI-программирования, но требует осторожности при выборе провайдера API из-за разброса цен 📊
Теперь в случае когда Claude Sonnet сбоит (как это было на прошлой неделе), у нас есть неплохая замена: Qwen3-code и Kimi-2 (оба варианта можно использовать в Claude Code)

@llm_notes

#qwen #vibecoding #llm #programming #opensource
1👍6