Технозаметки Малышева
4.76K subscribers
2.51K photos
830 videos
38 files
2.81K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c896
Download Telegram
Qwen2.5-Coder по тестам в разработке превосходит более тяжелые варианты DeepSeek Code

Qwen2.5-Coder, как был анонс выше, релизнули в вариантах 1.5B и 7B параметров.

Qwen2.5-Coder-1.5B
https://hf.co/qwen/Qwen/Qwen2.5-Coder-1.5B

Qwen2.5-Coder-7B
https://hf.co/qwen/Qwen/Qwen2.5-Coder-7B

И по тестам, получается, что Qwen2.5-Coder лидирует в бенчмарках HumanEval, MBPP, BigCodeBench и MultiPL-E, превосходя более крупные модели.

Показывает интересные результаты в генерации и автодополнении кода, а так же в Text-to-SQL задачах.

И вот не понятно, то ли правда китайские товарищи умудрились упаковать математическую мудрость в столь малый размер или это всё-таки файнтюн под бенчмарк.
В общем, нужно тестить.

Ну и традиционно, Qwen2.5 уже есть в ollama варианте:
ollama run qwen2.5

#Qwen #code #Alibaba #Китай
———
@tsingular