Qwen2.5-Coder по тестам в разработке превосходит более тяжелые варианты DeepSeek Code
Qwen2.5-Coder, как был анонс выше, релизнули в вариантах 1.5B и 7B параметров.
Qwen2.5-Coder-1.5B
https://hf.co/qwen/Qwen/Qwen2.5-Coder-1.5B
Qwen2.5-Coder-7B
https://hf.co/qwen/Qwen/Qwen2.5-Coder-7B
И по тестам, получается, что Qwen2.5-Coder лидирует в бенчмарках HumanEval, MBPP, BigCodeBench и MultiPL-E, превосходя более крупные модели.
Показывает интересные результаты в генерации и автодополнении кода, а так же в Text-to-SQL задачах.
И вот не понятно, то ли правда китайские товарищи умудрились упаковать математическую мудрость в столь малый размер или это всё-таки файнтюн под бенчмарк.
В общем, нужно тестить.
Ну и традиционно, Qwen2.5 уже есть в ollama варианте:
ollama run qwen2.5
#Qwen #code #Alibaba #Китай
———
@tsingular
Qwen2.5-Coder, как был анонс выше, релизнули в вариантах 1.5B и 7B параметров.
Qwen2.5-Coder-1.5B
https://hf.co/qwen/Qwen/Qwen2.5-Coder-1.5B
Qwen2.5-Coder-7B
https://hf.co/qwen/Qwen/Qwen2.5-Coder-7B
И по тестам, получается, что Qwen2.5-Coder лидирует в бенчмарках HumanEval, MBPP, BigCodeBench и MultiPL-E, превосходя более крупные модели.
Показывает интересные результаты в генерации и автодополнении кода, а так же в Text-to-SQL задачах.
И вот не понятно, то ли правда китайские товарищи умудрились упаковать математическую мудрость в столь малый размер или это всё-таки файнтюн под бенчмарк.
В общем, нужно тестить.
Ну и традиционно, Qwen2.5 уже есть в ollama варианте:
ollama run qwen2.5
#Qwen #code #Alibaba #Китай
———
@tsingular