DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
🇨🇳 Китайские ИИ-модели захватили мировой opensource-рейтинг! 🚀

Всего через несколько лет после начала «гонки больших моделей» китайские разработчики стали доминировать в мировых рейтингах открытых ИИ. Недавно инженер Rohan Paul обнаружил, что на платформе Design Arena все 15 первых мест занимают модели из КНР.

Почему это важно?
Design Arena — крупнейший бенчмарк для генеративного ИИ, где люди напрямую сравнивают ответы моделей и голосуют за лучший. Рейтинг строится по системе Elo (как в шахматах), что обеспечивает честную и объективную оценку пользовательского опыта.

🏆 ТОП-5 открытых моделей:
1. DeepSeek-R1-0528
2. GLM-4.5 (Zhipu AI)
3. Qwen 3 Coder 480B (Alibaba)
4. DeepSeek-V3-0324
5. DeepSeek-V3.1 (Thinking)

Далее в списке — ещё 10 китайских моделей. OpenAI GPT OSS 120B находится лишь на 16-й позиции.

📊 Распределение по компаниям:
• Alibaba: 6 моделей
• DeepSeek: 5 моделей
• Zhipu AI: 3 модели
• Moonshot AI (Kimi): 1 модель

Технические детали
В июле на Hugging Face китайские компании (Alibaba, Tencent, StepFun и др.) открыли 33 новые модели. Аналитики Interconnects выделяют 19 ключевых лабораторий Китая в области opensource-ИИ, включая DeepSeek, Qwen, MiniMax, Baidu ERNIE и Huawei Pangu.

Вывод
Китайский opensource-ИИ не просто догнал западные аналоги — он задаёт новые стандарты качества. Если раньше opensource-сообщество ассоциировалось с Llama, то сейчас лидерами стали Qwen и DeepSeek.

Подробнее в оригинальной статье.

#КитайскийИИ #КитайAI #OpenSource #DeepSeek #Qwen #DesignArena #HuggingFace
🤗 Кто реально двигает open-source ИИ: анализ топ-50 самых скачиваемых моделей на Hugging Face

Исследование  показывает, какие организации и типы моделей определяют экосистему открытых моделей


🔥 Главное:
📦 Топ-50 - это всего 3.4% всех моделей на Hugging Face,  но именно они собирают более 80% из 45 миллиардов скачиваний

Подавляющее большинство активности сосредоточено вокруг небольшой группы лидеров - 
именно эти модели формируют лицо всего open-source ИИ.

📉 Размер имеет значение (и чем меньше — тем лучше):
- 92.5% загрузок — модели < 1B параметров 
- 86.3% — < 500M 
- 70% — < 200M 
- 40% — < 100M 

Очевидны выводы: в open-source побеждают малые и лёгкие модели, пригодные для локального развёртывания и edge-инференса.

🧠 Популярные направления:
- NLP — 58.1% 
- Computer Vision — 21.2% 
- Audio — 15.1% 
- Multimodal — 3.3% 
- Time Series — 1.7%

Кто создаёт самые скачиваемые модели:
-  Компании - 63.2%  (Google лидер)
-  Университеты - 20.7% 
-  Индивидуальные авторы - 12.1% 
-  НКО - 3.8% 
-  Прочие лаборатории - 0.3%

Какие типы моделей побеждают:
Текстовые энкодеры - 45% всех загрузок 
Декодеры - всего 9.5% 
Энкодер-декодеры - 3%

📌 Несмотря на хайп вокруг LLM, массово скачиваются не гиганты, а утилитарные модельки  для интеграции в собственные продукты.

🇺🇸 Лидеры по странам: 
США доминируют по всем категориям: 
- встречаются 18 раз среди топ-50 скачиваний 
- на США приходится 56.4% всех загрузок

Open-source ИИ живёт не за счёт гигантских LLM, а благодаря компактным, быстрым и практичным моделям,  мкоторые реально работают в продуктах и проектах.

🟠 Почитать полностью: https://huggingface.co/blog/lbourdois/huggingface-models-stats

#AI #HuggingFace #OpenSource #ML #Research #LLM #AITrends
Please open Telegram to view this post
VIEW IN TELEGRAM