Vikhr models – Telegram

Vikhr models

2.48K subscribers

53 photos

5 videos

68 links

Vikhr models news feed
Задонатить можно:
- Тинькофф сбп:
- - https://www.tbank.ru/cf/3W1Ko1rj8ah

Наш сайт: https://vikhr.org
Чат сообщества: @vikhrmodels

Download Telegram

About

Blog

Apps

Platform

2.48K subscribers

Выложили перевод датасета reasoninga

dataset

Vikhrmodels/reasoning-0.01-ru · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥7🤡2

1.82K views09:51

🤗 Пост для сбора фидбека о новых моделях

Прошло уже некоторое время с релиза и я надеюсь, что вы успели попробовать наши модели (в Gradio, в ботах, в LM Studio или, быть может, в уже в реальных проектах).

Нам хотелось бы лучше понимать, какую пользу (или наоборот) мы приносим пользователям своими релизами и что работает хорошо, а что не очень и можно было бы добавить/доработать в следующих версиях. А также перформанс относительно других моделей.

Поделитесь, пожалуйста, юзкейсами, где вобще применяете LLM, в каких задачах (не только наши, любые). Присылайте хорошие/плохие/интересные примеры в комментарии, постараюсь помочь с проблемами с использованием.

Кстати, если вам понравились модели не забывайте ставить лайки в карточках моделей на HF (Vikhr-Nemo, Vikhr-Llama), а так же звездочки в Github - это поможет нам в продвижении и просто будет приятно.

Vikhrmodels/Vikhr-Llama3.1-8B-Instruct-R-21-09-24 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥10🖕8❤3👏2🤡1

1.94K views10:41

Forwarded from LakoMoor

🌪️ Vikhr выпустили переведенный датасет под обучения LLM

За основу взят SkunkworksAI/reasoning-0.01, который был переведен с помощью нейросети.

Синтетический набор данных цепочек рассуждений для широкого спектра задач. Мы используем такие данные в различных экспериментах/проектах по рассуждениям. Следите за моделями рассуждений и другими данными.

обнимающеелицо 🤗
🌪️ Vikhr

❤‍🔥7👍3🔥3🤡1

1.95K views18:24

https://huggingface.co/Vikhrmodels/Llama-3.2-3B-Instruct
https://huggingface.co/Vikhrmodels/Llama-3.2-1B-Instruct

https://huggingface.co/Vikhrmodels/Llama-3.2-1B
https://huggingface.co/Vikhrmodels/Llama-3.2-3B

Работаем братья

ЛЛАМА БУДУТ СВОБОДНЫ!

🔥33⚡2

8.6K viewsedited 20:29

🔥 Новое пополнение в семействе вихрей!

⚡️ Vikhr-Llama-3.2-1B-Instruct — компактная и мощная языковая модель, созданная на базе Llama-3.2-1B, специально обученная на русскоязычном датасете GrandMaster-PRO-MAX. Её эффективность в 5 раз выше по сравнению с базовой моделью, и она идеально подходит для мобильных и слабых устройств, занимая всего до 3GB.

💡 Что нового?
- Инструктивная дообученная модель: разработана для русскоязычных задач
- Компактный размер: всего 1B параметров
- Мощь в компактности: работает на уровне более крупных моделей

🔗 Подробнее о наших моделях: Vikhrmodels/Vikhr-Llama-3.2-1B-Instruct
🔗 GGUF: Vikhrmodels/Vikhr-Llama-3.2-1B-instruct-GGUF
🔗 Ollama: Ollama

Коллектив авторов: @LakoMoorDev @nlpwanderer

🔥30❤5👍4🤡2🍓1

12.9K viewsedited 12:40

Стоит ли строить web для вихрей?

Anonymous Poll

Да, хочу апи

Да, хочу веб чат/тг чат

🤔3

247 voters2.37K views15:13

Натурализация выходов llm

С помощью DPO можно учить LLM генерировать LLM более натуральные тексты, для этого берем текст, нарезаем на куски, суммаризируем, затем генерируем "любой сеткой" кандидатов. Учим DPO где хороший текст это оригинал, а плохой это то что сетка родила.

Собственно у нас в Vikhr Models есть трек с Roleplay+Interpretability поэтому мы сгенерировали такой датасет на основе habr+picabuu+ficbook.

Ну и забыли заанонсить🫠

А вчера увидел пост у Ильи что ребята в комьюнити проделали аналогичную работу над книжками!

На основе книжек
Наш датасет на основе более разнообразного датамикса

Старший Авгур

Помните историю про Гутенберг, датасет пар для обучения моделей писательству? Нашёлся-таки герой, который повторил его для русского, мой подписчик — Макс 👏

Вот сам датасет: https://huggingface.co/datasets/40umov/dostoevsky

Методология аналогична оригинальной.…

👍15🔥4

10.1K views07:54

Vikhr paper едет на Workshop emnlp!

А из-за того что все авторы очень русские никому не выдали визу)))

😢31😁10👍1🤡1

11.1K views10:46

📟 Вихрь теперь можно запустить даже на пейджерах !?

⚡️ Vikhr-Qwen-2.5-0.5B-Instruct - инструктивная модель на основе Qwen-2.5-0.5B-Instruct, обученная на русскоязычном датасете GrandMaster-PRO-MAX. В 4 раза эффективнее базовой модели, и идеально подходит для запуска на слабых мобильных устройствах.

💡 Что нового?
- Небольшой размер: Всего 0.5B параметров, идеально подходящая для применения на простых устройствах.
- Эффективность: Достигает результатов, сопоставимых с более крупными моделями.

🔗 HF: Vikhrmodels/Vikhr-Qwen-2.5-0.5b-Instruct
🔗 GGUF: Vikhrmodels/Vikhr-Qwen-2.5-0.5b-Instruct-GGUF

Инструкция по запуску на телефоне

Коллектив авторов: @LakoMoorDev @nlpwanderer

🔥26🍓7🤡3

11.2K views08:43

Forwarded from Старший Авгур

Ну что, сработала техника, получается. А нужен был всего лишь простой советский перевод Агаты Кристи.

Сайга пока догоняет, поэтому в качестве основы я взял Вихрь-Немо.

Аналогично оригинальному Ataraxy, дообучил модель через ORPO на датасете, описанном выше, и слил получившийся тюн с оригиналом. Внезапно получил +0.1 на ПингПонге. На арене стало чуть хуже, 77 у новой модели vs 80 у оригинала.

Сама модель: vikhr_nemo_orpo_dostoevsky_12b_slerp
В боте она тоже есть.

🔥26🤡3👍2👏1

2.5K views09:28

Круто!
Нашу библиотеку для алаймента добавили в awesome LLM resourses

GitHub - WangRongsheng/awesome-LLM-resources: 🧑‍🚀 全世界最好的LLM资料总结（语音视频生成、Agent、辅助编程、数据处理、模型训练、模型推理、o1 模型、MCP、小语言模型、视觉语言模型） | Summary…

🧑‍🚀 全世界最好的LLM资料总结（语音视频生成、Agent、辅助编程、数据处理、模型训练、模型推理、o1 模型、MCP、小语言模型、视觉语言模型） | Summary of the world's best LLM resources. - GitHub - WangRongsheng/awesome-LLM-resources: 🧑‍🚀 全世界最好的LLM资料总结（语音...

👍26👏9🔥6❤3😱1

8.98K viewsedited 09:53

Привет!

Спасибо Илье за репорт, мы обновили карточку модели и выкинули дубликаты из GrandMasterProMax

На днях обновим публичную арену

Когда мы готовили датасеты и арену мы старались дизайнить их устойчивыми к взломам, но в итоги вышли сами на себя 😅

Мы почти уверены что даже доливка всей арены не повлият очень значимо на перфоманс. В будущем будем помимо ngramной дедупликации использовать еще и exact match.

Старший Авгур

Ларчик с Вихрём Немо просто открывался. Рецепт оказался прост: трейн на тесте.
Я недавно случайно обнаружил, что в GrandMaster-PRO-MAX лежит около 180 промптов и ответов на них из ru_arena_general. А их там всего 500, то есть больше трети примеров из тестов…

🔥17👍7😁7🤡4❤3

2.47K viewsedited 12:02

Паблик арена слегка страдает от обновления, поэтому пока так

Ygpt v4 lite где то на уровне llama 8b, но с точки зрения русского очевидно будет лучше

Ygptv4 pro где то на уровне mistral nemo 12b

Qwen2.5 14b на уровне тюненной gemma/mistral Nemo

😁9

10.1K views21:47

Forwarded from Старший Авгур

Мммм, 35 место. Но так-то серьёзный скачок с 46. В комментах скриншоты с артефактами.

👍8😁2

2.06K views22:39

Мы дочинили arenahard, сабмиты снова работают как и раньше (спасибо gradio за обновления)

А также добавился gigachat max censored и uncensored. Подозреваю что цензор это мелкая модель сверху которая помимо прочего сильно режет качество генераций.

Версия с цензором где то между mistral nemo и gemma 27b. Версия без цензора на простой корзине(без особого кода, ризонинга и прочего) на уровне 4о.

Крутой рост за полгода, посмотрим что будет дальше.

👍37🤡12🔥9🤯6👏3

11.1K views15:19

💨👁 Vikhr-2-VL-2b-Instruct-experimental

это компактная VLM модель, обученная на переведенном датасете LLAVA-150K, специально доученная для обработки на русском языке. Дообученная модель является эксперементальной и не всегда будет работать ожидаемо (особенно OCR).

Ждем вашего фидбека от использования модели)

HuggingFace
Colab

Коллектив авторов: @LakoMoorDev @mlunderground @nlpwanderer

🔥25👍8🤡3👀1

16.7K views06:02

Обновилась llmarena.ru

TLDR
Vikhr Nemo - лучшая opensource модель в своем классе!

🔥33👍6❤1👏1😁1

10.4K views08:33

Forwarded from NLP семинар, ЛЕЯ (ВШЭ СПб)

19 ноября в 18:30 у нас выступит команда Vikhr models c докладом:

“Как мы русифицировали языковые модели и пришли к лучшей в классе открытой модели на русском”

Ссылка на видеовстречу: https://telemost.yandex.ru/j/89085873905223

❤27🔥8👍6❤‍🔥5

1.62K views12:53

Постер нашей статьи на EMNLP.

Самая статья для тех кто не читал.

🔥43🤡17👎8🤮7👍3👏2

10.1K viewsedited 16:24

Forwarded from NLP семинар, ЛЕЯ (ВШЭ СПб)

19 ноября в 18:30 у нас выступит команда Vikhr models c докладом:

“Как мы русифицировали языковые модели и пришли к лучшей в классе открытой модели на русском”

Ссылка на видеовстречу: https://telemost.yandex.ru/j/89085873905223

👍21🤡7👎3🤮3

1.8K views14:45