Forwarded from Сергей Марков: машинное обучение, искусство и шитпостинг
Мы собрали первый большой открытый бенчмарк работы LLM на 1C. В нем более 150 задач на написание кода в 1С. Бенчмарк имеет 2 режима — одношаговая генерация и многошаговый агентный режим для проверки работы AI агентов.
Подробности в статье на Хабре: https://habr.com/ru/companies/sberbank/articles/1040114
Сайт бенчмарка с результатами замаров на современных LLM: https://1cbench.github.io/
Репозиторий с кодом и задачами: https://github.com/1cbench/bench
Подробности в статье на Хабре: https://habr.com/ru/companies/sberbank/articles/1040114
Сайт бенчмарка с результатами замаров на современных LLM: https://1cbench.github.io/
Репозиторий с кодом и задачами: https://github.com/1cbench/bench
Хабр
1C Code Bench — бенчмарк для оценки способности LLM писать код на 1С
Бенчмарк разработан в Управлении экспериментальных систем машинного обучения Sber Al. Мы учим собственные модели, активно продвигаем науку в области, ставим уникальные эксперименты, пишем статьи...
👍2
Б Е С П Л А Т Н О
Бесплатный OpenAI API - заворачиваем халявные лимиты на вебе в API для любых целей.
PruhaNLP/web-to-api — заворачивает ваши сессии DeepSeek, Kimi и Qwen в стандартный эндпоинт для вайбкод IDE и любых других клиентов.
Есть удобный UI что бы быстро обновлять куки, уведомления через телегу и прочие приколы.
Бесплатный OpenAI API - заворачиваем халявные лимиты на вебе в API для любых целей.
PruhaNLP/web-to-api — заворачивает ваши сессии DeepSeek, Kimi и Qwen в стандартный эндпоинт для вайбкод IDE и любых других клиентов.
Есть удобный UI что бы быстро обновлять куки, уведомления через телегу и прочие приколы.
🔥6 3😁1🍓1 1
Нашел кастомную реализацию FA2 под V100 (ai-bond/flash-attention-v100).
Увидел цифры ускорения в readme, думал ща разгуляюсь на старом говне и как сделаю furry rp deepseek grpo но нет - автор взял за бейзлайн eager а не sdpa.
Понял я это только когда обучение замедлилось почти что х2, после имплементации. Господи как же тяжело быть нищетой, когда уже RTX 6000PRO на taobao за пару сотен баксов отдавать будут
Увидел цифры ускорения в readme, думал ща разгуляюсь на старом говне и как сделаю furry rp deepseek grpo но нет - автор взял за бейзлайн eager а не sdpa.
Понял я это только когда обучение замедлилось почти что х2, после имплементации. Господи как же тяжело быть нищетой, когда уже RTX 6000PRO на taobao за пару сотен баксов отдавать будут
GitHub
ai-bond - Overview
ai-bond has 3 repositories available. Follow their code on GitHub.
😭4 2
https://ai.meta.com/blog/brain2qwerty-brain-ai-human-communication/
Крутейшая штука, периодически проскакивают мысли сделать такое же благо домашний ЭЭГ стоит недорого - порядка 300$.
Я думаю это достаточно несложно и проблема сугубо в кринжевом подходе к ЭЭГ шлемам (скорее всего Даннинг Крюгер с моей стороны).
Для тех кому лень читать статью:
- свертка делает эмбеддинги
- трансформерный энкодер из эмбедденгов делает предложения
- n-грамная модель правит опечатки
Ты продашь свои мысли корпорации и будешь рад этому.
Крутейшая штука, периодически проскакивают мысли сделать такое же благо домашний ЭЭГ стоит недорого - порядка 300$.
Я думаю это достаточно несложно и проблема сугубо в кринжевом подходе к ЭЭГ шлемам (скорее всего Даннинг Крюгер с моей стороны).
Для тех кому лень читать статью:
- свертка делает эмбеддинги
- трансформерный энкодер из эмбедденгов делает предложения
- n-грамная модель правит опечатки
Meta AI
From Brain Waves to Words: Brain2Qwerty Offers a New Path to Communication Without Surgery