Punk Programmer

10 views06:00

⚡️

YandexGPT 5: модель нового поколения от Яндекса и возвращение компании к публикации LLM-моделей в опенсорс впервые с 2022 года.

Яндекс анонсировал новое поколение больших языковых моделей — YandexGPT 5, включающее Pro и Lite версии.

▶️

YandexGPT 5 Lite

YandexGPT 5 Lite 8B уже доступна на Hugging Face. Модель обучалась в два этапа: претрейн на массиве русско- и англоязычных текстов объёмом 15T токенов и этап Powerup на высококачественных данных объёмом 320B токенов. Она опубликована без финального этапа обучения, этических фильтров и алайнмента, что делает её удобной для исследований и дообучения под специфические задачи разработчиков.

Модель имеет контекстное окно 32k токенов, а в своей категории достигает паритета с мировыми SOTA по ключевым бенчмаркам для pretrain-моделей.

▶️

YandexGPT 5 Pro

В разработке Pro-версии применены значительные улучшения: переработанный датасет с более сложными и разнообразными примерами, усложнённые тренировочные задания, внедрение DPO и PPO с собственной модификацией LogDPO против «разучивания», оптимизация через YaFSDP (-25% вычислительных ресурсов), гибридное обучение с использованием базовых настроек Qwen.

По тестам YandexGPT 5 Pro:

🟢 Достигает уровня GPT-4o в международных тестах и их русскоязычных адаптациях

🟢 Превосходит Qwen-2.5-32b-Instruct в работе с фактами и форматированием, немного уступая в вычислениях

⚠️Pro-версия уже внедрена в чат с Алисой и доступна через API в Yandex Cloud, где может использоваться как в базовой версии, так и с подключением к Поиску.

🟡

Статья

@ai_machinelearning_big_data

#AI #ML

Please open Telegram to view this post

VIEW IN TELEGRAM

6 views11:35

Punk Programmer

Российские компании на 10% увеличили число научных публикаций об ИИ

В тройку лидеров вошли Сбербанк (76 штук), Smart Engines (50) и «Яндекс» (27). Остальные публикации приходятся на «Т-Банк» (11), MTS AI (9) и VK (3)

Согласно директивам Президента, Россия совместно с институтами и бизнесом должна к 2030 г. публиковать не менее 450 публикаций

При этом стоит отметить, что CNews считал публикации только ИИ-компаний

Наибольший массив статей по направлению ИИ приходится по обыкновению на вузы и структуры Российской академии наук

#новости #ai

8 views19:58

Punk Programmer

#мемы #ai

12 views10:42

Punk Programmer

Т-Банк первым в стране разработал AI-ассистента в сфере кибербезопасности.

Safeliner в пять раз ускоряет процессы поиска и исправления уязвимостей внутри компании, не допуская их появления. Он оптимизирует код и уменьшает нагрузку на продуктовые команды разработки.

AI-ассистент был запущен в августе прошлого года внутри Т-Технологий, где поможет экономить более 1 млрд рублей ежегодно.

Сейчас Safeliner тестирует несколько партнеров Т-Банка, а в будущем его сделают доступным для всех на рынке.

#AI #Новости

🔥1

12 views09:07

Punk Programmer

В GigaChat добавят возможность редактировать видео. Команда уже изучает вышедший недавно в паблик датасет Señorita-2M, рассказал Александр Капитанов, руководитель RnD GigaChat.

Заодно в очередной раз проговорили детали о вчерашнем релиза MALVINA. В ближайших планах: добавить в редактор поддержку нескольких операций одновременно, а также загрузку нескольких изображений или видео на входе. Бонусом может появиться опция работы с RAG.

#новости #ai

11 views10:02

Punk Programmer

Reddit подаёт в суд на Anthropic за незаконное использование данных

Reddit обвиняет Anthropic в массовом парсинге сайта и коммерческом использовании данных.

Согласно иску:
🔹 Anthropic парсили Reddit более 100 000 раз, несмотря на заверения, об остановке сбора данных
🔹 Anthropic использовали пользовательский контент в коммерческих целях без лицензии
🔹 Reddit утверждает: это прямое нарушение соглашения и "поведение не в духе компании, называющей себя белым рыцарем AI-индустрии"

📣 Цитата из иска:
> “Reddit — одно из последних по-настоящему человеческих мест в интернете. И то, как поступает Anthropic, недопустимо.”

На фоне миллиардных сделок с Google и OpenAI, это может стать прецедентом: что такое "честное использование" данных для ИИ?

Судебная битва за контент только начинается.

https://www.wsj.com/tech/ai/reddit-lawsuit-anthropic-ai-3b9624dd

#reddit #Anthropic #ai

The Wall Street Journal

Reddit Sues Anthropic, Alleges Unauthorized Use of Site’s Data

The online discussion forum says Anthropic continued to access its site more than 100,000 times after saying it had stopped.

9 viewsedited 13:41

Punk Programmer

Forwarded from Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

💡

GPT-5 и Sudoku-Bench, почему новые модели всё ещё ломаются на судоку

Sakana AI представили Sudoku-Bench - набор классических и продвинутых судоку-задач, который проверяет не память модели, а её способность рассуждать, понимать новые правила и держать всю логику пазла в голове.

Они протестировали современные модели, включая GPT-5 и методы тонкой настройки вроде GRPO и thought-cloning.

Главное:
GPT-5 стала первой моделью, которая уверенно решает часть сложных задач и показала около 33 % успешных решений на наборе challenge_100. Ранее ни одна LLM не справлялась даже с обычным 9×9.
Но треть решённых - это всё ещё мало: большая часть задач остаётся нерешённой, особенно варианты с необычными правилами.

Ключевая трудность в том, что такие головоломки требуют не просто следовать правилам, а уметь понять незнакомые ограничения, найти стратегию «входа», просчитывать ходы вперёд и сохранять глобальную согласованность. Модели часто делают правильные локальные шаги, но теряют общую структуру.

GRPO и thought-cloning дают улучшения, но пока не позволяют моделям преодолеть сложные варианты. Даже с обучением на человеческих примерах ИИ быстро «запутывается» в длинных логических цепочках.

Sudoku-Bench - это тест на реальное рассуждение, а не на подбор паттернов. Он проверяет пространственное мышление, логику, способность адаптироваться и работать с новыми правилами. Прогресс на таких задачах - показатель движения к более структурному и осмысленному ИИ.

Авторы предлагают Sudoku-Bench как стандарт, по которому можно судить, насколько модели действительно умеют думать. Для будущих систем важны не просто большие параметры, а развитая логика, планирование и умение работать с новыми структурами задач.

@ai_machinelearning_big_data

#ai #ml #sakana

Please open Telegram to view this post

VIEW IN TELEGRAM

😁1

6 views13:19

About

Blog

Apps

Platform