Forwarded from Machinelearning
Яндекс анонсировал новое поколение больших языковых моделей — YandexGPT 5, включающее Pro и Lite версии.
YandexGPT 5 Lite 8B уже доступна на Hugging Face. Модель обучалась в два этапа: претрейн на массиве русско- и англоязычных текстов объёмом 15T токенов и этап Powerup на высококачественных данных объёмом 320B токенов. Она опубликована без финального этапа обучения, этических фильтров и алайнмента, что делает её удобной для исследований и дообучения под специфические задачи разработчиков.
Модель имеет контекстное окно 32k токенов, а в своей категории достигает паритета с мировыми SOTA по ключевым бенчмаркам для pretrain-моделей.
В разработке Pro-версии применены значительные улучшения: переработанный датасет с более сложными и разнообразными примерами, усложнённые тренировочные задания, внедрение DPO и PPO с собственной модификацией LogDPO против «разучивания», оптимизация через YaFSDP (-25% вычислительных ресурсов), гибридное обучение с использованием базовых настроек Qwen.
По тестам YandexGPT 5 Pro:
⚠️Pro-версия уже внедрена в чат с Алисой и доступна через API в Yandex Cloud, где может использоваться как в базовой версии, так и с подключением к Поиску.
@ai_machinelearning_big_data
#AI #ML
Please open Telegram to view this post
VIEW IN TELEGRAM
Российские компании на 10% увеличили число научных публикаций об ИИ
В тройку лидеров вошли Сбербанк (76 штук), Smart Engines (50) и «Яндекс» (27). Остальные публикации приходятся на «Т-Банк» (11), MTS AI (9) и VK (3)
Согласно директивам Президента, Россия совместно с институтами и бизнесом должна к 2030 г. публиковать не менее 450 публикаций
При этом стоит отметить, что CNews считал публикации только ИИ-компаний
Наибольший массив статей по направлению ИИ приходится по обыкновению на вузы и структуры Российской академии наук
#новости #ai
В тройку лидеров вошли Сбербанк (76 штук), Smart Engines (50) и «Яндекс» (27). Остальные публикации приходятся на «Т-Банк» (11), MTS AI (9) и VK (3)
Согласно директивам Президента, Россия совместно с институтами и бизнесом должна к 2030 г. публиковать не менее 450 публикаций
При этом стоит отметить, что CNews считал публикации только ИИ-компаний
Наибольший массив статей по направлению ИИ приходится по обыкновению на вузы и структуры Российской академии наук
#новости #ai
Т-Банк первым в стране разработал AI-ассистента в сфере кибербезопасности.
Safeliner в пять раз ускоряет процессы поиска и исправления уязвимостей внутри компании, не допуская их появления. Он оптимизирует код и уменьшает нагрузку на продуктовые команды разработки.
AI-ассистент был запущен в августе прошлого года внутри Т-Технологий, где поможет экономить более 1 млрд рублей ежегодно.
Сейчас Safeliner тестирует несколько партнеров Т-Банка, а в будущем его сделают доступным для всех на рынке.
#AI #Новости
Safeliner в пять раз ускоряет процессы поиска и исправления уязвимостей внутри компании, не допуская их появления. Он оптимизирует код и уменьшает нагрузку на продуктовые команды разработки.
AI-ассистент был запущен в августе прошлого года внутри Т-Технологий, где поможет экономить более 1 млрд рублей ежегодно.
Сейчас Safeliner тестирует несколько партнеров Т-Банка, а в будущем его сделают доступным для всех на рынке.
#AI #Новости
🔥1
В GigaChat добавят возможность редактировать видео. Команда уже изучает вышедший недавно в паблик датасет Señorita-2M, рассказал Александр Капитанов, руководитель RnD GigaChat.
Заодно в очередной раз проговорили детали о вчерашнем релиза MALVINA. В ближайших планах: добавить в редактор поддержку нескольких операций одновременно, а также загрузку нескольких изображений или видео на входе. Бонусом может появиться опция работы с RAG.
#новости #ai
Заодно в очередной раз проговорили детали о вчерашнем релиза MALVINA. В ближайших планах: добавить в редактор поддержку нескольких операций одновременно, а также загрузку нескольких изображений или видео на входе. Бонусом может появиться опция работы с RAG.
#новости #ai
Reddit подаёт в суд на Anthropic за незаконное использование данных
Reddit обвиняет Anthropic в массовом парсинге сайта и коммерческом использовании данных.
Согласно иску:
🔹 Anthropic парсили Reddit более 100 000 раз, несмотря на заверения, об остановке сбора данных
🔹 Anthropic использовали пользовательский контент в коммерческих целях без лицензии
🔹 Reddit утверждает: это прямое нарушение соглашения и "поведение не в духе компании, называющей себя белым рыцарем AI-индустрии"
📣 Цитата из иска:
> “Reddit — одно из последних по-настоящему человеческих мест в интернете. И то, как поступает Anthropic, недопустимо.”
На фоне миллиардных сделок с Google и OpenAI, это может стать прецедентом: что такое "честное использование" данных для ИИ?
Судебная битва за контент только начинается.
https://www.wsj.com/tech/ai/reddit-lawsuit-anthropic-ai-3b9624dd
#reddit #Anthropic #ai
Reddit обвиняет Anthropic в массовом парсинге сайта и коммерческом использовании данных.
Согласно иску:
🔹 Anthropic парсили Reddit более 100 000 раз, несмотря на заверения, об остановке сбора данных
🔹 Anthropic использовали пользовательский контент в коммерческих целях без лицензии
🔹 Reddit утверждает: это прямое нарушение соглашения и "поведение не в духе компании, называющей себя белым рыцарем AI-индустрии"
📣 Цитата из иска:
> “Reddit — одно из последних по-настоящему человеческих мест в интернете. И то, как поступает Anthropic, недопустимо.”
На фоне миллиардных сделок с Google и OpenAI, это может стать прецедентом: что такое "честное использование" данных для ИИ?
Судебная битва за контент только начинается.
https://www.wsj.com/tech/ai/reddit-lawsuit-anthropic-ai-3b9624dd
#reddit #Anthropic #ai
The Wall Street Journal
Reddit Sues Anthropic, Alleges Unauthorized Use of Site’s Data
The online discussion forum says Anthropic continued to access its site more than 100,000 times after saying it had stopped.
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Sakana AI представили Sudoku-Bench - набор классических и продвинутых судоку-задач, который проверяет не память модели, а её способность рассуждать, понимать новые правила и держать всю логику пазла в голове.
Они протестировали современные модели, включая GPT-5 и методы тонкой настройки вроде GRPO и thought-cloning.
Главное:
GPT-5 стала первой моделью, которая уверенно решает часть сложных задач и показала около 33 % успешных решений на наборе challenge_100. Ранее ни одна LLM не справлялась даже с обычным 9×9.
Но треть решённых - это всё ещё мало: большая часть задач остаётся нерешённой, особенно варианты с необычными правилами.
Ключевая трудность в том, что такие головоломки требуют не просто следовать правилам, а уметь понять незнакомые ограничения, найти стратегию «входа», просчитывать ходы вперёд и сохранять глобальную согласованность. Модели часто делают правильные локальные шаги, но теряют общую структуру.
GRPO и thought-cloning дают улучшения, но пока не позволяют моделям преодолеть сложные варианты. Даже с обучением на человеческих примерах ИИ быстро «запутывается» в длинных логических цепочках.
Sudoku-Bench - это тест на реальное рассуждение, а не на подбор паттернов. Он проверяет пространственное мышление, логику, способность адаптироваться и работать с новыми правилами. Прогресс на таких задачах - показатель движения к более структурному и осмысленному ИИ.
Авторы предлагают Sudoku-Bench как стандарт, по которому можно судить, насколько модели действительно умеют думать. Для будущих систем важны не просто большие параметры, а развитая логика, планирование и умение работать с новыми структурами задач.
@ai_machinelearning_big_data
#ai #ml #sakana
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1