Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Sakana AI представили Sudoku-Bench - набор классических и продвинутых судоку-задач, который проверяет не память модели, а её способность рассуждать, понимать новые правила и держать всю логику пазла в голове.
Они протестировали современные модели, включая GPT-5 и методы тонкой настройки вроде GRPO и thought-cloning.
Главное:
GPT-5 стала первой моделью, которая уверенно решает часть сложных задач и показала около 33 % успешных решений на наборе challenge_100. Ранее ни одна LLM не справлялась даже с обычным 9×9.
Но треть решённых - это всё ещё мало: большая часть задач остаётся нерешённой, особенно варианты с необычными правилами.
Ключевая трудность в том, что такие головоломки требуют не просто следовать правилам, а уметь понять незнакомые ограничения, найти стратегию «входа», просчитывать ходы вперёд и сохранять глобальную согласованность. Модели часто делают правильные локальные шаги, но теряют общую структуру.
GRPO и thought-cloning дают улучшения, но пока не позволяют моделям преодолеть сложные варианты. Даже с обучением на человеческих примерах ИИ быстро «запутывается» в длинных логических цепочках.
Sudoku-Bench - это тест на реальное рассуждение, а не на подбор паттернов. Он проверяет пространственное мышление, логику, способность адаптироваться и работать с новыми правилами. Прогресс на таких задачах - показатель движения к более структурному и осмысленному ИИ.
Авторы предлагают Sudoku-Bench как стандарт, по которому можно судить, насколько модели действительно умеют думать. Для будущих систем важны не просто большие параметры, а развитая логика, планирование и умение работать с новыми структурами задач.
@ai_machinelearning_big_data
#ai #ml #sakana
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1
Северокорейские хакеры удаленно стирают содержимое устройств под управлением мобильной операционной системы Android.
По сообщению Bleeping Computer, делается это при помощи легитимного сервиса «Портал поиска» корпорации Google, разработчика Android (AOSP). Жертвами новой кампании в основном становятся жители Южной Кореи, по тем или иным причинам попавшие в поле интереса хакеров.
В инструментарии злоумышленников – метод целевого фишинга. На контакт с жертвой хакеры выходят посредством популярного в Южной Корее мессенджера KakaoTalk, разработкой которого занимается местная Kakao Corporation.
Специалисты по кибербезопасности из компании Genians связывают новую кампанию с северокорейскими группировками APT37 (ScarCruft) и Kimsuky (Emerald Sleet), использующие инструмент удаленного доступа Konni.
По сообщению Bleeping Computer, делается это при помощи легитимного сервиса «Портал поиска» корпорации Google, разработчика Android (AOSP). Жертвами новой кампании в основном становятся жители Южной Кореи, по тем или иным причинам попавшие в поле интереса хакеров.
В инструментарии злоумышленников – метод целевого фишинга. На контакт с жертвой хакеры выходят посредством популярного в Южной Корее мессенджера KakaoTalk, разработкой которого занимается местная Kakao Corporation.
Специалисты по кибербезопасности из компании Genians связывают новую кампанию с северокорейскими группировками APT37 (ScarCruft) и Kimsuky (Emerald Sleet), использующие инструмент удаленного доступа Konni.
Forwarded from Игнатий Цукергохер
Вчера вечером интернет вместе с отключением связи и заморозкой сим-карт заполонило видео с падающим роботом от Новой Технологической Коалиции. Каждый знаток робототехники из комментариев начал ныть, что в Рашке всё херово, представили какой-то аналагавнет, робот на презентации обосрался и прочие негативные мысли.
С дипломом робототехника и с опытом продвижения российского импортозамещения мне вдвойне обидно. Вчера хотел написать, что всё сложнее, чем просто "робот упал ахахах" и "российские разработчики опять не смогли". Дело в 10 годах пропаганды "всё купим, зачем производство", развале отраслей, кроме торговли, в 90-е и восстановлении их из откровенного барахла последние 15 лет, проблемах частных компаний, которые проснулись только после 2022, а не после 2014. Доля вины компаний есть: проще было закупать китайское, чем делать своё. Сейчас это меньше, а у многих китаеперекупов 2014-го уже локализованные линии и многое другое.
И то, что новый робот, даже с падением, — небольшой, но прорыв, особенно с локализацией в 77%, — игнорируется комментаторами. Важно, как в игре, докачаться до нужного уровня, и вот — роботы сами ходят, говорят и ура. Кстати, в новостях я не заметил ссылок-сравнений с Цукербергом и проё..долбом его компании с умными очками. Денег у них больше, разработчиков больше, но почему про это никто не вспомнил, или почти не вспомнил.
Мы запросили у разработчиков новое видео из лаборатории — они прислали. По видео видно, что робота тестировали и он проходил испытания. Да, ходит неуверенно, но аналоги ходят примерно так же.
Посмотрим, что будет дальше. Сейчас, учитывая обстоятельства и имеющиеся у меня данные, считаю, что катастрофы не случилось.
#робототехника #Игнатий_вещает #Игнатий_сентябрь
💬 Участвуйте в новом розыгрыше!
| Telegram | VK | Сайт | Милостыня |
С дипломом робототехника и с опытом продвижения российского импортозамещения мне вдвойне обидно. Вчера хотел написать, что всё сложнее, чем просто "робот упал ахахах" и "российские разработчики опять не смогли". Дело в 10 годах пропаганды "всё купим, зачем производство", развале отраслей, кроме торговли, в 90-е и восстановлении их из откровенного барахла последние 15 лет, проблемах частных компаний, которые проснулись только после 2022, а не после 2014. Доля вины компаний есть: проще было закупать китайское, чем делать своё. Сейчас это меньше, а у многих китаеперекупов 2014-го уже локализованные линии и многое другое.
И то, что новый робот, даже с падением, — небольшой, но прорыв, особенно с локализацией в 77%, — игнорируется комментаторами. Важно, как в игре, докачаться до нужного уровня, и вот — роботы сами ходят, говорят и ура. Кстати, в новостях я не заметил ссылок-сравнений с Цукербергом и проё..долбом его компании с умными очками. Денег у них больше, разработчиков больше, но почему про это никто не вспомнил, или почти не вспомнил.
Мы запросили у разработчиков новое видео из лаборатории — они прислали. По видео видно, что робота тестировали и он проходил испытания. Да, ходит неуверенно, но аналоги ходят примерно так же.
Посмотрим, что будет дальше. Сейчас, учитывая обстоятельства и имеющиеся у меня данные, считаю, что катастрофы не случилось.
#робототехника #Игнатий_вещает #Игнатий_сентябрь
| Telegram | VK | Сайт | Милостыня |
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
SanDisk повысила контрактные цены на флэш-память NAND на внушительные 50%
С увеличением стоимости NAND-памяти пользователи ПК могут ожидать повышения цен на SSD, ноутбуки и другие компьютерные устройства. Как утверждается, корректировка цен на продукцию SanDisk вызвала цепную реакцию в индустрии. Производители, такие как Apacer, Transcent и Innodisk, приостановили ценообразование и приостановили поставки. Эти компании ожидают дальнейшего роста цен.
За последний месяц цена акций SanDisk увеличилась более чем на 100%. Спрос на память всех типов значительно вырос из-за растущего интереса к центрам обработки данных для искусственного интеллекта, который поглощает все доступные модули памяти на рынке полупроводников. Этот фактор привел к дефициту и, как следствие, росту цен.
С увеличением стоимости NAND-памяти пользователи ПК могут ожидать повышения цен на SSD, ноутбуки и другие компьютерные устройства. Как утверждается, корректировка цен на продукцию SanDisk вызвала цепную реакцию в индустрии. Производители, такие как Apacer, Transcent и Innodisk, приостановили ценообразование и приостановили поставки. Эти компании ожидают дальнейшего роста цен.
За последний месяц цена акций SanDisk увеличилась более чем на 100%. Спрос на память всех типов значительно вырос из-за растущего интереса к центрам обработки данных для искусственного интеллекта, который поглощает все доступные модули памяти на рынке полупроводников. Этот фактор привел к дефициту и, как следствие, росту цен.
Череповецкий городской суд обязал фанерно-мебельный комбинат восстановить на работе экономиста, уволенного за игру в World of Tanks в рабочее время. С предприятия также взыскали свыше 580 тысяч рублей в качестве компенсации за моральный вред и вынужденный прогул. Увольнение произошло весной 2024 года после двух выговоров за «использование корпоративной сети в личных целях». Суд в ходе разбирательства установил, что приказы об увольнении и взысканиях были оформлены задним числом, а трудовым договором не предусмотренно запрета на компьютерные игры. Виктор проработал экономистом на комбинате более 20 лет без единого замечания и пользовался уважением коллег. По его словам, он запускал игру исключительно в перерывах и подключался через личный мобильный интернет, не затрагивая корпоративную сеть. Иск работника удовлетворен в полном объеме: все дисциплинарные меры отменены, Виктор возвращен на прежнюю должность, а комбинат обязан выплатить ему зарплату за весь период простоя плюс компенсацию морального ущерба.
Forwarded from VK Play
Императорский фарфоровый завод представил коллекцию по мотивам Atomic Heart!
Каждая фигурка — уникальна и сделана вручную. Цена: 169 тыс. рублей.
На мероприятии была Анита Пудикова, балерина — прообраз Близняшек.
😊 Подписывайтесь на VK Play
Каждая фигурка — уникальна и сделана вручную. Цена: 169 тыс. рублей.
На мероприятии была Анита Пудикова, балерина — прообраз Близняшек.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤯1😱1
Forwarded from Волкова (Кирбирева) Катерина
КАК О НАС ГОВОРЯТ МИРОВЫЕ СМИ
1 Китай
«Предлагаем познакомиться с первым российским антропоморфным роботом с искусственным интеллектом — это Aidol! Он может общаться с людьми, выражать эмоции, передвигаться на ногах, манипулировать предметами и работать полностью офлайн, рассказали разработчики. Презентация проекта Новой технологической коалиции состоялась в Москве.»
2 США
«Первый российский гуманоидный робот с искусственным интеллектом, AIdol, упал лицом вниз на сцене всего через несколько секунд после начала презентации на технологическом мероприятии в Москве во вторник, рухнув на пол после попытки помахать аудитории под музыкальную тему из фильма «Рокки».»
1 Китай
«Предлагаем познакомиться с первым российским антропоморфным роботом с искусственным интеллектом — это Aidol! Он может общаться с людьми, выражать эмоции, передвигаться на ногах, манипулировать предметами и работать полностью офлайн, рассказали разработчики. Презентация проекта Новой технологической коалиции состоялась в Москве.»
2 США
«Первый российский гуманоидный робот с искусственным интеллектом, AIdol, упал лицом вниз на сцене всего через несколько секунд после начала презентации на технологическом мероприятии в Москве во вторник, рухнув на пол после попытки помахать аудитории под музыкальную тему из фильма «Рокки».»