Forwarded from Сиолошная
Подглядел у @j_links ссылку на невероятную историю (твиттер тред тут)
Исследователи обучали агента играть в игру NetHack. Это очень старая ролевая игра из времён (1987 г.), когда нормальных пользовательских интерфейсов не было, и всё происходило в консоли. Игрок проходит уровни, собирает вещи и награды, участвует в сражениях и набирает очки — и всё выражается самыми простыми символами.
Агент научился стабильно набирать примерно 5000 очков. Но однажды после запуска он достиг лишь ~3000, то есть показал результат существенно хуже. Отладка решений всегда дело весёлое, поэтому автор треда попробовал:
— найти проблему в коде загрузки модели агента
— откатить код на пару дней назад
— откатить код на несколько недель назад (ну там то ТОЧНО всё работает?)
— пересобрать окружение
— поменять версию CUDA (драйверов для запуска нейросетей на видеокарте)
— запустить код на персональном ноутбуке, а не сервере
...и ничего не помогало: агент предательски, но стабильно играл на 3000 очков.
После этого автор треда написал автору модели, тот ответил:
— А, да, вероятно, сегодня полнолуние🌗
Что??😑
И да, в тот день и вправду было полнолуние. Чувак запустил игру, и увидел ...надпись «Ты — везунчик! Сегодня полнолуние»
Оказывается, в NetHack есть механика , которая немного меняет процесс игры каждый раз, когда наступает полнолуние (проверка происходит по времени вашей системы). В этот день у героя увеличивается удача, и меняется ещё пара вещей. Это не делает игру сложнее, но модель просто не понимает, как изменились правила, и старается играть так, как привыкла — отсюда и просадка в очках. Для проверки можно сменить время на компьютере — и агент снова набирает 5000 очков.
❓ вот так и сиди отлаживай программу
Исследователи обучали агента играть в игру NetHack. Это очень старая ролевая игра из времён (1987 г.), когда нормальных пользовательских интерфейсов не было, и всё происходило в консоли. Игрок проходит уровни, собирает вещи и награды, участвует в сражениях и набирает очки — и всё выражается самыми простыми символами.
Агент научился стабильно набирать примерно 5000 очков. Но однажды после запуска он достиг лишь ~3000, то есть показал результат существенно хуже. Отладка решений всегда дело весёлое, поэтому автор треда попробовал:
— найти проблему в коде загрузки модели агента
— откатить код на пару дней назад
— откатить код на несколько недель назад (ну там то ТОЧНО всё работает?)
— пересобрать окружение
— поменять версию CUDA (драйверов для запуска нейросетей на видеокарте)
— запустить код на персональном ноутбуке, а не сервере
...и ничего не помогало: агент предательски, но стабильно играл на 3000 очков.
После этого автор треда написал автору модели, тот ответил:
— А, да, вероятно, сегодня полнолуние
Что??
И да, в тот день и вправду было полнолуние. Чувак запустил игру, и увидел ...
Оказывается, в NetHack есть
Please open Telegram to view this post
VIEW IN TELEGRAM
Denis Sexy IT 🤖
Не очень понимаю, почему Google: 1) Не добавил приписку «AI Overview can make mistakes. Check important info», ну, как у одного конкурента 2) Не добавил промежуточный этап проверки ответ «на вред человеку», как в одной старой книге Ждем отката фичи, видимо…
Мне кажется ироничным, что люди так боятся АИ-фейков, что в итоге купились на фейки сделанные людьми же
Почти все скандальные скриншоты, где очевидно, что ответ сильно навредит пользователю – фейки, которые невозможно повторить используя Ai Overview фичу от Google
Делаются такие фейк в Хроме, в режиме Dev Tools, интересно как Google с этим справится – по сути просто троллинг корпорации интернетом
UPD. Пруф про фейки от NY Times:
>One manipulated screenshot appeared to show Google saying that a good remedy for depression was jumping off the Golden Gate Bridge, citing a Reddit user. Ms. Levin, the Google spokeswoman, said that the company’s systems never returned that result.
Почти все скандальные скриншоты, где очевидно, что ответ сильно навредит пользователю – фейки, которые невозможно повторить используя Ai Overview фичу от Google
Делаются такие фейк в Хроме, в режиме Dev Tools, интересно как Google с этим справится – по сути просто троллинг корпорации интернетом
UPD. Пруф про фейки от NY Times:
>One manipulated screenshot appeared to show Google saying that a good remedy for depression was jumping off the Golden Gate Bridge, citing a Reddit user. Ms. Levin, the Google spokeswoman, said that the company’s systems never returned that result.
This media is not supported in your browser
VIEW IN TELEGRAM
О, у Suno скоро появится audio2audio 🌈
Please open Telegram to view this post
VIEW IN TELEGRAM
А еще они выкатили для платных пользователей новую версию модели (v3.5) и поскольку я все еще болею, то страдать будут все 🐟 🔄 🐟
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Сделал вам караоке-версию BSOD в bossa nova жанре – не благодарите
Не вкладка инкогнито, а совместная интернет-разведка, не перепутайте
Please open Telegram to view this post
VIEW IN TELEGRAM
Когда-то давно писал про зачатки обсуждения такого закона во Франции, в Норвегии оказывается его уже приняли и я пропустил:
Если фото в рекламе обработано, то по закону, нужно повесить гигантский бейдж «Персонаж в рекламе отретуширован»
Тут подробнее про закон – нужен он, чтобы вы в депрессию не впали смотрясь в зеркало после прогулки по улице с такой рекламой 🌚
Если фото в рекламе обработано, то по закону, нужно повесить гигантский бейдж «Персонаж в рекламе отретуширован»
Тут подробнее про закон – нужен он, чтобы вы в депрессию не впали смотрясь в зеркало после прогулки по улице с такой рекламой 🌚
Neuralink, проект Маска по внедрению чипа в мозг, запустил конкурс на поиск улучшенного алгоритма компрессии, он тут и там есть немного технических деталий самого устройства:
Сам чип, между человеком и ПК, подключен по скорости 1 Мегабит в секунду (это 1/8 от Мегабайта):
Это значит, что если мы захотим закачать пациенту DVD Rip Первой части Властелина Кольца (4.7 Гб), то пациенту с чипом придётся ждать у компьютера примерно 11 часов до загрузки файла
Посмотреть человек его не сможет (мозг почему-то не поддерживает компьютерные кодеки, пока что), но как же клево, ходить с пираткой в голове – можно людям на вечеринках рассказывать и они будут отходить в сторону от вас, прикрывая стаканы 🌚
Сам чип, между человеком и ПК, подключен по скорости 1 Мегабит в секунду (это 1/8 от Мегабайта):
Это значит, что если мы захотим закачать пациенту DVD Rip Первой части Властелина Кольца (4.7 Гб), то пациенту с чипом придётся ждать у компьютера примерно 11 часов до загрузки файла
Посмотреть человек его не сможет (мозг почему-то не поддерживает компьютерные кодеки, пока что), но как же клево, ходить с пираткой в голове – можно людям на вечеринках рассказывать и они будут отходить в сторону от вас, прикрывая стаканы 🌚
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь моя локальная языковая модель стартует еще красивее (да, я люблю подождать)
Тут еще куча эффектов
Please open Telegram to view this post
VIEW IN TELEGRAM
Все эти рейтрейсинги и анрилы, наниты – это ерунда полная, настоящие хардкорные геймдев разработчики получают реалистичную графику так 🤌
Автор
Автор
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM