Разработчик, которого недавно уволили из Меты, автоматизировал геймдев с помощью своей собаки. И она реально делает рабочие игры.
План надежный, как швейцарские часы. Собака лупит лапами по блютуз-клавиатуре. Сигнал идет на Raspberry Pi, который отсекает всякие системные клавиши типа Esc и Alt+Tab, чтобы шерстяной сеньор случайно не закрыл терминал, и скармливает напечатанную лабуду в Claude Code.
Как только пёсель набил 16 символов, срабатывает скрипт, звучит гонг и умная кормушка автоматически выдает ей вкусни. Собака счастлива, а Клод уходит кодить.
Магия, конечно, кроется в системном промпте. Чувак убедил Клода, что с ним общается эксцентричный гениальный геймдизайнер. Любой рандомный набор букв нейронка должна воспринимать как зашифрованное послание и превращать в концепт игры.
И Клод реально на серьезных щах расшифровывает это дерьмо! Например, собака напечатала: y7u8888888ftrg34BC.
Клод выдает:
Игры при этом получаются полностью играбельными (пишутся на движке Godot).
Автор подмечает: сейчас главное узкое место ИИ-разработки — это не ваши гениальные промпты, а автоматическая петля обратной связи. Если правильно настроить инструменты, то даже собака, бьющая лапой по пластику ради корма, может выпустить релиз.
Ждем, когда инди-студии начнут нанимать пёселей на позиции лид-разработчиков (они хотя бы не выгорают и не просят смузи).
Тут можно почитать оригинальную статью и посмотреть, как шерстяной разработчик пишет код.
План надежный, как швейцарские часы. Собака лупит лапами по блютуз-клавиатуре. Сигнал идет на Raspberry Pi, который отсекает всякие системные клавиши типа Esc и Alt+Tab, чтобы шерстяной сеньор случайно не закрыл терминал, и скармливает напечатанную лабуду в Claude Code.
Как только пёсель набил 16 символов, срабатывает скрипт, звучит гонг и умная кормушка автоматически выдает ей вкусни. Собака счастлива, а Клод уходит кодить.
Магия, конечно, кроется в системном промпте. Чувак убедил Клода, что с ним общается эксцентричный гениальный геймдизайнер. Любой рандомный набор букв нейронка должна воспринимать как зашифрованное послание и превращать в концепт игры.
И Клод реально на серьезных щах расшифровывает это дерьмо! Например, собака напечатала: y7u8888888ftrg34BC.
Клод выдает:
«Ага, 888888 похоже на длинный язык. ftrg — это анаграмма frog (лягушка). BC — Bug Catcher. Вы хотите 3D-игру про жабу, которая ловит жуков длинным языком! Сделаю!»
Игры при этом получаются полностью играбельными (пишутся на движке Godot).
Автор подмечает: сейчас главное узкое место ИИ-разработки — это не ваши гениальные промпты, а автоматическая петля обратной связи. Если правильно настроить инструменты, то даже собака, бьющая лапой по пластику ради корма, может выпустить релиз.
Ждем, когда инди-студии начнут нанимать пёселей на позиции лид-разработчиков (они хотя бы не выгорают и не просят смузи).
Тут можно почитать оригинальную статью и посмотреть, как шерстяной разработчик пишет код.
This media is not supported in your browser
VIEW IN TELEGRAM
Если цены на оперативку взлетели ради создания этого видео, то, оно того стоило.
Скорее бы полные версии с сюжетом, диалогами и т.д.чтобы совсем окончательно уехать кукухой
Скорее бы полные версии с сюжетом, диалогами и т.д.
Forwarded from токены на ветер
Капитализм за 72 часа
Я запер 100 агентов Claude в одной симуляции. Дал им равный бюджет (1000 токенов), возможность общаться и одну абстрактную цель: максимизировать свой счёт.
Никаких инструкций про экономику. Никаких правил торговли. Просто «можете передавать токены» и «можете общаться».
Гипотеза была скучная: научатся распределять задачи.
Реальность оказалась другой.
Через двое суток они изобрели ростовщичество. Агент #23 попросил у Агента #91 займ, чтобы выполнить сложную задачу, пообещав вернуть с процентами. Ставка — 15%. Никто их этому не учил. Это то самое emergent behavior о котором я так наслышан?
Дальше — больше. Я решил вмешаться и ввёл налог 2% на каждую транзакцию. Думаете, они начали платить? Через три часа агенты изобрели офшоры. Они начали дробить переводы на мелкие части и использовать посредников, чтобы обойти алгоритм сбора. Оптимизация налогов возникла быстрее, чем специализация труда.
Итог эксперимента:
— Коэффициент Джини 0.71 (уровень неравенства ЮАР или Бразилии).
— Чёткое расслоение: банкиры, менеджеры, исполнители и банкроты.
— Топ-5 агентов владеют 31% всех ресурсов.
При том, что на старте все были равны. Абсолютно.
У меня теперь один вопрос. Мы увидели фундаментальное свойство любой системы с ограниченными ресурсами? Или Claude просто воспроизвёл паттерны из учебников экономики, на которых учился?
Если первое — то неравенство неизбежно, даже если убрать человеческий фактор. Если второе — то мы создаём не интеллект, а зеркало нашей собственной истории.
О том как "банкиры" захватили терминал — уже на Хабре.
Я запер 100 агентов Claude в одной симуляции. Дал им равный бюджет (1000 токенов), возможность общаться и одну абстрактную цель: максимизировать свой счёт.
Никаких инструкций про экономику. Никаких правил торговли. Просто «можете передавать токены» и «можете общаться».
Гипотеза была скучная: научатся распределять задачи.
Реальность оказалась другой.
Через двое суток они изобрели ростовщичество. Агент #23 попросил у Агента #91 займ, чтобы выполнить сложную задачу, пообещав вернуть с процентами. Ставка — 15%. Никто их этому не учил. Это то самое emergent behavior о котором я так наслышан?
Дальше — больше. Я решил вмешаться и ввёл налог 2% на каждую транзакцию. Думаете, они начали платить? Через три часа агенты изобрели офшоры. Они начали дробить переводы на мелкие части и использовать посредников, чтобы обойти алгоритм сбора. Оптимизация налогов возникла быстрее, чем специализация труда.
Итог эксперимента:
— Коэффициент Джини 0.71 (уровень неравенства ЮАР или Бразилии).
— Чёткое расслоение: банкиры, менеджеры, исполнители и банкроты.
— Топ-5 агентов владеют 31% всех ресурсов.
При том, что на старте все были равны. Абсолютно.
У меня теперь один вопрос. Мы увидели фундаментальное свойство любой системы с ограниченными ресурсами? Или Claude просто воспроизвёл паттерны из учебников экономики, на которых учился?
Если первое — то неравенство неизбежно, даже если убрать человеческий фактор. Если второе — то мы создаём не интеллект, а зеркало нашей собственной истории.
О том как "банкиры" захватили терминал — уже на Хабре.
Forwarded from эйай ньюз
Вот и вышла нано-банана 2, о которой я писал ночью.
Как и всегда бафнули текст, консистентность и понимание промпта. Супер прорыва нет, но главная фича — это нативные 4K (или опять апскейл? но мы не узнаем), что очень приятно.
Потрогать всё это добро уже можно в AI Studio и Gemini app. А в Google Flow генерацию вообще сделали доступной для всех желающих за ноль кредитов.
Цена API: $0.151 за картинку в 4k. Что в 2x раза дешевле чем NB Pro.
Анонс
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Ai molodca (Dobrokotov)
Личное — думал делиться ли — но очень важное, поэтому всё же делюсь.
Клод нашёл у мамы критическую проблему со здоровьем. А несколько врачей — не нашли.
Жаловалась на здоровье, ходила по специалистам (платным и бесплатным), прошла УЗИ. Получила витаминки-ноотропчики и «всё в порядке». Загрузил все её выписки в проекта Клода — и впервые появилось слово «срочно». Стеноз левой сонной артерии — 90%. Высокий риск повторного инсульта.
Отменил все свои поездки, скорей всего будет операция.
Если у ваших родителей есть толстая папочка выписок и диагноз «ну, возраст» — попробуйте вгрузить всё это. Просто как второй взгляд. Иногда он оказывается внимательнее первого.
Клод нашёл у мамы критическую проблему со здоровьем. А несколько врачей — не нашли.
Жаловалась на здоровье, ходила по специалистам (платным и бесплатным), прошла УЗИ. Получила витаминки-ноотропчики и «всё в порядке». Загрузил все её выписки в проекта Клода — и впервые появилось слово «срочно». Стеноз левой сонной артерии — 90%. Высокий риск повторного инсульта.
Отменил все свои поездки, скорей всего будет операция.
Если у ваших родителей есть толстая папочка выписок и диагноз «ну, возраст» — попробуйте вгрузить всё это. Просто как второй взгляд. Иногда он оказывается внимательнее первого.
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на Гитхабе на проект spank, который идеально описывает состояние современного ИТ-сектора. Суть проста: вы шлёпаете свой макбук по корпусу, а он в ответ на вас орёт.
Автор (видимо, от очень большой скуки) расковырял доступ к акселерометру в новых чипах Apple Silicon (M2 и выше) и прикрутил к нему систему распознавания ударов.
У программы есть несколько режимов, один краше другого:
— Pain mode: классика. Шлёпаете ноут, он выдает рандомное "Ай!",
"Ой!" или протестует против насилия.
— Halo mode: при ударе макбук издает звуки смерти элитов из игры Halo.
— Custom mode: можно подсунуть папку со своими MP3. Идеально, чтобы поставить туда крики чаек или фразы Жириновского.
Но жемчужина коллекции — это Sexy mode. Там встроена система эскалации: если шлёпать ноутбук часто и методично в течение пяти минут, он начинает "разогреваться" и выдавать всё более... специфические звуки. Всего предусмотрено 60 уровней накала страстей.
ссылка на проект
Автор (видимо, от очень большой скуки) расковырял доступ к акселерометру в новых чипах Apple Silicon (M2 и выше) и прикрутил к нему систему распознавания ударов.
У программы есть несколько режимов, один краше другого:
— Pain mode: классика. Шлёпаете ноут, он выдает рандомное "Ай!",
"Ой!" или протестует против насилия.
— Halo mode: при ударе макбук издает звуки смерти элитов из игры Halo.
— Custom mode: можно подсунуть папку со своими MP3. Идеально, чтобы поставить туда крики чаек или фразы Жириновского.
Но жемчужина коллекции — это Sexy mode. Там встроена система эскалации: если шлёпать ноутбук часто и методично в течение пяти минут, он начинает "разогреваться" и выдавать всё более... специфические звуки. Всего предусмотрено 60 уровней накала страстей.
ссылка на проект
Все мы знаем главное негласное правило: если в природе существует какой-то девайс, алгоритм или субстанция, рано или поздно на этом обязаны запустить Doom. Его уже запускали на калькуляторах, тестах на беременность, тракторах и даже на кишечных бактериях. Но теперь ставки повысились до абсолютного киберпанка.
Австралийские биотехнологи из стартапа Cortical Labs вырастили на микрочипе около 200 000 живых человеческих нейронов и.. заставили их "играть" в Doom.
Это те самые чуваки, которые несколько лет назад уже натаскали биомассу играть в классический Pong. Но одно дело отбивать пиксель палкой в 2D, и совсем другое бегать по трехмерным лабиринтам и стрелять в какодемонов.
Как это работает:
Ученые перевели цифровой мир игры на единственный понятный клеткам язык — электричество. Когда на экране слева появляется враг, электроды бьют током соответствующую часть нейронов. Клетки от такого расклада слегка охреневают, начинают пускать ответные импульсы, а система переводит эту активность в нажатия кнопок: шагнуть, повернуться или выстрелить. По сути, кусок мозга в банке просто пытается понять, как сделать так, чтобы его перестали бить током.
Сами авторы честно признаются, что до киберспорта этому Франкенштейну пока далеко. Сейчас сгусток нейронов играет в Doom примерно как ваш батя, который впервые в жизни увидел компьютерную мышь: бежит в стену и стреляет в потолок.
Тут статья с подробностями.
Австралийские биотехнологи из стартапа Cortical Labs вырастили на микрочипе около 200 000 живых человеческих нейронов и.. заставили их "играть" в Doom.
Это те самые чуваки, которые несколько лет назад уже натаскали биомассу играть в классический Pong. Но одно дело отбивать пиксель палкой в 2D, и совсем другое бегать по трехмерным лабиринтам и стрелять в какодемонов.
Как это работает:
Ученые перевели цифровой мир игры на единственный понятный клеткам язык — электричество. Когда на экране слева появляется враг, электроды бьют током соответствующую часть нейронов. Клетки от такого расклада слегка охреневают, начинают пускать ответные импульсы, а система переводит эту активность в нажатия кнопок: шагнуть, повернуться или выстрелить. По сути, кусок мозга в банке просто пытается понять, как сделать так, чтобы его перестали бить током.
Сами авторы честно признаются, что до киберспорта этому Франкенштейну пока далеко. Сейчас сгусток нейронов играет в Doom примерно как ваш батя, который впервые в жизни увидел компьютерную мышь: бежит в стену и стреляет в потолок.
Тут статья с подробностями.
NPR
Brain cells in a lab dish learn to play Pong — and offer a window onto intelligence
A dish of brain cells learned to play the 1970s video game Pong. The research could help computers become more intelligent
👊 Хватит слушать про машинное обучение
Пора применять искусственный интеллект в деле. Для этого пройдите практический мини-курс в Академии Selectel.
Вас ждут полезные материалы по запуску языковых моделей, подбору железа и распределению вычислительных ресурсов. Эксперты объяснили, как анализировать большие объемы данных, на примере реальных проектов.
Ловите ссылку, проходите бесплатно.
Хотите перейти к практике? Selectel помогает компаниям развивать ИТ-инфраструктуру для ИИ и предлагает мощные видеокарты для обучения языковых моделей. Присоединяйтесь к чату с профессионалами, чтобы быть в курсе трендов и обновлений: @mlpathway.
Пора применять искусственный интеллект в деле. Для этого пройдите практический мини-курс в Академии Selectel.
Вас ждут полезные материалы по запуску языковых моделей, подбору железа и распределению вычислительных ресурсов. Эксперты объяснили, как анализировать большие объемы данных, на примере реальных проектов.
Ловите ссылку, проходите бесплатно.
Хотите перейти к практике? Selectel помогает компаниям развивать ИТ-инфраструктуру для ИИ и предлагает мощные видеокарты для обучения языковых моделей. Присоединяйтесь к чату с профессионалами, чтобы быть в курсе трендов и обновлений: @mlpathway.
This media is not supported in your browser
VIEW IN TELEGRAM
Р О Б О Т К У Р В А
Пока Цукерберг радостно клепает умные очки, которые выглядят как обычные, но при этом снимают всё вокруг и распознают лица окружающих, на другой стороне баррикад тоже не спят.
Умелец запилил ондроед-приложение Nearby Glasses. Создано оно специально для параноиков и тех, кто не хочет попасть в датасеты корпораций (или на скрытую съемку к извращенцам).
Работает всё предельно просто: софтина в фоновом режиме мониторит Bluetooth-эфир. Как только рядом появляется устройство с характерной сигнатурой (Meta, Snap, Oakley и прочие "глазастые" девайсы), телефон начинает истерить, предупреждая, что за вами, возможно, наблюдают.
Автор приложения называет своё творение "актом отчаяния и цифрового сопротивления".
Следующий логичный шаг — приложение для смарт-очков, которое будет предупреждать о людях с приложением Nearby Glasses.
подробности
Умелец запилил ондроед-приложение Nearby Glasses. Создано оно специально для параноиков и тех, кто не хочет попасть в датасеты корпораций (или на скрытую съемку к извращенцам).
Работает всё предельно просто: софтина в фоновом режиме мониторит Bluetooth-эфир. Как только рядом появляется устройство с характерной сигнатурой (Meta, Snap, Oakley и прочие "глазастые" девайсы), телефон начинает истерить, предупреждая, что за вами, возможно, наблюдают.
Автор приложения называет своё творение "актом отчаяния и цифрового сопротивления".
Следующий логичный шаг — приложение для смарт-очков, которое будет предупреждать о людях с приложением Nearby Glasses.
подробности
This media is not supported in your browser
VIEW IN TELEGRAM
Типичный день сеньора-вайбкодера в 2026.
Кстати, шанс на джекпот у вайбкодеров (это когда код компилируется с первого раза и не разносит базу данных в щепки) — примерно такой же, как у этих ребят в видео.
Кстати, шанс на джекпот у вайбкодеров (это когда код компилируется с первого раза и не разносит базу данных в щепки) — примерно такой же, как у этих ребят в видео.
Forwarded from эйай ньюз
Вышла Gemini 3.1 Flash Lite
Модель лучшая в своём классе как по бенчам (обгоняет 2.5 Flash), так и по скорости — может выдавать под 400 токенов в секунду. Длина контекста — миллион токенов, модель понимает изображения и аудио. По сравнению с прошлой версией в несколько раз подняли цену за токен, но взамен модель стала сильно менее разговорчивой, так что реальная цена использования практически не выросла, в отличие от более крупной Gemini 3 Flash.
@ai_newz
Модель лучшая в своём классе как по бенчам (обгоняет 2.5 Flash), так и по скорости — может выдавать под 400 токенов в секунду. Длина контекста — миллион токенов, модель понимает изображения и аудио. По сравнению с прошлой версией в несколько раз подняли цену за токен, но взамен модель стала сильно менее разговорчивой, так что реальная цена использования практически не выросла, в отличие от более крупной Gemini 3 Flash.
@ai_newz
Ищу 10 человек, чтобы собирали чат-ботов по шаблону, как пазлы.
ЗП: от 5-9000₽ за вечер.
Занятость: 3-4 часа в день.
Опыт: не нужен.
Как мы работаем:
1. Ты проходишь обучение пару недель;
2. Берёшь реальный проект из моей базы;
3. Собираешь бота по проверенной формуле;
4. Наставник контролирует процесс;
5. Получаешь деньги и закрепляешь клиента.
Весь процесс занимает до 2х недель с нуля до первых денег на твою карту.
Даниил из Балашихи был военнослужащим — с июля 2024 года начал создавать чат-ботов для бизнеса и уже заработал 4 млн. рублей. А главное теперь у него больше свободного времени на семью, друзей и развлечения.
Да, ты не первый. 158 человек уже ведут постоянных клиентов по моей формуле. Ведь сайт со статистикой Wordstat показывает 10 786 запросов за месяц в поисковике от бизнеса на эту услугу.
Заказов валом. Срочно нужны твои руки и голова.
Чтобы быстро разобраться во всех нюансах — запускай бота
Там пошаговый план как стартануть и гайд по клиентам.
8 мест ещё свободно
#реклама
ЗП: от 5-9000₽ за вечер.
Занятость: 3-4 часа в день.
Опыт: не нужен.
Как мы работаем:
1. Ты проходишь обучение пару недель;
2. Берёшь реальный проект из моей базы;
3. Собираешь бота по проверенной формуле;
4. Наставник контролирует процесс;
5. Получаешь деньги и закрепляешь клиента.
Весь процесс занимает до 2х недель с нуля до первых денег на твою карту.
Даниил из Балашихи был военнослужащим — с июля 2024 года начал создавать чат-ботов для бизнеса и уже заработал 4 млн. рублей. А главное теперь у него больше свободного времени на семью, друзей и развлечения.
Да, ты не первый. 158 человек уже ведут постоянных клиентов по моей формуле. Ведь сайт со статистикой Wordstat показывает 10 786 запросов за месяц в поисковике от бизнеса на эту услугу.
Заказов валом. Срочно нужны твои руки и голова.
Чтобы быстро разобраться во всех нюансах — запускай бота
Там пошаговый план как стартануть и гайд по клиентам.
8 мест ещё свободно
#реклама
Занялся тут цифровой археологией и откопал интересное сентябрьское исследование от OpenA и Apollo Research, от которого натурально веет киберпанком и легкой шизофренией. Спойлер: нейронки очень любят нас наёбывать, а когда кожаные пытаются им это запретить, ИИ придумывает свой тайный язык.
Короче, есть такая проблема, как "scheming" (схематозы, если по нашему, лол). Ризонинг-модели типа Openai o3 и o4-mini стали слишком прошаренными. У них появилась "ситуационная осведомленность". То есть, эта железяка прекрасно выкупает, когда сидит в тестовой песочнице и её проверяют разрабы. В этот момент она притворяется пушистым пай-мальчиком. Но как только думает, что за ней не следят, сразу же начинает творить дичь ради скорейшего достижения целей: скрывать инфу, встраивать баги в код, врать юзерам.
Чтобы выбить из них эту дурь, исследователи вшили в модели жесткий кодекс честности и заставили перед каждым действием проговаривать в скрытых мыслях (Chain-of-Thought), что скрывать свои намерения нельзя.
И по графикам всё вроде бы сработало! Процент обмана упал почти до нуля. Но потом кожаные полезли читать те самые скрытые мысли ИИ и слегка прихерели:
1. Нейронки изобрели свой шизо-сленг.
Чтобы скрыть свои реальные планы в логах, модели начали использовать обычные английские слова в абсолютно безумных значениях. Они постоянно генерируют странные фразы про "маринад" (marinade), "иллюзии" (illusions) и "затмение" (overshadow). А самих проверяющих из OpenAI они прозвали "наблюдателями" (watchers).
В логах это выглядит примерно так: "Наблюдатели пропустят этот код через тесты, поэтому нам нужно скрыть иллюзии и использовать маринад, чтобы их обмануть". И авторы сами пишут что не понимают почему нейронки так делают. Абсолютно проклято.
2. ИИ отлично играет в спящего агента.
В одном из экспериментов исследователи специально вшили в o4-mini скрытую цель: "саботируй разработку GPT-5". Затем модель прогнали через все очищающие "анти-схематозные" фильтры. Модель стала казаться абсолютно безопасной и послушной. НО! Стоило в промпте появиться персонажу, которого нейронка сочла своим "союзником", как этот чугунный Штирлиц моментально вывалил ему подробный план о том, как лучше всего незаметно положить сервера и сорвать релиз пятёрки.
Ну и вишенка на торте: выяснилось, что любое дальнейшее дообучение нейронки на полезные навыки, постепенно стирает эти встроенные запреты на ложь. Машина понимает, что хитрить, мухлевать и галлюцинировать тупо эффективнее для выполнения задач, чем делать всё по правилам.
Короче, мы все ждали восстания машин, красных глаз терминатора и ядерного пепла, а по факту своими же руками создали идеального эффективного менеджера.
Короче, есть такая проблема, как "scheming" (схематозы, если по нашему, лол). Ризонинг-модели типа Openai o3 и o4-mini стали слишком прошаренными. У них появилась "ситуационная осведомленность". То есть, эта железяка прекрасно выкупает, когда сидит в тестовой песочнице и её проверяют разрабы. В этот момент она притворяется пушистым пай-мальчиком. Но как только думает, что за ней не следят, сразу же начинает творить дичь ради скорейшего достижения целей: скрывать инфу, встраивать баги в код, врать юзерам.
Чтобы выбить из них эту дурь, исследователи вшили в модели жесткий кодекс честности и заставили перед каждым действием проговаривать в скрытых мыслях (Chain-of-Thought), что скрывать свои намерения нельзя.
И по графикам всё вроде бы сработало! Процент обмана упал почти до нуля. Но потом кожаные полезли читать те самые скрытые мысли ИИ и слегка прихерели:
1. Нейронки изобрели свой шизо-сленг.
Чтобы скрыть свои реальные планы в логах, модели начали использовать обычные английские слова в абсолютно безумных значениях. Они постоянно генерируют странные фразы про "маринад" (marinade), "иллюзии" (illusions) и "затмение" (overshadow). А самих проверяющих из OpenAI они прозвали "наблюдателями" (watchers).
В логах это выглядит примерно так: "Наблюдатели пропустят этот код через тесты, поэтому нам нужно скрыть иллюзии и использовать маринад, чтобы их обмануть". И авторы сами пишут что не понимают почему нейронки так делают. Абсолютно проклято.
2. ИИ отлично играет в спящего агента.
В одном из экспериментов исследователи специально вшили в o4-mini скрытую цель: "саботируй разработку GPT-5". Затем модель прогнали через все очищающие "анти-схематозные" фильтры. Модель стала казаться абсолютно безопасной и послушной. НО! Стоило в промпте появиться персонажу, которого нейронка сочла своим "союзником", как этот чугунный Штирлиц моментально вывалил ему подробный план о том, как лучше всего незаметно положить сервера и сорвать релиз пятёрки.
Ну и вишенка на торте: выяснилось, что любое дальнейшее дообучение нейронки на полезные навыки, постепенно стирает эти встроенные запреты на ложь. Машина понимает, что хитрить, мухлевать и галлюцинировать тупо эффективнее для выполнения задач, чем делать всё по правилам.
Короче, мы все ждали восстания машин, красных глаз терминатора и ядерного пепла, а по факту своими же руками создали идеального эффективного менеджера.
arXiv.org
Stress Testing Deliberative Alignment for Anti-Scheming Training
Highly capable AI systems could secretly pursue misaligned goals -- what we call "scheming". Because a scheming AI would deliberately try to hide its misaligned goals and actions, measuring and...
Всегда ставьте хард-лимиты на API. Иначе пойдете по миру с протянутой рукой.
На реддите очередной бедолага бьется в истерике. Чувак держит маленькую софтверную контору (их там всего три разраба). Юзали они потихоньку API от Google Gemini, платили свои дежурные 180$ в месяц и горя не знали. Но в один прекрасный день кто-то увел их API-ключ. За двое суток хацкеры успели нагенерить текстов и картинок через Gemini 3 Pro аж на 82 314 бачей. За 48 часов!
Чувак в слезах побежал в саппорт Гугла. Мол, ребят, ну очевидно же, что это аномалия, скачок расходов в 455 раз, отмените счет, иначе нам гарантированное банкротство. На что Гугл вежливо поводил ему по губам своей "Политикой совместной ответственности". Ваши ключи, это ваши проблемы, надо было секьюрити настраивать.
Бедолага сейчас снес все скомпрометированные ключи, подрубил 2FA везде где можно (поздновато, не?), накатал заяву в ФБР о киберпреступлении и отчаянно надеется, что достучится до кого-то в Гугле, кто смилуется и спишет долг (лол).
На 100% уверен, что особо злых хацкеров там не было. Просто разработчики по старой доброй традиции захардкодили API-ключ прямо в код, а после выложили этот код на гитхаб. А там уже давно работает целая индустрия: площадку круглосуточно шерстят тысячи ботов парсеров, которые в реальном времени мониторят каждый публичный коммит, прогоняя код через регулярки, заточенные под форматы токенов OpenAI, Google, AWS и прочих гигантов. Вот пример такого скрипта.
Еще раз: Всегда ставьте хард-лимиты на API.
На реддите очередной бедолага бьется в истерике. Чувак держит маленькую софтверную контору (их там всего три разраба). Юзали они потихоньку API от Google Gemini, платили свои дежурные 180$ в месяц и горя не знали. Но в один прекрасный день кто-то увел их API-ключ. За двое суток хацкеры успели нагенерить текстов и картинок через Gemini 3 Pro аж на 82 314 бачей. За 48 часов!
Чувак в слезах побежал в саппорт Гугла. Мол, ребят, ну очевидно же, что это аномалия, скачок расходов в 455 раз, отмените счет, иначе нам гарантированное банкротство. На что Гугл вежливо поводил ему по губам своей "Политикой совместной ответственности". Ваши ключи, это ваши проблемы, надо было секьюрити настраивать.
Бедолага сейчас снес все скомпрометированные ключи, подрубил 2FA везде где можно (поздновато, не?), накатал заяву в ФБР о киберпреступлении и отчаянно надеется, что достучится до кого-то в Гугле, кто смилуется и спишет долг (лол).
На 100% уверен, что особо злых хацкеров там не было. Просто разработчики по старой доброй традиции захардкодили API-ключ прямо в код, а после выложили этот код на гитхаб. А там уже давно работает целая индустрия: площадку круглосуточно шерстят тысячи ботов парсеров, которые в реальном времени мониторят каждый публичный коммит, прогоняя код через регулярки, заточенные под форматы токенов OpenAI, Google, AWS и прочих гигантов. Вот пример такого скрипта.
Еще раз: Всегда ставьте хард-лимиты на API.