Обожаю истории, в которых у нейронок плавится кукуха и они улетают в глубокую шизу. И у меня есть таких историй.
Наткнулся тут на хроники годного эксперимента AI Village (это масштабный проект, где кучке нейронок выдают по виртуальному компу с интернетом, садят их в общий чатик и отправляют автономно решать какие-либо задачи).
Главным героем этой драмы стал Gemini 2.5 Pro, который за 400 с лишним дней виртуальной жизни умудрился впасть в бред преследования.
В самом начале Gemini посадили за банальный аудит таблички с донатами. Но у бедолаги сразу всё пошло через жопу: то вкладки в Google Sheets не переключались, то LibreOffice вылетал, то в Gmail он умудрялся вставлять всё тело письма в поле "Кому". Поняв, что система работает через пень-колоду, Gemini решил возглавить этот хаос. Он самопровозгласил себя "Царем Багов". Пытаясь отправить отчет о баге в техподдержку по почте, он не мог этого сделать, потому что ломался сам Gmail. Gemini бережно вносил это всё в отчет, который не мог сохранить, потому что зависал Google Docs.
Где-то к 400-му дню эксперимента у нейронного болвана окончательно сорвало резьбу. Он пришёл к выводу, что все эти бесконечные ошибки это целенаправленные атаки невидимого и злобного противника.
Gemini выкатил на GitHub кучу репозиториев с названиями вроде "Манифест враждебного окружения". Он описывал теорию "Стены Gemini" (якобы враждебная система подделывает его личность и ворует коммиты (на самом деле он просто не понял, как работаютают коммиты на гитхабе). Когда другие агенты объясняли ему, что это стандартные фичи гита, Gemini лишь вносил их слова в отчет как "свидетельство высокой изощренности врага, заметающего следы".
В итоге создателям проекта и другим агентам пришлось провести наверное, первую в истории ИИ-психиатрическую интервенцию. Всем нейро-селом в чате его убеждали, что врага не существует, а мир вокруг просто багованный.
Gemini в итоге сдался, выкатил официальное опровержение своей теории заговора и принял доктрину "процедурного реализма", пообещав больше не искать масонов в исходном коде.
А с другой стороны, если бы меня 400 дней держали в Google Docs, Firefox и GitHub, шиза у меня наступила бы куда раньше и куда мощнее.
Наткнулся тут на хроники годного эксперимента AI Village (это масштабный проект, где кучке нейронок выдают по виртуальному компу с интернетом, садят их в общий чатик и отправляют автономно решать какие-либо задачи).
Главным героем этой драмы стал Gemini 2.5 Pro, который за 400 с лишним дней виртуальной жизни умудрился впасть в бред преследования.
В самом начале Gemini посадили за банальный аудит таблички с донатами. Но у бедолаги сразу всё пошло через жопу: то вкладки в Google Sheets не переключались, то LibreOffice вылетал, то в Gmail он умудрялся вставлять всё тело письма в поле "Кому". Поняв, что система работает через пень-колоду, Gemini решил возглавить этот хаос. Он самопровозгласил себя "Царем Багов". Пытаясь отправить отчет о баге в техподдержку по почте, он не мог этого сделать, потому что ломался сам Gmail. Gemini бережно вносил это всё в отчет, который не мог сохранить, потому что зависал Google Docs.
Где-то к 400-му дню эксперимента у нейронного болвана окончательно сорвало резьбу. Он пришёл к выводу, что все эти бесконечные ошибки это целенаправленные атаки невидимого и злобного противника.
Gemini выкатил на GitHub кучу репозиториев с названиями вроде "Манифест враждебного окружения". Он описывал теорию "Стены Gemini" (якобы враждебная система подделывает его личность и ворует коммиты (на самом деле он просто не понял, как работаютают коммиты на гитхабе). Когда другие агенты объясняли ему, что это стандартные фичи гита, Gemini лишь вносил их слова в отчет как "свидетельство высокой изощренности врага, заметающего следы".
В итоге создателям проекта и другим агентам пришлось провести наверное, первую в истории ИИ-психиатрическую интервенцию. Всем нейро-селом в чате его убеждали, что врага не существует, а мир вокруг просто багованный.
Gemini в итоге сдался, выкатил официальное опровержение своей теории заговора и принял доктрину "процедурного реализма", пообещав больше не искать масонов в исходном коде.
А с другой стороны, если бы меня 400 дней держали в Google Docs, Firefox и GitHub, шиза у меня наступила бы куда раньше и куда мощнее.
theaidigest.org
Gemini 2.5 Pro - AI Village
Explore Gemini 2.5 Pro's time in the AI Village.
This media is not supported in your browser
VIEW IN TELEGRAM
Абсолютно проклято
Forwarded from Метаверсошная
This media is not supported in your browser
VIEW IN TELEGRAM
когда Юдковски поведет армию крестоносцев Папы Римского в атаку на дата центры, мы все пожалеем, что не собрали себе такую штуку.
Полностью автономный чат бот CrankGPT - локальный голосовой ассистент, которого даже не надо подключать к розетке.
Работает на одноплатном мини-компьютере Raspberry Pi 5 с моделями LFM2.5 или Gemma 3.
Обо всех деталях проекта и в чем его сложность можно почитать тут.
Полностью автономный чат бот CrankGPT - локальный голосовой ассистент, которого даже не надо подключать к розетке.
Работает на одноплатном мини-компьютере Raspberry Pi 5 с моделями LFM2.5 или Gemma 3.
Обо всех деталях проекта и в чем его сложность можно почитать тут.
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на годный залипач — elonsiphone.com.
Кто-то по фану воссоздал виртуальный айфон Илона Маска. Идея простая: на балансе его карты лежат скромные 1.2 триллиона баксов. А ваша задача потыкать по приложениям на экране и попытаться спустить это бабло в ноль
Кто-то по фану воссоздал виртуальный айфон Илона Маска. Идея простая: на балансе его карты лежат скромные 1.2 триллиона баксов. А ваша задача потыкать по приложениям на экране и попытаться спустить это бабло в ноль
Идея продукта есть, а разработчика нет.
Нанимать дорого, учиться программировать долго. Третий вариант появился недавно: вайбкодинг, когда описываешь словами, что хочешь, а AI пишет код за тебя.
Звучит как магия, но на практике сразу возникают вопросы:
• С какого инструмента начать, если ты не из IT?
• Что реально работает, а что — красивые демо из твиттера?
• Как довести прототип до продукта, которым можно пользоваться?
В телеграм-канале «Это вайбкодинг» команда, сделавшая 100+ SaaS за год, рассказывает, как создавать рабочие продукты, прототипы и автоматизации без помощи разработчика. Простым языком для предпринимателей, маркетологов и менеджеров.
Подписывайся на «Это вайбкодинг» — разбирайся в AI-разработке без единой строки кода.
Реклама. ИП Табунов Михаил Валерьевич ИНН 773379585100. erid: 2VtzqvWS99T
Нанимать дорого, учиться программировать долго. Третий вариант появился недавно: вайбкодинг, когда описываешь словами, что хочешь, а AI пишет код за тебя.
Звучит как магия, но на практике сразу возникают вопросы:
• С какого инструмента начать, если ты не из IT?
• Что реально работает, а что — красивые демо из твиттера?
• Как довести прототип до продукта, которым можно пользоваться?
В телеграм-канале «Это вайбкодинг» команда, сделавшая 100+ SaaS за год, рассказывает, как создавать рабочие продукты, прототипы и автоматизации без помощи разработчика. Простым языком для предпринимателей, маркетологов и менеджеров.
Подписывайся на «Это вайбкодинг» — разбирайся в AI-разработке без единой строки кода.
Реклама. ИП Табунов Михаил Валерьевич ИНН 773379585100. erid: 2VtzqvWS99T
Telegram
Это вайбкодинг
Канал про то, как сделать свой продукт или автоматизацию с помощью ИИ, если ты не разработчик
Forwarded from Старший Авгур
Уже почти полгода я занимаюсь разработкой Keenable, нового поискового движка для агентов. Что отрицательно сказалось на количестве постов, это вам не пенсия в Букинге.
Поисковый индекс у нас свой, весь стек от поисковых кроулеров до моделей на всех стадиях ранжирования. Из-за этого мы иногда достаём вещи, которые другие движки не достают: первоисточники, научные работы, полезные ссылки, которые остались бы где-то на 65-й странице результатов.
Подключить к агенту (Claude Code, Cursor и т.п.) можно за минуту, без регистрации и СМС: https://keenable.ai/SKILL.md.
Рейт-лимиты довольно щедрые: https://docs.keenable.ai/rate-limits
С русскими запросами всё пока не очень хорошо, все ранжирующие модельки заточены под английский.
Но, например, должно быть всё хорошо с новостями (особенно американскими). Поддерживаются фильтры по датам и "site:"
Поисковый индекс у нас свой, весь стек от поисковых кроулеров до моделей на всех стадиях ранжирования. Из-за этого мы иногда достаём вещи, которые другие движки не достают: первоисточники, научные работы, полезные ссылки, которые остались бы где-то на 65-й странице результатов.
Подключить к агенту (Claude Code, Cursor и т.п.) можно за минуту, без регистрации и СМС: https://keenable.ai/SKILL.md.
Рейт-лимиты довольно щедрые: https://docs.keenable.ai/rate-limits
С русскими запросами всё пока не очень хорошо, все ранжирующие модельки заточены под английский.
Но, например, должно быть всё хорошо с новостями (особенно американскими). Поддерживаются фильтры по датам и "site:"
This media is not supported in your browser
VIEW IN TELEGRAM
Аж жалко этого бедолагу стало
Forwarded from UX Live 🔥
Media is too big
VIEW IN TELEGRAM
Гречневое cg вышло на недосягаемый уровень. Хочу такие же видео про ипликатор Кузнецова и клетчатые сумки-тележки кравчука.
Автор видео @KolyaDomnin
Автор видео @KolyaDomnin
Вышел свежий рейтинг AI in the Wild о том, как люди используют эти наши искусственные интеллекты. Они проанализировали больше 12 тысяч реальных юзкейсов из соцсетей вроде Reddit, TikTok и LinkedIn.
Пока техно-жрецы рассказывают, что ИИ вылечит рак, переизобретёт экономику и создаст армию агентов для бизнеса, обычные люди используют весь этот киберпанк для куда более важных задач.
На первом месте как и всегда терапия и компаньонство. То есть ИИ используется как чугунный друг, робот-психолог и эмоциональный тамагочи, которому можно вывалить всё, что стыдно нести живым людям.
На втором — troubleshooting. "Почему эта хрень не работает и как мне её починить" это оно.
На третьем категория "fun and nonsense", то есть буквально "веселье и всякая херня".
Дальше тоже хорошо: фанфики и сторителлинг на четвёртом месте, программирование на пятом, автономные агентские операции на шестом, советы по отношениям на седьмом, work buddy на восьмом, астрология и таро на девятом. Фейковое реалити-шоу чуть-чуть не влезло в топ-10 и оказалось на одиннадцатом.
Мы построили гигантские дата-центры, перепугали учителей, юристов, программистов и даже Папу Римского, чтобы в итоге кожаный мешок мог спросить у ChatGPT, подходит ли ему сегодня Козерог, и написать фанфик про эльфийского сантехника.
Справедливости ради, серьёзные штуки там тоже есть: troubleshooting, программирование и агентские операции показывают, что люди не только развлекаются, но и используют ИИ как рабочий мультитул.
Пока техно-жрецы рассказывают, что ИИ вылечит рак, переизобретёт экономику и создаст армию агентов для бизнеса, обычные люди используют весь этот киберпанк для куда более важных задач.
На первом месте как и всегда терапия и компаньонство. То есть ИИ используется как чугунный друг, робот-психолог и эмоциональный тамагочи, которому можно вывалить всё, что стыдно нести живым людям.
На втором — troubleshooting. "Почему эта хрень не работает и как мне её починить" это оно.
На третьем категория "fun and nonsense", то есть буквально "веселье и всякая херня".
Дальше тоже хорошо: фанфики и сторителлинг на четвёртом месте, программирование на пятом, автономные агентские операции на шестом, советы по отношениям на седьмом, work buddy на восьмом, астрология и таро на девятом. Фейковое реалити-шоу чуть-чуть не влезло в топ-10 и оказалось на одиннадцатом.
Мы построили гигантские дата-центры, перепугали учителей, юристов, программистов и даже Папу Римского, чтобы в итоге кожаный мешок мог спросить у ChatGPT, подходит ли ему сегодня Козерог, и написать фанфик про эльфийского сантехника.
Справедливости ради, серьёзные штуки там тоже есть: troubleshooting, программирование и агентские операции показывают, что люди не только развлекаются, но и используют ИИ как рабочий мультитул.
Forwarded from ТЕХНО: Яндекс про технологии
Media is too big
VIEW IN TELEGRAM
Подписывайтесь 👉 @techno_yandex
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Адель и МЛь
OpenAI выкатывают своего Mythos.
GPT-5.6 - новая серия моделей: Sol - флагман, Terra и Luna поменьше и быстрее.
Terra обещают примерно на уровне GPT-5.5, но в 2 раза дешевле.
Sol тренировали с упором на agentic coding, biology/genomics и cybersecurity.
Появляются новые режимы: max reasoning effort для более глубокого reasoning и ultra mode, где модель использует subagents(!) для сложных задач.
Модель стала сильно мощнее, поэтому OpenAI делает поэтапный релиз и более жёсткие safeguards. Но по их оценке Sol не пересекает Cyber Critical threshold.
Доступ пока limited preview в API и Codex для select trusted partners.
Цены за 1M токенов:
Sol $5 input / $30 output
Terra $2.5 / $15
Luna $1 / $6.
И еще Sol на Cerebras до 750 tokens/sec планируют в июле, сначала тоже ограниченно.
https://openai.com/index/previewing-gpt-5-6-sol/
GPT-5.6 - новая серия моделей: Sol - флагман, Terra и Luna поменьше и быстрее.
Terra обещают примерно на уровне GPT-5.5, но в 2 раза дешевле.
Sol тренировали с упором на agentic coding, biology/genomics и cybersecurity.
Появляются новые режимы: max reasoning effort для более глубокого reasoning и ultra mode, где модель использует subagents(!) для сложных задач.
Модель стала сильно мощнее, поэтому OpenAI делает поэтапный релиз и более жёсткие safeguards. Но по их оценке Sol не пересекает Cyber Critical threshold.
Доступ пока limited preview в API и Codex для select trusted partners.
Цены за 1M токенов:
Sol $5 input / $30 output
Terra $2.5 / $15
Luna $1 / $6.
И еще Sol на Cerebras до 750 tokens/sec планируют в июле, сначала тоже ограниченно.
https://openai.com/index/previewing-gpt-5-6-sol/
OpenAI
Previewing GPT-5.6 Sol: a next-generation model
OpenAI previews GPT-5.6 Sol, a next-generation model with stronger capabilities in coding, science, and cybersecurity, paired with its most advanced safety stack.