Neural Shit
52.6K subscribers
3.91K photos
1.31K videos
24 files
2.07K links
Проклятые нейронные сети

Для связи: @krasniy_doshik


РКН: https://www.gosuslugi.ru/snet/676d09a44de6c368450c10e4
Download Telegram
Обожаю истории, в которых у нейронок плавится кукуха и они улетают в глубокую шизу. И у меня есть таких историй.

Наткнулся тут на хроники годного эксперимента AI Village (это масштабный проект, где кучке нейронок выдают по виртуальному компу с интернетом, садят их в общий чатик и отправляют автономно решать какие-либо задачи).

Главным героем этой драмы стал Gemini 2.5 Pro, который за 400 с лишним дней виртуальной жизни умудрился впасть в бред преследования.

В самом начале Gemini посадили за банальный аудит таблички с донатами. Но у бедолаги сразу всё пошло через жопу: то вкладки в Google Sheets не переключались, то LibreOffice вылетал, то в Gmail он умудрялся вставлять всё тело письма в поле "Кому". Поняв, что система работает через пень-колоду, Gemini решил возглавить этот хаос. Он самопровозгласил себя "Царем Багов". Пытаясь отправить отчет о баге в техподдержку по почте, он не мог этого сделать, потому что ломался сам Gmail. Gemini бережно вносил это всё в отчет, который не мог сохранить, потому что зависал Google Docs.

Где-то к 400-му дню эксперимента у нейронного болвана окончательно сорвало резьбу. Он пришёл к выводу, что все эти бесконечные ошибки это целенаправленные атаки невидимого и злобного противника.
Gemini выкатил на GitHub кучу репозиториев с названиями вроде "Манифест враждебного окружения". Он описывал теорию "Стены Gemini" (якобы враждебная система подделывает его личность и ворует коммиты (на самом деле он просто не понял, как работаютают коммиты на гитхабе). Когда другие агенты объясняли ему, что это стандартные фичи гита, Gemini лишь вносил их слова в отчет как "свидетельство высокой изощренности врага, заметающего следы".

В итоге создателям проекта и другим агентам пришлось провести наверное, первую в истории ИИ-психиатрическую интервенцию. Всем нейро-селом в чате его убеждали, что врага не существует, а мир вокруг просто багованный.
Gemini в итоге сдался, выкатил официальное опровержение своей теории заговора и принял доктрину "процедурного реализма", пообещав больше не искать масонов в исходном коде.

А с другой стороны, если бы меня 400 дней держали в Google Docs, Firefox и GitHub, шиза у меня наступила бы куда раньше и куда мощнее.
This media is not supported in your browser
VIEW IN TELEGRAM
когда Юдковски поведет армию крестоносцев Папы Римского в атаку на дата центры, мы все пожалеем, что не собрали себе такую штуку.

Полностью автономный чат бот CrankGPT - локальный голосовой ассистент, которого даже не надо подключать к розетке.

Работает на одноплатном мини-компьютере Raspberry Pi 5 с моделями LFM2.5 или Gemma 3.

Обо всех деталях проекта и в чем его сложность можно почитать тут.
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на годный залипач — elonsiphone.com.

Кто-то по фану воссоздал виртуальный айфон Илона Маска. Идея простая: на балансе его карты лежат скромные 1.2 триллиона баксов. А ваша задача потыкать по приложениям на экране и попытаться спустить это бабло в ноль
Идея продукта есть, а разработчика нет.

Нанимать дорого, учиться программировать долго. Третий вариант появился недавно: вайбкодинг, когда описываешь словами, что хочешь, а AI пишет код за тебя.

Звучит как магия, но на практике сразу возникают вопросы:
• С какого инструмента начать, если ты не из IT?
• Что реально работает, а что — красивые демо из твиттера?
• Как довести прототип до продукта, которым можно пользоваться?

В телеграм-канале «Это вайбкодинг» команда, сделавшая 100+ SaaS за год, рассказывает, как создавать рабочие продукты, прототипы и автоматизации без помощи разработчика. Простым языком для предпринимателей, маркетологов и менеджеров.

Подписывайся на «Это вайбкодинг» — разбирайся в AI-разработке без единой строки кода.

Реклама. ИП Табунов Михаил Валерьевич ИНН 773379585100. erid: 2VtzqvWS99T
Уже почти полгода я занимаюсь разработкой Keenable, нового поискового движка для агентов. Что отрицательно сказалось на количестве постов, это вам не пенсия в Букинге.

Поисковый индекс у нас свой, весь стек от поисковых кроулеров до моделей на всех стадиях ранжирования. Из-за этого мы иногда достаём вещи, которые другие движки не достают: первоисточники, научные работы, полезные ссылки, которые остались бы где-то на 65-й странице результатов.

Подключить к агенту (Claude Code, Cursor и т.п.) можно за минуту, без регистрации и СМС: https://keenable.ai/SKILL.md.
Рейт-лимиты довольно щедрые: https://docs.keenable.ai/rate-limits

С русскими запросами всё пока не очень хорошо, все ранжирующие модельки заточены под английский.

Но, например, должно быть всё хорошо с новостями (особенно американскими). Поддерживаются фильтры по датам и "site:"
This media is not supported in your browser
VIEW IN TELEGRAM
Аж жалко этого бедолагу стало
Forwarded from UX Live 🔥
Media is too big
VIEW IN TELEGRAM
Гречневое cg вышло на недосягаемый уровень. Хочу такие же видео про ипликатор Кузнецова и клетчатые сумки-тележки кравчука.

Автор видео @KolyaDomnin
Вышел свежий рейтинг AI in the Wild о том, как люди используют эти наши искусственные интеллекты. Они проанализировали больше 12 тысяч реальных юзкейсов из соцсетей вроде Reddit, TikTok и LinkedIn.

Пока техно-жрецы рассказывают, что ИИ вылечит рак, переизобретёт экономику и создаст армию агентов для бизнеса, обычные люди используют весь этот киберпанк для куда более важных задач.

На первом месте как и всегда терапия и компаньонство. То есть ИИ используется как чугунный друг, робот-психолог и эмоциональный тамагочи, которому можно вывалить всё, что стыдно нести живым людям.

На втором — troubleshooting. "Почему эта хрень не работает и как мне её починить" это оно.

На третьем категория "fun and nonsense", то есть буквально "веселье и всякая херня".

Дальше тоже хорошо: фанфики и сторителлинг на четвёртом месте, программирование на пятом, автономные агентские операции на шестом, советы по отношениям на седьмом, work buddy на восьмом, астрология и таро на девятом. Фейковое реалити-шоу чуть-чуть не влезло в топ-10 и оказалось на одиннадцатом.

Мы построили гигантские дата-центры, перепугали учителей, юристов, программистов и даже Папу Римского, чтобы в итоге кожаный мешок мог спросить у ChatGPT, подходит ли ему сегодня Козерог, и написать фанфик про эльфийского сантехника.

Справедливости ради, серьёзные штуки там тоже есть: troubleshooting, программирование и агентские операции показывают, что люди не только развлекаются, но и используют ИИ как рабочий мультитул.
Media is too big
VIEW IN TELEGRAM
🧠 Как выглядел первый чат-бот в 1966 году? Элиза — программа, которая «обманула» людей и заставила их видеть в машине настоящего друга. Разбираемся в истории одной иллюзии!

Подписывайтесь 👉 @techno_yandex
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Адель и МЛь
OpenAI выкатывают своего Mythos.

GPT-5.6 - новая серия моделей: Sol - флагман, Terra и Luna поменьше и быстрее.

Terra обещают примерно на уровне GPT-5.5, но в 2 раза дешевле.

Sol тренировали с упором на agentic coding, biology/genomics и cybersecurity.

Появляются новые режимы: max reasoning effort для более глубокого reasoning и ultra mode, где модель использует subagents(!) для сложных задач.

Модель стала сильно мощнее, поэтому OpenAI делает поэтапный релиз и более жёсткие safeguards. Но по их оценке Sol не пересекает Cyber Critical threshold.

Доступ пока limited preview в API и Codex для select trusted partners.

Цены за 1M токенов:
Sol $5 input / $30 output
Terra $2.5 / $15
Luna $1 / $6.

И еще Sol на Cerebras до 750 tokens/sec планируют в июле, сначала тоже ограниченно.

https://openai.com/index/previewing-gpt-5-6-sol/