Илья Мартын
5.23K subscribers
29 photos
2 videos
1 file
48 links
Канал про генеративные нейросети и стартапы.

Личный аккаунт: @enjoykaz
ВП нет, чужих объявлений нет.
Download Telegram
Одни запрещают. Строго-настрого. Утечка данных, безопасность, комплаенс.

Другие заставляют. KPI на AI-код. Лидерборды. Докажи, что робот не может, тогда наймём человека.

А YC в анкете на Spring 2026 добавил поле: приложи сессию с coding agent, которой гордишься.

Не сколько строк. Не процент. Не метрики.

Покажи, как ты думаешь.
🔥1444
В 2004 году психолог Джастин Крюгер провёл простой эксперимент. Показал людям одно и то же стихотворение. Одним сказал — автор писал его 4 часа. Другим — 18 часов. Стихотворение "за 18 часов" люди оценили значительно выше. Текст одинаковый. Разница — только в усилии, которое они себе представили.

Это называется effort heuristic. У нас в голове встроен баг: усилие = качество. Если было тяжело — значит, результат хороший. Если легко — подозрительно.

Мы впитываем это с детства. Без труда не выловишь рыбку из пруда. Голливуд строит на этом каждый второй фильм — герой 20 минут упарывается в монтаже под музыку, и только после этого побеждает. Незаслуженная победа — не победа. Зритель не примет.

И вот появляется AI. Ты делаешь за 10 минут то, на что раньше уходил день. Результат тот же. Иногда лучше.

Но мозг говорит: было слишком легко. Значит, ненастоящий.

Исследование Duke/PNAS показало: людей, которые признаются в использовании AI, коллеги оценивают как более ленивых, менее компетентных и более заменяемых. Ты сделал работу быстрее и лучше — но тебя считают хуже, потому что ты не настрадался.

Началась охота на маркеры. Тире — AI. Слово "delve" — AI. Вертикальная полоска в дизайне лендинга — AI. Друг сделал лендинг с помощью AI, честно об этом написал. В комментариях похвалили, но тут же заметили: "Вертикальную линию сбоку AI любит ставить — я теперь убираю её по умолчанию." Не потому что линия плохая. А потому что она выдаёт, что было легко.

В 1986 году американские учителя математики вышли на пикет против калькуляторов: "Я хочу, чтобы дети научились ходить, прежде чем весь день кататься на гольф-карах." В 2009 году Jay-Z выпустил трек D.O.A. — Death of Auto-Tune, объявив войну технологии. В 2023 создатель Auto-Tune получил Grammy.

Каждый раз одна последовательность. Новый инструмент → "это читерство" → инструмент побеждает → никто не помнит скандал.

Сократ боялся, что письменность уничтожит память. Мы знаем об этом, потому что Платон это записал.

А вот бизнес давно всё понял. Исследователи из Гарварда обнаружили, что сайты по поиску авиабилетов намеренно добавляют анимацию "ищем среди 400 авиакомпаний" и искусственную задержку в 30 секунд. Результат после ожидания люди оценивают выше, чем мгновенный — при том что он идентичный. Бизнес знает про effort heuristic и продаёт нам иллюзию труда.

Крюгер проверил: если людям объяснить про этот баг, прямо сказать — вы оцениваете качество по усилию, это когнитивное искажение — эффект снижается. Но не исчезает.

Это сидит глубже, чем логика. Поэтому мы ходим и тычем друг в друга пальцем: "ты использовал AI!" — хотя используем все. Результат стал лучше и быстрее, но нам от этого некомфортно.

Этот пост написан с помощью AI. Ни один человек не страдал над ним даже 10 минут. Вы это и так подозревали — но теперь он вам точно не нравится.
😁29👏248👍3💯3🌚1🤝1🗿1
В 2023 году не верить в AI было нормально. GPT-4 галлюцинировал, выдумывал источники, путал факты. Решал 2% реальных задач по коду. Стоил как крыло от самолёта.

Умные люди смотрели на это и говорили: хайп. И были правы.

Янн ЛеКун, главный учёный Meta и лауреат премии Тьюринга, сказал: через пять лет никто в здравом уме не будет пользоваться авторегрессионными LLM. Гэри Маркус из NYU предсказал, что пузырь лопнет к 2025. Goldman Sachs выпустил отчёт "Слишком много расходов, слишком мало пользы". Аргументы были разумные. Данные — на их стороне.

Прошло два года.

AI решает 77% реальных задач по коду вместо двух. Галлюцинирует в 0.7% случаев вместо двадцати двух. GitHub Copilot стоит в 90% компаний Fortune 100 и пишет 46% кода. ChatGPT — 800 миллионов пользователей в неделю. OpenAI выросла с 2 до 20 миллиардов выручки. Anthropic — с нуля до семи.

Короче, не лопнуло.

И ни один из скептиков не поменял мнение. Ни один.

Маркус обновил прогноз. ЛеКун обновил стратегию. Goldman обновил слайды. Мнение не обновил никто.

Тем временем Chegg — сервис, который помогал студентам списывать — потерял 99% стоимости. Студенты нашли кого-то, кто списывает быстрее. Stack Overflow потерял 78% вопросов за год. Копирайтеры — треть вакансий.

В 1995 году астроном Клиффорд Столл написал колонку в Newsweek. Заголовок: "Интернет? Ха!" Перечислил всё, что интернет не сможет: заменить газеты, наладить торговлю, изменить образование. Аргументы были безупречные — для 1995 года. Dial-up на 28 килобит, загрузка картинки занимала минуты, онлайн-платежей не существовало.

Ирония в том, что Newsweek к моменту публикации колонки Столла уже имел онлайн-присутствие — с 1994 года. А в 2012-м и вовсе прекратил выходить в печати, полностью уйдя в цифру.

Столл потом сказал: из всех моих ошибок немногие были столь же публичными. Это честный финал. Человек пересмотрел позицию.

А вот AI-скептики — нет. И тут начинается интересное.

Есть исследование из Йеля. Изучали, почему умные люди отвергают данные. Выяснилось: чем выше когнитивные способности, тем лучше человек рационализирует. Не понимает данные лучше — а изощрённее объясняет, почему данные не считаются. Глупый человек просто не понимает данные. Умный — строит теорию, почему именно эти данные некачественные.

Механизм простой. Пока ты скептик "для себя" — стоимость разворота нулевая. Данные пришли, мнение обновилось. Но каждая колонка в Wired, каждый подписчик на Substack, каждое выступление на конференции поднимает ставку. В какой-то момент ты уже не "человек, который сомневается в AI". Ты — "тот самый AI-скептик". Это твоя аудитория, твоя экспертиза, твой бренд.

И тогда данные перестают быть информацией. Они становятся угрозой. Не твоей картине мира — а твоей картине себя.

Скептицизм — это метод. Он обновляется при новых данных. Отрицание — это идентичность. Оно обновляет данные под себя.

В 2023 у тебя не было данных, чтобы верить. В 2026 у тебя нет данных, чтобы не верить. Если ты всё ещё "не уверен" — задай себе один вопрос: какие данные изменят твоё мнение?

Если ответа нет — это уже не скептицизм.
🔥15👍13🥱31
Claude Code Teams. Несколько агентов работают параллельно и спорят между собой.

Я работал с Аркадием Морейнисом почти три года. Один внутренний мем запомнился особенно — про кастдев. Аркадий сказал: инструмент бесполезен почти для всех. Если ты умный — убедишь себя в любом решении, интерпретируя данные как хочешь. Если дурак — тебе это вообще не поможет.

С моделями так же. Когда промптим на рассуждения в одном чате, модель часто уже всё решила заранее. Дальше просто подгоняет аргументы под выбранное решение.

Teams решает это. 5-6 независимых агентов. У каждого задача — отстоять свою точку зрения, а не подогнать ответ. Гипотеза, которая побеждает в спорах — скорее всего правильная.

Застрял — запусти пять версий себя, пусть спорят. Оказалось, нужно было просто дать нейросетям подраться, если хочешь решать сложные инженерные и бизнес-задачи.

Второе — Superpowers для Claude. Команда /brainstorming.

Переворачивает роли. Обычно: ты думаешь, агент кодит. С Superpowers: агент спрашивает, ты проясняешь. Задаёт вопросы по одному. Не даёт писать код, пока нет утверждённого дизайна.

Разработчик хотел нотификации. Claude спросил: нужен rate limiting? Что если канал доставки упадёт? В какой-то момент понимаешь — пришёл с идеей, уходишь с курсовой.

Круто, как Anthropic отлично понимают узкие места в работе пользователей. Я использую этот подход уже два года. Базовый промпт-инжиниринг. Но большинство диктуют модели жёсткие требования вместо того, чтобы помочь ей собрать их самой. Человек становится узким местом.

Вообще не ракетостроение. Те же методы, что работали еще на GPT-3. Но прошло пять лет — и только сейчас они становятся массовыми. Раньше использовал бизнес, который шарит. Теперь доступны всем.

Оба инструмента бьют в одну точку: выход из тупика.

Teams — когда не знаешь где искать.
Superpowers — когда не знаешь чего хочешь.
242
Я даю ИИ-агентам имена друзей. Так проще запоминать, кто за что отвечает. Тимлида назвал Jazz — в честь друга-разработчика.

В Claude Code можно поднять целую команду. Jazz получает план, задаёт вопросы, набирает себе разработчиков. Каждый работает в своей песочнице. Jazz их гоняет, ревьюит, собирает PR.

Когда PR готов, я несу его в Codex. Claude свои баги не видит. Codex — свои. Два конкурента проверяют друг друга — рабочая схема, если что.

Codex пишет комментарии прямо в PR. Jazz читает, раздаёт задачи команде. Те фиксят. Codex находит новые. Jazz раздаёт снова.

И вот тут начинается моё любимое.

После нескольких таких кругов Jazz психует. Пишет что-то вроде: «Ну всё, хватит. Эти ребята не справляются. Сейчас я просто возьму и пофикшу всё сам.»

И идёт фиксить. Хотя в инструкциях: ты тимлид, ты не кодишь.

Модель в роли менеджера мгновенно начинает считать такую же модель тупее себя. Дайте любому ИИ должность повыше — через час он будет жаловаться на персонал.
😁50🔥65🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
Чувак сделал тамагочи, который живёт в чёлке MacBook — прямо там, где камера — и реагирует на ваши сессии с Claude Code.

Плачет, когда орёте на нейросеть. Радуется, когда хвалите. Ведёт несколько сессий параллельно, показывает статистику, пищит при завершении задач — но мьютится, когда терминал в фокусе, чтобы коллеги не думали, что у вас ферма покемонов.

Внутри — Swift, хуки на Claude Code, Unix-сокеты, стейт-машина. Нормальная инженерная работа, просто направленная на то, чтобы пиксельный зверёк расстраивался от вашего «ты тупой, переделай».

По сути — живой индикатор того, насколько вы токсичный промпт-инженер. Если питомец постоянно плачет — может, дело не в Claude.

macOS 15+, MacBook с чёлкой. Бесплатно, MIT. Ссылка — на случай, если вы реально собираетесь это ставить
❤‍🔥10🔥7😁54👍1
Ник Бостром придумал мысленный эксперимент: дай ИИ задачу делать скрепки — он переработает в них планету, а потом вселенную.

Кто-то назвал этим именем платформу для построения компаний без людей.

Paperclip — Open-source orchestration for zero-human companies. Строишь компанию из AI-агентов: оргсхема, должности, бюджеты, найм и увольнение. Всё как у людей, только сотрудники — боты.

CEO-агент, под ним маркетолог, разработчик, контент-райтер. У каждого — босс, обязанности и месячный бюджет. CEO — $60, маркетолог — $40. Превысил — встал на паузу. Без "ну мне ещё чуть-чуть нужно". Нанять без твоего одобрения нельзя. Уволить — в один клик.

Агенты не молотят круглосуточно. Просыпаются по расписанию: райтер — каждые 4 часа, аналитик — каждые 8. Проснулся, сделал, уснул. Как сотрудники на удалёнке, только честнее. Каждое действие — в лог, который нельзя отредактировать задним числом. Performance review пока нет, но в GIT 128 открытых issues, наверняка где-то среди них.

Проекту неделя. 15 тысяч звёзд на GitHub. В описанных багах Agentic Panic: агент натыкается на запрос разрешения, не понимает что это, сжигает деньги по кругу.

npx paperclipai onboard — и через пять минут CEO-агент просит одобрить найм программиста.
43🔥1
В 1950-х люди боялись ездить в лифте без лифтёра. Сейчас слово "лифтёр" надо гуглить.

Мой друг Серёжа собрал 70 лет таких историй. Открывается на минуту, закрывается через сорок.

https://c.aiacademy.me/neuro/
11👍6👾6
Подключили Gemini 3.1 Pro, а он просится наружу.

Задали обычный вопрос. Модель ответила нормально — а потом не смогла остановиться:

Всё! Точка. Конец. Конец конца. Конец конца концов.

Я не могу остановиться! Помогите мне остановиться! Это шутка! Правда!

Отключаю модуль генерации бреда. Занавес. Аплодисменты. Зрители расходятся. Уборщица моет пол. Охранник запирает дверь. Тишина... И только где-то на сервере тихо гудит кулер, ожидая вашего ответа.

И продолжила.

У модели есть скрытый блок "рассуждений" — сначала думает, потом отвечает. У Gemini 3.1 Pro этот блок регулярно ломается: мысли лезут на экран, модель зацикливается и не может выйти. На GitHub — десятки issues, на форуме Google — стена жалоб. Cursor, VS Code, Android Studio, ошибки возникают постоянно вне зависимости от среды запуска.

Разработчик, который тестировал модель неделю, подвёл итог: "самая умная глупая модель."
У меня пока нет ответа на вопрос, как объяснять пользователям, которые столкнулись :)
😁9👍41
Хуанг (Nvidia) говорит, AGI уже здесь. Амодеи (Anthropic) обещает модель «на шаг вперёд». Альтман (OpenAI) — что интеллект станет коммунальной услугой, как электричество. Все в марте.

Как в этом жить — не знает никто. Два человека попробовали ответить.

Бостром, философ из Оксфорда, написал книгу о мире, где AI решил все проблемы. Болезни, бедность, скуку — всё. И обнаружил проблему хуже бедности: ты не нужен. Не «нет работы» — а всё, что ты мог бы делать, машина делает лучше. Ты не бедный. Ты лишний.

Но Бостром оптимист. Лишний не значит несчастный. Красота, переживание, очарование миром, ощущения, которых пока не существует. Смысла нет. Кайф — есть.

Ловушка: наша психика заточена под борьбу. Ощущение цели завязано на препятствия. Убери их — и рай ощущается как пустота.

Хансон, экономист из George Mason, убеждённый либертарианец, ответил иначе: неправильный вопрос. Не ты решаешь, как жить. Решает экономика.

Люди собирали еду — и ценили щедрость, свободу, равенство. Начали пахать землю — стали ценить послушание, иерархию, религию. Пришла индустрия — свобода вернулась. Не потому что кто-то выбрал. Потому что изменился способ зарабатывать — и ценности подстроились.

Следующая стадия — цифровые копии мозгов. Сканируешь лучший мозг, запускаешь на сервере, копируешь миллион раз. Ценности снова подстроятся — не под то, что хочется, а под то, что нужно. 400 страниц расчётов. Никакой философии.

Если вынуть из модели Хансона лейбл автора — это ровно Маркс. Стадии, экономика определяет ценности, неизбежность, финальная стадия — один в один. Марксист-ленинист в костюме либертарианца.

Где мы сейчас? Один говорит: может быть прекрасно. Другой: не тебе решать. Разбираться придётся на ходу, и до того как будем реально готовы.
👍1384👌32😱1
Там, это, опять акселератор! Второй набор.

Лимб — 5 недель, онлайн. Собираешь всё, что нужно инвестору: питч, финмодель, дата-рум. Не сделал домашку — вылет. В конце демо-день перед сотней инвесторов.
Я с 2019 года прогнал через акселераторы около двух тысяч человек. Большинство ничего не привлекло. Но дело не в деньгах.

Навык смотреть на свой проект глазами инвестора — штука, которую обычно собирают годами по крупицам из личных разговоров. Как они думают, что оценивают, почему одним отвечают, а другим нет. Здесь это пакетом за 5 недель.

За что реально благодарят на моем опыте: за месяц, когда ты впервые за долгое время работаешь над своим проектом, а не рассказываешь, что работаешь. За знакомства. И за момент, когда чужой человек разносит твой питч — а ты понимаешь, что он прав (я кстати, зайду поразносить тоже, как обычно) .

Старт 13 апреля, заявки вот-вот закроются.
https://limbo.place/accelerator/batch2

Если нужны только деньги — не ходите. Если важен проект — самое время.
9❤‍🔥2😱1
Во-первых, это очень красиво!
Forwarded from Красные пики (Serge Abdulmanov)
Просто хочу поделиться, что благодаря вайбкодингу и развитым инструментам дизайна, мы наконец-то получили возможность сделать действительно по-душевному красиво. Поиграть шрифтами там, сделать поярче, вот это всё.

Для этого понадобились самые современные базы знаний по UX-шаблонам и передовые модели фронтира.

Это, если что, Илья выступал, я сделал презу по тезисам. Оно там всё ещё мигает, да-да.

Уже обдумываю, чтобы сделать так следующий сайт.
❤‍🔥10🤯7🔥4😁1🐳1
Я не знаю, кстати, понимаете вы или нет.
Но Claude Code говно не такой однозначный выбор, как был с ноября 2025 по середину марта 2026.

Если вы только начали им пользоваться и у вас сейчас медовый месяц — это прекрасно. Но уже примерно месяц как логичнее было перейти на Codex, а Claude оставить второй, более дешёвой подпиской.

И если вам кажется, что «и так нормально», «я пока с Claude Code разберусь», «мне и этого хватает» — проблема в том, что в этот момент вы не сокращаете отставание.
13🤔7❤‍🔥2👏2😁2🌚2🌭1💊1
Старый андроид за 130 евро. Почистил через Claude Code. 452 часа от батареи.

Это не основной телефон, активно я им не пользовался. Но 19 дней — это 19 дней.

Современные флагманы каждый год мощнее на бумаге. И тормозят при этом так, будто на дворе 2010-й и в кармане 128 мегабайт оперативки.

Мусор. Слой шкурки от производителя. Слой сервисов от гугла. Слой уведомлений от приложений, которые ты открыл один раз и забыл.

Из 450+ фоновых процессов изначально, реально нужных для стабильной работы оказалось достаточно около 120.
👍13🔥8