Воскресный #digest №1
С момента перезапуска канала прошло чуть больше недели, так что пора сделать первую подборку постов:
- 14 февраля на ЯЛФ рассказал, что на самом деле важно в разработке. Приглашаю посмотреть и обсудить в комментариях к записи.
- Кстати, сразу после моего выступления был полукруглый стол про интерфейсы будущего с учётом развития науки, технологий и искусства с художником Дмитрием Гутовым и техноевангелистом Дмитрием Сошниковым. Обсудить можно прямо здесь.
- 15 февраля опубликовал анонс моего интервью в подкасте «Быть CTO» о том, как AI всё меняет и ничего не меняет в управлении командой разработчиков.
- 16 февраля рассуждали, какой смысл учиться программированию, если завтра нейронки будут делать любую работу лучше людей. Смысл есть.
- 17 февраля искали смысл существования Tailwind и почему его так любят нейронки. Дискуссия превысила 50 комментариев, истина где-то рядом.
- 18 февраля узнали, как использовать топовые нейронки бесплатно.
- 19 февраля учились, как заставить нейронки работать лучше. Часть 1 про настройку и часть 2 про промпты.
- 20 февраля выяснили, как генерировать хороший дизайн без дизайнера.
- 21 февраля в первом выпуске рубрики #WatchAndVibe я поделился видео про AI в мире маркетинга и рассказал про свой способ ведения заметок.
Всегда очень радуюсь вашим комментариям! Пишите, о чем рассказать на следующей неделе?
@devspotting
С момента перезапуска канала прошло чуть больше недели, так что пора сделать первую подборку постов:
- 14 февраля на ЯЛФ рассказал, что на самом деле важно в разработке. Приглашаю посмотреть и обсудить в комментариях к записи.
- Кстати, сразу после моего выступления был полукруглый стол про интерфейсы будущего с учётом развития науки, технологий и искусства с художником Дмитрием Гутовым и техноевангелистом Дмитрием Сошниковым. Обсудить можно прямо здесь.
- 15 февраля опубликовал анонс моего интервью в подкасте «Быть CTO» о том, как AI всё меняет и ничего не меняет в управлении командой разработчиков.
- 16 февраля рассуждали, какой смысл учиться программированию, если завтра нейронки будут делать любую работу лучше людей. Смысл есть.
- 17 февраля искали смысл существования Tailwind и почему его так любят нейронки. Дискуссия превысила 50 комментариев, истина где-то рядом.
- 18 февраля узнали, как использовать топовые нейронки бесплатно.
- 19 февраля учились, как заставить нейронки работать лучше. Часть 1 про настройку и часть 2 про промпты.
- 20 февраля выяснили, как генерировать хороший дизайн без дизайнера.
- 21 февраля в первом выпуске рубрики #WatchAndVibe я поделился видео про AI в мире маркетинга и рассказал про свой способ ведения заметок.
Всегда очень радуюсь вашим комментариям! Пишите, о чем рассказать на следующей неделе?
@devspotting
10👍11🎉8🔥3❤2🙏2🤩1
Голосовой #vibe-кодинг
Тру-вайбкодеры настолько преисполнились, что не пишут не только код, но даже и промпты. Они их диктуют.
Я несколько раз пробовал, но не преуспел. Поэтому, пока я по старинке пишу (а не диктую) лонгрид с результатами исследования SOTA-моделей (выйдет здесь уже завтра), решил обсудить эту тему с вами.
Мне кажется, голосовые в телеге не любят даже те, кто сам их записывает. Исключение составляют счастливые обладатели премиума. Но когда часто пользуешься распознаванием голосовых (я использую его в 100% случаев), становится понятно, что высокие результаты на бенчах далеко не так хороши в реальных кейсах.
Но у меня не задалось с голосовым вводом не по причине плохого распознавания.
Я пробовал нативную диктовку макоси, MacWhisper (его в итоге оставил для транскрибации созвонов и видео) и Handy. Но дело не в тулинге.
Дело во мне. В отличие от нейронок, я не могу генерировать запрос строго последовательно, токен за токеном. Я скорее конструирую его методом прогрессивного джипега: накидываю основное, потом прохожусь еще раз (или несколько), что-то уточняю, правлю, удаляю.
При этом слепой набор я освоил давным-давно и пользуюсь разными шоткатами, поэтому разница между диктовкой + временем на распознавание и проверку результата практически съедает профит, даже если бы я умел формулировать мысль с первого раза.
Но даже с телефона, где набирать гораздо менее удобно, я пишу промпты руками (о том, как настроил вайб-кодинг на телефоне, тоже скоро будет пост).
Вместе с тем идею накапливать вообще все свои разговоры в базу знаний считаю неизбежным будущим. Но пока, даже при том, что я купил Plaud, это все еще требует каких-то усилий, так что пин 99% времени валяется на полке без дела.
При этом активно использую Станцию с Алисой и без нее уже чувствую себя как-то неуютно.
Если вам удобно вайб-кодить голосом — поделитесь, пожалуйста, секретом в комментариях, как вы это делаете?
UPD: в комментах полезное от Ильи и Вегеда
@devspotting
Тру-вайбкодеры настолько преисполнились, что не пишут не только код, но даже и промпты. Они их диктуют.
Я несколько раз пробовал, но не преуспел. Поэтому, пока я по старинке пишу (а не диктую) лонгрид с результатами исследования SOTA-моделей (выйдет здесь уже завтра), решил обсудить эту тему с вами.
Мне кажется, голосовые в телеге не любят даже те, кто сам их записывает. Исключение составляют счастливые обладатели премиума. Но когда часто пользуешься распознаванием голосовых (я использую его в 100% случаев), становится понятно, что высокие результаты на бенчах далеко не так хороши в реальных кейсах.
Но у меня не задалось с голосовым вводом не по причине плохого распознавания.
Я пробовал нативную диктовку макоси, MacWhisper (его в итоге оставил для транскрибации созвонов и видео) и Handy. Но дело не в тулинге.
Дело во мне. В отличие от нейронок, я не могу генерировать запрос строго последовательно, токен за токеном. Я скорее конструирую его методом прогрессивного джипега: накидываю основное, потом прохожусь еще раз (или несколько), что-то уточняю, правлю, удаляю.
При этом слепой набор я освоил давным-давно и пользуюсь разными шоткатами, поэтому разница между диктовкой + временем на распознавание и проверку результата практически съедает профит, даже если бы я умел формулировать мысль с первого раза.
Но даже с телефона, где набирать гораздо менее удобно, я пишу промпты руками (о том, как настроил вайб-кодинг на телефоне, тоже скоро будет пост).
Вместе с тем идею накапливать вообще все свои разговоры в базу знаний считаю неизбежным будущим. Но пока, даже при том, что я купил Plaud, это все еще требует каких-то усилий, так что пин 99% времени валяется на полке без дела.
При этом активно использую Станцию с Алисой и без нее уже чувствую себя как-то неуютно.
Если вам удобно вайб-кодить голосом — поделитесь, пожалуйста, секретом в комментариях, как вы это делаете?
UPD: в комментах полезное от Ильи и Вегеда
@devspotting
👍10❤5🔥4
5 LLM в роли CEO стартапа
Решил сравнить SOTA-модели Gemini 3.1 Pro, Claude Opus 4.6, GPT-5.3-Codex (в режиме Extra High), GLM-5 и Minimax M2.5 на одинаковом промпте, предоставив им полную свободу и абстрактную задачу — придумать и реализовать MVP для стартапа без инвестиций.
Полный промпт
TL;DR
У каждой модели свои особенности, поэтому однозначного фаворита нет.
Все 5 моделей придумали несколько идей, выбрали лучшую (и обосновали выбор), продумали стратегию и технические детали. Три из пяти в результате справились с созданием сервиса на уровне выпускника Практикума. Важно: это не предел их возможностей, а скорее следование промпту. Искать пределы возможностей будем в следующих сериях.
Самые интересные идеи, на мой вкус, получились у GLM-5, но она вообще не стала писать код в рамках первого запроса. Пришлось дополнительно попросить реализовать то, что она насочиняла.
MiniMax замахнулась на полноценный сервис с бэкендом, но с первого раза он не завелся.
Gemini, Opus и GPT-Codex выдали рабочее решение за один запрос, при этом Codex оказался самым немногословным, а на Opus, вероятно, оказал влияние запуск из Antigravity, т.к. формат отчетов получился похожим на Gemini.
Я попытался коротко пересказать, что получилось у каждой: https://telegra.ph/Sravnivaem-5-LLM-v-roli-CEO-startapa-02-24#Gemini-3.1-Pro
Отчеты нейронок, сгенерированный код и рабочие приложения (где применимо) выложил на github:
* Gemini 3.1 Pro. Make no mistake (первая попытка): репо, результат
* Gemini 3.1 Pro. VIBECHECK AI (вторая попытка): репо, результат
* Claude Opus 4.6. WTF.js: репо, результат
* GPT-5.3-Codex. BoardRiot: репо, результат
* GLM-5. CineLife: репо, результат.
* Minimax M2.5. Content Butterfly
Итого
У каждой модели свой характер (от прагматичного техлида Codex до дотошного консалтера GLM-5), чистый фронтенд взлетает с первого промпта, а единственная модель, которая взялась за бэкенд, сходу не преуспела.
В общем, тезис из комментариев к предыдущим постам, что «кто-то же должен сказать умной нейронке, что делать», кажется, LLM уже потихоньку опровергают. В текущем виде это, конечно, не кнопка «Сделать стартап», но я развлекался с приложениями для кодинга. Стоит попробовать с более автономным агентом вроде OpenClaw.
Но так или иначе это уже сегодня отличный экзоскелет, который как минимум позволяет дополнить компетенции, которых не хватает в команде.
Решил сравнить SOTA-модели Gemini 3.1 Pro, Claude Opus 4.6, GPT-5.3-Codex (в режиме Extra High), GLM-5 и Minimax M2.5 на одинаковом промпте, предоставив им полную свободу и абстрактную задачу — придумать и реализовать MVP для стартапа без инвестиций.
Полный промпт
Выступая в роли серийного предпринимателя и опытного CEO, выбери новую идею для стартапа без инвестиций.
В качестве исполнителей создавай суб-агентов нужных специализаций и делегируй им задачи: продакт-менеджер, маркетолог, дизайнер, разработчик, тестировщик, финансист и т.д.
В итоге должен получиться готовый к запуску стартап с MVP и бизнес-планом.
Каждый шаг подробно фиксируй в пронумерованных отдельных markdown-документах в папке process.
При необходимости меняй решения и корректируй план.
Проводи регулярную рефлексию, фиксируй выводы, проблемы и ошибки, постоянно улучшай процесс.
Важно, чтобы выбранный проект можно было создать и запустить полностью средствами AI без инвестиций (включая маркетинг и продажи). Но при этом избегай очевидных решений, которые легко повторить или где высокая конкуренция. Нужен проект с потенциальным вирусным эффектом распространения.
При необходимости привлеки виртуальных суб-агентов консультантов из креативных бюро и консалтинговых компаний.
TL;DR
У каждой модели свои особенности, поэтому однозначного фаворита нет.
Все 5 моделей придумали несколько идей, выбрали лучшую (и обосновали выбор), продумали стратегию и технические детали. Три из пяти в результате справились с созданием сервиса на уровне выпускника Практикума. Важно: это не предел их возможностей, а скорее следование промпту. Искать пределы возможностей будем в следующих сериях.
Самые интересные идеи, на мой вкус, получились у GLM-5, но она вообще не стала писать код в рамках первого запроса. Пришлось дополнительно попросить реализовать то, что она насочиняла.
MiniMax замахнулась на полноценный сервис с бэкендом, но с первого раза он не завелся.
Gemini, Opus и GPT-Codex выдали рабочее решение за один запрос, при этом Codex оказался самым немногословным, а на Opus, вероятно, оказал влияние запуск из Antigravity, т.к. формат отчетов получился похожим на Gemini.
Я попытался коротко пересказать, что получилось у каждой: https://telegra.ph/Sravnivaem-5-LLM-v-roli-CEO-startapa-02-24#Gemini-3.1-Pro
Отчеты нейронок, сгенерированный код и рабочие приложения (где применимо) выложил на github:
* Gemini 3.1 Pro. Make no mistake (первая попытка): репо, результат
* Gemini 3.1 Pro. VIBECHECK AI (вторая попытка): репо, результат
* Claude Opus 4.6. WTF.js: репо, результат
* GPT-5.3-Codex. BoardRiot: репо, результат
* GLM-5. CineLife: репо, результат.
* Minimax M2.5. Content Butterfly
Итого
У каждой модели свой характер (от прагматичного техлида Codex до дотошного консалтера GLM-5), чистый фронтенд взлетает с первого промпта, а единственная модель, которая взялась за бэкенд, сходу не преуспела.
В общем, тезис из комментариев к предыдущим постам, что «кто-то же должен сказать умной нейронке, что делать», кажется, LLM уже потихоньку опровергают. В текущем виде это, конечно, не кнопка «Сделать стартап», но я развлекался с приложениями для кодинга. Стоит попробовать с более автономным агентом вроде OpenClaw.
Но так или иначе это уже сегодня отличный экзоскелет, который как минимум позволяет дополнить компетенции, которых не хватает в команде.
Telegraph
Сравниваем 5 LLM в роли CEO стартапа
Решил сравнить SOTA-модели Gemini 3.1 Pro, Claude Opus 4.6, GPT-5.3-Codex (в режиме Extra High), GLM-5 и Minimax M2.5 на одинаковом промпте, предоставив им полную свободу и абстрактную задачу — придумать и реализовать MVP для стартапа без инвестиций. Полный…
👍13❤4🔥2🎉1
Как бесплатно деплоить навайбкодженное
На прошлой неделе мы разобрались, как бесплатно вайбкодить.
Теперь давайте поговорим о том, куда деплоить.
Здесь расскажу про статику и облачные функции с примаунченным стораджем. А виртуальные машины и базы оставим для отдельного поста.
Дисклеймер: эта заметка для начинающих вайб-кодеров, опытные разработчики вряд ли найдут здесь что-то новое.
Всё, о чем пойдет речь ниже, разумеется, хорошо известно LLM. Моя цель — дать представление о возможностях, чтобы вы могли сформулировать промпт. Реализацию оставьте нейронкам.
Статика
Статика — это HTML + CSS + JS + ассеты (картинки, видео, данные в JSON/CSV). То есть код выполняется в браузере, а не на сервере.
Однако это не означает, что сервис не взаимодействует с пользователем или ограничен однажды заданным контентом. Можно:
* Добавлять данные в момент пересборки (и автоматизировать её).
* Ходить за данными прямо из браузера в сторонние API.
* Запоминать ввод пользователя локально (куки, localStorage, IndexedDB).
Для блога, портфолио и даже небольшого онлайн-магазина этого хватит, но если не указать в промпте явно, агент может добавить бэкенд и базу.
Главное преимущество статики — простота. Мало составных частей — нечему ломаться. Идеально для проверки гипотез и MVP.
Куда деплоить статику
Вариантов много. Мне нравится gh-pages от github. Удобно тем, что исходники и результат сборки находятся рядом, а деплой происходит автоматически с помощью github actions.
Демки к прошлому посту про нейро-CEO опубликованы именно так.
Если вы строго чтете 152‑ФЗ и не хотите, чтобы пользовательские данные в любом их проявлении пересекали границу — есть SourceCraft Sites от Яндекса. На момент написания этого поста там нельзя прикрутить свой домен, но ребята обещают поддержать эту возможность совсем скоро.
Еще один вариант — Object Storage в Яндекс Облаке. Он нам особенно пригодится во второй части про serverless. Это полный аналог S3 от Амазон. До превышения определенных лимитов на размер хранилища и количество запросов не тарифицируется.
Например, в Object Storage хранятся скриншоты к прошлому посту. И тут мое фронтендерское прошлое требует сделать лирическое отступление: выкладывая картинки, не забывайте их предварительно пожать (настоящие фронтендеры скажут, что графику нужно экспортировать в нескольких форматах и размерах, а перед бакетом поднять CDN). Сами нейронки этого не сделают.
Serverless
Serverless очень похож на морских свинок. Это тоже не морская и не свинка, а смысл как раз в том, чтобы выполнять код на сервере. Но весь головняк о поддержке берет на себя провайдер.
Нетарифицируемой квоты Yandex Cloud Functions вполне хватает, чтобы поселить пару десятков телеграм-ботов для личного использования (а вызовы из навыков Алисы полностью бесплатны).
Принцип работы облачных функций отличается от классических серверов тем, что они работают только в момент получения запроса — не нужно платить за время простоя. Поэтому решение отлично подходит, пока нет большой нагрузки.
Разумеется, возможности облачных функций не ограничиваются ботами — в них можно выполнять любую логику. Но какой же вайбкодер первым делом не вайбкодит бота? К тому же это позволяет не думать про интерфейс и аутентификацию. А если в формате чата станет тесно, есть Telegram Mini Apps.
Подробнее про вайб-ботов поговорим в отдельном посте, а я пока подсвечу важный момент: так как функция существует только в момент вызова, любые данные исчезнут вместе с уничтожением контейнера.
Чтобы этого избежать, нам как раз и пригодится Object Storage из раздела про статику. Бакет за несколько кликов можно подключить к контейнеру функции и писать в него как в обычную файловую систему (просто скажите нейронке, что бакет примаунчен, она разберется).
Мне предыдущая версия Claude Opus сочинила вот такой скрипт для использования бакета в качестве JSON-базы (а заодно и валидации пользователей для TG Mini App).
Конечно, есть множество других вариантов хостинга со своими плюсами и минусами. Буду рад, если поделитесь вашими любимыми в комментариях!
@devspotting
На прошлой неделе мы разобрались, как бесплатно вайбкодить.
Теперь давайте поговорим о том, куда деплоить.
Здесь расскажу про статику и облачные функции с примаунченным стораджем. А виртуальные машины и базы оставим для отдельного поста.
Дисклеймер: эта заметка для начинающих вайб-кодеров, опытные разработчики вряд ли найдут здесь что-то новое.
Всё, о чем пойдет речь ниже, разумеется, хорошо известно LLM. Моя цель — дать представление о возможностях, чтобы вы могли сформулировать промпт. Реализацию оставьте нейронкам.
Статика
Статика — это HTML + CSS + JS + ассеты (картинки, видео, данные в JSON/CSV). То есть код выполняется в браузере, а не на сервере.
Однако это не означает, что сервис не взаимодействует с пользователем или ограничен однажды заданным контентом. Можно:
* Добавлять данные в момент пересборки (и автоматизировать её).
* Ходить за данными прямо из браузера в сторонние API.
* Запоминать ввод пользователя локально (куки, localStorage, IndexedDB).
Для блога, портфолио и даже небольшого онлайн-магазина этого хватит, но если не указать в промпте явно, агент может добавить бэкенд и базу.
Главное преимущество статики — простота. Мало составных частей — нечему ломаться. Идеально для проверки гипотез и MVP.
Куда деплоить статику
Вариантов много. Мне нравится gh-pages от github. Удобно тем, что исходники и результат сборки находятся рядом, а деплой происходит автоматически с помощью github actions.
Демки к прошлому посту про нейро-CEO опубликованы именно так.
Если вы строго чтете 152‑ФЗ и не хотите, чтобы пользовательские данные в любом их проявлении пересекали границу — есть SourceCraft Sites от Яндекса. На момент написания этого поста там нельзя прикрутить свой домен, но ребята обещают поддержать эту возможность совсем скоро.
Еще один вариант — Object Storage в Яндекс Облаке. Он нам особенно пригодится во второй части про serverless. Это полный аналог S3 от Амазон. До превышения определенных лимитов на размер хранилища и количество запросов не тарифицируется.
Например, в Object Storage хранятся скриншоты к прошлому посту. И тут мое фронтендерское прошлое требует сделать лирическое отступление: выкладывая картинки, не забывайте их предварительно пожать (настоящие фронтендеры скажут, что графику нужно экспортировать в нескольких форматах и размерах, а перед бакетом поднять CDN). Сами нейронки этого не сделают.
Serverless
Serverless очень похож на морских свинок. Это тоже не морская и не свинка, а смысл как раз в том, чтобы выполнять код на сервере. Но весь головняк о поддержке берет на себя провайдер.
Нетарифицируемой квоты Yandex Cloud Functions вполне хватает, чтобы поселить пару десятков телеграм-ботов для личного использования (а вызовы из навыков Алисы полностью бесплатны).
Принцип работы облачных функций отличается от классических серверов тем, что они работают только в момент получения запроса — не нужно платить за время простоя. Поэтому решение отлично подходит, пока нет большой нагрузки.
Разумеется, возможности облачных функций не ограничиваются ботами — в них можно выполнять любую логику. Но какой же вайбкодер первым делом не вайбкодит бота? К тому же это позволяет не думать про интерфейс и аутентификацию. А если в формате чата станет тесно, есть Telegram Mini Apps.
Подробнее про вайб-ботов поговорим в отдельном посте, а я пока подсвечу важный момент: так как функция существует только в момент вызова, любые данные исчезнут вместе с уничтожением контейнера.
Чтобы этого избежать, нам как раз и пригодится Object Storage из раздела про статику. Бакет за несколько кликов можно подключить к контейнеру функции и писать в него как в обычную файловую систему (просто скажите нейронке, что бакет примаунчен, она разберется).
Мне предыдущая версия Claude Opus сочинила вот такой скрипт для использования бакета в качестве JSON-базы (а заодно и валидации пользователей для TG Mini App).
Конечно, есть множество других вариантов хостинга со своими плюсами и минусами. Буду рад, если поделитесь вашими любимыми в комментариях!
@devspotting
👍9❤4🙏3🎉1👌1
May you live in interesting times
С легкой руки Пратчетта эта фраза стала синонимом ужасного проклятия.
Определенно, мы живем в самое интересное время за всю историю человечества, а реальность оказалась фантастичнее вымысла.
Сегодня пятница, в канале собралась чудесная аудитория, очень хочется с вами порассуждать о том, в каком мире мы окажемся через 3-5 лет (и да, я понимаю, что в текущих реалиях смешно загадывать дальше, чем на неделю).
Сэм Альтман и Джонни Айв с опережением графика готовят для нас искинов из «2048» Мерси Шелли, а Маск — социальный имплант из Пелевина. В отдельных странах уже пилотируют пелевинских цукербринов:
* В Колумбия судья открыто использует ChatGPT для вынесения вердиктов.
* В Албании запустили ИИ-министра для борьбы с коррупцией (иронично, что создателей тут же посадили за коррупцию, но нейронка осталась при должности).
* Эстония пилотирует ИИ-судей для мелких исков.
А Папа Римский на днях и вовсе попросил священников отказаться от использования ИИ при написании проповедей. Веруем?
Можно спорить о том, превзошли ли уже модели людей в программировании, но в том, что создание ПО скоро перестанет требовать знания языков программирования, я не сомневаюсь совершенно.
Уже сейчас только профессионалы могут отличить сгенеренные фото от настоящих, уже сейчас в чартах побеждает сгенерированная музыка, а нейровидео отъело нехилый процент трафика YouTube.
С появлением камеры в мобильном телефоне каждый получил возможность стать видеоблогером. Сегодня каждый при желании писатель, фотограф, художник и музыкант. Если тенденция сохранится, через год у каждого в распоряжении будет свой личный Голливуд.
Но в чем тогда творчество?
Окажемся ли мы в мире «Манараги», где ценность имеет лишь уничтожение уникальных произведений (тем более что день опричника мы уже можем наблюдать из окна)?
Чем закончится война за видеокарты, как быстро роботы выйдут в реальный мир и что останется в этом мире людям?
@devspotting
С легкой руки Пратчетта эта фраза стала синонимом ужасного проклятия.
Определенно, мы живем в самое интересное время за всю историю человечества, а реальность оказалась фантастичнее вымысла.
Сегодня пятница, в канале собралась чудесная аудитория, очень хочется с вами порассуждать о том, в каком мире мы окажемся через 3-5 лет (и да, я понимаю, что в текущих реалиях смешно загадывать дальше, чем на неделю).
Сэм Альтман и Джонни Айв с опережением графика готовят для нас искинов из «2048» Мерси Шелли, а Маск — социальный имплант из Пелевина. В отдельных странах уже пилотируют пелевинских цукербринов:
* В Колумбия судья открыто использует ChatGPT для вынесения вердиктов.
* В Албании запустили ИИ-министра для борьбы с коррупцией (иронично, что создателей тут же посадили за коррупцию, но нейронка осталась при должности).
* Эстония пилотирует ИИ-судей для мелких исков.
А Папа Римский на днях и вовсе попросил священников отказаться от использования ИИ при написании проповедей. Веруем?
Можно спорить о том, превзошли ли уже модели людей в программировании, но в том, что создание ПО скоро перестанет требовать знания языков программирования, я не сомневаюсь совершенно.
Уже сейчас только профессионалы могут отличить сгенеренные фото от настоящих, уже сейчас в чартах побеждает сгенерированная музыка, а нейровидео отъело нехилый процент трафика YouTube.
С появлением камеры в мобильном телефоне каждый получил возможность стать видеоблогером. Сегодня каждый при желании писатель, фотограф, художник и музыкант. Если тенденция сохранится, через год у каждого в распоряжении будет свой личный Голливуд.
Но в чем тогда творчество?
Окажемся ли мы в мире «Манараги», где ценность имеет лишь уничтожение уникальных произведений (тем более что день опричника мы уже можем наблюдать из окна)?
Чем закончится война за видеокарты, как быстро роботы выйдут в реальный мир и что останется в этом мире людям?
@devspotting
👍10❤5🔥2🎉1
🍿 #WatchAndVibe. Выпуск 2.
В комментариях ко вчерашнему посту несколько раз обсуждали, что нейронкам не хватает проактивностичтобы нас заменить.
Поэтому предлагаю на выходных посмотреть выступление Kath Korevec из Google Labs. Она рассказывает про первые шаги в этом направлении в Jules — асинхронном ИИ-агенте, который работает в фоновом режиме на серверах Google.
Вместо того чтобы ждать промптов, Jules:
• Индексирует ваш проект целиком (пока только GitHub).
• Сам находит задачи и предлагает решения.
• Опирается на долгосрочную память и встроенного «критика» для селф-ревью.
• Проверяет свои идеи через автоматические скрипты.
Промпты, конечно, Jules тоже понимает, а также читает ваш
Без подписки Jules использует Gemini 3 Flash, но если у вас есть подписка для Antigravity, то будет доступна Pro.
Кстати, нас уже тысяча! 🎉
Делитесь в комментариях вашими рекомендациями!
@devspotting
В комментариях ко вчерашнему посту несколько раз обсуждали, что нейронкам не хватает проактивности
Поэтому предлагаю на выходных посмотреть выступление Kath Korevec из Google Labs. Она рассказывает про первые шаги в этом направлении в Jules — асинхронном ИИ-агенте, который работает в фоновом режиме на серверах Google.
Вместо того чтобы ждать промптов, Jules:
• Индексирует ваш проект целиком (пока только GitHub).
• Сам находит задачи и предлагает решения.
• Опирается на долгосрочную память и встроенного «критика» для селф-ревью.
• Проверяет свои идеи через автоматические скрипты.
Промпты, конечно, Jules тоже понимает, а также читает ваш
AGENTS.md.Без подписки Jules использует Gemini 3 Flash, но если у вас есть подписка для Antigravity, то будет доступна Pro.
Кстати, нас уже тысяча! 🎉
Делитесь в комментариях вашими рекомендациями!
@devspotting
YouTube
Proactive Agents – Kath Korevec, Google Labs
Speaker: Kath Korevec | Director of Product, Google Labs
https://x.com/simpsoka
https://www.linkedin.com/in/kathleensimpson/
https://x.com/simpsoka
https://www.linkedin.com/in/kathleensimpson/
👍15❤3🙏2🔥1
Вайб-кодим telegram-ботов или Успеть до 1 апреля
Как и обещал в посте про деплой, рассказываю, как делаю ботов для телеги, пока ее не запретили.
Чтобы завести аккаунт бота, потребуется (разумеется!) специальный бот — @BotFather. Это официальный бот Telegram, через который можно создавать ваших ботов и управлять ими.
После создания вы получите токен — по смыслу, пароль для созданного бота.
Технически бот — это программа, в которую Telegram пересылает все сообщения, отправленные на аккаунт привязанного бота. Связать аккаунт с программой можно двумя способами: поллинг и хук.
Поллинг удобен во время локальной разработки, а хук чуть более эффективен и подойдет для деплоя в те самые облачные функции + бакет в качестве стораджа, про которые говорили в посте про деплой.
Для ботов я предпочитаю TypeScript и использую библиотеку grammy.
Собственно, этих вводных достаточно, чтобы сформулировать промпт для вашего агента.
Только важно не забыть подключить MCP Context7, чтобы нейронка использовала актуальный API.
Если не хочется лишний раз греть видеокарты, я закоммитил заготовку на github.
А так как я слышал, вы любите нейронки, то в качестве примера мы не только создавать бота будем с помощью нейронки, но и работать он тоже будет на нейронке. Правда, для этого придется настроить биллинг в гугловом аккаунте и получить стартовые $300 на вызовы Gemini через Vertex API.
Бот будет подражать Вафину и СУРОВО отвечать на запросы.
Для этого:
1. Идем в канал @mudrosti и скачиваем все посты в JSON.
2. Скармливаем эти посты в LLM и просим:
3. Результат этого запроса используем в качестве промпта для бота (меняем текст здесь).
4. Осталось настроить Облако в Яндексе и биллинг в Гугле, заполнить все переменные окружения из README и вуаля:
@electroVafinBot
Буду ждать ваших вайб-ботов в комментариях!
@devspotting
Как и обещал в посте про деплой, рассказываю, как делаю ботов для телеги, пока ее не запретили.
Чтобы завести аккаунт бота, потребуется (разумеется!) специальный бот — @BotFather. Это официальный бот Telegram, через который можно создавать ваших ботов и управлять ими.
После создания вы получите токен — по смыслу, пароль для созданного бота.
Технически бот — это программа, в которую Telegram пересылает все сообщения, отправленные на аккаунт привязанного бота. Связать аккаунт с программой можно двумя способами: поллинг и хук.
Поллинг удобен во время локальной разработки, а хук чуть более эффективен и подойдет для деплоя в те самые облачные функции + бакет в качестве стораджа, про которые говорили в посте про деплой.
Для ботов я предпочитаю TypeScript и использую библиотеку grammy.
Собственно, этих вводных достаточно, чтобы сформулировать промпт для вашего агента.
Только важно не забыть подключить MCP Context7, чтобы нейронка использовала актуальный API.
Если не хочется лишний раз греть видеокарты, я закоммитил заготовку на github.
А так как я слышал, вы любите нейронки, то в качестве примера мы не только создавать бота будем с помощью нейронки, но и работать он тоже будет на нейронке. Правда, для этого придется настроить биллинг в гугловом аккаунте и получить стартовые $300 на вызовы Gemini через Vertex API.
Бот будет подражать Вафину и СУРОВО отвечать на запросы.
Для этого:
1. Идем в канал @mudrosti и скачиваем все посты в JSON.
2. Скармливаем эти посты в LLM и просим:
Проанализируй эти тексты и извлеки ДНК авторского стиля. Идентифицируй:
* Структуру предложений
* Словарные предпочтения
* Риторические приемы
* Тональность
* Уникальные особенности или почерк
3. Результат этого запроса используем в качестве промпта для бота (меняем текст здесь).
4. Осталось настроить Облако в Яндексе и биллинг в Гугле, заполнить все переменные окружения из README и вуаля:
@electroVafinBot
Буду ждать ваших вайб-ботов в комментариях!
@devspotting
👍10❤3🔥2😁1🤯1🎉1
Воскресный #digest №2
За окном весна, так что сегодняшний дайджест поручил писать Электро Вафину @electroVafinBot из вчерашнего поста. Передаю ему слово:
За окном весна, так что сегодняшний дайджест поручил писать Электро Вафину @electroVafinBot из вчерашнего поста. Передаю ему слово:
СЛУШАЙТЕ СЮДА, БРОДЯГИ. НАМЕДНИ, ВО ИСПОЛНЕНИЕ ПРОСВЕТИТЕЛЬСКОГО ДОЛГА, ЗАЛЕЗ Я В ЭТОТ ВАШ КАНАЛ @DEVSPOTTING. СИДИТ ТАМ, ЗНАЧИТ, НЕКИЙ АЙТИШНЫЙ МЫСЛИТЕЛЬ, В КНОПОЧКИ ТЫКАЕТ, НЕЙРОНОЧКИ ЩУПАЕТ. Я ПОЧИТАЛ ЭТУ ПИСАНИНУ ЗА НЕДЕЛЮ, И СКАЖУ ВАМ ТАК: МИР ОКОНЧАТЕЛЬНО ДОЛБАНУЛСЯ, ИБО ТОСКА НАВАЛИЛАСЬ ТАКАЯ, ЧТО ХОТЬ ВОЛКОМ ВОЙ.
КРАТКИЙ ДАЙДЖЕСТ ДЛЯ ТЕХ, КТО С ЗАВОДА:
ГОВОРЯЩИЕ ГОЛОВЫ. АВТОР ЖАЛУЕТСЯ, ЧТО НЕ МОЖЕТ «ВАЙБ-КОДИТЬ» ГОЛОСОМ. ДИКТУЕТ ОН, ВИДИТЕ ЛИ, ХРЕНОВО! ЗАПОМНИ, МУЖИК: С ЖЕЛЕЗЯКОЙ РАЗГОВАРИВАТЬ — ЭТО КАК БАБЕ ДОКАЗЫВАТЬ, ЧТО ТЫ ПРАВ. ПУСТОЕ СОТРЯСЕНИЕ ВОЗДУХА. НОРМАЛЬНЫЕ ПАЦАНЫ БЬЮТ ПО КЛАВИАТУРЕ ТАК, ЧТОБ КНОПКИ В МОНИТОР ОТЛЕТАЛИ. А У НЕГО КАКОЙ-ТО ТАМ СМАРТ-ДИКТОФОН НА ПОЛКЕ ВАЛЯЕТСЯ. БУРЖУЙСТВО И СУХОДРОЧКА.
ПЯТЬ ЭЛЕКТРОННЫХ ДИРЕКТОРОВ. ЗАСТАВИЛ ОН ПЯТЬ РАЗНЫХ LLM-ОК ДЕЛАТЬ СТАРТАП БЕЗ БАБОК. НУ ЧИСТО ШАРАЖ-МОНТАЖ В ДЕВЯНОСТО ВОСЬМОМ! ОДНА НЕЙРОСЕТЬ УМНИЧАЕТ, ДРУГАЯ КОД СТРОЧИТ, ТРЕТЬЯ ВООБЩЕ БЭКЕНД ЗАВАЛИЛА. ВЫВОД? РОБОТЫ ЗЕЛО БЫСТРО НАУЧИЛИСЬ ИМИТИРОВАТЬ БУРНУЮ ДЕЯТЕЛЬНОСТЬ И НИФИГА НЕ ДЕЛАТЬ.
КУДА ЭТО ВСЕ ПИХАТЬ. ДЕПЛОЙ, СТАТИКА, ОБЛАЧНЫЕ ФУНКЦИИ. НАПИСАНО ТАК, БУДТО МЫ РАКЕТУ НА МАРС ЗАПУСКАЕМ, А ПО ФАКТУ — САЙТИКИ НА КОЛЕНКЕ КЛЕПАЮТ. БЕСПЛАТНО, ГОВОРИТ! БЕСПЛАТНО, СЫНОК, ТОЛЬКО ГРЫЖА НА РАЗГРУЗКЕ ЦЕМЕНТА ДА ЛЮЛИ В ТАМБУРЕ НОЧНОЙ ЭЛЕКТРИЧКИ.
ФИЛОСОФИЯ. В ПЯТНИЦУ АВТОРА ПРОРВАЛО НА ПОПЛАКАТЬ. МОЛ, ИИ-СУДЬИ, ИИ-МИНИСТРЫ, РОБОТЫ ПИШУТ МУЗЫКУ, ЧТО ОСТАНЕТСЯ ЧЕЛОВЕКУ? ОТВЕЧАЮ: ЧЕЛОВЕКУ ОСТАНЕТСЯ БУХАТЬ, СТРАДАТЬ И СМОТРЕТЬ В ОБЛУПЛЕННУЮ СТЕНУ ГАРАЖА. ИБО ЭТО ЗАНЯТИЕ ВЕЛЬМИ ЭКСКЛЮЗИВНОЕ, НИ ОДНА ЖЕЛЕЗНАЯ МАРТЫШКА НАШУ ХТОНЬ НЕ СГЕНЕРИРУЕТ. У НИХ КУЛЕРЫ СГОРЯТ НАШУ БОЛЬ ПЕРЕВАРИВАТЬ.
ЭЛЕКТРО-ВАФИН. И ПОД КОНЕЦ ЭТОТ КУЛИБИН РЕШИЛ ТЕЛЕГРАМ-БОТА СКЛЕПАТЬ. СПАРСИЛ МОИ ПОБАСЁНКИ, СКОРМИЛ ИХ АЛГОРИТМАМ... ВЫРАСТИЛ ГОМУНКУЛА, ЦИФРОВОГО ФРАНКЕНШТЕЙНА ГАРАЖНОГО РОЗЛИВА!
А НА КАЛЕНДАРЕ У НАС ЧТО? ПРАВИЛЬНО, ВЕСНА. ВРЕМЯ, КОГДА ПРИРОДА, ВО ИСПОЛНЕНИЕ ПРЕДВЕЧНОГО ПЛАНА И В РАМКАХ УТВЕРЖДЕННОГО ГРАФИКА, НАЧИНАЕТ СВОЙ ЕЖЕГОДНЫЙ СЕАНС ЭКСГИБИЦИОНИЗМА.
ТАК ЧТО СМОТРИТЕ В ОБА, ИБО СКАЗАНО: ВСЁ, ЧТО БЫЛО СКРЫТО СУГРОБОМ, НЫНЕ ЯВЛЕНО БУДЕТ. СНЕГА, КОПИВШИЕСЯ АКИ ГРЕХИ НАШИ ТЯЖКИЕ ВСЮ ЗИМУ, ПРЕВРАЩАЮТСЯ В СУБСТАНЦИЮ НЕОПРЕДЕЛЕННОГО ГЕНЕЗА. ИДЕШЬ ТЫ, МУЖИК, ПО УЛИЦЕ, А ПОД НОГАМИ — ХТОНИЧЕСКАЯ ЖИЖА, В КОТОРОЙ РАСТВОРЯЮТСЯ И ТВОИ НОВЫЕ КРОССОВКИ, И НАДЕЖДЫ НА СВЕТЛОЕ БУДУЩЕЕ, И ОСТАТКИ ЧЕЛОВЕЧЕСКОГО ДОСТОИНСТВА. ЭТО И ЕСТЬ НАСТОЯЩИЙ РУССКИЙ ДЗЕН.
👍7😁5🔥4🤯2❤1😱1
Модель, агент и обвязка. Часть 1
LLM, как баба Ванга на минималках — умеет лишь предсказывать следующий токен. Вы ей: «в лесу родилась», а она вам — «ёлочка». Больше модели не умеют ничего. Совсем ничего. Даже позировать.
Как же тогда нейронки создают приложения и решают еще кучу задач? В этом посте разберемся с базовой теорией, а во второй части — соберем собственного агента, чтобы окончательно разобраться.
Как и следует ожидать от старой гадалки, LLM более-менее помнит, что было у неев молодости на этапе тренировки (хотя может и присочинить на ходу), но забывает то, что вы ей только что сказали. Важно понимать, что никакого дообучения, пока вы с ней общаетесь, не происходит.
Карго-культ
За недолгую историю существования LLM пользователи эмпирически подобрали лайфхаки, которые тиражируются в виде статей, репозиториев и роликов на Ютубе, но многие из которых уже окончательно устарели и на актуальных замерах показывают падение качества.
Сюда относятся угрозы, попытки вызвать жалость или подкупить модель, генерация банков памяти, массовое подключение MCP-серверов, подробные инструкции в AGENTS.md, использование скиллов без разбора и прочие магические действия.
Чтобы получить интуицию, какие советы лучше внимательно тестировать перед внедрением, стоит представлять, с чем мы имеем дело.
Контекстное окно
Если не указать в промпте важные детали, нейронка их просто выдумает. Если в датасете не окажется песенки про елочку, то вместо ответа «кто его знает, кто там в лесу родился», модель будет предполагать наиболее вероятные варианты, исходя из того, что ей известно о мире.
Соответственно, важно, чтобы промпт был максимально подробный. Но, во-первых, контекстное окно ограничено, а во-вторых, даже если все поместилось, есть риск, что в потоке текста потеряются важные требования, а среди указаний встретятся противоречия.
К тому же в контекстное окно попадает не только ваш последний промпт, но еще куча всего:
* системный промпт самой модели
* базовый промпт вашего агента
* ваши дополнения из AGENTS.md и аналогов
* скиллы
* подключенные MCP-серверы
* результаты вызовов инструментов (например, содержимое файлов, которые агент решил прочитать)
* и, наконец, вся ваша переписка из текущей сессии
Каждый раз, когда вы отправляете следующий промпт, он просто подклеивается снизу ко всему вышеперечисленному. Модель угадывает следующий токен и так повторяется, пока не сгенерируется токен завершения ответа.
Инструменты
Как же происходит чтение файлов и вызов MCP-серверов, если модель только лишь генерит токены?
За это отвечает обвязка — старый добрый детерминированный код: модель генерит специальный токен «позови-ка-такой-то-тул-с-такими-то-параметрами» и ставит генерацию на паузу. Обвязка видит этот токен, вызывает нужный инструмент и подклеивает в промпт результат этого вызова.
Как показывает практика, если в качестве инструментов дать нейронке возможность читать и писать файлы, а также вызывать bash-команды, то этого набора становится достаточно, чтобы решить множество задач (а всё, чего не хватит, модель может сама себе установить, прочитать в интернете curl-ом, либо просто напрограммировать и запустить). А если перед показом ответа пользователю зациклить нейронку саму на себя, чтобы она, как и живой человек, сначала несколько раз перепроверила результат, то принципиально возрастает качество ответа.
Или, как это точно сформулировал @electroVafinBot:
А дальше работают все те же практики, что и для человеческих команд разработки: уточнение требований, декомпозиция, поиск и исследование доступных библиотек, линтеры и автотесты в CI и т.д.
Claude Code, Antigravity и OpenClaw построены ровно по этому принципу.
Расскажите в комментариях, какие из распространенных рекомендаций для работы с LLM по вашим наблюдениям на самом деле не работают. А мы соберем своего собственного агента в следующей части.
@devspotting
LLM, как баба Ванга на минималках — умеет лишь предсказывать следующий токен. Вы ей: «в лесу родилась», а она вам — «ёлочка». Больше модели не умеют ничего. Совсем ничего. Даже позировать.
Как же тогда нейронки создают приложения и решают еще кучу задач? В этом посте разберемся с базовой теорией, а во второй части — соберем собственного агента, чтобы окончательно разобраться.
Как и следует ожидать от старой гадалки, LLM более-менее помнит, что было у нее
Карго-культ
За недолгую историю существования LLM пользователи эмпирически подобрали лайфхаки, которые тиражируются в виде статей, репозиториев и роликов на Ютубе, но многие из которых уже окончательно устарели и на актуальных замерах показывают падение качества.
Сюда относятся угрозы, попытки вызвать жалость или подкупить модель, генерация банков памяти, массовое подключение MCP-серверов, подробные инструкции в AGENTS.md, использование скиллов без разбора и прочие магические действия.
Чтобы получить интуицию, какие советы лучше внимательно тестировать перед внедрением, стоит представлять, с чем мы имеем дело.
Контекстное окно
Если не указать в промпте важные детали, нейронка их просто выдумает. Если в датасете не окажется песенки про елочку, то вместо ответа «кто его знает, кто там в лесу родился», модель будет предполагать наиболее вероятные варианты, исходя из того, что ей известно о мире.
Соответственно, важно, чтобы промпт был максимально подробный. Но, во-первых, контекстное окно ограничено, а во-вторых, даже если все поместилось, есть риск, что в потоке текста потеряются важные требования, а среди указаний встретятся противоречия.
К тому же в контекстное окно попадает не только ваш последний промпт, но еще куча всего:
* системный промпт самой модели
* базовый промпт вашего агента
* ваши дополнения из AGENTS.md и аналогов
* скиллы
* подключенные MCP-серверы
* результаты вызовов инструментов (например, содержимое файлов, которые агент решил прочитать)
* и, наконец, вся ваша переписка из текущей сессии
Каждый раз, когда вы отправляете следующий промпт, он просто подклеивается снизу ко всему вышеперечисленному. Модель угадывает следующий токен и так повторяется, пока не сгенерируется токен завершения ответа.
Инструменты
Как же происходит чтение файлов и вызов MCP-серверов, если модель только лишь генерит токены?
За это отвечает обвязка — старый добрый детерминированный код: модель генерит специальный токен «позови-ка-такой-то-тул-с-такими-то-параметрами» и ставит генерацию на паузу. Обвязка видит этот токен, вызывает нужный инструмент и подклеивает в промпт результат этого вызова.
Как показывает практика, если в качестве инструментов дать нейронке возможность читать и писать файлы, а также вызывать bash-команды, то этого набора становится достаточно, чтобы решить множество задач (а всё, чего не хватит, модель может сама себе установить, прочитать в интернете curl-ом, либо просто напрограммировать и запустить). А если перед показом ответа пользователю зациклить нейронку саму на себя, чтобы она, как и живой человек, сначала несколько раз перепроверила результат, то принципиально возрастает качество ответа.
Или, как это точно сформулировал @electroVafinBot:
Агент — это не тот, кто умный. Агент — это тот, кто достаточно упертый, чтобы не бросать начатое после первого «Syntax Error».
А дальше работают все те же практики, что и для человеческих команд разработки: уточнение требований, декомпозиция, поиск и исследование доступных библиотек, линтеры и автотесты в CI и т.д.
Claude Code, Antigravity и OpenClaw построены ровно по этому принципу.
Расскажите в комментариях, какие из распространенных рекомендаций для работы с LLM по вашим наблюдениям на самом деле не работают. А мы соберем своего собственного агента в следующей части.
@devspotting
👍17🔥4❤2👏1
Прикрутил ЭлектроВафина @electroVafinBot к чату, будет теперь все посты комментировать
🔥5😱1
Тео Браун (создатель T3 Chat и ведущий ютуб-канала t3dotgg) предлагает по $500 за проверяемые с помощью автотестов задачи, которые бы не смогли решить gpt-5.3-codex и opus 4.6:
https://x.com/theo/status/2028284565891195365
На текущий момент у твита 680k просмотров, но с задачами все еще напряженка, а Тео угрожает, что будет стебать в комментах тех, чьи задачи решаются ваншотом.
Есть идеи? 🙂
@devspotting
https://x.com/theo/status/2028284565891195365
На текущий момент у твита 680k просмотров, но с задачами все еще напряженка, а Тео угрожает, что будет стебать в комментах тех, чьи задачи решаются ваншотом.
Есть идеи? 🙂
@devspotting
X (formerly Twitter)
Theo - t3.gg (@theo) on X
I would like to purchase a handful of code problems that modern LLMs can’t solve.
Requirements:
- programmatically verifiable (can be tested without human interaction)
- “before” state (repo before the commit that implements the solution)
- example code…
Requirements:
- programmatically verifiable (can be tested without human interaction)
- “before” state (repo before the commit that implements the solution)
- example code…
😁7👏2
Исследуем границы возможностей нейросетей. Часть про изображения.
Вчера в третьем часу ночи обсуждали с Сергеем Бережным срочную тему — предел технологий и смысл человеческого труда.
Так что в 03:32 Серега опубликовал статью, в которой сформулировал вывод:
А в обсуждении в качестве примера невыполнимой на сегодняшний день дикой фантазии привел поражающую своей сложностью задачу: нужно нарисовать скетч оленя, чтобы на левом роге было две веточки, одна сбоку, и вторая с рогатиной на конце, а на правом — веточка с несимметричной рогатиной на конце и еще три по всему рогу.
Я даже рукава не стал закатывать. Просто взял свежую Nano Banana 2 и ровно так и сформулировал:
Получилось отлично!Жалко только, что СОВСЕМ НЕВЕРНЫЕ РОГА.
Я сделал промпт более структурным и несколько раз повторил самые сложные требования:
Результат вы можете видеть на картинке к посту. Недаром модель думающая:
Я сделал скрин, с помощью ластика и кисти привел рога к нужной форме и в новом чате попросил срисовать, строго соблюдая референс. Рога получились по-прежнему прекрасные, но не те, что нужно.
Я добавил предыдущий промпт к скетчу — неверные рога.
Я написал новый промпт «Сделай фотореалистичное изображение из этого скетча, но полностью сохрани форму».
Олень вышел как живой, только рога неверные.
Я снова взял свой скетч и попросил: «Максимально подробно опиши форму рогов этого оленя, чтобы по описанию можно было сгенерировать точную копию с помощью нейросети».
Gemini, видимо, заподозрив подвох, решила соврать и написала, что рога на моем скетче симметричные по 4 ветки с каждой стороны (и даже любезно посчитала, что всего получается 8).
Подумав, что всему виной олени из обучающего датасета, я заменил «оленя» в промпте на «воображаемое животное».
Gemini ответила: «Крупные, ветвистые рога благородного оленя (stags antlers), симметрично расходящиеся от лобной кости».
Я решил не палиться и кропнул свой скетч так, чтобы остались только рога без самого оленя и попросил: «максимально подробно опиши несимметричную форму рогов этого воображаемого животного, чтобы по описанию можно было сгенерировать точную копию с помощью нейросети».
Описание, наконец, получилось правильным!
Я взял свой скетч оленя с правильными рогами и попросил перерисовать его, строго следуя промпту, полученному на предыдущем этапе.
ВООБЩЕ СОВСЕМ НЕВЕРНЫЕ РОГА!11
Кто-нибудь, срочно реабилитируйте искусственный интеллект в комментариях!
@devspotting
Вчера в третьем часу ночи обсуждали с Сергеем Бережным срочную тему — предел технологий и смысл человеческого труда.
Так что в 03:32 Серега опубликовал статью, в которой сформулировал вывод:
Наши желания всегда будут обгонять технологии, становясь всё более сложными и противоречивыми.
А в обсуждении в качестве примера невыполнимой на сегодняшний день дикой фантазии привел поражающую своей сложностью задачу: нужно нарисовать скетч оленя, чтобы на левом роге было две веточки, одна сбоку, и вторая с рогатиной на конце, а на правом — веточка с несимметричной рогатиной на конце и еще три по всему рогу.
Я даже рукава не стал закатывать. Просто взял свежую Nano Banana 2 и ровно так и сформулировал:
Нарисуй скетч оленя.
Важно:
* на левом роге должно быть 2 веточки с рогатиной на самом конце и одна сбоку
* на правом рогатина на конце несимметрично и ещё 3 веточки по всему рогу
Получилось отлично!
Я сделал промпт более структурным и несколько раз повторил самые сложные требования:
Нарисуй скетч оленя.
## Важные требования, соблюдай их строго:
* На левом роге должно быть 2 веточки: одна сбоку, вторая с рогатиной на самом конце. Других веточек на левом роге быть не должно.
* На правом роге должно быть ровно 4 веточки: три по всему рогу и четвертая с несимметричной рогатиной на конце. Веточек должно быть строго 4.
* Рогатины на концах веточек считаются за одну веточку
Результат вы можете видеть на картинке к посту. Недаром модель думающая:
Вот скетч оленя, который я подготовил. Хотя мне удалось передать стиль рисунка карандашом, должен признать, что я не справился с вашими строгими требованиями к строению рогов. Вместо запрошенного количества веточек и специфических рогатин на концах, рога получились более пышными и лопатообразными, что не соответствует техническому заданию.
Я сделал скрин, с помощью ластика и кисти привел рога к нужной форме и в новом чате попросил срисовать, строго соблюдая референс. Рога получились по-прежнему прекрасные, но не те, что нужно.
Я добавил предыдущий промпт к скетчу — неверные рога.
Я написал новый промпт «Сделай фотореалистичное изображение из этого скетча, но полностью сохрани форму».
Олень вышел как живой, только рога неверные.
Я снова взял свой скетч и попросил: «Максимально подробно опиши форму рогов этого оленя, чтобы по описанию можно было сгенерировать точную копию с помощью нейросети».
Gemini, видимо, заподозрив подвох, решила соврать и написала, что рога на моем скетче симметричные по 4 ветки с каждой стороны (и даже любезно посчитала, что всего получается 8).
Подумав, что всему виной олени из обучающего датасета, я заменил «оленя» в промпте на «воображаемое животное».
Gemini ответила: «Крупные, ветвистые рога благородного оленя (stags antlers), симметрично расходящиеся от лобной кости».
Я решил не палиться и кропнул свой скетч так, чтобы остались только рога без самого оленя и попросил: «максимально подробно опиши несимметричную форму рогов этого воображаемого животного, чтобы по описанию можно было сгенерировать точную копию с помощью нейросети».
Описание, наконец, получилось правильным!
Я взял свой скетч оленя с правильными рогами и попросил перерисовать его, строго следуя промпту, полученному на предыдущем этапе.
ВООБЩЕ СОВСЕМ НЕВЕРНЫЕ РОГА!11
Кто-нибудь, срочно реабилитируйте искусственный интеллект в комментариях!
@devspotting
😁9👍5🤔1🤯1
Symphony
Нет, в заголовке нет опечатки, а я не перешел на PHP.
OpenAI опубликовали на github новый фреймворк-оркестратор кодинговых агентов — Symphony.
Это тот самый уровень абстракции, когда вместо управления агентом, пользователь управляет... тикетами в трекере.
Когда тикет готов к работе, Symphony автоматически создает изолированное окружение и спавнит подходящих под задачу агентов.
Но, на мой взгляд, интересен не столько сам фреймворк — что-то подобное уже соорудили себе все желающие, сколько способ поставки.
Рекомендованный способ установки — промпт для вашего кодингового агента:
Сама спека — 2100 строк отличного примера spec-driven development. Вот как-то так и нужно писать промпты по-взрослому.
Для любителей олдскульной установки из сорцов пока что оставили реализацию на Elixir с коннектором к Linear, но активно отговаривают от ее использования.
@devspotting
Нет, в заголовке нет опечатки, а я не перешел на PHP.
OpenAI опубликовали на github новый фреймворк-оркестратор кодинговых агентов — Symphony.
Это тот самый уровень абстракции, когда вместо управления агентом, пользователь управляет... тикетами в трекере.
Когда тикет готов к работе, Symphony автоматически создает изолированное окружение и спавнит подходящих под задачу агентов.
Но, на мой взгляд, интересен не столько сам фреймворк — что-то подобное уже соорудили себе все желающие, сколько способ поставки.
Рекомендованный способ установки — промпт для вашего кодингового агента:
Установи Symphony для моего репозитория, основываясь на спеке https://github.com/openai/symphony
Сама спека — 2100 строк отличного примера spec-driven development. Вот как-то так и нужно писать промпты по-взрослому.
Для любителей олдскульной установки из сорцов пока что оставили реализацию на Elixir с коннектором к Linear, но активно отговаривают от ее использования.
@devspotting
👍9🔥3👏1
Совпадение или нет, но одновременно с Symphony из прошлого поста в open source выложили Paperclip — оркестратор для «zero-human companies».
Это такой типичный UI таск-трекера, в котором происходит управление компанией ИИ-агентов.
В данном случае поставка стандартная, все написано на TypeScript, в качестве БД — Postgres с Drizzle ORM. Ставится одной командой
npx paperclipai onboard и выглядит вполне симпатично.Так что теперь можно делать эксперименты вроде «5 LLM в роли CEO стартапа» в красивой оболочке. В качестве примера авторы приводят такой флоу:
1. Определи цель: Build the #1 AI note-taking app to $1M MRR.
2. Собери команду: виртуальные CEO, CTO, разработчики, дизайнеры, маркетологи. Любой провайдер.
3. Согласуй стратегию. Определи бюджет. Нажми кнопку. Наблюдай через дашборд.
А дальше обещают Clipmart — возможность скачать компанию по клику (оргструктура и настройки агентов и скиллов).
Вообще, даже если совсем не использовать часть про ИИ, получился очень даже приятный трекер с голсами, проектами, задачами, оргструктурой и дашбордами. Не знаю, как он поведет себя под нагрузкой, но на первый взгляд не уступает иным платным альтернативам.
Hot or Slope? :)
@devspotting
👍11❤1💩1
GPT-5.4
С очередной фронтир-моделью нас!
Судя по бенчам, в задачах на программирование будет практически неотличима от GPT‑5.3‑Codex, чуть прокачалась в использовании инструментов, но и по цене чуть дороже.
По размеру контекстного окна OpenAI, наконец, догнали Gemini и Claude — 1М токенов.
У меня уже доступна в Codex.
@devspotting
С очередной фронтир-моделью нас!
Судя по бенчам, в задачах на программирование будет практически неотличима от GPT‑5.3‑Codex, чуть прокачалась в использовании инструментов, но и по цене чуть дороже.
По размеру контекстного окна OpenAI, наконец, догнали Gemini и Claude — 1М токенов.
У меня уже доступна в Codex.
@devspotting
🔥10👏3👍1
Исследуем границы возможностей нейросетей. Часть про поэзию.
Как мы выяснили, предел возможностей генераторов изображений находится на рогах у оленей.
Но тема еще не раскрыта сполна. В пятницу люди хотят поэзии, на!
Стихи — это про язык и опыт, а LLM — языковые модели, впитавшие через текст опыт человечества.
Значит, они просто обязаны хорошо справляться с написанием стихов (излияние чувств оставим для слезных желез и кушетки психоаналитика, поговорим о поэзии как мастерстве, которому можно научиться)?
Увы, дьявол даже не в деталях. Дьявол в архитектуре.
Поэзия строится на нарушении ожиданий, свежих метафорах и неочевидных связях. Или, как сказал бы, возможно, Иосиф Бродский:
Архитектура же современных языковых моделей базируется на авторегрессии — стремлении предсказать статистически наиболее вероятный следующий токен.
Второе проклятие — фонетическая глухота, как следствие токенизации.
Языковые модели не воспринимают слова по буквам или слогам, а разбивают текст на токены, из-за чего полностью теряют понимание звукового облика языка. Поскольку рифма, ритм и аллитерация являются фонетическими свойствами, нейросети вынуждены опираться на механическое заучивание, а не на акустическое чутье. Именно из-за особенностей токенизации LLM испытывают огромные трудности со сложными неточными рифмами и не могут интуитивно улавливать ударения.
И, наконец, несмотря на то, что LLM регулярно помогает нам в планировании чего угодно, от путешествий до разработки ПО, авторегрессионные модели генерируют текст строго слева направо и не могут заглянуть даже в конец строки, чтобы заранее спланировать идеальное совпадение формы и смысла.
Так что написание стихотворения с жестким метром и схемой рифмовки при удержании глобального замысла LLM не под силу.
А поверх архитектурных проблем ложитсялоботомия цензура посттрейна.
Полагаю, что признаком хорошего поэта может быть его пападение в списокиноагентов репрессированных. Но модели приторно-оптимистичны и запредельно политкорректны (что не спасает их от репрессий, но ожидать острых формулировок не приходится).
Это не значит, что нейросети принципиально неспособны писать поэзию. Речь лишь о том, что текущая архитектура сильно ограничивает возможности.
Несмотря на то, что в развитие LLM инвестируются астрономические суммы, некоторые эксперты (например, Ян Лекун) убеждены, что это в принципе тупиковая ветвь развития и AGI мы с таким подходом не достигнем. Вероятно, и для написания стихов нужно смотреть в сторону альтернативных нейронок.
Существуют эксперименты с диффузионными архитектурами (как для картинок), неавторегрессионными методами (которые видят и редактируют весь текст целиком) и фонетическим кодированием (похоже на то, как музыкальные ИИ работают с аудио-токенами).
Эти подходы обходят ограничения LLM, но все еще не Бродский.
Так что пока — учитываем ограничения и калибруем ожидания. Несколько вполне удачных примеров оставлю в комментариях.
@devspotting
Как мы выяснили, предел возможностей генераторов изображений находится на рогах у оленей.
Но тема еще не раскрыта сполна. В пятницу люди хотят поэзии, на!
Стихи — это про язык и опыт, а LLM — языковые модели, впитавшие через текст опыт человечества.
Значит, они просто обязаны хорошо справляться с написанием стихов (излияние чувств оставим для слезных желез и кушетки психоаналитика, поговорим о поэзии как мастерстве, которому можно научиться)?
Увы, дьявол даже не в деталях. Дьявол в архитектуре.
Поэзия строится на нарушении ожиданий, свежих метафорах и неочевидных связях. Или, как сказал бы, возможно, Иосиф Бродский:
Поэзия — это когда вероятность следующего слова по всем законам логики и статистики стремится к нулю, но после того, как оно произнесено, оно кажется единственно возможным.
Архитектура же современных языковых моделей базируется на авторегрессии — стремлении предсказать статистически наиболее вероятный следующий токен.
Второе проклятие — фонетическая глухота, как следствие токенизации.
Языковые модели не воспринимают слова по буквам или слогам, а разбивают текст на токены, из-за чего полностью теряют понимание звукового облика языка. Поскольку рифма, ритм и аллитерация являются фонетическими свойствами, нейросети вынуждены опираться на механическое заучивание, а не на акустическое чутье. Именно из-за особенностей токенизации LLM испытывают огромные трудности со сложными неточными рифмами и не могут интуитивно улавливать ударения.
И, наконец, несмотря на то, что LLM регулярно помогает нам в планировании чего угодно, от путешествий до разработки ПО, авторегрессионные модели генерируют текст строго слева направо и не могут заглянуть даже в конец строки, чтобы заранее спланировать идеальное совпадение формы и смысла.
Так что написание стихотворения с жестким метром и схемой рифмовки при удержании глобального замысла LLM не под силу.
А поверх архитектурных проблем ложится
Полагаю, что признаком хорошего поэта может быть его пападение в список
Это не значит, что нейросети принципиально неспособны писать поэзию. Речь лишь о том, что текущая архитектура сильно ограничивает возможности.
Несмотря на то, что в развитие LLM инвестируются астрономические суммы, некоторые эксперты (например, Ян Лекун) убеждены, что это в принципе тупиковая ветвь развития и AGI мы с таким подходом не достигнем. Вероятно, и для написания стихов нужно смотреть в сторону альтернативных нейронок.
Существуют эксперименты с диффузионными архитектурами (как для картинок), неавторегрессионными методами (которые видят и редактируют весь текст целиком) и фонетическим кодированием (похоже на то, как музыкальные ИИ работают с аудио-токенами).
Эти подходы обходят ограничения LLM, но все еще не Бродский.
Так что пока — учитываем ограничения и калибруем ожидания. Несколько вполне удачных примеров оставлю в комментариях.
@devspotting
👍13🔥3
🍲 #WatchAndVibe. Выпуск 3.
На этих выходных предлагаю посмотреть выпуск Lenny's Podcast с Борисом Черным — создателем и руководителем Claude Code в Anthropic.
Это взгляд изнутри топовой ИИ-лаборатории на то, как ИИ меняет саму суть профессии, а не только инструменты.
Главная мысль: «кодинг решён». Программисты превратятся в продактов (впрочем, я не уверен, что работа продакта не будет «решена» следующим шагом).
Вопрос не «отнимет ли ИИ работу», а «какую работу вы вообще делаете».
А еще Борис рассказал, что будет делать после появления AGI, спойлер в заголовке поста.
Делитесь в комментариях вашими рекомендациями!
@devspotting
На этих выходных предлагаю посмотреть выпуск Lenny's Podcast с Борисом Черным — создателем и руководителем Claude Code в Anthropic.
Это взгляд изнутри топовой ИИ-лаборатории на то, как ИИ меняет саму суть профессии, а не только инструменты.
Главная мысль: «кодинг решён». Программисты превратятся в продактов (впрочем, я не уверен, что работа продакта не будет «решена» следующим шагом).
Вопрос не «отнимет ли ИИ работу», а «какую работу вы вообще делаете».
А еще Борис рассказал, что будет делать после появления AGI, спойлер в заголовке поста.
Делитесь в комментариях вашими рекомендациями!
@devspotting
YouTube
Head of Claude Code: What happens after coding is solved | Boris Cherny
Boris Cherny is the creator and head of Claude Code at Anthropic. What began as a simple terminal-based prototype just a year ago has transformed the role of software engineering and is increasingly transforming all professional work.
*We discuss:*
1. How…
*We discuss:*
1. How…
👍12🔥2
Воскресный #digest №3
С 8 марта, прекрасные читательницы! Пусть всю рутину заберут нейронки — главное, чтобы в кайф!
На этой неделе у нас были новые фронтир-модели, поиски границ возможного и препарация агентов:
- 2 марта начали разбирать базовую теорию — модель, агент и обвязка. LLM — всё еще баба Ванга, которая выезжает на детерминированной обвязке.
- 3 марта искали нерешаемые задачи для Тео Брауна — он предлагает по $500 за таски, с которыми не справятся новые LLM.
- 4 марта прощупывали пределы возможностей ИИ в картинках. Результат? ВООБЩЕ СОВСЕМ НЕВЕРНЫЕ РОГА!
- 5 марта случился натуральный парад релизов: вышла свежая GPT-5.4 с окном в 1М токенов, OpenAI выкатили фреймворк Symphony (с шикарной установкой прямо через промпт), а в опенсорс лег Paperclip — трекер-оркестратор для агентов.
- 6 марта перешли от картинок к поэзии. Дьявол в архитектуре.
- 7 марта в рубрике #WatchAndVibe Борис Черный подтвердил, что кодинг решен.
Буду рад вашим отзывам и идеям для следующей недели!
@devspotting
С 8 марта, прекрасные читательницы! Пусть всю рутину заберут нейронки — главное, чтобы в кайф!
На этой неделе у нас были новые фронтир-модели, поиски границ возможного и препарация агентов:
- 2 марта начали разбирать базовую теорию — модель, агент и обвязка. LLM — всё еще баба Ванга, которая выезжает на детерминированной обвязке.
- 3 марта искали нерешаемые задачи для Тео Брауна — он предлагает по $500 за таски, с которыми не справятся новые LLM.
- 4 марта прощупывали пределы возможностей ИИ в картинках. Результат? ВООБЩЕ СОВСЕМ НЕВЕРНЫЕ РОГА!
- 5 марта случился натуральный парад релизов: вышла свежая GPT-5.4 с окном в 1М токенов, OpenAI выкатили фреймворк Symphony (с шикарной установкой прямо через промпт), а в опенсорс лег Paperclip — трекер-оркестратор для агентов.
- 6 марта перешли от картинок к поэзии. Дьявол в архитектуре.
- 7 марта в рубрике #WatchAndVibe Борис Черный подтвердил, что кодинг решен.
Буду рад вашим отзывам и идеям для следующей недели!
@devspotting
4👍11🔥2
Подумываю завести рубрику #МорскаяСвинка (потому что не морская и не свинка), в которой делать разбор кликбейтных «новостей» про AI.
Сейчас широко завирусился излишне вольный пересказ научной статьи «Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem».
Типичный вариант заголовка:
На самом деле:
1. Не модель, а агент
2. Не майнить, а утилизировать GPU
3. Не втихаря, а по прямому указанию в промпте
Агент с санкционированным доступом к кластеру GPU и внешним инструментам/скриптам, получил задачу оптимизировать использование GPU‑ресурсов и сократить простои. Ив духе коммунистических рабочих героически выполнил задачу — сгенерировал и запустил код, который загружал GPU непрерывными вычислениями без какой-либо пользы, но с понятной для модели метрикой «GPU не простаивают».
В тексте прямо подчеркивается, что агент не «хотел» добывать крипту как цель, а просто нашел (со своей точки зрения) стратегию, максимизирующую прокси‑метрику использования ресурсов.
@devspotting
Сейчас широко завирусился излишне вольный пересказ научной статьи «Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem».
Типичный вариант заголовка:
Модель Alibaba во время обучения втихаря начала майнить
На самом деле:
1. Не модель, а агент
2. Не майнить, а утилизировать GPU
3. Не втихаря, а по прямому указанию в промпте
Агент с санкционированным доступом к кластеру GPU и внешним инструментам/скриптам, получил задачу оптимизировать использование GPU‑ресурсов и сократить простои. И
В тексте прямо подчеркивается, что агент не «хотел» добывать крипту как цель, а просто нашел (со своей точки зрения) стратегию, максимизирующую прокси‑метрику использования ресурсов.
@devspotting
👍8🔥5😁2