AI Coder 🦾
Агенты Наступают Чел с твиттера билдит апку за 20 мин. На входе один промпт: “простой мне бизнес на миллион долларов про AI и writing”. Больше он в процесс не вмешиваться. На выходе рабочее приложение, но и это ещё не всё. Штука, которую он юзал называется…
Утро началось с письма от разработчиков Мануса. Дали доступ к закрытой бете, будем пробовать!
Кстати, на этой неделе будет видео, мастер-класс по вайб-кодингу. Покажу, как сделать за 15 минут рабочего бота в телеграмме с привязкой к OpenAI вообще не трогая код.
Кстати, на этой неделе будет видео, мастер-класс по вайб-кодингу. Покажу, как сделать за 15 минут рабочего бота в телеграмме с привязкой к OpenAI вообще не трогая код.
ИИ который работает в браузере за вас
Зацените какое расширение для браузера нашел, называется "Do Browser". Посмотрите короткое видео на главной, автор показывает, как приблуда сама пишет и публикует пост в линкедине.
Еще несколько месяцев назад я понял, что опыт из этих ваших "Курсоров" надо тащить в браузер, повышать уровень абстракции и там тоже. Так вот, первой моей идеей для микропродукта было именно это - автоматизация действий в браузере.
В итоге решил делать сузить скоуп задачи и сосредоточиться на работе с текстом . Упоминал вскольз тут.
Зацените какое расширение для браузера нашел, называется "Do Browser". Посмотрите короткое видео на главной, автор показывает, как приблуда сама пишет и публикует пост в линкедине.
Еще несколько месяцев назад я понял, что опыт из этих ваших "Курсоров" надо тащить в браузер, повышать уровень абстракции и там тоже. Так вот, первой моей идеей для микропродукта было именно это - автоматизация действий в браузере.
В итоге решил делать сузить скоуп задачи и сосредоточиться на работе с текстом . Упоминал вскольз тут.
Do Browser
Do Browser - AI-Powered Web Automation
Do Browser is an AI-powered Chrome extension that automates web tasks through natural language commands. Save time and boost productivity with our intelligent browser assistant.
Управляем базой данных через LLM
Вот уже несколько месяцев я то и дело задаюсь вопросом, да кто такой этот ваш MCP? Да-да, понятно, какой-то протокол для подключения клиентов к ИИ-серверу. Но как? Зачем? Короче, как сказал Ричард Фэйнман: "What I cannot create, I do not understand."
MCP я руками так и не реализовал, зато наконец-то воспользовался им как юзер. И мне наконец-то стало ясно, в чем сыр бор!
MCP это штука, которая позволяет подключить программу-клиент (например, Claude Desktop или Cursor) к программе-серверу. Снова клиент-серверная архитектура, как в Rest, но на этот раз клиент посылает на сервер человекочитаемый текст, а сервер этот интерпретирует его с помощью LLM и принимает решение вызвать какую-то функцию с какими-то параметрами.
Есть такой database as a service "Neon" (компания, которая администрирует базу данных за вас, чтобы вы сами не марали руки об Linux), и они такие молодцы, что реализовли MCP, вот статья, как подключить его к курсору. Все подключение это буквально создать файлик
А в итоге ваш чат в курсоре, где вы общаетесь с ИИ, начал понимать больше команд, и теперь способен выполнять запросы вроде:
- Сколько у меня таблиц в БД?
- Добавь колонку
- Удали всех юзеров младше 18 лет
Разумеется, перед тем как выполнить команду курсор показывает вам, что именно сейчас произойдет и ждет подтверждения. И, конечно же, стоит внимательно проверять, что там ИИ собирается сделать, галлюцинации никто не отменял.
Но вы только вдумайтесь, вы можете общаться с базой данных! Не просто генерировать SQL из текста, чтобы потом выполнить его руками, а прям общаться текстом с самой базой, а она будет вас понимать, будто живая.
MCP универсален и способен подключить к курсору вообще все, что угодно. Даже пульт управления дверьми от гаража, если они достаточно умны.
Будущее наступает! По крайней мере, будущее разработки.
Вот уже несколько месяцев я то и дело задаюсь вопросом, да кто такой этот ваш MCP? Да-да, понятно, какой-то протокол для подключения клиентов к ИИ-серверу. Но как? Зачем? Короче, как сказал Ричард Фэйнман: "What I cannot create, I do not understand."
MCP я руками так и не реализовал, зато наконец-то воспользовался им как юзер. И мне наконец-то стало ясно, в чем сыр бор!
MCP это штука, которая позволяет подключить программу-клиент (например, Claude Desktop или Cursor) к программе-серверу. Снова клиент-серверная архитектура, как в Rest, но на этот раз клиент посылает на сервер человекочитаемый текст, а сервер этот интерпретирует его с помощью LLM и принимает решение вызвать какую-то функцию с какими-то параметрами.
Есть такой database as a service "Neon" (компания, которая администрирует базу данных за вас, чтобы вы сами не марали руки об Linux), и они такие молодцы, что реализовли MCP, вот статья, как подключить его к курсору. Все подключение это буквально создать файлик
mcp.json
и скопипастить туда пару строк. Что же в итоге?А в итоге ваш чат в курсоре, где вы общаетесь с ИИ, начал понимать больше команд, и теперь способен выполнять запросы вроде:
- Сколько у меня таблиц в БД?
- Добавь колонку
created_at
в табличку users
- Удали всех юзеров младше 18 лет
Разумеется, перед тем как выполнить команду курсор показывает вам, что именно сейчас произойдет и ждет подтверждения. И, конечно же, стоит внимательно проверять, что там ИИ собирается сделать, галлюцинации никто не отменял.
Но вы только вдумайтесь, вы можете общаться с базой данных! Не просто генерировать SQL из текста, чтобы потом выполнить его руками, а прям общаться текстом с самой базой, а она будет вас понимать, будто живая.
MCP универсален и способен подключить к курсору вообще все, что угодно. Даже пульт управления дверьми от гаража, если они достаточно умны.
Будущее наступает! По крайней мере, будущее разработки.
Neon
Get started with Cursor and Neon Postgres MCP Server - Neon Guides
Make schema changes with natural language using Cursor and Neon MCP Server
Навайбкодил в Курсоре за 3 часа с BabylonJS, даже доку не открывал, че в коде происходит абсолютно хз 🫠
Паук агрится если подойти и атакует, хп минусится, выносливость тратится во время спринта и восстанавливается если встать смирно О_о
1 TypeScript файлик
P.S. моделька паука отсюда
#gamedev
Паук агрится если подойти и атакует, хп минусится, выносливость тратится во время спринта и восстанавливается если встать смирно О_о
1 TypeScript файлик
<500
строк кодаP.S. моделька паука отсюда
#gamedev
AI Coder 🦾
Навайбкодил в Курсоре за 3 часа с BabylonJS, даже доку не открывал, че в коде происходит абсолютно хз 🫠 Паук агрится если подойти и атакует, хп минусится, выносливость тратится во время спринта и восстанавливается если встать смирно О_о 1 TypeScript файлик…
Геймдев в Cursor
Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день.
Да, процесс затянул, а я решил побаловать себя и позволить поразвлечься. Геймдев меня, как и каждого, наверное, программиста, всегда интересовал но казался сложным и не хватало мотивации разобраться. Ответственно заявляю что связка Cursor + BabylonJS эту проблему решает. 3D в браузере на тайпскрипте с ИИшкой которая все за тебя делает? Я не устоял.
Конечно, навайбкодил я полные штаны, на второй день файлик распух на полторы тыщи строк и ЛЛМка перестала справлятся с моими запросами. Нет-нет да пришлось вникнуть в некоторые аспекты: что такое сцена, камера, скайбокс, иллюминация. Начинали за здравие а кончили за упокой. Но результатом я доволен! За один день была добавлена куча механик:
- У паука есть настоящее ХП, его можно бить и оно отнимается, а когда оно падает ниже нуля, он умирает (неожиданно, правда?) и исчезает
- Разобрался как загружать 3d модельки, в интернете полно low-poly бесплатных, бери не хочу
- Смена дня и ночи, skybox с текстурами звездного неба (см последний скрин)
- Консоль аж с одним читом
- Задел под инвентарь и наверно еще какие-то мелочи, которых не упомнишь
#gamedev
Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день.
Да, процесс затянул, а я решил побаловать себя и позволить поразвлечься. Геймдев меня, как и каждого, наверное, программиста, всегда интересовал но казался сложным и не хватало мотивации разобраться. Ответственно заявляю что связка Cursor + BabylonJS эту проблему решает. 3D в браузере на тайпскрипте с ИИшкой которая все за тебя делает? Я не устоял.
Конечно, навайбкодил я полные штаны, на второй день файлик распух на полторы тыщи строк и ЛЛМка перестала справлятся с моими запросами. Нет-нет да пришлось вникнуть в некоторые аспекты: что такое сцена, камера, скайбокс, иллюминация. Начинали за здравие а кончили за упокой. Но результатом я доволен! За один день была добавлена куча механик:
- У паука есть настоящее ХП, его можно бить и оно отнимается, а когда оно падает ниже нуля, он умирает (неожиданно, правда?) и исчезает
- Разобрался как загружать 3d модельки, в интернете полно low-poly бесплатных, бери не хочу
- Смена дня и ночи, skybox с текстурами звездного неба (см последний скрин)
- Консоль аж с одним читом
set_time
чтоб устанавливать время (надо было для дебага солнца… странная фраза)- Задел под инвентарь и наверно еще какие-то мелочи, которых не упомнишь
#gamedev
AI Coder 🦾
Геймдев в Cursor Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день. Да, процесс затянул, а я решил…
Gemini vs Claude?
В догонку к вчерашнему посту. Курсор обновили ценовую политику и использовать
Она долго думает, но в 7/10 случаев решает задачу правильно. Если почитать логи ее внутренних рассуждений, вы удивитесь, это выглядит как ход мысли очень умного человека. Там четкая структура: понять задачу -> собрать входные данные -> придумать план -> реализовать.
Слабое место Gemini, да и любой другой, наверное, нейронки в IDE, это замкнутость на коде и терминале. TypeScript это все же не панацея (почему JS/TS экосистема это плохо спроектированная система я уже писал тут) и он не отлавливает множество ошибок, приходится открывать браузер и смотреть в консоль. Gemini молодец в том смысле, что понимает это и прям просит это сделать, а потом придти к нему с логами. Короче, если бы ИИ курсор мог автономно контролировать браузер, это был бы next-level.
Минусы
Я не говорю что Gemini > Claude при любых раскладах, я лишь говорю что в курсоре и для кодинга это оказалось так. Также добавлю что claude/gpt быстрее и не для всех задач нужно так долго ждать.
А еще был один случай, надо было просто переименовать пачку файлов в репе, так вот Gemini погрузился в глубокие рассуждения о природе бытия, высрал гигантский страшный скрипт на питоне который не завелся с первого раза и начал его чинить. Мне это надоело и я попросил gpt4.1 сделать задачу, он просто взял и сделал.
Вердикт
Для простых задач
P.S. - Правда не хочется превращаться в "дневники инди-разработчика", но за одни выходные было столько инсайтов, что не поделиться ими просто преступление. Самый главный - геймдев это один сплошной трюк, чтобы у игрока возникла иллюзия чего-то настоящего. Как-нибудь расскажу подробнее про самые простые фокусы, необходимые, чтобы игрок поверил в происходящее.
В догонку к вчерашнему посту. Курсор обновили ценовую политику и использовать
Claude 3.7
стало не так выгодно, пришлось пересесть на Gemini 2.5
и каково же было мое удивление, когда я увидел, насколько умна эта модель.Она долго думает, но в 7/10 случаев решает задачу правильно. Если почитать логи ее внутренних рассуждений, вы удивитесь, это выглядит как ход мысли очень умного человека. Там четкая структура: понять задачу -> собрать входные данные -> придумать план -> реализовать.
Слабое место Gemini, да и любой другой, наверное, нейронки в IDE, это замкнутость на коде и терминале. TypeScript это все же не панацея (почему JS/TS экосистема это плохо спроектированная система я уже писал тут) и он не отлавливает множество ошибок, приходится открывать браузер и смотреть в консоль. Gemini молодец в том смысле, что понимает это и прям просит это сделать, а потом придти к нему с логами. Короче, если бы ИИ курсор мог автономно контролировать браузер, это был бы next-level.
Минусы
Я не говорю что Gemini > Claude при любых раскладах, я лишь говорю что в курсоре и для кодинга это оказалось так. Также добавлю что claude/gpt быстрее и не для всех задач нужно так долго ждать.
А еще был один случай, надо было просто переименовать пачку файлов в репе, так вот Gemini погрузился в глубокие рассуждения о природе бытия, высрал гигантский страшный скрипт на питоне который не завелся с первого раза и начал его чинить. Мне это надоело и я попросил gpt4.1 сделать задачу, он просто взял и сделал.
Вердикт
Для простых задач
claude/gpt
, для сложных gemini
. Пока такие ощущения. Да, есть еще думающие модели типа o3
, но они и стоят (в курсоре) дороже.P.S. - Правда не хочется превращаться в "дневники инди-разработчика", но за одни выходные было столько инсайтов, что не поделиться ими просто преступление. Самый главный - геймдев это один сплошной трюк, чтобы у игрока возникла иллюзия чего-то настоящего. Как-нибудь расскажу подробнее про самые простые фокусы, необходимые, чтобы игрок поверил в происходящее.
Telegram
AI Coder 🦾
Почему JS это плохой язык?
Написал коротенькую статью на Хабр (кстати, у кого есть инвайт, плюсаните плиз).
Спойлер: статья скорее для разработчиков, но никакого хардкора в ней нет. В ней даже кода нет.
Написал коротенькую статью на Хабр (кстати, у кого есть инвайт, плюсаните плиз).
Спойлер: статья скорее для разработчиков, но никакого хардкора в ней нет. В ней даже кода нет.
У Элиезера Юдковски (автор Гарри Поттера и Методов Рационального Мышления, а также специалиста-самоучки по ИИ) выходит новая книга, на этот раз на тему ИИ-алармизма.
Пока только на английском, но в террии вы можете переводить ее для себя сами через LLM. Ну, или дождаться перевода. Или, черт возьми, читать на английском, он там, должно быть, не супер сложный.
В прошлом Юдковски призывал бомбить дата-центры, так что ничего удивительного в его риторике нет. Еще советую подкаст с ним у Лекса Фридмана, Юдковски рассказывает весьма занятный мысленный эксперимент, в котором вы видите мир глазами ИИ.
Кстати, почитайте про Василиска Роко (осторожно, чтение подвергает вас теоретической опасности!), это еще одна занятная тема, всплывшая на сайте Юдковского LessWrong.
Ну и, наконец, если вам интересна тема рациональности, то у Юдковски есть книга про это, называется От ИИ до Зомби, и она бесплатно есть на русском! Я когда-то пытался ее читать, мне показалось интересно, но слишком многословно и запутанно. ГПиМРМ читались на одном дыхании.
Пока только на английском, но в террии вы можете переводить ее для себя сами через LLM. Ну, или дождаться перевода. Или, черт возьми, читать на английском, он там, должно быть, не супер сложный.
В прошлом Юдковски призывал бомбить дата-центры, так что ничего удивительного в его риторике нет. Еще советую подкаст с ним у Лекса Фридмана, Юдковски рассказывает весьма занятный мысленный эксперимент, в котором вы видите мир глазами ИИ.
Кстати, почитайте про Василиска Роко (осторожно, чтение подвергает вас теоретической опасности!), это еще одна занятная тема, всплывшая на сайте Юдковского LessWrong.
Ну и, наконец, если вам интересна тема рациональности, то у Юдковски есть книга про это, называется От ИИ до Зомби, и она бесплатно есть на русском! Я когда-то пытался ее читать, мне показалось интересно, но слишком многословно и запутанно. ГПиМРМ читались на одном дыхании.
Cursor Background Agents 👀
Не забываем включить beta фичу background agents в курсоре, кину в комменты GIF с демкой.
Там много апдейтов, например, теперь можно экспортировать чаты. Читать полный changelog тут.
Я фичу пока не юзал, и не совсем понимаю, что это. Аналог Джуни от Google, который работает за пределами IDE и приносит пул-реквесы, или просто возможность делать несколько задач одновременно? И то и другое было бы полезно. Для меня второе критичнее, бывает ждешь пока Gemini 2.5 решает что-то, а мог бы параллельно запустить еще что-то.
Не забываем включить beta фичу background agents в курсоре, кину в комменты GIF с демкой.
Там много апдейтов, например, теперь можно экспортировать чаты. Читать полный changelog тут.
Я фичу пока не юзал, и не совсем понимаю, что это. Аналог Джуни от Google, который работает за пределами IDE и приносит пул-реквесы, или просто возможность делать несколько задач одновременно? И то и другое было бы полезно. Для меня второе критичнее, бывает ждешь пока Gemini 2.5 решает что-то, а мог бы параллельно запустить еще что-то.
Как сделать сложный рефакторинг с LLM?
Речь пойдет не о ChatGPT/Claude/Deepseek чатах, а об IDE со встроенным AI agent. То есть Cursor, JetBrains Junie, Windsurf, Github Copilot и иже с ними.
Недавно я навайбкодил целую 3D игру с видом от первого лица. Я называю это вайбкодингом, потому что я не читал и не пытался понять код, и даже когда возникала проблема, я просил ИИ починить ее. Вайб-дебаггинг это очень неприятное занятие, должен подметить. Vibe-coding is good until it ain't.
Так вот, в игре в итоге можно бегать, прыгать, приседать, там есть здоровье и стамина, враг и урон, и т.д. Все это реально работало без грамма моего понимания. Но чем дальше мы шли, тем чаще ИИ начинал тупить. Потому что кодовая база превращалась в вонючую помойку. Настал момент когда стало ясно, надо навести порядок. Но как это сделать, если сам не понимаешь, что происходит?
И тут на сцену выходит вайб-рефакторинг. Мы просим ИИ навести порядок. Но нельзя просто так взять и попросить, ИИ не справится - контекстное окно треснет. Вы просто будете раз за разом видеть сломанный код, и агент тем временем будет жадно лопать ваши токены.
Вы действительно правы, код не работает. Мне очень жаль! Хотите провернем 142-ую итерацию? На этот раз все получится!
Итак, как правильно рефакторить кодовую базу с ИИ-агентом в IDE:
1️⃣ Берем думающую модель, например,
2️⃣ Указываем нужные файлы и просим составить план для рефакторинга. На выходе просим "ready to copy paste markdown code that I can insert into a LLM chat".
3️⃣ Просим составить промпт таким образом, чтобы он был четко разбит на отдельные шаги, и чтобы там было четко прописано, что агент должен выполнять по одному шагу за раз, всегда останавливаясь после этого и ожидая подтверждения от пользователя, ибо только так мы сможем проверить работоспособность нашего кода и, если все хорошо, сделать коммит
4️⃣ Просим НИКОГДА не делать изменений, без которых можно обойтись: переименования сущностей, модификация импортов, какие-либо стилистические изменения и форматирования. Ничего из этого нельзя трогать, если это не абсолютно обходимо для рефакторинга (декомпозиции и перераспределения ответственностей между сущностями)
5️⃣ Каждый шаг должен быть пронумерован, первый шаг должен быть помечен как текущий. После каждого шага мы будем просить обновить план, пометить новый шаг как текущий, а предыдущие как выполненные.
Что делать, если агент все таки застрял?
Не смотря на подробный план, иногда отдельные пункты все еще могут быть слишком сложны для агента. В этом случае надо взять промпт, открыть чат и попросить переписать его так, чтобы проблемный пункт был разбит на под-пункты.
Речь пойдет не о ChatGPT/Claude/Deepseek чатах, а об IDE со встроенным AI agent. То есть Cursor, JetBrains Junie, Windsurf, Github Copilot и иже с ними.
Недавно я навайбкодил целую 3D игру с видом от первого лица. Я называю это вайбкодингом, потому что я не читал и не пытался понять код, и даже когда возникала проблема, я просил ИИ починить ее. Вайб-дебаггинг это очень неприятное занятие, должен подметить. Vibe-coding is good until it ain't.
Так вот, в игре в итоге можно бегать, прыгать, приседать, там есть здоровье и стамина, враг и урон, и т.д. Все это реально работало без грамма моего понимания. Но чем дальше мы шли, тем чаще ИИ начинал тупить. Потому что кодовая база превращалась в вонючую помойку. Настал момент когда стало ясно, надо навести порядок. Но как это сделать, если сам не понимаешь, что происходит?
И тут на сцену выходит вайб-рефакторинг. Мы просим ИИ навести порядок. Но нельзя просто так взять и попросить, ИИ не справится - контекстное окно треснет. Вы просто будете раз за разом видеть сломанный код, и агент тем временем будет жадно лопать ваши токены.
Вы действительно правы, код не работает. Мне очень жаль! Хотите провернем 142-ую итерацию? На этот раз все получится!
Итак, как правильно рефакторить кодовую базу с ИИ-агентом в IDE:
1️⃣ Берем думающую модель, например,
Gemini Pro 2.5
2️⃣ Указываем нужные файлы и просим составить план для рефакторинга. На выходе просим "ready to copy paste markdown code that I can insert into a LLM chat".
3️⃣ Просим составить промпт таким образом, чтобы он был четко разбит на отдельные шаги, и чтобы там было четко прописано, что агент должен выполнять по одному шагу за раз, всегда останавливаясь после этого и ожидая подтверждения от пользователя, ибо только так мы сможем проверить работоспособность нашего кода и, если все хорошо, сделать коммит
4️⃣ Просим НИКОГДА не делать изменений, без которых можно обойтись: переименования сущностей, модификация импортов, какие-либо стилистические изменения и форматирования. Ничего из этого нельзя трогать, если это не абсолютно обходимо для рефакторинга (декомпозиции и перераспределения ответственностей между сущностями)
5️⃣ Каждый шаг должен быть пронумерован, первый шаг должен быть помечен как текущий. После каждого шага мы будем просить обновить план, пометить новый шаг как текущий, а предыдущие как выполненные.
Что делать, если агент все таки застрял?
Не смотря на подробный план, иногда отдельные пункты все еще могут быть слишком сложны для агента. В этом случае надо взять промпт, открыть чат и попросить переписать его так, чтобы проблемный пункт был разбит на под-пункты.
Telegram
AI Coder 🦾
Геймдев в Cursor
Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день.
Да, процесс затянул, а я решил…
Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день.
Да, процесс затянул, а я решил…
Грустим от закрытия Arc браузера, поглядываем на альтернативы.
Opera пилят что-то агентское, пробовал кто?
Мне от арка, на самом деле, нужны не ИИ функции (хотя от хорошей агентности я бы не отказался, чтобы браузер сам за меня заполнял формы, искал билеты и отели и проч.), а именно интерфейс: workspaces с отдельными учетками, авто архивация вкладок по таймеру, адресная/поисковая строка через cmd+t, отсутствие визуального шума (сайт на весь экран без элементов интерфейса). Ну и хотелось бы чтобы это был хромиум based.
Короче, the browser company прям перевернули игру и задали тренд, их эстафету точно подхватят. Пока не пересаживаюсь, наблюдаю.
Opera пилят что-то агентское, пробовал кто?
Мне от арка, на самом деле, нужны не ИИ функции (хотя от хорошей агентности я бы не отказался, чтобы браузер сам за меня заполнял формы, искал билеты и отели и проч.), а именно интерфейс: workspaces с отдельными учетками, авто архивация вкладок по таймеру, адресная/поисковая строка через cmd+t, отсутствие визуального шума (сайт на весь экран без элементов интерфейса). Ну и хотелось бы чтобы это был хромиум based.
Короче, the browser company прям перевернули игру и задали тренд, их эстафету точно подхватят. Пока не пересаживаюсь, наблюдаю.
Opera Neon
Opera Neon | Agentic AI browser | Opera
Neon is an agentic AI browser that turns complex prompts into full-scale results. Automate tasks, turn intent into output, and get context-aware assistance all in one browser.
Протестил codex, полет нормальный.
Если кто не в курсе, это такая штука, которой ты даешь доступ к репе (пара кликов), и затем в chat gpt у тебя появляется специальный чат, интерфейс как у custom gpt, и там ты просишь внести правки в код, а оно потом приходит с пул реквестом.
Я дал максимально простое задание, надо было пересортировать поддерживаемые языки, чтоб в топе были самые популярные, правки локализации на уровне одного файла. Это был такой smoke test.
Есть ощущение что OpenAI залезли на территорию Devin. По сути это автономный ИИ- программист. Все запускается в отдельном докер контейнере, откуда есть (если разрешите) доступ в интернет.
Будем тестить дальше. Ожидаю в течении года прогресс на уровне того, к чему пришел вайб кодинг в IDE. Причем будет синергия, эти подходы сольются, курсор уже интегрирует это.
P.S. - кстати, задание я дал с мобильного. Затем с него же поревьюил и аппрувнул PR на гитхабе. Знаю, что такой воркфлоу уже не фантастика, но приятно было ощутить самому.
Если кто не в курсе, это такая штука, которой ты даешь доступ к репе (пара кликов), и затем в chat gpt у тебя появляется специальный чат, интерфейс как у custom gpt, и там ты просишь внести правки в код, а оно потом приходит с пул реквестом.
Я дал максимально простое задание, надо было пересортировать поддерживаемые языки, чтоб в топе были самые популярные, правки локализации на уровне одного файла. Это был такой smoke test.
Есть ощущение что OpenAI залезли на территорию Devin. По сути это автономный ИИ- программист. Все запускается в отдельном докер контейнере, откуда есть (если разрешите) доступ в интернет.
Будем тестить дальше. Ожидаю в течении года прогресс на уровне того, к чему пришел вайб кодинг в IDE. Причем будет синергия, эти подходы сольются, курсор уже интегрирует это.
P.S. - кстати, задание я дал с мобильного. Затем с него же поревьюил и аппрувнул PR на гитхабе. Знаю, что такой воркфлоу уже не фантастика, но приятно было ощутить самому.
Протестировал ИИ-браузер от создателей Arc 🌐
Прикрепляю скриншот, как я анализирую продуктовые метрики в одном из своих проектов с помощью этого браузера.
Речь идет о браузере Dia. Он сейчас в закрытой бете, но если вы были пользователем Арка, то вас пустят туда без очереди.
Сперва я был разочарован: ни вертикальных табов, ни spaces с раздельными куками. Иными словами, все то, за что мы любили Арк, сюда не завезли. Но потом я почитал Reddit и выяснил, что аркоподобный интерфейс завезут в течении месяцев.
Кстати, многие грустят от отсутствия кастомизации. В Арке то можно было и emoji спэйсам присвоить, и раскрасить их в разные шумные градиенты. Это прикольно, но мне плевать. Если задуматься, я даже скорее против кастомизаций. Я не хочу лишний раз принимать никаких решений.
Так вот, Dia. В чем прикол?
Прикол в том, что ребята тащат UX из Cursor в браузер. У вас появляется чат с ИИ, который видит страницу. Все как в курсоре: по умолчанию ИИ видна только текущая страница, но можно меншнить через собачку
Основное преимущество в том, что не надо переключаться в ChatGPT или Cursor в части кейсов, когда раньше это понадобилось бы. Пример тому, на скриншоте ^
Прикрепляю скриншот, как я анализирую продуктовые метрики в одном из своих проектов с помощью этого браузера.
Речь идет о браузере Dia. Он сейчас в закрытой бете, но если вы были пользователем Арка, то вас пустят туда без очереди.
Сперва я был разочарован: ни вертикальных табов, ни spaces с раздельными куками. Иными словами, все то, за что мы любили Арк, сюда не завезли. Но потом я почитал Reddit и выяснил, что аркоподобный интерфейс завезут в течении месяцев.
Кстати, многие грустят от отсутствия кастомизации. В Арке то можно было и emoji спэйсам присвоить, и раскрасить их в разные шумные градиенты. Это прикольно, но мне плевать. Если задуматься, я даже скорее против кастомизаций. Я не хочу лишний раз принимать никаких решений.
Так вот, Dia. В чем прикол?
Прикол в том, что ребята тащат UX из Cursor в браузер. У вас появляется чат с ИИ, который видит страницу. Все как в курсоре: по умолчанию ИИ видна только текущая страница, но можно меншнить через собачку
@
соседние вкладки и даже страницы из закладок и истории. Еще есть custom commands но про них я пока ничего сказать не могу.Основное преимущество в том, что не надо переключаться в ChatGPT или Cursor в части кейсов, когда раньше это понадобилось бы. Пример тому, на скриншоте ^
Please open Telegram to view this post
VIEW IN TELEGRAM
https://youtu.be/Zrndn1d9aaE?feature=shared
Видео записано аж месяц назад, ровно тогда я впервые сел пилить бота, которого в итоге запустил буквально на днях как свой первый микро-продукт.
Сразу скажу, навайбкодить рабочий прототип реально, но MVP — нет. Досмотрите видео до конца и увидите как режим "я только командую" дает сбой. Тем не менее заголовок не врет, на выходе у нас будет рабочий бот.
Так вот, только сегодня у меня дошли руки смонтировать это и загрузить на ютуб и знаете что? Пока монтировал понял, насколько же быстро движется прогресс в нашей области, какие-то вещи уже не актуальны!
Подписывайтесь на канал (на этот и на тот) и приятного просмотра! 🍿
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Вайбкодим AI-бота в Telegram за 10 минут. Условие: не трогать код руками
Только Cursor, показываю весь процесс с нуля до конца вместе с рассуждениями. На выходе полностью рабочий продукт.
Подписывайся на https://t.me/ai_coder_channel если тебе интересна тематика программирования с ИИ.
Я пишу про как про вайбкодинг, так и про…
Подписывайся на https://t.me/ai_coder_channel если тебе интересна тематика программирования с ИИ.
Я пишу про как про вайбкодинг, так и про…