Нас сотня! 💯
И каждый — настоящий, живой. Ни одного бота, никакой накрутки. Без рекламы. Только авторский контент.
Много ли это? Нет. Но мы не про количество, а про качество. Качество контента перетекает в качество подписчиков.
Спасибо, что читаете. Для меня это правда важно. Сотня это только начало, когда-нибудь нас будет тысяча. Оставайтесь и будьте в курсе событий в мире ИИ кодинга!
И каждый — настоящий, живой. Ни одного бота, никакой накрутки. Без рекламы. Только авторский контент.
Много ли это? Нет. Но мы не про количество, а про качество. Качество контента перетекает в качество подписчиков.
Спасибо, что читаете. Для меня это правда важно. Сотня это только начало, когда-нибудь нас будет тысяча. Оставайтесь и будьте в курсе событий в мире ИИ кодинга!
Психотерапия и аффирмации - это промпт инжиниринг мясных нейронок 🫠
Долго я полагал, что психотерапия чушь, а психология не наука. К психотерапевту я ходить так и не стал, и учебников по психологии до сих пор ни одного не прочел, зато повзрослел и дотумкал, что:
1️⃣ Не стоит лихо рассуждать о вещах, в которых не разбираешься (привет, специалисты по геополитике)
2️⃣ Есть ненаучные области знания, которые, тем не менее, показывают результаты (кому-то, например, религия помогает)
3️⃣ Что такое промпт-инжиниринг
А теперь по порядку:
Раз. Не стоит лихо рассуждать о вещах, в которых не разбираешься
По этому пункту, думаю, все ясно. Можно дополнить разве что вот каким тезисом - у тебя может быть свое мнение только относительно вещей, в которых ты являешься профессионалом. То есть когда люди платят тебе за твое мнение об этих вещах.
Например, я специалист по программированию и у меня есть мнение, как проектировать реляционные БД. А вот мнения, почему пала Римская империя, у меня нет и быть не может.
Тут можно (и нужно) взять чужое. Остается только попытаться выбрать, чье лучше. Еще можно (вообще респект), изучить полярные мнения и вычислить среднее арифметическое. Но и это будет не ваше мнение, а лишь компиляция из чужих. И это нормально! Не нормально принимать чужое мнение за свое и, тем более, отстаивать его как свое собственное.
Два'с. Есть ненаучные области знания, которые, тем не менее, показывают результаты
Религия, духовные практики, нейро-лингвистическое программирование, даже физиогномика. Все это может приносить реальную пользу.
Лично я человек не религиозный и к мистицизму отношусь, если честно, с долей скепсиса. Но теперь мне хватает ума понимать, что глупо называть все это абсолютно бесполезным.
Очень часто есть некий процент истины. Просто он спрятан. Человеку с критическим мышлением, мне кажется, не опасно (а даже полезно) попытаться познакомиться поближе с чем-то подобным.
Так вот, психотерапия и аффирмации (объединяю их тут потому что оба направлены на некий разговор с самим собой, в одном случае "об другого", в другом сразу об себя) даже если и являются чем-то ненаучным (что само по себе не факт, к слову), не должны отрицаться по причине вышеописанной.
Три'с. Что такое промпт-инжиниринг
Наконец, к сути поста.
Я как человек далекий, увы, от машинного обучения, но зато близкий к компьютерам как таковым, думая, что понимаю, как примерно работает электроника, операционные системы, сети и алгоритмы, наивно полагал что программирование это обязательно четкий набор инструкций на языке, где:
- Не может быть двусмысленности (инструкция всегда абсолютно однозначна);
- Программа всегда состоит из формального языка, грамматика которого может быть непротиворечиво описана набором (четких) правил;
Но с приходом ChatGPT я понял, что это все равно что думать, будто программы могут быть написаны только на ассемблере!
Мы же можем программировать на высокоуровневых языках, например, на Питоне, и здесь нет противоречия? То же самое и с LLM - да, под капотом там все тот же бинарный код, инструкции и электричество. Ну так и у нас там, если что, нейронные сигналы и электричество. И никому, при этом, не кажется странным пытаться убедить кого-то, воздействуя на него словами, а не ковыряясь отверткой в его нервной системе, верно? (Ведь верно???)
От машины, которая не понимает нас, если не там стоит запятая, мы приходим к машинам, что понимают нас лучше нас самих - строгий и четкой ввод (код) стал не строгим и не четким (промпт), но в остальном суть осталась той же - есть набор инструкций, и машина его интерпретирует.
Настанет день, когда людям будет очевидно, что слово "робот" совершенно не обязательно обозначает нелепую груду металла. И тогда осознание, что мы тоже роботы, не будет шокировать. Мы не такие уж и разные, а психотерапия и аффирмации это самый что ни на есть промпт-инжиниринг.
На самом деле много что промпт-инжиниринг, даже просто чтение книг и просмотр сериалов, но это уже тема для отдельного поста.
Да и надо ли вообще окунаться в эти дебри?
Долго я полагал, что психотерапия чушь, а психология не наука. К психотерапевту я ходить так и не стал, и учебников по психологии до сих пор ни одного не прочел, зато повзрослел и дотумкал, что:
1️⃣ Не стоит лихо рассуждать о вещах, в которых не разбираешься (привет, специалисты по геополитике)
2️⃣ Есть ненаучные области знания, которые, тем не менее, показывают результаты (кому-то, например, религия помогает)
3️⃣ Что такое промпт-инжиниринг
А теперь по порядку:
Раз. Не стоит лихо рассуждать о вещах, в которых не разбираешься
По этому пункту, думаю, все ясно. Можно дополнить разве что вот каким тезисом - у тебя может быть свое мнение только относительно вещей, в которых ты являешься профессионалом. То есть когда люди платят тебе за твое мнение об этих вещах.
Например, я специалист по программированию и у меня есть мнение, как проектировать реляционные БД. А вот мнения, почему пала Римская империя, у меня нет и быть не может.
Тут можно (и нужно) взять чужое. Остается только попытаться выбрать, чье лучше. Еще можно (вообще респект), изучить полярные мнения и вычислить среднее арифметическое. Но и это будет не ваше мнение, а лишь компиляция из чужих. И это нормально! Не нормально принимать чужое мнение за свое и, тем более, отстаивать его как свое собственное.
Два'с. Есть ненаучные области знания, которые, тем не менее, показывают результаты
Религия, духовные практики, нейро-лингвистическое программирование, даже физиогномика. Все это может приносить реальную пользу.
Лично я человек не религиозный и к мистицизму отношусь, если честно, с долей скепсиса. Но теперь мне хватает ума понимать, что глупо называть все это абсолютно бесполезным.
Очень часто есть некий процент истины. Просто он спрятан. Человеку с критическим мышлением, мне кажется, не опасно (а даже полезно) попытаться познакомиться поближе с чем-то подобным.
Так вот, психотерапия и аффирмации (объединяю их тут потому что оба направлены на некий разговор с самим собой, в одном случае "об другого", в другом сразу об себя) даже если и являются чем-то ненаучным (что само по себе не факт, к слову), не должны отрицаться по причине вышеописанной.
Три'с. Что такое промпт-инжиниринг
Наконец, к сути поста.
Я как человек далекий, увы, от машинного обучения, но зато близкий к компьютерам как таковым, думая, что понимаю, как примерно работает электроника, операционные системы, сети и алгоритмы, наивно полагал что программирование это обязательно четкий набор инструкций на языке, где:
- Не может быть двусмысленности (инструкция всегда абсолютно однозначна);
- Программа всегда состоит из формального языка, грамматика которого может быть непротиворечиво описана набором (четких) правил;
Но с приходом ChatGPT я понял, что это все равно что думать, будто программы могут быть написаны только на ассемблере!
Мы же можем программировать на высокоуровневых языках, например, на Питоне, и здесь нет противоречия? То же самое и с LLM - да, под капотом там все тот же бинарный код, инструкции и электричество. Ну так и у нас там, если что, нейронные сигналы и электричество. И никому, при этом, не кажется странным пытаться убедить кого-то, воздействуя на него словами, а не ковыряясь отверткой в его нервной системе, верно? (Ведь верно???)
От машины, которая не понимает нас, если не там стоит запятая, мы приходим к машинам, что понимают нас лучше нас самих - строгий и четкой ввод (код) стал не строгим и не четким (промпт), но в остальном суть осталась той же - есть набор инструкций, и машина его интерпретирует.
Настанет день, когда людям будет очевидно, что слово "робот" совершенно не обязательно обозначает нелепую груду металла. И тогда осознание, что мы тоже роботы, не будет шокировать. Мы не такие уж и разные, а психотерапия и аффирмации это самый что ни на есть промпт-инжиниринг.
На самом деле много что промпт-инжиниринг, даже просто чтение книг и просмотр сериалов, но это уже тема для отдельного поста.
Да и надо ли вообще окунаться в эти дебри?
Wikipedia
Формальная система
Форма́льная систе́ма (форма́льная тео́рия, аксиоматическая теория, аксиоматика, дедуктивная система) — результат строгой формализации теории, предполагающей полную абстракцию от смысла слов используемого языка, причём все условия, регулирующие употребление…
Code Review в 2025
Осторожно: пост для айтишников! В тексте содержитсянецензурная лексика LLM-Engineering терминология.
Пришло в голову, как можно было бы улучшить код-ревью с помощью LLM. По сути, идея для стартапа, но я уверен, в этом направлении уже копают.
1️⃣ Берёмсначал укропа вектора (embeddings) кодовой базы, актуальные, конечно же. Такие строит курсор и его аналоги, на GitHub наверняка куча тулов которые могут высрать вам это прямо в репу.
2️⃣ Потомкошачью жопу что-то типа repomix, чтобы у нас было
3️⃣25 картошек в момент запуска CI/CD пайплайна берем ЛЛМ с контекстным окном потолще и кормим её фирменным блюдом по рецепту: diff коммита/PR'а + текстовое описание кодовой базы. Просим ответить на вопрос: "Глядя на этот пиздец, скажи, на какие места в коде стоит взглянуть внимательнее, чтобы проанализировать их на предмет возможной поломки?". Тут еще можно попросить сформулировать суть изменений, полезно для шага 5.
4️⃣17 мандовошек собственно RAG, иначе зачем нам вектора? Векторизируем ответ с предыдущего шага, через него находим релевантные куски кода и, наконец, билдим идеальный контекст для финального, пятого шага.
5️⃣Ведро воды и хуй туды! Снова идем в ЛЛМ (результаты предыдущих шагов надо отбросить, они больше не нужны и лишь займут место в окне) и просим: "Смотри, вот описание наших изменений + diff PRа + куски кода, которые могут быть затронуты этим изменением; Твоя задача тщательно проанализировать и оценить вероятность поломки от 0 до 100".
Охапка дров и плов готов! Остается только настроить пайплайн условием типа "если вероятность фэйла > 5%, то завали пайплайн".
Тут, конечно, есть над чем поразмыслить, это просто очерк, чтобы мысль не растворилась в воздухе. Наверняка тут найдется место и Structured Output и, может, каким-нибудь Chain of Thought, и без Evaluations вряд-ли обойдется. И может количество шагов нужно уменьшить или увеличить. Над этим уже пускай думает тот, кто будет это имплементить.
P.S. - перекликается с тезисом про статическую типизацию ("явное лучше чем неявное" тут играет очень важную роль).
Осторожно: пост для айтишников! В тексте содержится
Пришло в голову, как можно было бы улучшить код-ревью с помощью LLM. По сути, идея для стартапа, но я уверен, в этом направлении уже копают.
1️⃣ Берём
2️⃣ Потом
markdown
описание репы (пригодится для RAG на следующем этапе). Тут главное не переусердствовать, чтоб у ЛЛМ контекстное окно не треснуло. В идеале это текстовое описание кодовой базы, но без настоящего кода (он занимает много токенов). Быть может текст + псевдокод или что-то вроде outline view (сигнатуры функций, но без имплементаций)3️⃣
4️⃣
5️⃣
Охапка дров и плов готов! Остается только настроить пайплайн условием типа "если вероятность фэйла > 5%, то завали пайплайн".
Тут, конечно, есть над чем поразмыслить, это просто очерк, чтобы мысль не растворилась в воздухе. Наверняка тут найдется место и Structured Output и, может, каким-нибудь Chain of Thought, и без Evaluations вряд-ли обойдется. И может количество шагов нужно уменьшить или увеличить. Над этим уже пускай думает тот, кто будет это имплементить.
P.S. - перекликается с тезисом про статическую типизацию ("явное лучше чем неявное" тут играет очень важную роль).
Telegram
AI Coder 🦾
Сжимаем репозиторий до одного файла, чтобы скормить ИИ
Наткнулся на просторах гитхаба на интресную штуковину, называется Repomix - в описании заявлено, что она каким-то магическим образом может создать файл, в котором в удобном для ИИ виде описан весь ваш…
Наткнулся на просторах гитхаба на интресную штуковину, называется Repomix - в описании заявлено, что она каким-то магическим образом может создать файл, в котором в удобном для ИИ виде описан весь ваш…
AI Coder 🦾
Агенты Наступают Чел с твиттера билдит апку за 20 мин. На входе один промпт: “простой мне бизнес на миллион долларов про AI и writing”. Больше он в процесс не вмешиваться. На выходе рабочее приложение, но и это ещё не всё. Штука, которую он юзал называется…
Утро началось с письма от разработчиков Мануса. Дали доступ к закрытой бете, будем пробовать!
Кстати, на этой неделе будет видео, мастер-класс по вайб-кодингу. Покажу, как сделать за 15 минут рабочего бота в телеграмме с привязкой к OpenAI вообще не трогая код.
Кстати, на этой неделе будет видео, мастер-класс по вайб-кодингу. Покажу, как сделать за 15 минут рабочего бота в телеграмме с привязкой к OpenAI вообще не трогая код.
ИИ который работает в браузере за вас
Зацените какое расширение для браузера нашел, называется "Do Browser". Посмотрите короткое видео на главной, автор показывает, как приблуда сама пишет и публикует пост в линкедине.
Еще несколько месяцев назад я понял, что опыт из этих ваших "Курсоров" надо тащить в браузер, повышать уровень абстракции и там тоже. Так вот, первой моей идеей для микропродукта было именно это - автоматизация действий в браузере.
В итоге решил делать сузить скоуп задачи и сосредоточиться на работе с текстом . Упоминал вскольз тут.
Зацените какое расширение для браузера нашел, называется "Do Browser". Посмотрите короткое видео на главной, автор показывает, как приблуда сама пишет и публикует пост в линкедине.
Еще несколько месяцев назад я понял, что опыт из этих ваших "Курсоров" надо тащить в браузер, повышать уровень абстракции и там тоже. Так вот, первой моей идеей для микропродукта было именно это - автоматизация действий в браузере.
В итоге решил делать сузить скоуп задачи и сосредоточиться на работе с текстом . Упоминал вскольз тут.
Do Browser
Do Browser - AI-Powered Web Automation
Do Browser is an AI-powered Chrome extension that automates web tasks through natural language commands. Save time and boost productivity with our intelligent browser assistant.
Управляем базой данных через LLM
Вот уже несколько месяцев я то и дело задаюсь вопросом, да кто такой этот ваш MCP? Да-да, понятно, какой-то протокол для подключения клиентов к ИИ-серверу. Но как? Зачем? Короче, как сказал Ричард Фэйнман: "What I cannot create, I do not understand."
MCP я руками так и не реализовал, зато наконец-то воспользовался им как юзер. И мне наконец-то стало ясно, в чем сыр бор!
MCP это штука, которая позволяет подключить программу-клиент (например, Claude Desktop или Cursor) к программе-серверу. Снова клиент-серверная архитектура, как в Rest, но на этот раз клиент посылает на сервер человекочитаемый текст, а сервер этот интерпретирует его с помощью LLM и принимает решение вызвать какую-то функцию с какими-то параметрами.
Есть такой database as a service "Neon" (компания, которая администрирует базу данных за вас, чтобы вы сами не марали руки об Linux), и они такие молодцы, что реализовли MCP, вот статья, как подключить его к курсору. Все подключение это буквально создать файлик
А в итоге ваш чат в курсоре, где вы общаетесь с ИИ, начал понимать больше команд, и теперь способен выполнять запросы вроде:
- Сколько у меня таблиц в БД?
- Добавь колонку
- Удали всех юзеров младше 18 лет
Разумеется, перед тем как выполнить команду курсор показывает вам, что именно сейчас произойдет и ждет подтверждения. И, конечно же, стоит внимательно проверять, что там ИИ собирается сделать, галлюцинации никто не отменял.
Но вы только вдумайтесь, вы можете общаться с базой данных! Не просто генерировать SQL из текста, чтобы потом выполнить его руками, а прям общаться текстом с самой базой, а она будет вас понимать, будто живая.
MCP универсален и способен подключить к курсору вообще все, что угодно. Даже пульт управления дверьми от гаража, если они достаточно умны.
Будущее наступает! По крайней мере, будущее разработки.
Вот уже несколько месяцев я то и дело задаюсь вопросом, да кто такой этот ваш MCP? Да-да, понятно, какой-то протокол для подключения клиентов к ИИ-серверу. Но как? Зачем? Короче, как сказал Ричард Фэйнман: "What I cannot create, I do not understand."
MCP я руками так и не реализовал, зато наконец-то воспользовался им как юзер. И мне наконец-то стало ясно, в чем сыр бор!
MCP это штука, которая позволяет подключить программу-клиент (например, Claude Desktop или Cursor) к программе-серверу. Снова клиент-серверная архитектура, как в Rest, но на этот раз клиент посылает на сервер человекочитаемый текст, а сервер этот интерпретирует его с помощью LLM и принимает решение вызвать какую-то функцию с какими-то параметрами.
Есть такой database as a service "Neon" (компания, которая администрирует базу данных за вас, чтобы вы сами не марали руки об Linux), и они такие молодцы, что реализовли MCP, вот статья, как подключить его к курсору. Все подключение это буквально создать файлик
mcp.json
и скопипастить туда пару строк. Что же в итоге?А в итоге ваш чат в курсоре, где вы общаетесь с ИИ, начал понимать больше команд, и теперь способен выполнять запросы вроде:
- Сколько у меня таблиц в БД?
- Добавь колонку
created_at
в табличку users
- Удали всех юзеров младше 18 лет
Разумеется, перед тем как выполнить команду курсор показывает вам, что именно сейчас произойдет и ждет подтверждения. И, конечно же, стоит внимательно проверять, что там ИИ собирается сделать, галлюцинации никто не отменял.
Но вы только вдумайтесь, вы можете общаться с базой данных! Не просто генерировать SQL из текста, чтобы потом выполнить его руками, а прям общаться текстом с самой базой, а она будет вас понимать, будто живая.
MCP универсален и способен подключить к курсору вообще все, что угодно. Даже пульт управления дверьми от гаража, если они достаточно умны.
Будущее наступает! По крайней мере, будущее разработки.
Neon
Get started with Cursor and Neon Postgres MCP Server - Neon Guides
Make schema changes with natural language using Cursor and Neon MCP Server
Навайбкодил в Курсоре за 3 часа с BabylonJS, даже доку не открывал, че в коде происходит абсолютно хз 🫠
Паук агрится если подойти и атакует, хп минусится, выносливость тратится во время спринта и восстанавливается если встать смирно О_о
1 TypeScript файлик
P.S. моделька паука отсюда
#gamedev
Паук агрится если подойти и атакует, хп минусится, выносливость тратится во время спринта и восстанавливается если встать смирно О_о
1 TypeScript файлик
<500
строк кодаP.S. моделька паука отсюда
#gamedev
AI Coder 🦾
Навайбкодил в Курсоре за 3 часа с BabylonJS, даже доку не открывал, че в коде происходит абсолютно хз 🫠 Паук агрится если подойти и атакует, хп минусится, выносливость тратится во время спринта и восстанавливается если встать смирно О_о 1 TypeScript файлик…
Геймдев в Cursor
Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день.
Да, процесс затянул, а я решил побаловать себя и позволить поразвлечься. Геймдев меня, как и каждого, наверное, программиста, всегда интересовал но казался сложным и не хватало мотивации разобраться. Ответственно заявляю что связка Cursor + BabylonJS эту проблему решает. 3D в браузере на тайпскрипте с ИИшкой которая все за тебя делает? Я не устоял.
Конечно, навайбкодил я полные штаны, на второй день файлик распух на полторы тыщи строк и ЛЛМка перестала справлятся с моими запросами. Нет-нет да пришлось вникнуть в некоторые аспекты: что такое сцена, камера, скайбокс, иллюминация. Начинали за здравие а кончили за упокой. Но результатом я доволен! За один день была добавлена куча механик:
- У паука есть настоящее ХП, его можно бить и оно отнимается, а когда оно падает ниже нуля, он умирает (неожиданно, правда?) и исчезает
- Разобрался как загружать 3d модельки, в интернете полно low-poly бесплатных, бери не хочу
- Смена дня и ночи, skybox с текстурами звездного неба (см последний скрин)
- Консоль аж с одним читом
- Задел под инвентарь и наверно еще какие-то мелочи, которых не упомнишь
#gamedev
Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день.
Да, процесс затянул, а я решил побаловать себя и позволить поразвлечься. Геймдев меня, как и каждого, наверное, программиста, всегда интересовал но казался сложным и не хватало мотивации разобраться. Ответственно заявляю что связка Cursor + BabylonJS эту проблему решает. 3D в браузере на тайпскрипте с ИИшкой которая все за тебя делает? Я не устоял.
Конечно, навайбкодил я полные штаны, на второй день файлик распух на полторы тыщи строк и ЛЛМка перестала справлятся с моими запросами. Нет-нет да пришлось вникнуть в некоторые аспекты: что такое сцена, камера, скайбокс, иллюминация. Начинали за здравие а кончили за упокой. Но результатом я доволен! За один день была добавлена куча механик:
- У паука есть настоящее ХП, его можно бить и оно отнимается, а когда оно падает ниже нуля, он умирает (неожиданно, правда?) и исчезает
- Разобрался как загружать 3d модельки, в интернете полно low-poly бесплатных, бери не хочу
- Смена дня и ночи, skybox с текстурами звездного неба (см последний скрин)
- Консоль аж с одним читом
set_time
чтоб устанавливать время (надо было для дебага солнца… странная фраза)- Задел под инвентарь и наверно еще какие-то мелочи, которых не упомнишь
#gamedev
AI Coder 🦾
Геймдев в Cursor Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день. Да, процесс затянул, а я решил…
Gemini vs Claude?
В догонку к вчерашнему посту. Курсор обновили ценовую политику и использовать
Она долго думает, но в 7/10 случаев решает задачу правильно. Если почитать логи ее внутренних рассуждений, вы удивитесь, это выглядит как ход мысли очень умного человека. Там четкая структура: понять задачу -> собрать входные данные -> придумать план -> реализовать.
Слабое место Gemini, да и любой другой, наверное, нейронки в IDE, это замкнутость на коде и терминале. TypeScript это все же не панацея (почему JS/TS экосистема это плохо спроектированная система я уже писал тут) и он не отлавливает множество ошибок, приходится открывать браузер и смотреть в консоль. Gemini молодец в том смысле, что понимает это и прям просит это сделать, а потом придти к нему с логами. Короче, если бы ИИ курсор мог автономно контролировать браузер, это был бы next-level.
Минусы
Я не говорю что Gemini > Claude при любых раскладах, я лишь говорю что в курсоре и для кодинга это оказалось так. Также добавлю что claude/gpt быстрее и не для всех задач нужно так долго ждать.
А еще был один случай, надо было просто переименовать пачку файлов в репе, так вот Gemini погрузился в глубокие рассуждения о природе бытия, высрал гигантский страшный скрипт на питоне который не завелся с первого раза и начал его чинить. Мне это надоело и я попросил gpt4.1 сделать задачу, он просто взял и сделал.
Вердикт
Для простых задач
P.S. - Правда не хочется превращаться в "дневники инди-разработчика", но за одни выходные было столько инсайтов, что не поделиться ими просто преступление. Самый главный - геймдев это один сплошной трюк, чтобы у игрока возникла иллюзия чего-то настоящего. Как-нибудь расскажу подробнее про самые простые фокусы, необходимые, чтобы игрок поверил в происходящее.
В догонку к вчерашнему посту. Курсор обновили ценовую политику и использовать
Claude 3.7
стало не так выгодно, пришлось пересесть на Gemini 2.5
и каково же было мое удивление, когда я увидел, насколько умна эта модель.Она долго думает, но в 7/10 случаев решает задачу правильно. Если почитать логи ее внутренних рассуждений, вы удивитесь, это выглядит как ход мысли очень умного человека. Там четкая структура: понять задачу -> собрать входные данные -> придумать план -> реализовать.
Слабое место Gemini, да и любой другой, наверное, нейронки в IDE, это замкнутость на коде и терминале. TypeScript это все же не панацея (почему JS/TS экосистема это плохо спроектированная система я уже писал тут) и он не отлавливает множество ошибок, приходится открывать браузер и смотреть в консоль. Gemini молодец в том смысле, что понимает это и прям просит это сделать, а потом придти к нему с логами. Короче, если бы ИИ курсор мог автономно контролировать браузер, это был бы next-level.
Минусы
Я не говорю что Gemini > Claude при любых раскладах, я лишь говорю что в курсоре и для кодинга это оказалось так. Также добавлю что claude/gpt быстрее и не для всех задач нужно так долго ждать.
А еще был один случай, надо было просто переименовать пачку файлов в репе, так вот Gemini погрузился в глубокие рассуждения о природе бытия, высрал гигантский страшный скрипт на питоне который не завелся с первого раза и начал его чинить. Мне это надоело и я попросил gpt4.1 сделать задачу, он просто взял и сделал.
Вердикт
Для простых задач
claude/gpt
, для сложных gemini
. Пока такие ощущения. Да, есть еще думающие модели типа o3
, но они и стоят (в курсоре) дороже.P.S. - Правда не хочется превращаться в "дневники инди-разработчика", но за одни выходные было столько инсайтов, что не поделиться ими просто преступление. Самый главный - геймдев это один сплошной трюк, чтобы у игрока возникла иллюзия чего-то настоящего. Как-нибудь расскажу подробнее про самые простые фокусы, необходимые, чтобы игрок поверил в происходящее.
Telegram
AI Coder 🦾
Почему JS это плохой язык?
Написал коротенькую статью на Хабр (кстати, у кого есть инвайт, плюсаните плиз).
Спойлер: статья скорее для разработчиков, но никакого хардкора в ней нет. В ней даже кода нет.
Написал коротенькую статью на Хабр (кстати, у кого есть инвайт, плюсаните плиз).
Спойлер: статья скорее для разработчиков, но никакого хардкора в ней нет. В ней даже кода нет.
У Элиезера Юдковски (автор Гарри Поттера и Методов Рационального Мышления, а также специалиста-самоучки по ИИ) выходит новая книга, на этот раз на тему ИИ-алармизма.
Пока только на английском, но в террии вы можете переводить ее для себя сами через LLM. Ну, или дождаться перевода. Или, черт возьми, читать на английском, он там, должно быть, не супер сложный.
В прошлом Юдковски призывал бомбить дата-центры, так что ничего удивительного в его риторике нет. Еще советую подкаст с ним у Лекса Фридмана, Юдковски рассказывает весьма занятный мысленный эксперимент, в котором вы видите мир глазами ИИ.
Кстати, почитайте про Василиска Роко (осторожно, чтение подвергает вас теоретической опасности!), это еще одна занятная тема, всплывшая на сайте Юдковского LessWrong.
Ну и, наконец, если вам интересна тема рациональности, то у Юдковски есть книга про это, называется От ИИ до Зомби, и она бесплатно есть на русском! Я когда-то пытался ее читать, мне показалось интересно, но слишком многословно и запутанно. ГПиМРМ читались на одном дыхании.
Пока только на английском, но в террии вы можете переводить ее для себя сами через LLM. Ну, или дождаться перевода. Или, черт возьми, читать на английском, он там, должно быть, не супер сложный.
В прошлом Юдковски призывал бомбить дата-центры, так что ничего удивительного в его риторике нет. Еще советую подкаст с ним у Лекса Фридмана, Юдковски рассказывает весьма занятный мысленный эксперимент, в котором вы видите мир глазами ИИ.
Кстати, почитайте про Василиска Роко (осторожно, чтение подвергает вас теоретической опасности!), это еще одна занятная тема, всплывшая на сайте Юдковского LessWrong.
Ну и, наконец, если вам интересна тема рациональности, то у Юдковски есть книга про это, называется От ИИ до Зомби, и она бесплатно есть на русском! Я когда-то пытался ее читать, мне показалось интересно, но слишком многословно и запутанно. ГПиМРМ читались на одном дыхании.
Cursor Background Agents 👀
Не забываем включить beta фичу background agents в курсоре, кину в комменты GIF с демкой.
Там много апдейтов, например, теперь можно экспортировать чаты. Читать полный changelog тут.
Я фичу пока не юзал, и не совсем понимаю, что это. Аналог Джуни от Google, который работает за пределами IDE и приносит пул-реквесы, или просто возможность делать несколько задач одновременно? И то и другое было бы полезно. Для меня второе критичнее, бывает ждешь пока Gemini 2.5 решает что-то, а мог бы параллельно запустить еще что-то.
Не забываем включить beta фичу background agents в курсоре, кину в комменты GIF с демкой.
Там много апдейтов, например, теперь можно экспортировать чаты. Читать полный changelog тут.
Я фичу пока не юзал, и не совсем понимаю, что это. Аналог Джуни от Google, который работает за пределами IDE и приносит пул-реквесы, или просто возможность делать несколько задач одновременно? И то и другое было бы полезно. Для меня второе критичнее, бывает ждешь пока Gemini 2.5 решает что-то, а мог бы параллельно запустить еще что-то.
Как сделать сложный рефакторинг с LLM?
Речь пойдет не о ChatGPT/Claude/Deepseek чатах, а об IDE со встроенным AI agent. То есть Cursor, JetBrains Junie, Windsurf, Github Copilot и иже с ними.
Недавно я навайбкодил целую 3D игру с видом от первого лица. Я называю это вайбкодингом, потому что я не читал и не пытался понять код, и даже когда возникала проблема, я просил ИИ починить ее. Вайб-дебаггинг это очень неприятное занятие, должен подметить. Vibe-coding is good until it ain't.
Так вот, в игре в итоге можно бегать, прыгать, приседать, там есть здоровье и стамина, враг и урон, и т.д. Все это реально работало без грамма моего понимания. Но чем дальше мы шли, тем чаще ИИ начинал тупить. Потому что кодовая база превращалась в вонючую помойку. Настал момент когда стало ясно, надо навести порядок. Но как это сделать, если сам не понимаешь, что происходит?
И тут на сцену выходит вайб-рефакторинг. Мы просим ИИ навести порядок. Но нельзя просто так взять и попросить, ИИ не справится - контекстное окно треснет. Вы просто будете раз за разом видеть сломанный код, и агент тем временем будет жадно лопать ваши токены.
Вы действительно правы, код не работает. Мне очень жаль! Хотите провернем 142-ую итерацию? На этот раз все получится!
Итак, как правильно рефакторить кодовую базу с ИИ-агентом в IDE:
1️⃣ Берем думающую модель, например,
2️⃣ Указываем нужные файлы и просим составить план для рефакторинга. На выходе просим "ready to copy paste markdown code that I can insert into a LLM chat".
3️⃣ Просим составить промпт таким образом, чтобы он был четко разбит на отдельные шаги, и чтобы там было четко прописано, что агент должен выполнять по одному шагу за раз, всегда останавливаясь после этого и ожидая подтверждения от пользователя, ибо только так мы сможем проверить работоспособность нашего кода и, если все хорошо, сделать коммит
4️⃣ Просим НИКОГДА не делать изменений, без которых можно обойтись: переименования сущностей, модификация импортов, какие-либо стилистические изменения и форматирования. Ничего из этого нельзя трогать, если это не абсолютно обходимо для рефакторинга (декомпозиции и перераспределения ответственностей между сущностями)
5️⃣ Каждый шаг должен быть пронумерован, первый шаг должен быть помечен как текущий. После каждого шага мы будем просить обновить план, пометить новый шаг как текущий, а предыдущие как выполненные.
Что делать, если агент все таки застрял?
Не смотря на подробный план, иногда отдельные пункты все еще могут быть слишком сложны для агента. В этом случае надо взять промпт, открыть чат и попросить переписать его так, чтобы проблемный пункт был разбит на под-пункты.
Речь пойдет не о ChatGPT/Claude/Deepseek чатах, а об IDE со встроенным AI agent. То есть Cursor, JetBrains Junie, Windsurf, Github Copilot и иже с ними.
Недавно я навайбкодил целую 3D игру с видом от первого лица. Я называю это вайбкодингом, потому что я не читал и не пытался понять код, и даже когда возникала проблема, я просил ИИ починить ее. Вайб-дебаггинг это очень неприятное занятие, должен подметить. Vibe-coding is good until it ain't.
Так вот, в игре в итоге можно бегать, прыгать, приседать, там есть здоровье и стамина, враг и урон, и т.д. Все это реально работало без грамма моего понимания. Но чем дальше мы шли, тем чаще ИИ начинал тупить. Потому что кодовая база превращалась в вонючую помойку. Настал момент когда стало ясно, надо навести порядок. Но как это сделать, если сам не понимаешь, что происходит?
И тут на сцену выходит вайб-рефакторинг. Мы просим ИИ навести порядок. Но нельзя просто так взять и попросить, ИИ не справится - контекстное окно треснет. Вы просто будете раз за разом видеть сломанный код, и агент тем временем будет жадно лопать ваши токены.
Вы действительно правы, код не работает. Мне очень жаль! Хотите провернем 142-ую итерацию? На этот раз все получится!
Итак, как правильно рефакторить кодовую базу с ИИ-агентом в IDE:
1️⃣ Берем думающую модель, например,
Gemini Pro 2.5
2️⃣ Указываем нужные файлы и просим составить план для рефакторинга. На выходе просим "ready to copy paste markdown code that I can insert into a LLM chat".
3️⃣ Просим составить промпт таким образом, чтобы он был четко разбит на отдельные шаги, и чтобы там было четко прописано, что агент должен выполнять по одному шагу за раз, всегда останавливаясь после этого и ожидая подтверждения от пользователя, ибо только так мы сможем проверить работоспособность нашего кода и, если все хорошо, сделать коммит
4️⃣ Просим НИКОГДА не делать изменений, без которых можно обойтись: переименования сущностей, модификация импортов, какие-либо стилистические изменения и форматирования. Ничего из этого нельзя трогать, если это не абсолютно обходимо для рефакторинга (декомпозиции и перераспределения ответственностей между сущностями)
5️⃣ Каждый шаг должен быть пронумерован, первый шаг должен быть помечен как текущий. После каждого шага мы будем просить обновить план, пометить новый шаг как текущий, а предыдущие как выполненные.
Что делать, если агент все таки застрял?
Не смотря на подробный план, иногда отдельные пункты все еще могут быть слишком сложны для агента. В этом случае надо взять промпт, открыть чат и попросить переписать его так, чтобы проблемный пункт был разбит на под-пункты.
Telegram
AI Coder 🦾
Геймдев в Cursor
Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день.
Да, процесс затянул, а я решил…
Так, все хорошо. Канал не превращается в дневники инди-разработчика, честно. Выходные кончились, и уже завтра придется вернуться к делам насущным. Но пока поделюсь, чего удалось добиться за еще один день.
Да, процесс затянул, а я решил…
Грустим от закрытия Arc браузера, поглядываем на альтернативы.
Opera пилят что-то агентское, пробовал кто?
Мне от арка, на самом деле, нужны не ИИ функции (хотя от хорошей агентности я бы не отказался, чтобы браузер сам за меня заполнял формы, искал билеты и отели и проч.), а именно интерфейс: workspaces с отдельными учетками, авто архивация вкладок по таймеру, адресная/поисковая строка через cmd+t, отсутствие визуального шума (сайт на весь экран без элементов интерфейса). Ну и хотелось бы чтобы это был хромиум based.
Короче, the browser company прям перевернули игру и задали тренд, их эстафету точно подхватят. Пока не пересаживаюсь, наблюдаю.
Opera пилят что-то агентское, пробовал кто?
Мне от арка, на самом деле, нужны не ИИ функции (хотя от хорошей агентности я бы не отказался, чтобы браузер сам за меня заполнял формы, искал билеты и отели и проч.), а именно интерфейс: workspaces с отдельными учетками, авто архивация вкладок по таймеру, адресная/поисковая строка через cmd+t, отсутствие визуального шума (сайт на весь экран без элементов интерфейса). Ну и хотелось бы чтобы это был хромиум based.
Короче, the browser company прям перевернули игру и задали тренд, их эстафету точно подхватят. Пока не пересаживаюсь, наблюдаю.
Opera Neon
Opera Neon | Agentic AI browser | Opera
Neon is an agentic AI browser that turns complex prompts into full-scale results. Automate tasks, turn intent into output, and get context-aware assistance all in one browser.
Протестил codex, полет нормальный.
Если кто не в курсе, это такая штука, которой ты даешь доступ к репе (пара кликов), и затем в chat gpt у тебя появляется специальный чат, интерфейс как у custom gpt, и там ты просишь внести правки в код, а оно потом приходит с пул реквестом.
Я дал максимально простое задание, надо было пересортировать поддерживаемые языки, чтоб в топе были самые популярные, правки локализации на уровне одного файла. Это был такой smoke test.
Есть ощущение что OpenAI залезли на территорию Devin. По сути это автономный ИИ- программист. Все запускается в отдельном докер контейнере, откуда есть (если разрешите) доступ в интернет.
Будем тестить дальше. Ожидаю в течении года прогресс на уровне того, к чему пришел вайб кодинг в IDE. Причем будет синергия, эти подходы сольются, курсор уже интегрирует это.
P.S. - кстати, задание я дал с мобильного. Затем с него же поревьюил и аппрувнул PR на гитхабе. Знаю, что такой воркфлоу уже не фантастика, но приятно было ощутить самому.
Если кто не в курсе, это такая штука, которой ты даешь доступ к репе (пара кликов), и затем в chat gpt у тебя появляется специальный чат, интерфейс как у custom gpt, и там ты просишь внести правки в код, а оно потом приходит с пул реквестом.
Я дал максимально простое задание, надо было пересортировать поддерживаемые языки, чтоб в топе были самые популярные, правки локализации на уровне одного файла. Это был такой smoke test.
Есть ощущение что OpenAI залезли на территорию Devin. По сути это автономный ИИ- программист. Все запускается в отдельном докер контейнере, откуда есть (если разрешите) доступ в интернет.
Будем тестить дальше. Ожидаю в течении года прогресс на уровне того, к чему пришел вайб кодинг в IDE. Причем будет синергия, эти подходы сольются, курсор уже интегрирует это.
P.S. - кстати, задание я дал с мобильного. Затем с него же поревьюил и аппрувнул PR на гитхабе. Знаю, что такой воркфлоу уже не фантастика, но приятно было ощутить самому.