ChatGPTevelopment & Promptgramming
23 subscribers
204 photos
38 videos
50 files
393 links
#ChatGPT using development & Prompt based programming – new era of coding! 🥹
#ChatGPT #GPT4dev
Download Telegram
Чудеса AI агентов

Мой опыт работы с AI агентами имеет переменный успех. Иногда получается быстро сделать нужное и агенты сильно упрощают работу, иногда агенты никак не справляются с задачей, и проще сделать самому.

Но иногда бывают моменты, когда реально впечатляешься возможностям. У нас на работе с недавних пор стало можно официально использовать Claude Code, и люди стали активно допиливать его. Один из способов расширения возможностей - создание skills. По факту, это инструкции для выполнения каких-то конкретных задач.

Сегодня мне надо было обновить ранее сделанные мной диаграммы Excalidraw. Я их рисовал вручную, на основе моих пайпланов (sql-запросы с разными обёртками). Снова делать это вручную стало лень, и я стал искать другие варианты. Буквально случайно обнаружил, что несколько недель назад кто-то сделал skill для создания диаграмм Excalidraw.

Я установил skill, написал команду типа "Generate the excalidraw diagram for the dataflow in this file", подождал минут 5, и получил файлик. Открыл его... и реально - красиво нарисованная диаграмма, со стрелочками, разными цветами, комментариями. Всё было нарисовано из коробки отлично, даже не пришлось ничего исправлять. Это был взрыв мозга.

P. S. Потом правда оказалось, что если попросить его нарисовать диаграмму по нескольким большим скриптам, он ломается с ошибкой 504, ибо превышает лимиты :) Так что создавал дальше диаграммы по отдельности для каждого файла.

#datascience
Мне кажется или OpenAI постепенно начинает проигрывать рынок Anthropic?
Повсюду слышу про Claude Code, а про OpenAI Codex только в твиттах Sam Altman и Co про то какой он крутой и невероятный?

Или это я в бабле?

—————————
Мысли Рвачева
—————————
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Claude Code добавил удобную фичу для работы с permissions

Boris Cherny из Anthropic поделился новым улучшением Claude Code: теперь при запросе разрешения (permission prompt) можно нажать Tab и добавить дополнительные инструкции перед тем как принять или отклонить.

Мелочь, но приятная - особенно когда хочешь уточнить контекст для модели, но не хочешь прерывать флоу.

По словам Бориса, команда перепробовала около дюжины вариантов UX за последние недели, прежде чем остановились на этом.

🔗 Source: https://x.com/bcherny/status/2011332893772308867

#claudecode #anthropic #ai #ux

—————————
Мысли Рвачева
—————————
Forwarded from Rust
🔥 CEO Cursor заявил, что они скоординировали **сотни GPT-5.2 агентов**, чтобы автономно собрать браузер с нуля всего за 1 неделю.

Цитата:
> “Мы построили браузер с GPT-5.2 прямо в Cursor. Он работал без остановки целую неделю.”


Что особенно дико:
- 3M+ строк кода
- тысячи файлов
- рендер-движок с нуля на Rust
- парсинг HTML / CSS

Если это правда - мы уже не “пишем код”, мы управляем армией агентов, которые строят целые продукты без сна и выходных.

https://x.com/mntruell/status/2011562190286045552
Разорился на подписку Ultra в Cursor.

Решил переписать на Rust все микросервисы в компании, где работаю.
Потом поставлю плашку что сервисы на Rust переписал и заодно на ходу изучу Rust лучше, чем на говнокурсах.
Счастлив не тот кто прорешал много задачек с Литкода
А тот у кого нейронка не обнаружаема

#memes
промптинг - это не технический навык

обещал разобрать эту статью mutual theory of mind in human-ai collaboration

MIT показывают, что это скорее
социальный и метакогнитивный навык,
просто применённый к нечеловеческому разуму

они смотрели не на «качество запросов»,
а на то, кто в итоге лучше всего работает с ИИ

сравнивали корреляции между
интеллектом,
техническими навыками,
опытом,
и эффективностью совместного мышления с ИИ

и корреляция почти нулевая

зато вылезает другое

лучше всего работают люди,
у которых уже развит навык
работать с контекстом, перспективами
и рамками взаимодействия

умения:
- чувствовать, где есть рассинхрон понимания
- замечать, что «другой агент» чего-то не понял
- догружать смысл, а не инструкции
- менять рамку диалога на лету

по сути, то, что раньше считалось
«гуманитарным», «мягким», «неприкладным»

пост про ai posture в ту же копилку про то из какой позиции сознания мы вообще входим в диалог

MIT просто смотрят на то же самое
через поведение в диалоге

и там дальше становится еще интереснее

успешные пользователи не «инструктируют» модель.
MIT это прямо показывают.
они с ней координируются

не оптимизируют команды,
а настраивают общее пространство мышления

поэтому так странно, но логично:
ИИ сильнее всего энейблит гуманитариев

людей, привыкших
работать со смыслами,
держать несколько перспектив,
чувствовать динамику диалога,
не требовать «правильного ответа», а исследовать

технари часто застревают в режиме контроля:
«скажи точно»,
«следуй инструкции»,
«не отклоняйся»

и в этот момент модель
работает хуже, не лучше.

дальше MIT разбирают микроповедение в диалоге -
не что человек пишет,
а как он в это взаимодействие входит

и там постоянно повторяются одни и те же эффекты

assumption tracking -
умение ловить момент,
когда внутри появляется
«ну это же очевидно, она должна понять»

раздражение почти всегда = непроговорённое ожидание

gap filling -
умение замечать,
какая часть картины есть только у тебя в голове,
и выносить её наружу.

не уточнять запрос,
а достраивать общее поле смысла.

perspective shifting -
момент, когда ты вдруг понимаешь:
«мы сейчас вообще в разных моделях мира»

и вместо давления
меняешь угол, а не усилие.

и самый важный слой - interaction framing

человек всегда задает рамку взаимодействия,
даже когда думает, что просто «спросил»

инструмент.
исполнитель.
оракул.
собеседник.
напарник

рамка считывается не из слов,
а из тона, ожиданий, реакции на ошибки.

и модель начинает играть ровно в эту игру.

если собрать всё это в одну цепочку,
выходит простой, но неочевидный вывод:

качество ответа - это производная
от рамки взаимодействия,
а не от сложности инструкции


поэтому промптинг и перестаёт быть техникой
и становится чем-то ближе
к диалогу,
фасилитации,
мышлению вместе.

взаимодействие с ии все больше похоже не на технические науки а про те же метанавыки что в отношениях между людьми

что чувствуете?
🚀 Ollama + Claude — что произошло и почему это важно

Ollama добавила поддержку Anthropic Messages API. Проще говоря: теперь Claude Code и агентные инструменты Claude можно запускать через Ollama, в том числе с локальными моделями.

🤨 Что это значит:

🔘Claude-style агенты больше не привязаны строго к облаку
🔘можно использовать agent-workflow (кодинг, правки, автоматизация) поверх локальных LLM
🔘Ollama становится слоем-адаптером между closed-source инструментами и open-source моделями

🔮 Перспективы:

Мы движемся к гибридному AI-стеку:
локальные модели 🔜 приватность и контроль, облачные инструменты 🔜 зрелые агенты и UX.

Следующий этап — автономные AI-ассистенты, которые работают локально, но используют лучшие практики топ-провайдеров.
И Ollama явно метит в роль стандарта такого стека.

#ai #agentic #claude #ollama #dev #agents #future
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 Cursor провели кодовый марафон среди AI-агентов на недели и получили миллионы строк кода среднего качества

Cursor провёл эксперимент: можно ли масштабировать длительное автономное программирование, просто добавляя больше агентов? Оказалось — да, но с оговорками.

Что удалось навайбкодить в ходе эксперимента:
- Веб-браузер с нуля — 1М+ строк кода за ~неделю
- Миграция Cursor с Solid на React, - агенты работали 3 недели, +266K строк добавлено, удалено 193K.
- Эмулятор Windows 7 — 14.6K коммитов, 1.2М строк (в процессе)
- Клон Excel — 12K коммитов, 1.6М строк (в процессе)

Плоская структура с равнозначными агентами провалилась, - 20 агентов работали как 2-3, остальные ждали разблокировки очереди.

Без иерархии агенты избегали сложных задач и делали только безопасные мелкие правки.
Когда у общества нет цветовой дифференциации штанов, то нет цели! А когда нет цели — нет будущего!


Решение — разделение ролей:
- Планировщики — исследуют код, создают задачи, могут порождать суб-планировщиков
- Воркеры, - пилят свою задачу до конца, потом пушат в репу
- Судьи, - решают, продолжать или повторять цикл

Главный инсайт по моделям:
Codex
отменяем. GPT-5.2 оказался значительно лучше для длительной автономной работы,- лучше держит фокус, точнее следует инструкциям, не дрейфует.
Opus 4.5 склонен останавливаться раньше и срезать углы, быстро возвращая управление человеку.

Интересно, что GPT-5.2 оказался лучшим планировщиком, чем GPT-5.1-codex, хотя последний специально обучен написанию кода.

Вайб-косяки:
На Hacker News заметили — браузер не компилируется у внешних пользователей, CI не проходит.
PR миграции Solid→React назвали «невозможным для ревью». Код описывают как «крайне хрупкий».

Ключевые выводы Cursor:
- Промпты важнее архитектуры и выбора модели
- Упрощение системы часто давало лучшие результаты
- Периодические «свежие старты» обязательны чтобы не сваливаться в дрейф
- Под разные роли лучше использовать разные модели

#Cursor #агенты #GPT #Opus #AgenticCoding
———
@tsingular
Microsoft обновил бесплатный курс по агентам

на русском языке

курс охватывает базу, шаблоны, RAG, вывод в продакшен, масштабирование и системы защиты.

#Microsoft #агенты #обучение
———
@tsingular
Forwarded from AI for Devs
Для любителей LeetCode и performance-задачек: Anthropic выложили в открытый доступ своё старое тестовое задание на оптимизацию производительности.

Это не алгоритмы и не структуры данных. Задача: жёсткая оптимизация ядра виртуальной машины, где результат измеряется напрямую в clock cycles.

Стартовая реализация работает за 147 734 такта. Дальше — только код и микрооптимизации.

Для ориентира, результаты моделей Anthropic:

* 1790 — Claude Opus 4.5 в обычной сессии
* 1579 — тот же Opus 4.5 после 2 часов оптимизаций
* 1487 — после 11.5 часов
* 1363 — лучший результат Opus 4.5 в улучшенном harness

Если опускаешься ниже 1487, предлагают прислать код и резюме 😉

Робот сочинит симфонию? Робот оптимизирует ядро виртуальной машины? А человек нах*й может мне...
Forwarded from AI for Devs
До появления ИИ-агентов для программирования у меня обычно было 2-3 пет-проекта, которые я с трудом мог закончить.

ИИ полностью изменил правила игры.

Теперь у меня их 15-20.
Как говориться elevate your game with AI - ну то есть пора уже дальше двигаться.

Кто смотрел мое видео как я на работе работаю и задачки закрываю одну за другой с AI, MCP, rulers, repo indexing и тп? Там я показал реальные практические примеры, которые закрывают 90% моих повседневных задач.

Но все это ограничено 1-2 сессиями с AI, где я, как бы контролирую файлы и процесс.

Все пошло дальше. Теперь инженер может запускать 20-50 сессий и агенты работают, каждый в свой git branch и потом все это собирается в pull request.

Я пока еще не приступил к такому, но это следующий шаг в разработке, уже без IDE.

Вот что почитать:
Gastown
Multi-Claude
Claude-flow

Это все будем разбирать на Surfalytics.

Даже уже сейчас вы может через tmux запускать агентов и контролировать план задача через OpenSpec.

PS при этом 98% моих коллег, а их явно очень много практически не используют базовые возможности. На их фоне я просто супер герой производительности, я уже думаю понижать скорость и просить AI помогать мне дозировать мою сверх производительность🙈

PPS: как видите Claude code сейчас number one для разработки.

А как у вас?
Forwarded from Клуб CDO (PostoplanBot)
Команда Cursor опубликовала практическое руководство по лучшим практикам работы с агентами при написании кода.

Агенты для программирования меняют то, как создаётся софт. Не потому, что они пишут код. А потому, что они меняют само понимание «хорошей инженерии»

Вот паттерны, которые стоит позаимствовать:

- Результаты работы агента зависят от трёх вещей: инструкций, инструментов и ваших промптов. Если результаты нестабильны, не спешите винить модель. Исправляйте harness.

- Самый большой рычаг эффективности — планирование всего, что хоть немного сложнее тривиального.
Пусть агент изучит кодовую базу, прояснит требования, составит план с указанием файлов и путей — и только потом приступает к выполнению.

- Не пытайтесь «допромптить» неверное направление. Откатитесь назад, уточните план, запустите заново. В итоге — более чистые диффы и меньше странных edge case’ов.

- Начинайте новый диалог, когда меняете задачу, агент повторяет ошибки или падает качество. Продолжайте текущий — когда вы итеративно работаете над одной и той же частью или дебажите то, что он только что сделал.

- Стандартизируйте использование агентов в команде: Rules — это постоянные ограничения проекта: команды, стиль, канонические примеры. Skills — это динамические рабочие процессы: повторяемые команды, хуки, долгоживущие циклы, интеграции.

https://cursor.com/blog/agent-best-practices
Там много классных AI штук появляется на рынке, что и не успеваешь за всем уследить, в Discord Surfalytics у нас даже есть специальные канал dev-boost-with-ai, где я собираю самое важное, что может повлиять на нашу работу.

Буквально на днях увидел про Clawbot. Судя по отзывам топ инструмент, который служит персональным ассистентом и живет на локальной машине (бесплатный и открытый).

Я хотел его попробовать для автоматизации создания и мониторинга задач в Jira, Notion, Asana. У меня всегда с этим проблема, я не создаю и не обновляю задачки.

А сегодня ребята скинули пост - From Clawdbot to Moltbot: How a C&D, Crypto Scammers, and 10 Seconds of Chaos Took Down the Internet's Hottest AI Project

Эта статья рассказывает о драматической истории проекта Clawdbot (теперь Moltbot) — самостоятельно размещаемого AI-ассистента, который за 72 часа пережил настоящий хаос.
Основные моменты:

Взлёт проекта
• Clawdbot набрал 60,800+ звёзд на GitHub за рекордно короткое время
• Это был AI-ассистент с "руками" — не просто чат, а инструмент, который реально выполнял действия (доступ к файлам, браузеру, командной строке)
• Поддерживал 50+ интеграций и работал через WhatsApp, Telegram, Slack, iMessage и другие платформы

Принудительный ребрендинг
• Anthropic (создатели Claude) потребовали сменить название из-за схожести "Clawd" с "Claude"
• Проект переименовали в Moltbot (от слова "molt" — линька у омаров, символ роста)

10 секунд хаоса
• При переименовании аккаунтов GitHub и X/Twitter основатель допустил ошибку
• Криптоскамеры перехватили старые аккаунты за ~10 секунд и начали рассылать мошеннические объявления
• Появились фейковые токены
$CLAWD на Solana с капитализацией до $16 млн, которые затем обрушились

Проблемы безопасности
• Исследователи обнаружили сотни публично доступных экземпляров Moltbot с открытыми учётными данными
• Через Shodan можно было найти API-ключи, токены ботов, историю переписок и возможность удалённого выполнения кода
• Демонстрация показала, как за 5 минут можно перехватить письма пользователя через prompt injection

Вопросы к Anthropic
• Многие пользователи Moltbot использовали Claude как основную модель, фактически продвигая продукт Anthropic
• Сообщество недоумевает: зачем компания преследует проект, который увеличивал продажи их подписок?

Выводы статьи:
История показывает хрупкость экосистемы AI и open-source проектов — один юридический запрос может запустить цепную реакцию из взломов, скамов и хаоса. Проект технически остаётся сильным, но репутационный ущерб огромен.

Будьте аккуратны с новыми инструментами.
А Antropic есть станица с курсами. Я сам не проходил, но дал задание сыну (13 лет)

AI Fluency for Students
Claude 101
Claude Code in Action

Раньше
у него был VSCode + KiloCode, и он создавал простые игры. Я ему настроил Claude Code в CLI, и он сказал ему намного удобней работать в командной строке, чем в VSCode. Для меня это было неожиданно. Мне вот неудобно в CLI работать, я же не вижу файлы, которые меняется. А для него эти файлы были шумом, он сфокусирован на конечном продукте, и всякие там js, css файлы это лишняя абстракция, которую он еще не знает. Я его похвалил, что он делает крутые успехи, ведь даже в этом канале мало кто использует Claude Code😝

Конечно возникает вопрос - как же так, отдать AI весь процесс создания, а самому только смотреть на input/output. Возможно так и будет скоро и новое поколение явно будет использовать AI по другому. Я ему помог нарисовать диаграмму карандашом, что у нас происходит и как можно через API генерить картинки при загрузке страницы. Дальше я хочу, чтобы он загрузил эту игру (продукт) в Netlify (хостинг) и добавь настоящий домен. Таким образом будет пример end-to-end продукта. Я в 8 классе играл в Sims, Fallout 2 и Commandos, а тут такое раздолье. Так же каждый вечер мы слушаем summary книг про компании и бизнес и мой главный point для детей, что важна дисциплина, фокус и consistency.

На подходе у нас Mini Reachy - open source робот (300 деталей), который умеет разговорить и видеть, обязательно напишу про него, когда соберем. Еще детям очень понравились проекты от Mark Robert - Crunch Labs.

Что касается меня, то я решил параллельно работать на Cursor и на Claude Code (CLI), чтобы не отставать от трендов.

PS Вот прям сейчас AI сэкономил мне 150$. На кухне выбило пробки и перестал работать фильтр и половину розеток. В щитке я включал/выключал все - не помогло. Уже думали завтра вызвать мастера. Я сфоткал свои розетки и щиток, рассказал симптомы и получил решение - на одной из розеток на кухне есть circuit breaker, я его нашел и нажал, все заработало! Электрики скоро без работы останутся! 😆

#дети #ai
Media is too big
VIEW IN TELEGRAM
Claude 4.6 Sonnet и сбой в Матрице

Короче это буквально я сегодня утром.
Есть у меня, кто не знает, бот, который анализирует логи каналов и каждое утро присылает саммари того, что обсуждали за сутки.
Делает это бесплатно, т.е. даром.
И всё было хорошо примерно год.
40+ каналов разных - все работало без сбоев.
И тут сегодня утром вдруг он начинает сыпать ошибками разметки ни с того ни с сего, - я его этот год вообще не трогал ни разу.

А работает он, надо сказать, на Антропике - Haiku модель.

Ну и я предположил, что в Матрице Антропике, видимо, что-то поменяли и готовят релиз, ну потому, что других причин то вроде нет.

И вот, - нате получите, распишитесь:

Anthropic выкатила новый Sonnet 4.6 — дефолтная модель для Free и Pro планов в claude.ai. Цена прежняя: $3/$15 за миллион токенов.

Ключевое:
Контекстное окно 1M токенов (бета)
В Claude Code пользователи предпочли Sonnet 4.6 вместо Sonnet 4.5 в 70% случаев
Даже против Opus 4.5 (фронтир от ноября 2025) — предпочтение в 59% случаев

Серьёзный прогресс в computer use — на OSWorld бенчмарке стабильный рост за 16 месяцев (полезно для OpenClaw)

Что улучшили:
- Кодинг: меньше overengineering, меньше «лени», лучшее следование инструкциям
- Меньше галлюцинаций и ложных заявлений об успехе
- Фронтенд-код и финансовый анализ — клиенты отмечают заметно более качественный визуал
- Устойчивость к prompt injection на уровне Opus 4.6

API: claude-sonnet-4-6, поддержка adaptive и extended thinking, context compaction (бета).

По сути Sonnet 4.6 закрывает задачи, для которых раньше нужен был Opus — но по цене Sonnet.

Matrix has you Neo

#AI #Claude #Anthropic #Sonnet #агенты
———
@tsingular
Forwarded from Agentic Engineer
Зачем делят AGENTS.md / CLAUDE.md на несколько файлов

TL;DR: AGENTS.md/CLAUDE.md дробят, чтобы сужать контекст, давать правила "по месту" (для конкретного модуля) и не упираться в лимиты - и OpenAI это прямо заложила в механику Codex.

1️⃣ Контекст "по месту", а не простыня на весь репо

Идея - держать базовые правила в корне, а узкие - рядом с кодом (сервис/пакет/папка). Тогда агент подтягивает то, что релевантно текущей директории. В Codex это оформлено как "цепочка инструкций": он собирает файлы от корня проекта до текущей папки, и файлы ближе к текущей директории "перекрывают" ранние.

2️⃣ Официально поддержанные override`s и приоритеты

Codex проверяет в каждой папке сначала AGENTS.override.md, потом AGENTS.md, и берёт максимум один файл на директорию. Это и есть "переопределение правил" без копипасты всего документа.

3️⃣ Лимит размера 🔜 проще дробить, чем раздувать один файл

В документации Codex явно сказано, что он прекращает добавлять инструкции, когда суммарный размер достигает лимита (по умолчанию 32 KiB) - и прямо рекомендует разносить инструкции по вложенным директориям, если упираетесь в кап.

👇👇👇

Как это делает OpenAI у себя

Про практику OpenAI есть публичный сигнал: в обзоре формата отмечают, что у OpenAI-организации "десятки AGENTS.md" по подкомпонентам, т.е. подход именно "много маленьких по месту", а не один общий.
Плюс, сама документация Codex описывает "слоение" инструкций: глобальные (~/.codex), репо-уровень (корень) и локальные overrides (подпапки).

〰️〰️〰️〰️〰️〰️〰️〰️

Дробление AGENTS.md/CLAUDE.md - это важный инженерный приём, который привнесёт тебе следующей пользы:

🟢меньше шума в контексте,
🟢правила применяются там, где нужно,
🟢проще сопровождать,
🟢не ловить silent-truncation на лимитах.

@data_engi

#openai #agents #hack #trix #ai #llm #dev
Please open Telegram to view this post
VIEW IN TELEGRAM