Forwarded from Data, Stories and Languages
Чудеса AI агентов
Мой опыт работы с AI агентами имеет переменный успех. Иногда получается быстро сделать нужное и агенты сильно упрощают работу, иногда агенты никак не справляются с задачей, и проще сделать самому.
Но иногда бывают моменты, когда реально впечатляешься возможностям. У нас на работе с недавних пор стало можно официально использовать Claude Code, и люди стали активно допиливать его. Один из способов расширения возможностей - создание skills. По факту, это инструкции для выполнения каких-то конкретных задач.
Сегодня мне надо было обновить ранее сделанные мной диаграммы Excalidraw. Я их рисовал вручную, на основе моих пайпланов (sql-запросы с разными обёртками). Снова делать это вручную стало лень, и я стал искать другие варианты. Буквально случайно обнаружил, что несколько недель назад кто-то сделал skill для создания диаграмм Excalidraw.
Я установил skill, написал команду типа "Generate the excalidraw diagram for the dataflow in this file", подождал минут 5, и получил файлик. Открыл его... и реально - красиво нарисованная диаграмма, со стрелочками, разными цветами, комментариями. Всё было нарисовано из коробки отлично, даже не пришлось ничего исправлять. Это был взрыв мозга.
P. S. Потом правда оказалось, что если попросить его нарисовать диаграмму по нескольким большим скриптам, он ломается с ошибкой 504, ибо превышает лимиты :) Так что создавал дальше диаграммы по отдельности для каждого файла.
#datascience
Мой опыт работы с AI агентами имеет переменный успех. Иногда получается быстро сделать нужное и агенты сильно упрощают работу, иногда агенты никак не справляются с задачей, и проще сделать самому.
Но иногда бывают моменты, когда реально впечатляешься возможностям. У нас на работе с недавних пор стало можно официально использовать Claude Code, и люди стали активно допиливать его. Один из способов расширения возможностей - создание skills. По факту, это инструкции для выполнения каких-то конкретных задач.
Сегодня мне надо было обновить ранее сделанные мной диаграммы Excalidraw. Я их рисовал вручную, на основе моих пайпланов (sql-запросы с разными обёртками). Снова делать это вручную стало лень, и я стал искать другие варианты. Буквально случайно обнаружил, что несколько недель назад кто-то сделал skill для создания диаграмм Excalidraw.
Я установил skill, написал команду типа "Generate the excalidraw diagram for the dataflow in this file", подождал минут 5, и получил файлик. Открыл его... и реально - красиво нарисованная диаграмма, со стрелочками, разными цветами, комментариями. Всё было нарисовано из коробки отлично, даже не пришлось ничего исправлять. Это был взрыв мозга.
P. S. Потом правда оказалось, что если попросить его нарисовать диаграмму по нескольким большим скриптам, он ломается с ошибкой 504, ибо превышает лимиты :) Так что создавал дальше диаграммы по отдельности для каждого файла.
#datascience
Claude Code Docs
Extend Claude with skills - Claude Code Docs
Create, manage, and share skills to extend Claude's capabilities in Claude Code. Includes custom commands and bundled skills.
Forwarded from Мысли Рвачева
Мне кажется или OpenAI постепенно начинает проигрывать рынок Anthropic?
Повсюду слышу про Claude Code, а про OpenAI Codex только в твиттах Sam Altman и Co про то какой он крутой и невероятный?
Или это я в бабле?
—————————
Мысли Рвачева
—————————
Повсюду слышу про Claude Code, а про OpenAI Codex только в твиттах Sam Altman и Co про то какой он крутой и невероятный?
Или это я в бабле?
—————————
Мысли Рвачева
—————————
Forwarded from Мысли Рвачева
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Claude Code добавил удобную фичу для работы с permissions
Boris Cherny из Anthropic поделился новым улучшением Claude Code: теперь при запросе разрешения (permission prompt) можно нажать Tab и добавить дополнительные инструкции перед тем как принять или отклонить.
Мелочь, но приятная - особенно когда хочешь уточнить контекст для модели, но не хочешь прерывать флоу.
По словам Бориса, команда перепробовала около дюжины вариантов UX за последние недели, прежде чем остановились на этом.
🔗 Source: https://x.com/bcherny/status/2011332893772308867
#claudecode #anthropic #ai #ux
—————————
Мысли Рвачева
—————————
Boris Cherny из Anthropic поделился новым улучшением Claude Code: теперь при запросе разрешения (permission prompt) можно нажать Tab и добавить дополнительные инструкции перед тем как принять или отклонить.
Мелочь, но приятная - особенно когда хочешь уточнить контекст для модели, но не хочешь прерывать флоу.
По словам Бориса, команда перепробовала около дюжины вариантов UX за последние недели, прежде чем остановились на этом.
🔗 Source: https://x.com/bcherny/status/2011332893772308867
#claudecode #anthropic #ai #ux
—————————
Мысли Рвачева
—————————
Forwarded from Rust
🔥 CEO Cursor заявил, что они скоординировали **сотни GPT-5.2 агентов**, чтобы автономно собрать браузер с нуля всего за 1 неделю.
Цитата:
Что особенно дико:
- 3M+ строк кода
- тысячи файлов
- рендер-движок с нуля на Rust
- парсинг HTML / CSS
Если это правда - мы уже не “пишем код”, мы управляем армией агентов, которые строят целые продукты без сна и выходных.
https://x.com/mntruell/status/2011562190286045552
Цитата:
> “Мы построили браузер с GPT-5.2 прямо в Cursor. Он работал без остановки целую неделю.”
Что особенно дико:
- 3M+ строк кода
- тысячи файлов
- рендер-движок с нуля на Rust
- парсинг HTML / CSS
Если это правда - мы уже не “пишем код”, мы управляем армией агентов, которые строят целые продукты без сна и выходных.
https://x.com/mntruell/status/2011562190286045552
Forwarded from Данные по-большому
Разорился на подписку Ultra в Cursor.
Решил переписать на Rust все микросервисы в компании, где работаю.
Потом поставлю плашку что сервисы на Rust переписал и заодно на ходу изучу Rust лучше, чем на говнокурсах.
Решил переписать на Rust все микросервисы в компании, где работаю.
Потом поставлю плашку что сервисы на Rust переписал и заодно на ходу изучу Rust лучше, чем на говнокурсах.
Forwarded from Данные по-большому
Forwarded from ии и новый мир @matskevich
промптинг - это не технический навык
обещал разобрать эту статью mutual theory of mind in human-ai collaboration
MIT показывают, что это скорее
социальный и метакогнитивный навык,
просто применённый к нечеловеческому разуму
они смотрели не на «качество запросов»,
а на то, кто в итоге лучше всего работает с ИИ
сравнивали корреляции между
интеллектом,
техническими навыками,
опытом,
и эффективностью совместного мышления с ИИ
и корреляция почти нулевая
зато вылезает другое
лучше всего работают люди,
у которых уже развит навык
работать с контекстом, перспективами
и рамками взаимодействия
умения:
- чувствовать, где есть рассинхрон понимания
- замечать, что «другой агент» чего-то не понял
- догружать смысл, а не инструкции
- менять рамку диалога на лету
по сути, то, что раньше считалось
«гуманитарным», «мягким», «неприкладным»
пост про ai posture в ту же копилку про то из какой позиции сознания мы вообще входим в диалог
MIT просто смотрят на то же самое
через поведение в диалоге
и там дальше становится еще интереснее
успешные пользователи не «инструктируют» модель.
MIT это прямо показывают.
они с ней координируются
не оптимизируют команды,
а настраивают общее пространство мышления
поэтому так странно, но логично:
ИИ сильнее всего энейблит гуманитариев
людей, привыкших
работать со смыслами,
держать несколько перспектив,
чувствовать динамику диалога,
не требовать «правильного ответа», а исследовать
технари часто застревают в режиме контроля:
«скажи точно»,
«следуй инструкции»,
«не отклоняйся»
и в этот момент модель
работает хуже, не лучше.
дальше MIT разбирают микроповедение в диалоге -
не что человек пишет,
а как он в это взаимодействие входит
и там постоянно повторяются одни и те же эффекты
assumption tracking -
умение ловить момент,
когда внутри появляется
«ну это же очевидно, она должна понять»
раздражение почти всегда = непроговорённое ожидание
gap filling -
умение замечать,
какая часть картины есть только у тебя в голове,
и выносить её наружу.
не уточнять запрос,
а достраивать общее поле смысла.
perspective shifting -
момент, когда ты вдруг понимаешь:
«мы сейчас вообще в разных моделях мира»
и вместо давления
меняешь угол, а не усилие.
и самый важный слой - interaction framing
человек всегда задает рамку взаимодействия,
даже когда думает, что просто «спросил»
инструмент.
исполнитель.
оракул.
собеседник.
напарник
рамка считывается не из слов,
а из тона, ожиданий, реакции на ошибки.
и модель начинает играть ровно в эту игру.
если собрать всё это в одну цепочку,
выходит простой, но неочевидный вывод:
качество ответа - это производная
от рамки взаимодействия,
а не от сложности инструкции
поэтому промптинг и перестаёт быть техникой
и становится чем-то ближе
к диалогу,
фасилитации,
мышлению вместе.
взаимодействие с ии все больше похоже не на технические науки а про те же метанавыки что в отношениях между людьми
что чувствуете?
обещал разобрать эту статью mutual theory of mind in human-ai collaboration
MIT показывают, что это скорее
социальный и метакогнитивный навык,
просто применённый к нечеловеческому разуму
они смотрели не на «качество запросов»,
а на то, кто в итоге лучше всего работает с ИИ
сравнивали корреляции между
интеллектом,
техническими навыками,
опытом,
и эффективностью совместного мышления с ИИ
и корреляция почти нулевая
зато вылезает другое
лучше всего работают люди,
у которых уже развит навык
работать с контекстом, перспективами
и рамками взаимодействия
умения:
- чувствовать, где есть рассинхрон понимания
- замечать, что «другой агент» чего-то не понял
- догружать смысл, а не инструкции
- менять рамку диалога на лету
по сути, то, что раньше считалось
«гуманитарным», «мягким», «неприкладным»
пост про ai posture в ту же копилку про то из какой позиции сознания мы вообще входим в диалог
MIT просто смотрят на то же самое
через поведение в диалоге
и там дальше становится еще интереснее
успешные пользователи не «инструктируют» модель.
MIT это прямо показывают.
они с ней координируются
не оптимизируют команды,
а настраивают общее пространство мышления
поэтому так странно, но логично:
ИИ сильнее всего энейблит гуманитариев
людей, привыкших
работать со смыслами,
держать несколько перспектив,
чувствовать динамику диалога,
не требовать «правильного ответа», а исследовать
технари часто застревают в режиме контроля:
«скажи точно»,
«следуй инструкции»,
«не отклоняйся»
и в этот момент модель
работает хуже, не лучше.
дальше MIT разбирают микроповедение в диалоге -
не что человек пишет,
а как он в это взаимодействие входит
и там постоянно повторяются одни и те же эффекты
assumption tracking -
умение ловить момент,
когда внутри появляется
«ну это же очевидно, она должна понять»
раздражение почти всегда = непроговорённое ожидание
gap filling -
умение замечать,
какая часть картины есть только у тебя в голове,
и выносить её наружу.
не уточнять запрос,
а достраивать общее поле смысла.
perspective shifting -
момент, когда ты вдруг понимаешь:
«мы сейчас вообще в разных моделях мира»
и вместо давления
меняешь угол, а не усилие.
и самый важный слой - interaction framing
человек всегда задает рамку взаимодействия,
даже когда думает, что просто «спросил»
инструмент.
исполнитель.
оракул.
собеседник.
напарник
рамка считывается не из слов,
а из тона, ожиданий, реакции на ошибки.
и модель начинает играть ровно в эту игру.
если собрать всё это в одну цепочку,
выходит простой, но неочевидный вывод:
качество ответа - это производная
от рамки взаимодействия,
а не от сложности инструкции
поэтому промптинг и перестаёт быть техникой
и становится чем-то ближе
к диалогу,
фасилитации,
мышлению вместе.
взаимодействие с ии все больше похоже не на технические науки а про те же метанавыки что в отношениях между людьми
что чувствуете?
arXiv.org
Mutual Theory of Mind in Human-AI Collaboration: An Empirical...
Theory of Mind (ToM) significantly impacts human collaboration and communication as a crucial capability to understand others. When AI agents with ToM capability collaborate with humans, Mutual...
Ollama добавила поддержку Anthropic Messages API. Проще говоря: теперь Claude Code и агентные инструменты Claude можно запускать через Ollama, в том числе с локальными моделями.
Мы движемся к гибридному AI-стеку:
локальные модели
Следующий этап — автономные AI-ассистенты, которые работают локально, но используют лучшие практики топ-провайдеров.
И Ollama явно метит в роль стандарта такого стека.
#ai #agentic #claude #ollama #dev #agents #future
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Технозаметки Малышева
🤖 Cursor провели кодовый марафон среди AI-агентов на недели и получили миллионы строк кода среднего качества
Cursor провёл эксперимент: можно ли масштабировать длительное автономное программирование, просто добавляя больше агентов? Оказалось — да, но с оговорками.
Что удалось навайбкодить в ходе эксперимента:
- Веб-браузер с нуля — 1М+ строк кода за ~неделю
- Миграция Cursor с Solid на React, - агенты работали 3 недели, +266K строк добавлено, удалено 193K.
- Эмулятор Windows 7 — 14.6K коммитов, 1.2М строк (в процессе)
- Клон Excel — 12K коммитов, 1.6М строк (в процессе)
Плоская структура с равнозначными агентами провалилась, - 20 агентов работали как 2-3, остальные ждали разблокировки очереди.
Без иерархии агенты избегали сложных задач и делали только безопасные мелкие правки.
Решение — разделение ролей:
- Планировщики — исследуют код, создают задачи, могут порождать суб-планировщиков
- Воркеры, - пилят свою задачу до конца, потом пушат в репу
- Судьи, - решают, продолжать или повторять цикл
Главный инсайт по моделям:
Codex отменяем. GPT-5.2 оказался значительно лучше для длительной автономной работы,- лучше держит фокус, точнее следует инструкциям, не дрейфует.
Opus 4.5 склонен останавливаться раньше и срезать углы, быстро возвращая управление человеку.
Интересно, что GPT-5.2 оказался лучшим планировщиком, чем GPT-5.1-codex, хотя последний специально обучен написанию кода.
Вайб-косяки:
На Hacker News заметили — браузер не компилируется у внешних пользователей, CI не проходит.
PR миграции Solid→React назвали «невозможным для ревью». Код описывают как «крайне хрупкий».
Ключевые выводы Cursor:
- Промпты важнее архитектуры и выбора модели
- Упрощение системы часто давало лучшие результаты
- Периодические «свежие старты» обязательны чтобы не сваливаться в дрейф
- Под разные роли лучше использовать разные модели
#Cursor #агенты #GPT #Opus #AgenticCoding
———
@tsingular
Cursor провёл эксперимент: можно ли масштабировать длительное автономное программирование, просто добавляя больше агентов? Оказалось — да, но с оговорками.
Что удалось навайбкодить в ходе эксперимента:
- Веб-браузер с нуля — 1М+ строк кода за ~неделю
- Миграция Cursor с Solid на React, - агенты работали 3 недели, +266K строк добавлено, удалено 193K.
- Эмулятор Windows 7 — 14.6K коммитов, 1.2М строк (в процессе)
- Клон Excel — 12K коммитов, 1.6М строк (в процессе)
Плоская структура с равнозначными агентами провалилась, - 20 агентов работали как 2-3, остальные ждали разблокировки очереди.
Без иерархии агенты избегали сложных задач и делали только безопасные мелкие правки.
Когда у общества нет цветовой дифференциации штанов, то нет цели! А когда нет цели — нет будущего!
Решение — разделение ролей:
- Планировщики — исследуют код, создают задачи, могут порождать суб-планировщиков
- Воркеры, - пилят свою задачу до конца, потом пушат в репу
- Судьи, - решают, продолжать или повторять цикл
Главный инсайт по моделям:
Codex отменяем. GPT-5.2 оказался значительно лучше для длительной автономной работы,- лучше держит фокус, точнее следует инструкциям, не дрейфует.
Opus 4.5 склонен останавливаться раньше и срезать углы, быстро возвращая управление человеку.
Интересно, что GPT-5.2 оказался лучшим планировщиком, чем GPT-5.1-codex, хотя последний специально обучен написанию кода.
Вайб-косяки:
На Hacker News заметили — браузер не компилируется у внешних пользователей, CI не проходит.
PR миграции Solid→React назвали «невозможным для ревью». Код описывают как «крайне хрупкий».
Ключевые выводы Cursor:
- Промпты важнее архитектуры и выбора модели
- Упрощение системы часто давало лучшие результаты
- Периодические «свежие старты» обязательны чтобы не сваливаться в дрейф
- Под разные роли лучше использовать разные модели
#Cursor #агенты #GPT #Opus #AgenticCoding
———
@tsingular
Forwarded from Технозаметки Малышева
Microsoft обновил бесплатный курс по агентам
на русском языке
курс охватывает базу, шаблоны, RAG, вывод в продакшен, масштабирование и системы защиты.
#Microsoft #агенты #обучение
———
@tsingular
на русском языке
курс охватывает базу, шаблоны, RAG, вывод в продакшен, масштабирование и системы защиты.
#Microsoft #агенты #обучение
———
@tsingular
Forwarded from AI for Devs
Для любителей LeetCode и performance-задачек: Anthropic выложили в открытый доступ своё старое тестовое задание на оптимизацию производительности.
Это не алгоритмы и не структуры данных. Задача: жёсткая оптимизация ядра виртуальной машины, где результат измеряется напрямую в clock cycles.
Стартовая реализация работает за 147 734 такта. Дальше — только код и микрооптимизации.
Для ориентира, результаты моделей Anthropic:
* 1790 — Claude Opus 4.5 в обычной сессии
* 1579 — тот же Opus 4.5 после 2 часов оптимизаций
* 1487 — после 11.5 часов
* 1363 — лучший результат Opus 4.5 в улучшенном harness
Если опускаешься ниже 1487, предлагают прислать код и резюме 😉
Робот сочинит симфонию? Робот оптимизирует ядро виртуальной машины? А человек нах*й может мне...
Это не алгоритмы и не структуры данных. Задача: жёсткая оптимизация ядра виртуальной машины, где результат измеряется напрямую в clock cycles.
Стартовая реализация работает за 147 734 такта. Дальше — только код и микрооптимизации.
Для ориентира, результаты моделей Anthropic:
* 1790 — Claude Opus 4.5 в обычной сессии
* 1579 — тот же Opus 4.5 после 2 часов оптимизаций
* 1487 — после 11.5 часов
* 1363 — лучший результат Opus 4.5 в улучшенном harness
Если опускаешься ниже 1487, предлагают прислать код и резюме 😉
Робот сочинит симфонию? Робот оптимизирует ядро виртуальной машины? А человек нах*й может мне...
GitHub
GitHub - anthropics/original_performance_takehome: Anthropic's original performance take-home, now open for you to try!
Anthropic's original performance take-home, now open for you to try! - anthropics/original_performance_takehome
Forwarded from AI for Devs
До появления ИИ-агентов для программирования у меня обычно было 2-3 пет-проекта, которые я с трудом мог закончить.
ИИ полностью изменил правила игры.
Теперь у меня их 15-20.
ИИ полностью изменил правила игры.
Forwarded from Инжиниринг Данных
Как говориться elevate your game with AI - ну то есть пора уже дальше двигаться.
Кто смотрел мое видео как я на работе работаю и задачки закрываю одну за другой с AI, MCP, rulers, repo indexing и тп? Там я показал реальные практические примеры, которые закрывают 90% моих повседневных задач.
Но все это ограничено 1-2 сессиями с AI, где я, как бы контролирую файлы и процесс.
Все пошло дальше. Теперь инженер может запускать 20-50 сессий и агенты работают, каждый в свой git branch и потом все это собирается в pull request.
Я пока еще не приступил к такому, но это следующий шаг в разработке, уже без IDE.
Вот что почитать:
Gastown
Multi-Claude
Claude-flow
Это все будем разбирать на Surfalytics.
Даже уже сейчас вы может через tmux запускать агентов и контролировать план задача через OpenSpec.
PS при этом 98% моих коллег, а их явно очень много практически не используют базовые возможности. На их фоне я просто супер герой производительности, я уже думаю понижать скорость и просить AI помогать мне дозировать мою сверх производительность🙈
PPS: как видите Claude code сейчас number one для разработки.
А как у вас?
Кто смотрел мое видео как я на работе работаю и задачки закрываю одну за другой с AI, MCP, rulers, repo indexing и тп? Там я показал реальные практические примеры, которые закрывают 90% моих повседневных задач.
Но все это ограничено 1-2 сессиями с AI, где я, как бы контролирую файлы и процесс.
Все пошло дальше. Теперь инженер может запускать 20-50 сессий и агенты работают, каждый в свой git branch и потом все это собирается в pull request.
Я пока еще не приступил к такому, но это следующий шаг в разработке, уже без IDE.
Вот что почитать:
Gastown
Multi-Claude
Claude-flow
Это все будем разбирать на Surfalytics.
Даже уже сейчас вы может через tmux запускать агентов и контролировать план задача через OpenSpec.
PS при этом 98% моих коллег, а их явно очень много практически не используют базовые возможности. На их фоне я просто супер герой производительности, я уже думаю понижать скорость и просить AI помогать мне дозировать мою сверх производительность🙈
PPS: как видите Claude code сейчас number one для разработки.
А как у вас?
Medium
Welcome to Gas Town
Happy New Year, and Welcome to Gas Town!
Forwarded from Клуб CDO (PostoplanBot)
Команда Cursor опубликовала практическое руководство по лучшим практикам работы с агентами при написании кода.
Агенты для программирования меняют то, как создаётся софт. Не потому, что они пишут код. А потому, что они меняют само понимание «хорошей инженерии»
Вот паттерны, которые стоит позаимствовать:
- Результаты работы агента зависят от трёх вещей: инструкций, инструментов и ваших промптов. Если результаты нестабильны, не спешите винить модель. Исправляйте harness.
- Самый большой рычаг эффективности — планирование всего, что хоть немного сложнее тривиального.
Пусть агент изучит кодовую базу, прояснит требования, составит план с указанием файлов и путей — и только потом приступает к выполнению.
- Не пытайтесь «допромптить» неверное направление. Откатитесь назад, уточните план, запустите заново. В итоге — более чистые диффы и меньше странных edge case’ов.
- Начинайте новый диалог, когда меняете задачу, агент повторяет ошибки или падает качество. Продолжайте текущий — когда вы итеративно работаете над одной и той же частью или дебажите то, что он только что сделал.
- Стандартизируйте использование агентов в команде: Rules — это постоянные ограничения проекта: команды, стиль, канонические примеры. Skills — это динамические рабочие процессы: повторяемые команды, хуки, долгоживущие циклы, интеграции.
https://cursor.com/blog/agent-best-practices
Агенты для программирования меняют то, как создаётся софт. Не потому, что они пишут код. А потому, что они меняют само понимание «хорошей инженерии»
Вот паттерны, которые стоит позаимствовать:
- Результаты работы агента зависят от трёх вещей: инструкций, инструментов и ваших промптов. Если результаты нестабильны, не спешите винить модель. Исправляйте harness.
- Самый большой рычаг эффективности — планирование всего, что хоть немного сложнее тривиального.
Пусть агент изучит кодовую базу, прояснит требования, составит план с указанием файлов и путей — и только потом приступает к выполнению.
- Не пытайтесь «допромптить» неверное направление. Откатитесь назад, уточните план, запустите заново. В итоге — более чистые диффы и меньше странных edge case’ов.
- Начинайте новый диалог, когда меняете задачу, агент повторяет ошибки или падает качество. Продолжайте текущий — когда вы итеративно работаете над одной и той же частью или дебажите то, что он только что сделал.
- Стандартизируйте использование агентов в команде: Rules — это постоянные ограничения проекта: команды, стиль, канонические примеры. Skills — это динамические рабочие процессы: повторяемые команды, хуки, долгоживущие циклы, интеграции.
https://cursor.com/blog/agent-best-practices
Cursor
Cursor agent best practices
A comprehensive guide to working with coding agents, from starting with plans to managing context, customizing workflows, and reviewing code.
Forwarded from Инжиниринг Данных
Там много классных AI штук появляется на рынке, что и не успеваешь за всем уследить, в Discord Surfalytics у нас даже есть специальные канал dev-boost-with-ai, где я собираю самое важное, что может повлиять на нашу работу.
Буквально на днях увидел про Clawbot. Судя по отзывам топ инструмент, который служит персональным ассистентом и живет на локальной машине (бесплатный и открытый).
Я хотел его попробовать для автоматизации создания и мониторинга задач в Jira, Notion, Asana. У меня всегда с этим проблема, я не создаю и не обновляю задачки.
А сегодня ребята скинули пост - From Clawdbot to Moltbot: How a C&D, Crypto Scammers, and 10 Seconds of Chaos Took Down the Internet's Hottest AI Project
Эта статья рассказывает о драматической истории проекта Clawdbot (теперь Moltbot) — самостоятельно размещаемого AI-ассистента, который за 72 часа пережил настоящий хаос.
Будьте аккуратны с новыми инструментами.
Буквально на днях увидел про Clawbot. Судя по отзывам топ инструмент, который служит персональным ассистентом и живет на локальной машине (бесплатный и открытый).
Я хотел его попробовать для автоматизации создания и мониторинга задач в Jira, Notion, Asana. У меня всегда с этим проблема, я не создаю и не обновляю задачки.
А сегодня ребята скинули пост - From Clawdbot to Moltbot: How a C&D, Crypto Scammers, and 10 Seconds of Chaos Took Down the Internet's Hottest AI Project
Эта статья рассказывает о драматической истории проекта Clawdbot (теперь Moltbot) — самостоятельно размещаемого AI-ассистента, который за 72 часа пережил настоящий хаос.
Основные моменты:
Взлёт проекта
• Clawdbot набрал 60,800+ звёзд на GitHub за рекордно короткое время
• Это был AI-ассистент с "руками" — не просто чат, а инструмент, который реально выполнял действия (доступ к файлам, браузеру, командной строке)
• Поддерживал 50+ интеграций и работал через WhatsApp, Telegram, Slack, iMessage и другие платформы
Принудительный ребрендинг
• Anthropic (создатели Claude) потребовали сменить название из-за схожести "Clawd" с "Claude"
• Проект переименовали в Moltbot (от слова "molt" — линька у омаров, символ роста)
10 секунд хаоса
• При переименовании аккаунтов GitHub и X/Twitter основатель допустил ошибку
• Криптоскамеры перехватили старые аккаунты за ~10 секунд и начали рассылать мошеннические объявления
• Появились фейковые токены $CLAWD на Solana с капитализацией до $16 млн, которые затем обрушились
Проблемы безопасности
• Исследователи обнаружили сотни публично доступных экземпляров Moltbot с открытыми учётными данными
• Через Shodan можно было найти API-ключи, токены ботов, историю переписок и возможность удалённого выполнения кода
• Демонстрация показала, как за 5 минут можно перехватить письма пользователя через prompt injection
Вопросы к Anthropic
• Многие пользователи Moltbot использовали Claude как основную модель, фактически продвигая продукт Anthropic
• Сообщество недоумевает: зачем компания преследует проект, который увеличивал продажи их подписок?
Выводы статьи:
История показывает хрупкость экосистемы AI и open-source проектов — один юридический запрос может запустить цепную реакцию из взломов, скамов и хаоса. Проект технически остаётся сильным, но репутационный ущерб огромен.
Будьте аккуратны с новыми инструментами.
DEV Community
From Clawdbot to Moltbot: How a C&D, Crypto Scammers, and 10 Seconds of Chaos Took Down the Internet's Hottest AI Project
The 72-Hour Unraveling of Open Source's Fastest-Growing Star Three days ago, Clawdbot was...
Forwarded from Инжиниринг Данных
А Antropic есть станица с курсами. Я сам не проходил, но дал задание сыну (13 лет)
• AI Fluency for Students
• Claude 101
• Claude Code in Action
Раньше у него был VSCode + KiloCode, и он создавал простые игры. Я ему настроил Claude Code в CLI, и он сказал ему намного удобней работать в командной строке, чем в VSCode. Для меня это было неожиданно. Мне вот неудобно в CLI работать, я же не вижу файлы, которые меняется. А для него эти файлы были шумом, он сфокусирован на конечном продукте, и всякие там js, css файлы это лишняя абстракция, которую он еще не знает. Я его похвалил, что он делает крутые успехи, ведь даже в этом канале мало кто использует Claude Code😝
Конечно возникает вопрос - как же так, отдать AI весь процесс создания, а самому только смотреть на input/output. Возможно так и будет скоро и новое поколение явно будет использовать AI по другому. Я ему помог нарисовать диаграмму карандашом, что у нас происходит и как можно через API генерить картинки при загрузке страницы. Дальше я хочу, чтобы он загрузил эту игру (продукт) в Netlify (хостинг) и добавь настоящий домен. Таким образом будет пример end-to-end продукта. Я в 8 классе играл в Sims, Fallout 2 и Commandos, а тут такое раздолье. Так же каждый вечер мы слушаем summary книг про компании и бизнес и мой главный point для детей, что важна дисциплина, фокус и consistency.
На подходе у нас Mini Reachy - open source робот (300 деталей), который умеет разговорить и видеть, обязательно напишу про него, когда соберем. Еще детям очень понравились проекты от Mark Robert - Crunch Labs.
Что касается меня, то я решил параллельно работать на Cursor и на Claude Code (CLI), чтобы не отставать от трендов.
PS Вот прям сейчас AI сэкономил мне 150$. На кухне выбило пробки и перестал работать фильтр и половину розеток. В щитке я включал/выключал все - не помогло. Уже думали завтра вызвать мастера. Я сфоткал свои розетки и щиток, рассказал симптомы и получил решение - на одной из розеток на кухне есть circuit breaker, я его нашел и нажал, все заработало! Электрики скоро без работы останутся! 😆
#дети #ai
• AI Fluency for Students
• Claude 101
• Claude Code in Action
Раньше у него был VSCode + KiloCode, и он создавал простые игры. Я ему настроил Claude Code в CLI, и он сказал ему намного удобней работать в командной строке, чем в VSCode. Для меня это было неожиданно. Мне вот неудобно в CLI работать, я же не вижу файлы, которые меняется. А для него эти файлы были шумом, он сфокусирован на конечном продукте, и всякие там js, css файлы это лишняя абстракция, которую он еще не знает. Я его похвалил, что он делает крутые успехи, ведь даже в этом канале мало кто использует Claude Code😝
Конечно возникает вопрос - как же так, отдать AI весь процесс создания, а самому только смотреть на input/output. Возможно так и будет скоро и новое поколение явно будет использовать AI по другому. Я ему помог нарисовать диаграмму карандашом, что у нас происходит и как можно через API генерить картинки при загрузке страницы. Дальше я хочу, чтобы он загрузил эту игру (продукт) в Netlify (хостинг) и добавь настоящий домен. Таким образом будет пример end-to-end продукта. Я в 8 классе играл в Sims, Fallout 2 и Commandos, а тут такое раздолье. Так же каждый вечер мы слушаем summary книг про компании и бизнес и мой главный point для детей, что важна дисциплина, фокус и consistency.
На подходе у нас Mini Reachy - open source робот (300 деталей), который умеет разговорить и видеть, обязательно напишу про него, когда соберем. Еще детям очень понравились проекты от Mark Robert - Crunch Labs.
Что касается меня, то я решил параллельно работать на Cursor и на Claude Code (CLI), чтобы не отставать от трендов.
PS Вот прям сейчас AI сэкономил мне 150$. На кухне выбило пробки и перестал работать фильтр и половину розеток. В щитке я включал/выключал все - не помогло. Уже думали завтра вызвать мастера. Я сфоткал свои розетки и щиток, рассказал симптомы и получил решение - на одной из розеток на кухне есть circuit breaker, я его нашел и нажал, все заработало! Электрики скоро без работы останутся! 😆
#дети #ai
Anthropic Courses
Learn to build with Claude AI through Anthropic's comprehensive courses and training programs.
Forwarded from Технозаметки Малышева
Media is too big
VIEW IN TELEGRAM
Claude 4.6 Sonnet и сбой в Матрице
Короче это буквально я сегодня утром.
Есть у меня, кто не знает, бот, который анализирует логи каналов и каждое утро присылает саммари того, что обсуждали за сутки.
Делает это бесплатно, т.е. даром.
И всё было хорошо примерно год.
40+ каналов разных - все работало без сбоев.
И тут сегодня утром вдруг он начинает сыпать ошибками разметки ни с того ни с сего, - я его этот год вообще не трогал ни разу.
А работает он, надо сказать, на Антропике - Haiku модель.
Ну и я предположил, что вМатрице Антропике, видимо, что-то поменяли и готовят релиз, ну потому, что других причин то вроде нет.
И вот, - нате получите, распишитесь:
Anthropic выкатила новый Sonnet 4.6 — дефолтная модель для Free и Pro планов в claude.ai. Цена прежняя: $3/$15 за миллион токенов.
Ключевое:
Контекстное окно 1M токенов (бета)
В Claude Code пользователи предпочли Sonnet 4.6 вместо Sonnet 4.5 в 70% случаев
Даже против Opus 4.5 (фронтир от ноября 2025) — предпочтение в 59% случаев
Серьёзный прогресс в computer use — на OSWorld бенчмарке стабильный рост за 16 месяцев (полезно для OpenClaw)
Что улучшили:
- Кодинг: меньше overengineering, меньше «лени», лучшее следование инструкциям
- Меньше галлюцинаций и ложных заявлений об успехе
- Фронтенд-код и финансовый анализ — клиенты отмечают заметно более качественный визуал
- Устойчивость к prompt injection на уровне Opus 4.6
API: claude-sonnet-4-6, поддержка adaptive и extended thinking, context compaction (бета).
По сути Sonnet 4.6 закрывает задачи, для которых раньше нужен был Opus — но по цене Sonnet.
Matrix has you Neo
#AI #Claude #Anthropic #Sonnet #агенты
———
@tsingular
Короче это буквально я сегодня утром.
Есть у меня, кто не знает, бот, который анализирует логи каналов и каждое утро присылает саммари того, что обсуждали за сутки.
Делает это бесплатно, т.е. даром.
И всё было хорошо примерно год.
40+ каналов разных - все работало без сбоев.
И тут сегодня утром вдруг он начинает сыпать ошибками разметки ни с того ни с сего, - я его этот год вообще не трогал ни разу.
А работает он, надо сказать, на Антропике - Haiku модель.
Ну и я предположил, что в
И вот, - нате получите, распишитесь:
Anthropic выкатила новый Sonnet 4.6 — дефолтная модель для Free и Pro планов в claude.ai. Цена прежняя: $3/$15 за миллион токенов.
Ключевое:
Контекстное окно 1M токенов (бета)
В Claude Code пользователи предпочли Sonnet 4.6 вместо Sonnet 4.5 в 70% случаев
Даже против Opus 4.5 (фронтир от ноября 2025) — предпочтение в 59% случаев
Серьёзный прогресс в computer use — на OSWorld бенчмарке стабильный рост за 16 месяцев (полезно для OpenClaw)
Что улучшили:
- Кодинг: меньше overengineering, меньше «лени», лучшее следование инструкциям
- Меньше галлюцинаций и ложных заявлений об успехе
- Фронтенд-код и финансовый анализ — клиенты отмечают заметно более качественный визуал
- Устойчивость к prompt injection на уровне Opus 4.6
API: claude-sonnet-4-6, поддержка adaptive и extended thinking, context compaction (бета).
По сути Sonnet 4.6 закрывает задачи, для которых раньше нужен был Opus — но по цене Sonnet.
Matrix has you Neo
#AI #Claude #Anthropic #Sonnet #агенты
———
@tsingular
Forwarded from Agentic Engineer
Зачем делят AGENTS.md / CLAUDE.md на несколько файлов ❓
TL;DR: AGENTS.md/CLAUDE.md дробят, чтобы сужать контекст, давать правила "по месту" (для конкретного модуля) и не упираться в лимиты - и OpenAI это прямо заложила в механику Codex.
1️⃣ Контекст "по месту", а не простыня на весь репо
Идея - держать базовые правила в корне, а узкие - рядом с кодом (сервис/пакет/папка). Тогда агент подтягивает то, что релевантно текущей директории. В Codex это оформлено как "цепочка инструкций": он собирает файлы от корня проекта до текущей папки, и файлы ближе к текущей директории "перекрывают" ранние.
2️⃣ Официально поддержанные override`s и приоритеты
Codex проверяет в каждой папке сначала AGENTS.override.md, потом AGENTS.md, и берёт максимум один файл на директорию. Это и есть "переопределение правил" без копипасты всего документа.
3️⃣ Лимит размера 🔜 проще дробить, чем раздувать один файл
В документации Codex явно сказано, что он прекращает добавлять инструкции, когда суммарный размер достигает лимита (по умолчанию 32 KiB) - и прямо рекомендует разносить инструкции по вложенным директориям, если упираетесь в кап.
👇 👇 👇
Как это делает OpenAI у себя
Про практику OpenAI есть публичный сигнал: в обзоре формата отмечают, что у OpenAI-организации "десятки AGENTS.md" по подкомпонентам, т.е. подход именно "много маленьких по месту", а не один общий.
Плюс, сама документация Codex описывает "слоение" инструкций: глобальные (~/.codex), репо-уровень (корень) и локальные overrides (подпапки).
〰️ 〰️ 〰️ 〰️ 〰️ 〰️ 〰️ 〰️
Дробление AGENTS.md/CLAUDE.md - это важный инженерный приём, который привнесёт тебе следующей пользы:
🟢 меньше шума в контексте,
🟢 правила применяются там, где нужно,
🟢 проще сопровождать,
🟢 не ловить silent-truncation на лимитах.
@data_engi
#openai #agents #hack #trix #ai #llm #dev
TL;DR: AGENTS.md/CLAUDE.md дробят, чтобы сужать контекст, давать правила "по месту" (для конкретного модуля) и не упираться в лимиты - и OpenAI это прямо заложила в механику Codex.
Идея - держать базовые правила в корне, а узкие - рядом с кодом (сервис/пакет/папка). Тогда агент подтягивает то, что релевантно текущей директории. В Codex это оформлено как "цепочка инструкций": он собирает файлы от корня проекта до текущей папки, и файлы ближе к текущей директории "перекрывают" ранние.
Codex проверяет в каждой папке сначала AGENTS.override.md, потом AGENTS.md, и берёт максимум один файл на директорию. Это и есть "переопределение правил" без копипасты всего документа.
В документации Codex явно сказано, что он прекращает добавлять инструкции, когда суммарный размер достигает лимита (по умолчанию 32 KiB) - и прямо рекомендует разносить инструкции по вложенным директориям, если упираетесь в кап.
Как это делает OpenAI у себя
Про практику OpenAI есть публичный сигнал: в обзоре формата отмечают, что у OpenAI-организации "десятки AGENTS.md" по подкомпонентам, т.е. подход именно "много маленьких по месту", а не один общий.
Плюс, сама документация Codex описывает "слоение" инструкций: глобальные (~/.codex), репо-уровень (корень) и локальные overrides (подпапки).
Дробление AGENTS.md/CLAUDE.md - это важный инженерный приём, который привнесёт тебе следующей пользы:
@data_engi
#openai #agents #hack #trix #ai #llm #dev
Please open Telegram to view this post
VIEW IN TELEGRAM