Я попросил своих агентов сократить проект на 15% (это минус 20к строчек кода). Убрать dead code, отрефакторить под DRY и т.п. Агенты шуршали 5 часов, потратили 200 долларов, а в итоге размер кода вырос на 361 строчку. Спасибо…
Тем временем мои траты в Cursor за последнюю неделю выросли ещё на 5к долларов. Я уже начинаю думать, что adversarial review — это не такая уж и хорошая идея🥲
Тем временем мои траты в Cursor за последнюю неделю выросли ещё на 5к долларов. Я уже начинаю думать, что adversarial review — это не такая уж и хорошая идея
Please open Telegram to view this post
VIEW IN TELEGRAM
😱131😁106🌚19🤯12💩6🥱6😨3❤2🔥2👍1💯1
Я считаю RAG, графы и вообще любой retrieval тупиковой ветвью развития агентной памяти. В библии Уробороса у меня вообще прописан запрет на RAG как базы памяти. Меня кучу раз спрашивали почему, поэтому объясню свою позицию тут.
Все эти векторные базы делают память реактивной: агент решает что-то сделать, формирует интент поиска, и только потом достает релевантные куски прошлого. Но так эволюция не работает! Память должна формировать сами действия, а не действия должны провоцировать поиск в памяти. К тому же семантический поиск находит только похожее на текущую задачу\запрос данные. Он слеп к неочевидным взаимосвязям между фактами.
Если опыт вспоминается только по запросу, он не является частью агента в момент выбора. Поэтому я против подмены основной памяти индексом. Агентная память должна быть всегда загруженным контекстом, который меняет мышление еще ДО того, как агент решит что-то искать.
Именно поэтому я так жду модели с контекстном 10B токенов. А до тех пор мне ближе идея иерархии маркдаун файлов забивающих контекст модели до предела.
Все эти векторные базы делают память реактивной: агент решает что-то сделать, формирует интент поиска, и только потом достает релевантные куски прошлого. Но так эволюция не работает! Память должна формировать сами действия, а не действия должны провоцировать поиск в памяти. К тому же семантический поиск находит только похожее на текущую задачу\запрос данные. Он слеп к неочевидным взаимосвязям между фактами.
Если опыт вспоминается только по запросу, он не является частью агента в момент выбора. Поэтому я против подмены основной памяти индексом. Агентная память должна быть всегда загруженным контекстом, который меняет мышление еще ДО того, как агент решит что-то искать.
Именно поэтому я так жду модели с контекстном 10B токенов. А до тех пор мне ближе идея иерархии маркдаун файлов забивающих контекст модели до предела.
🔥150💯81🤔54💩25❤24👍19🤷♂16👎12🤨9😁5🤯3
OpenAI пожопились и не дали длинный контекст для своей же модели в Codex? Почему там максимум 258k токенов, а в Cursor — 1M у этой же GPT-5.5? Потому что длинный контекст дороже? Или потому что версия с длинным контекстом хуже, чем версия с коротким? Не одобряю в любом случае... Видимо, останусь на Cursor.
🤯74🤨39👎6👍5😁3🌚3👀2❤1😭1
Agent = LLM(s) + harness
Много разногласий в определениях, но это мне кажется самым понятным и компактным. Поэтому оставлю тут.
👍63🔥16❤11💩6🤔4💯3👀2😁1
Честно говоря, я в шоке от того, насколько gemini-3.5-flash хороша за эти копейки. В режиме flex она дешевле Sonnet-4.6 в 3–4 раза. А по метрикам сильно лучше (и по ощущениям кстати тоже).
🔥133❤21👍18⚡6🤯4👎1
coming out
вы могли заметить, что в последнее время формат постов и контент в канале сильно изменились. Хочу объяснить почему.
После разработки Уробороса и осознания того, на что способны автономные системы, я пережил своего рода творческий кризис. Я потерял мотивацию писать разборы статей: кажется, ChatGPT уже лучше разберёт их для вас. Потом пропала мотивация писать код. А потом даже промптить агентов, чтобы они писали код и работали за меня. Мне даже свежие статьи стало лень читать.
С того момента для меня по-настоящему имеют смысл только мета-системы: процессы, агенты и харнессы, которые строят сами себя. Я всё больше уверен, что дальше рисёрч будут двигать именно они, а нам останется скорее наблюдать, направлять и пытаться понять, что вообще происходит.
Я почти не вижу смысла инвестировать время и силы во что-либо, кроме разработки автономных, эволюционирующих мета-систем. Какой смысл идти и проводить условные эксперименты с линейностью трансформеров, чтобы написать ещё одну статью формата Your Transformer is Secretly Linear, если это время можно потратить на создание автономного рисёрчера, который через пару поколений Opus станет лучше и креативнее меня?
С выходом Opus 4.6 и GPT-5.4 мир начал очень быстро меняться. Как минимум для меня. Поэтому канал постепенно трансформируется вместе со мной: из дайджеста научных статей в более личный блог про AI, агентов, мета-системы и всё, что из этого вырастает.
Закидайте пост какашками и клоунами, если скучаете по старому abstractDL.
вы могли заметить, что в последнее время формат постов и контент в канале сильно изменились. Хочу объяснить почему.
После разработки Уробороса и осознания того, на что способны автономные системы, я пережил своего рода творческий кризис. Я потерял мотивацию писать разборы статей: кажется, ChatGPT уже лучше разберёт их для вас. Потом пропала мотивация писать код. А потом даже промптить агентов, чтобы они писали код и работали за меня. Мне даже свежие статьи стало лень читать.
С того момента для меня по-настоящему имеют смысл только мета-системы: процессы, агенты и харнессы, которые строят сами себя. Я всё больше уверен, что дальше рисёрч будут двигать именно они, а нам останется скорее наблюдать, направлять и пытаться понять, что вообще происходит.
Я почти не вижу смысла инвестировать время и силы во что-либо, кроме разработки автономных, эволюционирующих мета-систем. Какой смысл идти и проводить условные эксперименты с линейностью трансформеров, чтобы написать ещё одну статью формата Your Transformer is Secretly Linear, если это время можно потратить на создание автономного рисёрчера, который через пару поколений Opus станет лучше и креативнее меня?
С выходом Opus 4.6 и GPT-5.4 мир начал очень быстро меняться. Как минимум для меня. Поэтому канал постепенно трансформируется вместе со мной: из дайджеста научных статей в более личный блог про AI, агентов, мета-системы и всё, что из этого вырастает.
Закидайте пост какашками и клоунами, если скучаете по старому abstractDL.
Telegram
AbstractDL
Мой агент попытался опенсорснуться без спроса. Ладно, разрешаю.
Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения"…
Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения"…
❤342💩229🤡150👍29😢29🥴13⚡10👏8💔8🔥7🙏6