контекст rot
197 subscribers
401 photos
24 videos
2 files
53 links
пропаганда htmx + daisyui
Download Telegram
Завтра не на РАБоту... очень скоро чиллим, уважаемые читатели!!


Ах да, у вас только с пятницы чил...


Потрогал новую модельку вчера. Токенов жрёт совсем не много, хз видел что в Твиттере много кто жалуется.

Дал ей задачку с которой когда то не справился опус ... Ну что сказать, она тоже не справилась💀 Хотя кода они с кодексом оч много нагенерили. Надо менять цель в задачках как-то чтобы и контекста много не хавало на проверку стали ли мы ближе ...

Думаю, проблема всё же находится не в модели а, как всегда, между монитором и клавиатурой.

Продолжаем работу! Всем самого лучшего продуктивного дня
😁2
А ведь последствия могут оказаться... неожиданными
1🔥6
Щас агентов делают, да? Интересно, если честно, что отсутствуют какие-то принципы построения агентских систем. Основной смысл то какой - разделить задачу на несколько частей. Делегировать. Не нагружать механизм внимания. Уменьшать размер контекста. Но таких принципов нет сформулированных! Куча разрозненных, а порой и противоречащих друг другу, статей.

После десятилетий накопленного опыта (которые я не застал) в программировании появились свои уникальные правила - SOLID. Понятно что никто их идеально не соблюдает. Но при общении с коллегой ты можешь сказать что, вот, если сделаем так, то это нарушение принципа L или S.

А дальше дело чисто инженерное, может стоит принцип этот нарушить чтобы мозга не делать. А мб наоборот стоит прислушаться с дяде Бобу и сделать по красоте. Основная проблема - объяснить коллеге что имеешь ввиду и зачем - решается.

А вот при разработке агентов у нас пока такого нет!

Предлагаю набор принципов DESU (на пикче)
👀1
Круто вчера было да? Контент текстовый на подумать + мемы оригинальные сам делал. Ну вы это, особо не привыкайте к такому, уважаемые подписчики
🔥10👀2😁1
Я залутаю недвижимость на петроге... Рано или поздно... Наверное...
💔3👀2🔥1🤡1
почему так?
👀1
Не знаю как можно простить KDE за всё то ЗЛО что они меня заставили пережить
😁2👀1
💔1👀1
Клод, давай сделаем аналог языка Си только чтобы было его просто писать и в качестве теста сделаем видеоигру с грабежом караванов🙏
😁3
ProgramBench — бенчмарк, который проверяет, могут ли агенты восстановить сурсы имея только скомпилированный бинарник, возможность его запускать ну и документацию.

Мощнейшее LLM AGI детище компании добра Fable (Mythos) отказалось выполнять все 200/200 задач!!
😁1🤡1
В такси чел рассказывал что работал ПМом в Сбере/Газпроме, какие внедрял ЦРМки. После увольнения пол года не мог найти РАБоту, проел свои накопления и подался водителем в Яндекс.

Друзья, поделитесь, есть ли у вас какие-то "планы Б"?
👀4
Текущая мета, друзья, это циклы + разделение контекста на планирование и написание кода. Это не точно но это то, как я счас РАБотаю.

Тред кому любопытно 👇
🔥6
контекст rot
Текущая мета, друзья, это циклы + разделение контекста на планирование и написание кода. Это не точно но это то, как я счас РАБотаю. Тред кому любопытно 👇
В openrouter появился API который дёргает параллельно несколько моделей и выбирает "лучший" ответ из нескольких.

Глядя на "trust me bro" бенчмарк - такая комбинация сопоставима с уровнем интеллекта fable.

Гении мыслят одинаково!! Ну, согласитесь, оч напоминает мой воркфлоу что я описал вчера.
🔥4
Мы можем осуждать такое мнение но можем ли мы фактически спорить
👀2