Было настроение написать свое ((экспертное)) мнение про слишком сложные ниши для агентов. Сотни постов помню где люди писали про то, что интеллекта у ллмок не хватает для решения их повседневных задач.
Вот, думаю, сейчас встречу такой постик и напишу что думаю... Но прошло недели три уже. Честно, уже передумал пост писать. И не понимаю, а КУДА делись все решатели слишком сложных задач. Случилось чего?
Статья на пикче от MIT «AI-агенты уже могут самостоятельно делать экспериментальную физику высоких энергий»
Вот, думаю, сейчас встречу такой постик и напишу что думаю... Но прошло недели три уже. Честно, уже передумал пост писать. И не понимаю, а КУДА делись все решатели слишком сложных задач. Случилось чего?
Статья на пикче от MIT «AI-агенты уже могут самостоятельно делать экспериментальную физику высоких энергий»
👀2
Интересный факт по лору: Anthropic (корпорация добра) выросла из OpenAI (корпорация зла) на рубеже 2020-2021, когда несколько ключевых исследователей не выдержали работу над GPT-3.
На публику сказали что чето они не смогли договориться о безопасности использования ИИ. Истинные причины, естественно, никто не назовёт))
Причём Дарио ушел и возглавил корпорацию добра со своей сестрой! И счас они остаются основными ЛПР:
Дарио Амодеи — CEO (бывший VP of Research в OpenAI).
Даниэла Амодеи — президент (бывший VP of Operations в OpenAI).
На публику сказали что чето они не смогли договориться о безопасности использования ИИ. Истинные причины, естественно, никто не назовёт))
Причём Дарио ушел и возглавил корпорацию добра со своей сестрой! И счас они остаются основными ЛПР:
Дарио Амодеи — CEO (бывший VP of Research в OpenAI).
Даниэла Амодеи — президент (бывший VP of Operations в OpenAI).
🔥2
Попробовал вчера новый модный молодёжный композер 2.5 в курсоре. В целом - сомнительно но окей... Не опус это, друзья. И, тем более, не гпт5.5 (( Но и не дипсик/квен. Лучше китайских но хуже SOTA, я бы как-то так описал.
Знаете, счас умная модель от "норм" отличается тем, что сразу понимает чё делать, по моим наблюдениям. Десяток грепов -> поняла -> начинает работать.
Дипсик v4 / минимакс да и композер этот начинают исследовать репозиторий и не могут остановиться. Минут 10 может пройти прежде чем моделька понимает формулировку задачи и как это в коде добавить/исправить. Со стороны видно как ей тяжело и она старается. 🦾
Оф статья про новый композер: https://cursor.com/blog/composer-2-5
Знаете, счас умная модель от "норм" отличается тем, что сразу понимает чё делать, по моим наблюдениям. Десяток грепов -> поняла -> начинает работать.
Дипсик v4 / минимакс да и композер этот начинают исследовать репозиторий и не могут остановиться. Минут 10 может пройти прежде чем моделька понимает формулировку задачи и как это в коде добавить/исправить. Со стороны видно как ей тяжело и она старается. 🦾
Оф статья про новый композер: https://cursor.com/blog/composer-2-5
Cursor
Introducing Composer 2.5 · Cursor
A substantial improvement in intelligence and behavior over Composer 2, particularly on long-horizon agentic tasks.
👀1