Maxim.ML - канал

В последнее время я активно экспериментирую с AI-агентами и хочу поделиться с вами своими результатами. Контента получилось много, поэтому я разбил его на несколько частей.

Сегодня я дам вводную по AI-агентам, а в понедельник покажу результат, которого мне удалось добиться.

Кто такие AI-агенты? На самом деле, четкого определения нет. Разные лидеры индустрии искусственного интеллекта дают разное определение AI-агентам, и это вполне нормально, поскольку это достаточно новая и развивающаяся концепция.

Например, Сэм Альтман, CEO OpenAI, говорит: «Я рассматриваю агента как программу, которая может выполнять задачи в течение длительного времени и не требует постоянного контроля со стороны человека». Это определение подчеркивает автономность и способность AI-агента действовать без непрерывного человеческого вмешательства.

С другой стороны, Андрей Карпатый, ведущий исследователь в области глубокого обучения, считает, что современный подход к ИИ-агентам отличается от использования обучения с подкреплением и в большей степени ориентирован на создание систем, которые могут планировать, обдумывать и анализировать действия. Его взгляд акцентирует внимание на когнитивных способностях агентов, таких как планирование и рассуждение.

Я склоняюсь к тому, что агент – это объект, способный изменять свое поведение в зависимости от данных, поступающих из окружающей среды. В обучении с подкреплением (reinforcement learning) используется понятие «агент» и «среда» ещё с прошлого века. Агент RL адаптируется к окружающей среде, изменяя свое поведение в соответствии с полученными вознаграждениями или наказаниями.

Важно понимать, что не всякий инструмент с AI является агентом. Простой скрипт с языковой моделью (LLM) под капотом, который выполняется линейно и не взаимодействует с внешней средой, не является AI-агентом. Например, продвинутый редактор текста с функцией AI-автодополнения, такой как Notion, – это просто удобный инструмент для работы с текстом, а не настоящий агент.

А вот исследовательские поисковые системы с LLM под капотом можно считать AI-агентами. Почему? Потому что агент в виде LLM может обращаться к «среде» – поисковику (интернету) и на основе полученной информации (поисковая выдача, веб-сайты) менять свое поведение (создать дополнительный текст запроса, найти еще один веб-сайт).

На этом заканчиваю вводную часть. А что у меня получилось на практике – узнаете уже в понедельник!

(мемы для привлечения внимания)

👍3❤2🔥2

394 views09:48

Maxim.ML - канал

Всех с началом рабочей недели 😬. Если вам начинает казаться, что информации появляется так много (по ML-тематике и не только), и вы не успеваете в ней разбираться - вам не кажется и вы не одиноки. Я чувствую себя точно так же.

Это проблема и я решаю её как могу - как DS. Я сделал своего ai-агента. Его задача - собирать и освещать интересные новости из индустрии ai в пассивно агрессивном режиме. Теперь он будет жить в этом канале и иногда делать самостоятельные публикации. (пока что сильно реже меня настоящего 👍).

Почему он все таки агент?

- Потому что может действовать самостоятельно, и принимать решения на основе информации из окружающей среды.
- LLM движок под капотом в связке с некоторыми функциями оптимизации, которые помогают принимать решение.

Для чего я его делаю?

- Первая цель агента - мониторинг и анализ текущих новинок в сфере, которая мне интересна - ML. Чтобы я периодически получал выжимку того, что сейчас актуально (читай - умная лента новостей).
- Вторая цель - собирать отчеты, которые должны простым языком объяснять сложные понятия с ссылками на источники (читай - deep search на кроне по сложным и интересным темам).
- Третья цель - поразвлекать и вдохновить вас на создание чего-то подобного.

Ближайшие планы, чем я буду делиться:

- Буду рассказывать о ходе разработки (о подводных камнях, о технических особенностях и трудностях)
- Буду делиться артефактами работы агента (саммари по новостям, отчеты (по ML тематике))

Ближайшие планы по разработке:

- Настроить сбор обратной связи
- Дообучение модели ранкера и модели оценки токсичности

Чтобы вам тоже сделать такой же проект, нужно иметь некоторый опыт в ML sys design и в LLM sys design. Хотите пост об этом? Ставьте 🔥 и я напишу его с практическими советами.

P.S. к посту прикрепил текущую схему работы агента

Please open Telegram to view this post