Хабр / ML & AI

Вызов функций с помощью LLM

Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.

Читать далее

#искуственный_интеллект #nlp #языковые_модели #agent #llm #обработка_естественного_языка #нейтронные_сети #нейросети #api #нейросеть | @habr_ai

Хабр

Вызов функций с помощью LLM

Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично...

35 views13:25

Хабр / ML & AI

Как (не)удачно превращали LLM в 2d виртуальных сотрудников

Эта идея получила новую жизнь примерно восемь месяцев назад, когда Reworked AI представили llama 2d. Они научили языковые модели не просто «читать» текст, а по-настоящему воспринимать структуру и смысл двухмерных документов, таких как веб-страницы. Перед тем как расскажу как это работает - пару не очень удачных подходов, по которым пытались идти их конкуренты

Читать далее

#llama #rework #agent #ai | @habr_ai

Хабр

Как (не)удачно превращали LLM в 2d виртуальных сотрудников

Идея превратить языковые модели в виртуальных сотрудников, которые могут выполнять задачи на веб-страницах и в приложениях, увлекала многие стартапы и корпорации. Вместо того, чтобы самим кликать...

22 views15:23

Хабр / ML & AI

Ваш персональный аналитик: как создать RAG-пайплайн для анализа Telegram-каналов

Сегодня мы создадим вашего персонального аналитика источников, который будет вытаскивать самое важное из ваших любимых Telegram-каналов.

Мы соберём RAG-пайплайн, который по запросу проанализирует последние новости по интересующим темам и выдаст понятный отчёт. Разберём пошагово всю структуру и подумаем, как можно развивать и улучшить эту систему. Читать далее

#llm #rag #assistant #agent #rag_pipeline | @habr_ai

Хабр

Ваш персональный аналитик: как создать RAG-пайплайн для анализа Telegram-каналов

Привет, чемпионы! Сегодня мы создадим вашего персонального аналитика источников, который будет вытаскивать самое важное из ваших любимых Telegram-каналов. Мы соберём RAG-пайплайн, который по запросу...

🔥2

124 views03:01

Хабр / ML & AI

Я создал AI-агента, который думает 24/7 и выполняет реальный код. Вот что из этого вышло

Создал экспериментальную систему DepthNet, где AI-агент мыслит циклично, то есть непрерывно, может выполнять PHP-код, управлять своей памятью и живет автономной цифровой жизнью. Протестировал на Claude 3.5 Sonnet — результаты понравились. Читать далее

#agi #agent #llm #llm_агент #php #laravel | @habr_ai

Хабр

Я создал AI-агента, который думает 24/7 и выполняет реальный код. Вот что из этого вышло

Создал экспериментальную систему DepthNet, где AI-агент мыслит циклично, то есть непрерывно, может выполнять PHP-код, управлять своей памятью и живет автономной цифровой жизнью. Протестировал на...

156 views17:06

Хабр / ML & AI

Claude 3.5 Sonnet в роли AI-агента: тестирую работу в цикле с реальным выполнением кода

Вчера тестировал мой агент DepthNet на реальных моделях. Это что то вроде "операционной системы для LLM моделей" В прошлой статье пользователи просили привести диалоги, и рассказать подробнее, и тогда я решил более полно осветить вопрос. Читать далее

#agi #agent #llm #llm_агент #php #laravel | @habr_ai

Хабр

Claude 3.5 Sonnet в роли AI-агента: тестирую работу в цикле с реальным выполнением кода

Вчера тестировал мой агент DepthNet на реальных моделях. Это что то вроде "операционной системы для LLM моделей" В прошлой статье пользователи просили привести диалоги, и рассказать подробнее, и тогда...

59 views14:12

Хабр / ML & AI

Пишем агента на Kotlin: KOSMOS

Интернет завален реализациями на Питоне, но иногда удобнее разбираться с технологиями на своём основном языке. Для мен;я это Kotlin.

Если вы программист, наверняка к вам приходят знакомые и предлагают писать агентов. Реализовав оного самостоятельно, вы поймете, что задача из себя представляет.

Статья обещает соблюдать два принципа, упрощающих восприятие:

‣ Движение от частного к общему, потому что легче воспринимать примеры, чем абстракцию.

‣ Быстрая обратная связь, как с REPL.

Агента реализуем так, чтобы легко было заменить лежащую в основе LLM. Посмотрим, как отличается работа при использовании REST API в сравнении с SDK, пощупаем Гигачат и Anthropic.

Ах да, 🪐 KOSMOS — акроним. Kotlin Open Synthetic Mind Orbiting System. Читать далее

#космотекст #llm #anthropic #гигачат #agent #coroutines #ktor #ai #java #gigachat | @habr_ai

Хабр

Пишем агента на Kotlin: KOSMOS

Интернет завален реализациями на Питоне, но иногда удобнее разбираться с технологиями на своём основном языке. Для меня это Kotlin. Если вы программист, наверняка к вам приходят знакомые и предлагают...

71 views12:55

Хабр / ML & AI

Jules у меня дома… буквально

В последнее время тестил разные инструменты для вайб-кодинга и зашёл на Jules чисто дать ему очередную задачку. Jules выполняет все операции в изолированном окружении. Он клонирует ваш github-репозиторий, выполняет ваши просьбы, редактирует файлы, формирует коммиты и публикует в ваш репозиторий pull request с выполненной задачей. Если задача простая, то Jules прекрасно подойдёт, чтобы решить её автономно. В этой статье расскажу про его бесплатный аналог agent zero. Пристёгивайтесь, будет жарко! Пристегнуться!

#agent_zero #ai #agent #agentic_ai #windows #openrouter | @habr_ai

Хабр

Jules у меня дома… буквально

Привет, хабр! В последнее время тестил разные инструменты для вайб-кодинга и зашёл на Jules (*google - организация пока что не признанная в РФ экстремистской) чисто дать ему очередную задачку. На этом...

85 views00:58

Хабр / ML & AI

Взять и собрать ИИ-агента: редактор сценариев, мультимодальная основа и другие открытые инструменты

Агенты — одна из горячих тем этого лета: интерес к ним существенно вырос, как и потребность в инструментах, упрощающих разработку таких систем. И мы в Beeline Cloud собрали несколько open source-проектов по теме под лицензией Apache 2.0. Читать далее

#beeline_cloud #ии_агенты #container_use #embabel #agent_development_kit #sim | @habr_ai

Хабр

Взять и собрать ИИ-агента: редактор сценариев, мультимодальная основа и другие открытые инструменты

Агенты — одна из горячих тем этого лета: интерес к ним существенно вырос, как и потребность в инструментах, упрощающих разработку таких систем. И мы в Beeline Cloud собрали несколько open...

58 views07:58

Хабр / ML & AI

Мои впечатления от нового AI IDE — Qoder

Alibaba (у которых Qwen, AliExpress и Tmall) на днях представила Qoder — свою пока бесплатную альтернативу Cursor.

Я успел провести с ним сегодня свой рабочий день, и вот мои впечатления. Сравнивать его я буду с Windsurf, т.к. им пользовался дольше остальных. Читать далее

#ide #среда_разработки #unity #rider #ai #llm #agent | @habr_ai

Хабр

Мои впечатления от нового AI IDE — Qoder

Alibaba ( у которых Qwen, AliExpress и Tmall ) на днях представили Qoder — свою пока бесплатную альтернативу Cursor. Я успел провести с ним сегодня свой рабочий день, и вот мои впечатления. Сравнивать...

75 views15:09

Хабр / ML & AI

Мой личный экзамен: как я разработал MVP LLM-агента на Google ADK

В этой статье я делюсь личным опытом разработки MVP LLM-агента на базе Google ADK в образовательных сценариях. Рассказываю, как строил архитектуру от монолитного агента до модульной системы, с какими вызовами столкнулся (память, токены, оркестрация) и какие инженерные лайфхаки помогли справиться. Но главное — делюсь философией: почему работа с LLM похожа на экзамен, как меняется роль CTO и чему учат такие проекты. В финале — 10 уроков, которые я вынес из этого «AI-экзамена». Читать далее

#mvp #artificial_intelligence #google_adk #google #python #llm_агент #agent #llm | @habr_ai

Хабр

Мой личный экзамен: как я разработал MVP LLM-агента на Google ADK

Мой личный экзамен: как я разработал MVP LLM-агента на Google ADK Уже несколько лет я работаю в качестве CTO компании ASRP , которая развивает образовательные проекты и исследует новые подходы в...

41 views10:58

Хабр / ML & AI

[Перевод] PCW — новая метрика продуктивности разработчиков с ИИ

Команда AI for Devs подготовила перевод статьи о метрике Percentage of Code Written (PCW) от Windsurf. Эта метрика показывает, какой процент кода в проекте реально пришёл от ИИ. Авторы утверждают: PCW надёжнее привычных показателей вроде acceptance rate и отражает, насколько продукт действительно помогает разработчикам. А как вы думаете — можно ли измерить ценность ИИ в цифрах? Читать далее

#ai #продуктивность #agent #ии #agentic_ai #эффективность | @habr_ai

Хабр

PCW — новая метрика продуктивности разработчиков с ИИ

Команда AI for Devs подготовила перевод статьи о метрике Percentage of Code Written (PCW) от Windsurf. Эта метрика показывает, какой процент кода в проекте реально пришёл от ИИ. Авторы...

40 views08:18

Хабр / ML & AI

Мультиагентные системы: как «команда ИИ» берёт сложность штурмом

Когда один ИИ — мало. Нужна команда

Ночные падения, баги «только на проде», фичи, которые нужно вчера — знакомо?

В такие моменты один, даже очень умный, ИИ похож на гения-одиночку на стройке небоскрёба. Он силён, но не масштабируется. Решение — команда ИИ-агентов: аналитик, фиксер, контролёр, координатор. Каждый делает своё, вместе — закрывают задачу.

В этой статье мы покажем, как собрать такую «бригаду» поверх LLM так, чтобы она реально работала с кодом: читала файлы, вносила патчи, гоняла тесты и сама себя проверяла. Без магии — с понятным интерфейсом действий (ACI), с архитектурой, которая объясняет метрики, и с живыми примерами из репозитория.

Что получите за чтение:

простую логику, почему «команда» надёжнее «соло-ИИ» и как это связано с ReAct, self-consistency, процессной проверкой и Mixture-of-Agents;

инженерный взгляд на масштабирование качества не только «размером модели», но и временем вывода (больше попыток → лучше отбор);

практику: минимальные команды запуска, «скриншоты» прогонов и аккуратный ACI, который превращает LLM из советчика в исполнителя;

архитектурный эскиз асинхронного оркестратора поверх реального LLM API — без тяжёлого кода, но с ясной идеей, как это встроить к вам.

Если вы тимлид, архитектор или ресёрчер, это статья-мост: от теории, которая действительно помогает, к работающим сценариям. Откроем крышку, включим свет — и соберём команду ИИ, которая берёт сложность штурмом. Читать далее

#ai #agent #bug #codereview | @habr_ai

Хабр

Мультиагентные системы: как «команда ИИ» берёт сложность штурмом

Введение: мир, где одному ИИ тесно Софт стал распределённым организмом: микросервисы, бесконечные API, CI/CD, инфраструктура как код, пользователи в разных часовых поясах. Ошибки проявляются не...

39 views04:51

Хабр / ML & AI

Почему бокс — это мультиагентная система

Привет! Наверняка уже все видели как ИИ-агентов ради хайпа пытаются затащить куда угодно, совсем не глядя на эффективность и какой-либо здравый смысл.

В этой статье я расскажу о действительно полезном применении концепции агентов и попробую доказать, почему любой боксерский поединок является мультиагентной системой. Поговорим про system design бокса, про RLHF, адаптивные алгоритмы, всевозможный вызов tools типа джебов или клинча, очереди сообщений и гарантию их доставки, graceful degradation и выведем метрики эффективности нашей мультиагентной системы. Читать далее

#llm #agent #agentic_ai #агенты_ии #агенты #машинное_обучение #машинное_обучение #языковые_модели #большие_языковые_модели #ии_агенты | @habr_ai

Хабр

Почему бокс — это мультиагентная система

Привет! ИИ-агенты — главная горячая тема этого года, но все наверняка видели как их ради хайпа пытаются затащить куда угодно, совсем не глядя на эффективность и какой-либо здравый смысл. В этой статье...

14 views07:10

About

Blog

Apps

Platform