Вызов функций с помощью LLM
Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.
Читать далее
#искуственный_интеллект #nlp #языковые_модели #agent #llm #обработка_естественного_языка #нейтронные_сети #нейросети #api #нейросеть | @habr_ai
Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.
Читать далее
#искуственный_интеллект #nlp #языковые_модели #agent #llm #обработка_естественного_языка #нейтронные_сети #нейросети #api #нейросеть | @habr_ai
Хабр
Вызов функций с помощью LLM
Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично...
Как (не)удачно превращали LLM в 2d виртуальных сотрудников
Эта идея получила новую жизнь примерно восемь месяцев назад, когда Reworked AI представили llama 2d. Они научили языковые модели не просто «читать» текст, а по-настоящему воспринимать структуру и смысл двухмерных документов, таких как веб-страницы. Перед тем как расскажу как это работает - пару не очень удачных подходов, по которым пытались идти их конкуренты
Читать далее
#llama #rework #agent #ai | @habr_ai
Эта идея получила новую жизнь примерно восемь месяцев назад, когда Reworked AI представили llama 2d. Они научили языковые модели не просто «читать» текст, а по-настоящему воспринимать структуру и смысл двухмерных документов, таких как веб-страницы. Перед тем как расскажу как это работает - пару не очень удачных подходов, по которым пытались идти их конкуренты
Читать далее
#llama #rework #agent #ai | @habr_ai
Хабр
Как (не)удачно превращали LLM в 2d виртуальных сотрудников
Идея превратить языковые модели в виртуальных сотрудников, которые могут выполнять задачи на веб-страницах и в приложениях, увлекала многие стартапы и корпорации. Вместо того, чтобы самим кликать...
Ваш персональный аналитик: как создать RAG-пайплайн для анализа Telegram-каналов
Сегодня мы создадим вашего персонального аналитика источников, который будет вытаскивать самое важное из ваших любимых Telegram-каналов.
Мы соберём RAG-пайплайн, который по запросу проанализирует последние новости по интересующим темам и выдаст понятный отчёт. Разберём пошагово всю структуру и подумаем, как можно развивать и улучшить эту систему. Читать далее
#llm #rag #assistant #agent #rag_pipeline | @habr_ai
Сегодня мы создадим вашего персонального аналитика источников, который будет вытаскивать самое важное из ваших любимых Telegram-каналов.
Мы соберём RAG-пайплайн, который по запросу проанализирует последние новости по интересующим темам и выдаст понятный отчёт. Разберём пошагово всю структуру и подумаем, как можно развивать и улучшить эту систему. Читать далее
#llm #rag #assistant #agent #rag_pipeline | @habr_ai
Хабр
Ваш персональный аналитик: как создать RAG-пайплайн для анализа Telegram-каналов
Привет, чемпионы! Сегодня мы создадим вашего персонального аналитика источников, который будет вытаскивать самое важное из ваших любимых Telegram-каналов. Мы соберём RAG-пайплайн, который по запросу...
🔥2
Я создал AI-агента, который думает 24/7 и выполняет реальный код. Вот что из этого вышло
Создал экспериментальную систему DepthNet, где AI-агент мыслит циклично, то есть непрерывно, может выполнять PHP-код, управлять своей памятью и живет автономной цифровой жизнью. Протестировал на Claude 3.5 Sonnet — результаты понравились. Читать далее
#agi #agent #llm #llm_агент #php #laravel | @habr_ai
Создал экспериментальную систему DepthNet, где AI-агент мыслит циклично, то есть непрерывно, может выполнять PHP-код, управлять своей памятью и живет автономной цифровой жизнью. Протестировал на Claude 3.5 Sonnet — результаты понравились. Читать далее
#agi #agent #llm #llm_агент #php #laravel | @habr_ai
Хабр
Я создал AI-агента, который думает 24/7 и выполняет реальный код. Вот что из этого вышло
Создал экспериментальную систему DepthNet, где AI-агент мыслит циклично, то есть непрерывно, может выполнять PHP-код, управлять своей памятью и живет автономной цифровой жизнью. Протестировал на...
Claude 3.5 Sonnet в роли AI-агента: тестирую работу в цикле с реальным выполнением кода
Вчера тестировал мой агент DepthNet на реальных моделях. Это что то вроде "операционной системы для LLM моделей" В прошлой статье пользователи просили привести диалоги, и рассказать подробнее, и тогда я решил более полно осветить вопрос. Читать далее
#agi #agent #llm #llm_агент #php #laravel | @habr_ai
Вчера тестировал мой агент DepthNet на реальных моделях. Это что то вроде "операционной системы для LLM моделей" В прошлой статье пользователи просили привести диалоги, и рассказать подробнее, и тогда я решил более полно осветить вопрос. Читать далее
#agi #agent #llm #llm_агент #php #laravel | @habr_ai
Хабр
Claude 3.5 Sonnet в роли AI-агента: тестирую работу в цикле с реальным выполнением кода
Вчера тестировал мой агент DepthNet на реальных моделях. Это что то вроде "операционной системы для LLM моделей" В прошлой статье пользователи просили привести диалоги, и рассказать подробнее, и тогда...
Пишем агента на Kotlin: KOSMOS
Интернет завален реализациями на Питоне, но иногда удобнее разбираться с технологиями на своём основном языке. Для мен;я это Kotlin.
Если вы программист, наверняка к вам приходят знакомые и предлагают писать агентов. Реализовав оного самостоятельно, вы поймете, что задача из себя представляет.
Статья обещает соблюдать два принципа, упрощающих восприятие:
‣ Движение от частного к общему, потому что легче воспринимать примеры, чем абстракцию.
‣ Быстрая обратная связь, как с REPL.
Агента реализуем так, чтобы легко было заменить лежащую в основе LLM. Посмотрим, как отличается работа при использовании REST API в сравнении с SDK, пощупаем Гигачат и Anthropic.
Ах да, 🪐 KOSMOS — акроним. Kotlin Open Synthetic Mind Orbiting System. Читать далее
#космотекст #llm #anthropic #гигачат #agent #coroutines #ktor #ai #java #gigachat | @habr_ai
Интернет завален реализациями на Питоне, но иногда удобнее разбираться с технологиями на своём основном языке. Для мен;я это Kotlin.
Если вы программист, наверняка к вам приходят знакомые и предлагают писать агентов. Реализовав оного самостоятельно, вы поймете, что задача из себя представляет.
Статья обещает соблюдать два принципа, упрощающих восприятие:
‣ Движение от частного к общему, потому что легче воспринимать примеры, чем абстракцию.
‣ Быстрая обратная связь, как с REPL.
Агента реализуем так, чтобы легко было заменить лежащую в основе LLM. Посмотрим, как отличается работа при использовании REST API в сравнении с SDK, пощупаем Гигачат и Anthropic.
Ах да, 🪐 KOSMOS — акроним. Kotlin Open Synthetic Mind Orbiting System. Читать далее
#космотекст #llm #anthropic #гигачат #agent #coroutines #ktor #ai #java #gigachat | @habr_ai
Хабр
Пишем агента на Kotlin: KOSMOS
Интернет завален реализациями на Питоне, но иногда удобнее разбираться с технологиями на своём основном языке. Для меня это Kotlin. Если вы программист, наверняка к вам приходят знакомые и предлагают...
Jules у меня дома… буквально
В последнее время тестил разные инструменты для вайб-кодинга и зашёл на Jules чисто дать ему очередную задачку. Jules выполняет все операции в изолированном окружении. Он клонирует ваш github-репозиторий, выполняет ваши просьбы, редактирует файлы, формирует коммиты и публикует в ваш репозиторий pull request с выполненной задачей. Если задача простая, то Jules прекрасно подойдёт, чтобы решить её автономно. В этой статье расскажу про его бесплатный аналог agent zero. Пристёгивайтесь, будет жарко! Пристегнуться!
#agent_zero #ai #agent #agentic_ai #windows #openrouter | @habr_ai
В последнее время тестил разные инструменты для вайб-кодинга и зашёл на Jules чисто дать ему очередную задачку. Jules выполняет все операции в изолированном окружении. Он клонирует ваш github-репозиторий, выполняет ваши просьбы, редактирует файлы, формирует коммиты и публикует в ваш репозиторий pull request с выполненной задачей. Если задача простая, то Jules прекрасно подойдёт, чтобы решить её автономно. В этой статье расскажу про его бесплатный аналог agent zero. Пристёгивайтесь, будет жарко! Пристегнуться!
#agent_zero #ai #agent #agentic_ai #windows #openrouter | @habr_ai
Хабр
Jules у меня дома… буквально
Привет, хабр! В последнее время тестил разные инструменты для вайб-кодинга и зашёл на Jules (*google - организация пока что не признанная в РФ экстремистской) чисто дать ему очередную задачку. На этом...
Взять и собрать ИИ-агента: редактор сценариев, мультимодальная основа и другие открытые инструменты
Агенты — одна из горячих тем этого лета: интерес к ним существенно вырос, как и потребность в инструментах, упрощающих разработку таких систем. И мы в Beeline Cloud собрали несколько open source-проектов по теме под лицензией Apache 2.0. Читать далее
#beeline_cloud #ии_агенты #container_use #embabel #agent_development_kit #sim | @habr_ai
Агенты — одна из горячих тем этого лета: интерес к ним существенно вырос, как и потребность в инструментах, упрощающих разработку таких систем. И мы в Beeline Cloud собрали несколько open source-проектов по теме под лицензией Apache 2.0. Читать далее
#beeline_cloud #ии_агенты #container_use #embabel #agent_development_kit #sim | @habr_ai
Хабр
Взять и собрать ИИ-агента: редактор сценариев, мультимодальная основа и другие открытые инструменты
Агенты — одна из горячих тем этого лета: интерес к ним существенно вырос, как и потребность в инструментах, упрощающих разработку таких систем. И мы в Beeline Cloud собрали несколько open...
Мои впечатления от нового AI IDE — Qoder
Alibaba (у которых Qwen, AliExpress и Tmall) на днях представила Qoder — свою пока бесплатную альтернативу Cursor.
Я успел провести с ним сегодня свой рабочий день, и вот мои впечатления. Сравнивать его я буду с Windsurf, т.к. им пользовался дольше остальных. Читать далее
#ide #среда_разработки #unity #rider #ai #llm #agent | @habr_ai
Alibaba (у которых Qwen, AliExpress и Tmall) на днях представила Qoder — свою пока бесплатную альтернативу Cursor.
Я успел провести с ним сегодня свой рабочий день, и вот мои впечатления. Сравнивать его я буду с Windsurf, т.к. им пользовался дольше остальных. Читать далее
#ide #среда_разработки #unity #rider #ai #llm #agent | @habr_ai
Хабр
Мои впечатления от нового AI IDE — Qoder
Alibaba ( у которых Qwen, AliExpress и Tmall ) на днях представили Qoder — свою пока бесплатную альтернативу Cursor. Я успел провести с ним сегодня свой рабочий день, и вот мои впечатления. Сравнивать...
Мой личный экзамен: как я разработал MVP LLM-агента на Google ADK
В этой статье я делюсь личным опытом разработки MVP LLM-агента на базе Google ADK в образовательных сценариях. Рассказываю, как строил архитектуру от монолитного агента до модульной системы, с какими вызовами столкнулся (память, токены, оркестрация) и какие инженерные лайфхаки помогли справиться. Но главное — делюсь философией: почему работа с LLM похожа на экзамен, как меняется роль CTO и чему учат такие проекты. В финале — 10 уроков, которые я вынес из этого «AI-экзамена». Читать далее
#mvp #artificial_intelligence #google_adk #google #python #llm_агент #agent #llm | @habr_ai
В этой статье я делюсь личным опытом разработки MVP LLM-агента на базе Google ADK в образовательных сценариях. Рассказываю, как строил архитектуру от монолитного агента до модульной системы, с какими вызовами столкнулся (память, токены, оркестрация) и какие инженерные лайфхаки помогли справиться. Но главное — делюсь философией: почему работа с LLM похожа на экзамен, как меняется роль CTO и чему учат такие проекты. В финале — 10 уроков, которые я вынес из этого «AI-экзамена». Читать далее
#mvp #artificial_intelligence #google_adk #google #python #llm_агент #agent #llm | @habr_ai
Хабр
Мой личный экзамен: как я разработал MVP LLM-агента на Google ADK
Мой личный экзамен: как я разработал MVP LLM-агента на Google ADK Уже несколько лет я работаю в качестве CTO компании ASRP , которая развивает образовательные проекты и исследует новые подходы в...
[Перевод] PCW — новая метрика продуктивности разработчиков с ИИ
Команда AI for Devs подготовила перевод статьи о метрике Percentage of Code Written (PCW) от Windsurf. Эта метрика показывает, какой процент кода в проекте реально пришёл от ИИ. Авторы утверждают: PCW надёжнее привычных показателей вроде acceptance rate и отражает, насколько продукт действительно помогает разработчикам. А как вы думаете — можно ли измерить ценность ИИ в цифрах? Читать далее
#ai #продуктивность #agent #ии #agentic_ai #эффективность | @habr_ai
Команда AI for Devs подготовила перевод статьи о метрике Percentage of Code Written (PCW) от Windsurf. Эта метрика показывает, какой процент кода в проекте реально пришёл от ИИ. Авторы утверждают: PCW надёжнее привычных показателей вроде acceptance rate и отражает, насколько продукт действительно помогает разработчикам. А как вы думаете — можно ли измерить ценность ИИ в цифрах? Читать далее
#ai #продуктивность #agent #ии #agentic_ai #эффективность | @habr_ai
Хабр
PCW — новая метрика продуктивности разработчиков с ИИ
Команда AI for Devs подготовила перевод статьи о метрике Percentage of Code Written (PCW) от Windsurf. Эта метрика показывает, какой процент кода в проекте реально пришёл от ИИ. Авторы...
Мультиагентные системы: как «команда ИИ» берёт сложность штурмом
Когда один ИИ — мало. Нужна команда
Ночные падения, баги «только на проде», фичи, которые нужно вчера — знакомо?
В такие моменты один, даже очень умный, ИИ похож на гения-одиночку на стройке небоскрёба. Он силён, но не масштабируется. Решение — команда ИИ-агентов: аналитик, фиксер, контролёр, координатор. Каждый делает своё, вместе — закрывают задачу.
В этой статье мы покажем, как собрать такую «бригаду» поверх LLM так, чтобы она реально работала с кодом: читала файлы, вносила патчи, гоняла тесты и сама себя проверяла. Без магии — с понятным интерфейсом действий (ACI), с архитектурой, которая объясняет метрики, и с живыми примерами из репозитория.
Что получите за чтение:
простую логику, почему «команда» надёжнее «соло-ИИ» и как это связано с ReAct, self-consistency, процессной проверкой и Mixture-of-Agents;
инженерный взгляд на масштабирование качества не только «размером модели», но и временем вывода (больше попыток → лучше отбор);
практику: минимальные команды запуска, «скриншоты» прогонов и аккуратный ACI, который превращает LLM из советчика в исполнителя;
архитектурный эскиз асинхронного оркестратора поверх реального LLM API — без тяжёлого кода, но с ясной идеей, как это встроить к вам.
Если вы тимлид, архитектор или ресёрчер, это статья-мост: от теории, которая действительно помогает, к работающим сценариям. Откроем крышку, включим свет — и соберём команду ИИ, которая берёт сложность штурмом. Читать далее
#ai #agent #bug #codereview | @habr_ai
Когда один ИИ — мало. Нужна команда
Ночные падения, баги «только на проде», фичи, которые нужно вчера — знакомо?
В такие моменты один, даже очень умный, ИИ похож на гения-одиночку на стройке небоскрёба. Он силён, но не масштабируется. Решение — команда ИИ-агентов: аналитик, фиксер, контролёр, координатор. Каждый делает своё, вместе — закрывают задачу.
В этой статье мы покажем, как собрать такую «бригаду» поверх LLM так, чтобы она реально работала с кодом: читала файлы, вносила патчи, гоняла тесты и сама себя проверяла. Без магии — с понятным интерфейсом действий (ACI), с архитектурой, которая объясняет метрики, и с живыми примерами из репозитория.
Что получите за чтение:
простую логику, почему «команда» надёжнее «соло-ИИ» и как это связано с ReAct, self-consistency, процессной проверкой и Mixture-of-Agents;
инженерный взгляд на масштабирование качества не только «размером модели», но и временем вывода (больше попыток → лучше отбор);
практику: минимальные команды запуска, «скриншоты» прогонов и аккуратный ACI, который превращает LLM из советчика в исполнителя;
архитектурный эскиз асинхронного оркестратора поверх реального LLM API — без тяжёлого кода, но с ясной идеей, как это встроить к вам.
Если вы тимлид, архитектор или ресёрчер, это статья-мост: от теории, которая действительно помогает, к работающим сценариям. Откроем крышку, включим свет — и соберём команду ИИ, которая берёт сложность штурмом. Читать далее
#ai #agent #bug #codereview | @habr_ai
Хабр
Мультиагентные системы: как «команда ИИ» берёт сложность штурмом
Введение: мир, где одному ИИ тесно Софт стал распределённым организмом: микросервисы, бесконечные API, CI/CD, инфраструктура как код, пользователи в разных часовых поясах. Ошибки проявляются не...
Почему бокс — это мультиагентная система
Привет! Наверняка уже все видели как ИИ-агентов ради хайпа пытаются затащить куда угодно, совсем не глядя на эффективность и какой-либо здравый смысл.
В этой статье я расскажу о действительно полезном применении концепции агентов и попробую доказать, почему любой боксерский поединок является мультиагентной системой. Поговорим про system design бокса, про RLHF, адаптивные алгоритмы, всевозможный вызов tools типа джебов или клинча, очереди сообщений и гарантию их доставки, graceful degradation и выведем метрики эффективности нашей мультиагентной системы. Читать далее
#llm #agent #agentic_ai #агенты_ии #агенты #машинное_обучение #машинное_обучение #языковые_модели #большие_языковые_модели #ии_агенты | @habr_ai
Привет! Наверняка уже все видели как ИИ-агентов ради хайпа пытаются затащить куда угодно, совсем не глядя на эффективность и какой-либо здравый смысл.
В этой статье я расскажу о действительно полезном применении концепции агентов и попробую доказать, почему любой боксерский поединок является мультиагентной системой. Поговорим про system design бокса, про RLHF, адаптивные алгоритмы, всевозможный вызов tools типа джебов или клинча, очереди сообщений и гарантию их доставки, graceful degradation и выведем метрики эффективности нашей мультиагентной системы. Читать далее
#llm #agent #agentic_ai #агенты_ии #агенты #машинное_обучение #машинное_обучение #языковые_модели #большие_языковые_модели #ии_агенты | @habr_ai
Хабр
Почему бокс — это мультиагентная система
Привет! ИИ-агенты — главная горячая тема этого года, но все наверняка видели как их ради хайпа пытаются затащить куда угодно, совсем не глядя на эффективность и какой-либо здравый смысл. В этой статье...