This media is not supported in your browser
VIEW IN TELEGRAM
AWS снова отличились.
Недавно они представили новый подход, который по-настоящему меняет то, как разработчики строят агентные пайплайны.
Проблема в том, что большинство агентных фреймворков до сих пор заставляют захардкоживать workflow, деревья решений и сценарии отказов.
Это работает ровно до тех пор, пока агент не сталкивается с ситуацией, которую ты не предусмотрел.
Strands Agents от AWS идут другим путём.
Вместо переусложнённой оркестрации они опираются на способности современных моделей к рассуждению и позволяют модели самой вести workflow.
Ты:
- задаёшь цель,
- предоставляешь инструменты,
- и позволяешь агенту самому понять, как к этой цели прийти.
С точки зрения реализации всё максимально просто » нужно определить всего три вещи:
1. LLM,
2. инструменты,
3. задачу.
И всё. Дальше агентный цикл берёт управление на себя.
При запуске модель сама решает:
- нужен ли инструмент,
- какой именно,
- как сформировать входные данные,
- и когда остановиться.
Вся логика » model-driven.
То есть вместо правил вида «если математика — зови калькулятор» или «если API упал — делай retry», модель динамически планирует шаги и выполняет их сама.
Workflow формируется во время выполнения, исходя из цели и доступных инструментов.
Выше в видео показано конкретный, прикладной пример.
Это агент на базе MCP, который умеет создавать видео в стиле 3Blue1Brown по одному простому промпту.
Сетап был минимальный:
- MCP-сервер с инструментом для запуска Manim-скриптов,
- затем описал агента с этими инструментами. Без системных промптов и без правил workflow.
Дальше модель сама:
- спланировала шаги,
- сгенерировала сцену Manim,
- и автономно вызвала нужный инструмент.
Даже минимальная конфигурация уже даёт удивительно высокий уровень возможностей. А по мере добавления лучших инструментов или моделей агент становится сильнее сам по себе - без переписывания workflow.
Фреймворк полностью open source и работает с любым локальным сетапом.📖
👉 @PythonPortal
Недавно они представили новый подход, который по-настоящему меняет то, как разработчики строят агентные пайплайны.
Проблема в том, что большинство агентных фреймворков до сих пор заставляют захардкоживать workflow, деревья решений и сценарии отказов.
Это работает ровно до тех пор, пока агент не сталкивается с ситуацией, которую ты не предусмотрел.
Strands Agents от AWS идут другим путём.
Вместо переусложнённой оркестрации они опираются на способности современных моделей к рассуждению и позволяют модели самой вести workflow.
Ты:
- задаёшь цель,
- предоставляешь инструменты,
- и позволяешь агенту самому понять, как к этой цели прийти.
С точки зрения реализации всё максимально просто » нужно определить всего три вещи:
1. LLM,
2. инструменты,
3. задачу.
И всё. Дальше агентный цикл берёт управление на себя.
При запуске модель сама решает:
- нужен ли инструмент,
- какой именно,
- как сформировать входные данные,
- и когда остановиться.
Вся логика » model-driven.
То есть вместо правил вида «если математика — зови калькулятор» или «если API упал — делай retry», модель динамически планирует шаги и выполняет их сама.
Workflow формируется во время выполнения, исходя из цели и доступных инструментов.
Выше в видео показано конкретный, прикладной пример.
Это агент на базе MCP, который умеет создавать видео в стиле 3Blue1Brown по одному простому промпту.
Сетап был минимальный:
- MCP-сервер с инструментом для запуска Manim-скриптов,
- затем описал агента с этими инструментами. Без системных промптов и без правил workflow.
Дальше модель сама:
- спланировала шаги,
- сгенерировала сцену Manim,
- и автономно вызвала нужный инструмент.
Даже минимальная конфигурация уже даёт удивительно высокий уровень возможностей. А по мере добавления лучших инструментов или моделей агент становится сильнее сам по себе - без переписывания workflow.
Фреймворк полностью open source и работает с любым локальным сетапом.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍5🤯3👀1
Python-совет:
Shallow copy (copy.copy()) копирует сам объект, но не его вложенные элементы.
Deep copy (copy.deepcopy()) копирует и объект, и все вложенные структуры.
Поэтому при shallow copy изменения во вложенных элементах отражаются на оригинале, а при deep copy — нет.
👉 @PythonPortal
Shallow copy (copy.copy()) копирует сам объект, но не его вложенные элементы.
Deep copy (copy.deepcopy()) копирует и объект, и все вложенные структуры.
Поэтому при shallow copy изменения во вложенных элементах отражаются на оригинале, а при deep copy — нет.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20❤4👀3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Превратите любой авторегресcивный LLM в диффузионную языковую модель.
dLLM — это Python-библиотека, которая объединяет обучение и оценку diffusion-LM.
С её помощью можно превратить любой авторегресcивный LLM в diffusion-LM с минимальными вычислительными затратами.
Проект полностью open source.👌
Почему это важно:
Классические авторегресcивные модели генерируют текст слева направо, по одному токену за раз.
Диффузионные модели работают иначе » они итеративно уточняют всю последовательность целиком.
В итоге:
- больше контроля над качеством генерации
- гибкое редактирование текста
- меньше ограничений, связанных с порядком генерации
👉 @PythonPortal
dLLM — это Python-библиотека, которая объединяет обучение и оценку diffusion-LM.
С её помощью можно превратить любой авторегресcивный LLM в diffusion-LM с минимальными вычислительными затратами.
Проект полностью open source.
Почему это важно:
Классические авторегресcивные модели генерируют текст слева направо, по одному токену за раз.
Диффузионные модели работают иначе » они итеративно уточняют всю последовательность целиком.
В итоге:
- больше контроля над качеством генерации
- гибкое редактирование текста
- меньше ограничений, связанных с порядком генерации
Please open Telegram to view this post
VIEW IN TELEGRAM