Data Portal | DS & ML

Loop Engineering — следующий шаг после prompt engineering.

Большинство всё ещё использует Claude Code, Codex, Cursor или Grok как чат-окно:

Промпт. Ждёшь. Копируешь. Исправляешь. Снова промпт.

Этот репозиторий показывает следующий шаг:

Вы перестаёте давать промпты агенту.

Вы проектируете цикл, который сам даёт промпты агенту.

Внутри:
→ Ежедневные циклы триажа
→ Циклы PR-няньки
→ Циклы CI-уборки
→ Циклы чистки зависимостей
→ Циклы составления changelog
→ Циклы пост-мерж очистки
→ Циклы триажа issues

Также даёт CLI для:
• Создания цикла (scaffold)
• Оценки токенов
• Аудита готовности репозитория
• Добавления памяти/состояния
• Добавления передачи человеку
• Добавления верификационных шлюзов
• Безопасного запуска агентов через GitHub Actions

Самое интересное — сдвиг в мышлении.

Prompt engineering был о том, как писать лучшие промты.

Loop engineering — о создании системы, где агенты продолжают работать, проверять, исправлять и эскалировать без вашего присмотра на каждом шагу.

Репозиторий: https://github.com/cobusgreyling/loop-engineering

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

807 views16:07

Data Portal | DS & ML

Вышло практическое руководство по созданию обвязок для AI-агентов

Harness Engineering Guide — практическое руководство по созданию обвязок для AI-агентов с концепциями, туториалами, статьями, инструментами и работающими примерами кода.

Оно помогает понять, что превращает голую языковую модель в агента, разбирая компоненты обвязки: выполнение инструментов, память, сборку контекста, границы безопасности, планирование и мультиагентную оркестрацию.

Ключевые особенности:

* Путь от основ — начинается с «Что такое Harness?» и 50-строчного Python-примера, который можно скопировать и запустить
* Основные концепции рантайма — охватывает агентный цикл, системы инструментов, память, контекст и guardrails
* Практические главы — включает песочницы, навыки, саб-агенты, обработку ошибок, планирование и проектирование долгоиграющих обвязок
* Сравнение инструментов — сравнивает OpenClaw, Claude Code, Codex, Cline, Aider и Cursor бок о бок
* Вклад сообщества — принимает материалы через GitHub issues или прямые PR

Проект с открытым исходным кодом (лицензия MIT).

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

GitHub - nexu-io/harness-engineering-guide: 🔧 The open guide to Harness Engineering — concepts, tutorials, papers, tools, and resources…

🔧 The open guide to Harness Engineering — concepts, tutorials, papers, tools, and resources for building and managing AI agent runtimes. - nexu-io/harness-engineering-guide

785 views06:07

Data Portal | DS & ML

This media is not supported in your browser

VIEW IN TELEGRAM

Промпт-инжиниринг и loop engineering — простое объяснение!

По своей сути агент — это цикл while:

- Модель выполняется
- Она запрашивает вызовы инструментов
- Результаты работы инструментов возвращаются в контекст
- Модель запускается снова, пока не перестанет запрашивать инструменты

Подход ReAct описал такую форму цикла ещё в 2022–2023 годах, и почти все современные агентные системы и фреймворки используют похожую реализацию.

Поэтому сами циклы — далеко не новая идея. Описанная выше реализация была решена уже давно.

Но оставался нерешённым цикл вокруг этого цикла. Именно о нём недавно говорили Борис и Питер.

В наиболее распространённой схеме внешним циклом управляешь ты.

- Пишешь промпт
- Читаешь шаги, которые выполняет агент
- Пишешь следующий промпт
- Повторяешь процесс, отслеживая ошибки по мере работы

Сейчас появляются попытки автоматизировать и внешний цикл, чтобы исключить человека из процесса.

- Запуск происходит по расписанию или по событию
- Агент выполняет множество шагов без новых промптов между ними
- Сам решает, когда работа завершена
- Возвращается к человеку только тогда, когда действительно требуется его участие

Рассмотрим пример с упавшим тестом в CI.

Сейчас ты копируешь сообщение об ошибке в агента, читаешь предложенное исправление, запускаешь тесты и снова передаёшь следующую ошибку, пока все тесты не пройдут.

То есть каждый шаг проходит через тебя.

При автоматизированном цикле агент выполняет те же самые шаги самостоятельно.

Он запускается по расписанию, считывает ошибку, готовит исправление в отдельной ветке, запускает тесты и передаёт следующую ошибку самому себе как новый шаг, пока тесты не пройдут или не будет достигнут лимит шагов.

Отдельный ревьюер проверяет исправление, открывает PR, если всё в порядке, или передаёт его человеку, если обнаруживает проблемы.

Внутренний цикл всегда был автоматическим. Сейчас автоматизируют именно твоё участие в этом процессе.

Но бесплатно это не даётся.

> Пока ты управлял внешним циклом, ты мог остановить процесс, обладал памятью о проекте и выступал в роли ревьюера. Теперь все эти функции должны существовать внутри самой системы.

> И хотя участие в цикле замедляло работу, зато ты понимал, что именно происходит.

Главный недостаток исключения человека из цикла в том, что ответственность остаётся за тобой, а понимание происходящего, скорее всего, теряется.

> Сам по себе цикл не умеет определять, когда действительно пора остановиться. Он просто поверит агенту, что задача выполнена, и может завершиться даже при падающих тестах. Поэтому условие остановки должно проверяться независимо, а также необходим лимит шагов или токенов, чтобы избежать бесконечных циклов.

> Контекст увеличивается на каждом шаге, и по мере его роста качество работы модели снижается.

Поэтому цикл должен сокращать контекст, сохраняя только сводки вместо полной истории, переносить большие результаты в файлы и разбивать крупные задачи на отдельные запуски.

> Наконец, агент не должен сам проверять собственную работу, потому что он примет любое своё решение как правильное.

Такую проверку должна выполнять отдельная модель или бинарный/детерминированный тест.

Стоимость тоже быстро растёт, потому что на каждом шаге заново передаётся весь контекст. Поэтому длинный цикл может стоить во много раз дороже, чем выполнение одного промпта.

Если хочешь разобраться глубже, мой сооснователь подготовил подробный разбор — от описанного выше цикла до полностью автономного запуска, который завершает работу самостоятельно, с примерами кода для каждого этапа.

Читайте дальше

🐸

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

735 views16:07

Data Portal | DS & ML

Нашёл отличную книгу — The Hitchhiker’s Guide to Agentic AI, которая охватывает практически весь стек Agentic AI.

https://arxiv.org/abs/2606.24937

Главная ценность книги — широкий обзор всего направления: архитектура LLM, обучение моделей, методы обучения с подкреплением, системы инференса, оценка моделей, агентные системы и многое другое.
Лучше всего использовать её как карту знаний. Сначала просмотреть оглавление, найти темы, в которых есть пробелы, понять, чего ещё не хватает, а затем углубиться в соответствующие главы. Такой подход помогает выстроить системное понимание Agentic AI.

🐸

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

806 views06:07

Data Portal | DS & ML

Представлен tau (τ) — образовательный agent harness, который помогает разобраться, как создавать собственные agent harness'ы.

Автор проекта планирует публиковать туториалы и демо, посвящённые созданию собственных TUI, harness'ов, расширений и других компонентов на базе tau.

Подробнее: https://twotimespi.dev

Также автор рассказал, почему проект получил название tau: https://twotimespi.dev/why-tau/

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

748 views17:28

Data Portal | DS & ML

Я нашёл OCR-инструмент, созданный для эпохи LLM.

Он называется olmOCR.

olmOCR берёт PDF, сканы, PNG и JPEG и превращает их в чистый Markdown, который модели действительно могут понять.

Он обрабатывает то, что обычно ломает документные пайплайны:

→ Таблицы
→ Формулы
→ Рукописный текст
→ Многоколоночная вёрстка
→ Иллюстрации
→ Врезки
→ Старые сканы
→ Верхние и нижние колонтитулы
→ Естественный порядок чтения

Вместо того чтобы скормить вашей ИИ грязный дамп PDF, вы даёте ей структурированный Markdown, сохраняющий исходный замысел документа.

Это важно, потому что огромная часть мировых знаний всё ещё заперта внутри PDF.

Научные статьи.
Юридические документы.
Финансовые отчёты.
Медицинские документы.
Отсканированные архивы.
Государственные документы.
Внутренние корпоративные знания.

Все строят RAG поверх документов.

Но если ваш OCR плох — ваша ИИ уже ошибается ещё до начала поиска.

olmOCR чинит первый рубеж.

Скучный слой.

Слой, о котором никто не говорит, пока их агент не начинает галлюцинировать из-за сломанного текста из PDF.

https://github.com/allenai/olmocr

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

691 views06:07

Data Portal | DS & ML

This media is not supported in your browser

VIEW IN TELEGRAM

Инжиниринг агентов (Agentic Engineering) Карпати наконец-то получил нормальный инструментарий

(созданный Google)

Карпати определил агентный инжиниринг как дисциплину, которая отделяет продакшн-работу с агентами от «вайб-кодинга». Основные навыки, которые он перечислил: проектирование спецификаций, eval-циклы и контроль безопасности.

Проблема в том, что для практики всё ещё нужен отдельный инструмент на каждом этапе:

- редактор для кода
- терминал для шаблонов
- браузер для тестирования
- облачная консоль для деплоя
- отдельный фреймворк для eval'ов

Каждый переход — это переключение контекста.

Решение для продакшн-уровня агентного инжиниринга теперь реализовано в Google Agents CLI.

Он покрывает весь воркфлоу в одном месте: шаблонизация, eval'ы и деплой ADK-агентов.

Одна команда настройки внедряет 7 ADK-специфичных навыков в контекст кодинг-агента, что позволяет ему обрабатывать шаблонизацию, eval'ы, деплой и регистрацию в Enterprise через естественный язык.

Я протестировал это от начала до конца, собрав RAG-агента с нуля через Claude Code.

Он сгенерировал полный проект из шаблона ADK agentic_rag, создал 20 eval-сценариев с оценкой LLM-as-judge и выдал количественную скоринг-карту.

В конце он также развернул всё в Agent Runtime и зарегистрировал агента в Gemini Enterprise, так что вся организация может его найти и использовать.

Видео выше показывает это в действии

Репозиторий Agents CLI на GitHub →

Вот полный гайд по сборке, охватывающий все шесть шагов — от установки до регистрации в Enterprise.

Он включает скоринг-карту eval'ов, «дыру» в инструкции, которую eval поймал до деплоя, и то, как процесс деплоя выглядит от начала до конца.

Читайте 🐸

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

697 viewsedited 16:07

Data Portal | DS & ML

Трансформеры становятся понятнее, когда можно «потыкать» модель напрямую.

Transformer Explainer — это интерактивный инструмент визуализации для изучения того, как работают текстогенерирующие модели на основе трансформеров, такие как GPT.

Он помогает связать архитектуру с реальным поведением, запуская живую GPT-2 прямо в браузере, позволяя вводить свой текст и показывая, как внутренние компоненты работают вместе для предсказания следующих токенов.

Ключевые возможности:

- Живая GPT-2 в браузере — экспериментируйте без настройки отдельного сервера модели
- Свой текст — пробуйте собственные промпты и смотрите, как модель их обрабатывает
- Внутренние компоненты — наблюдайте за операциями, работающими внутри трансформера
- Фокус на предсказании следующего токена — связывайте каждый визуальный шаг с предсказаниями модели
- Локальная разработка — клонируйте репозиторий, установите зависимости и запустите через npm для глубокого изучения

Это open-source (лицензия MIT).

https://github.com/poloclub/transformer-explainer

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

783 views06:07

Data Portal | DS & ML

Не учите ML, прыгая по случайным туториалам.

DS-ML Bootcamp — это публичный репозиторий курса по Data Science и машинному обучению для начинающих, которые хотят структурированный путь от нуля до практических проектов.

Он помогает перейти от установки и концепций к практической ML-работе, организуя уроки, задания, примеры кода, датасеты и решения вокруг основного воркфлоу машинного обучения.

Ключевые возможности:

- Сквозной воркфлоу — охватывает сбор данных, предобработку, разбиение на train/test, выбор модели, обучение, оценку и развёртывание
- Структура по урокам — начинается с инструментов/настройки, Data Science, ML, основ данных и регрессии
- Практические материалы — задания дают учащимся структурированные задачи, а не только чтение конспектов
- Код + датасеты — примеры на Python и сырые CSV-датасеты включены для упражнений
- Настройка для повторения — в README сказано, что можно клонировать репозиторий и использовать Jupyter или VS Code, параллельно просматривая уроки

Бесплатный публичный репозиторий на GitHub.

👉

@DataSciencegx

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

GitHub - goobolabs/ds-ml-bootcamp: Data Science and Machine Learning Bootcamp. (Jun - 2026)

Data Science and Machine Learning Bootcamp. (Jun - 2026) - goobolabs/ds-ml-bootcamp

632 views16:07

About

Blog

Apps

Platform