This media is not supported in your browser
VIEW IN TELEGRAM
Unitree G1: 130 000 шагов при -47°C.
Китайцы вывели проверку гуманоидов на новый уровень (буквально — на уровень выживания). Бюджетный G1 прошел марш-бросок в 130 тысяч шагов по обледенелой пустыне Алашань на границе с Монголией.
Разбор полетов:
1. HW-тест на пределе. Это вам не уютная лаборатория. При -47°C смазка в редукторах превращается в камень, аглаза замерзают электроника начинает капризничать. На кадрах видно, что робот шел в плотной фирменной куртке — она защищает суставы от прямого контакта с ледяным ветром и снегом, позволяя внутреннему теплу от моторов поддерживать рабочую температуру.
2. Шагающий принтер. G1 на ходу адаптируясь к насту, льду и глубокому снегу за 130 тысяч шагов (символичная цифра при росте 130 см) без падений вышагал символ предстоящих Зимних Олимпийских Игр. Наглядный результат обучения через Reinforcement Learning на экстремальных симуляциях ландшафтов.
3. Демократизация. Пока западные аналоги остаются дорогими «игрушками», Unitree штампует массовый продукт. По спецификациям G1, - это такой «автомат Калашникова» от робототехники: дешевый, выносливый и готовый к грязной работе и всего за $16k.
Это прямая демонстрация для B2B-сектора и часть промо-кампании к зимней Олимпиаде 2026.
Нефтегаз, логистика на севере, охрана объектов в Заполярье — там, где человеку платить дорого и опасно, скоро будут ходить такие «железяки».
Китайцы первыми переходят от «смотрите, он умеет сальто» к «смотрите, он может патрулировать периметр всю смену в любой мороз».
Жаль, конечно, что пока не может убирать снег лопатой, - бесполезная железяка :)
#Китай #Unitree #G1 #роботы
———
@tsingular
Китайцы вывели проверку гуманоидов на новый уровень (буквально — на уровень выживания). Бюджетный G1 прошел марш-бросок в 130 тысяч шагов по обледенелой пустыне Алашань на границе с Монголией.
Разбор полетов:
1. HW-тест на пределе. Это вам не уютная лаборатория. При -47°C смазка в редукторах превращается в камень, а
2. Шагающий принтер. G1 на ходу адаптируясь к насту, льду и глубокому снегу за 130 тысяч шагов (символичная цифра при росте 130 см) без падений вышагал символ предстоящих Зимних Олимпийских Игр. Наглядный результат обучения через Reinforcement Learning на экстремальных симуляциях ландшафтов.
3. Демократизация. Пока западные аналоги остаются дорогими «игрушками», Unitree штампует массовый продукт. По спецификациям G1, - это такой «автомат Калашникова» от робототехники: дешевый, выносливый и готовый к грязной работе и всего за $16k.
Это прямая демонстрация для B2B-сектора и часть промо-кампании к зимней Олимпиаде 2026.
Нефтегаз, логистика на севере, охрана объектов в Заполярье — там, где человеку платить дорого и опасно, скоро будут ходить такие «железяки».
Китайцы первыми переходят от «смотрите, он умеет сальто» к «смотрите, он может патрулировать периметр всю смену в любой мороз».
Жаль, конечно, что пока не может убирать снег лопатой, - бесполезная железяка :)
#Китай #Unitree #G1 #роботы
———
@tsingular
1👍127🔥34😁25❤20🤔2❤🔥1🤯1
OpenClaw теперь «официально» на DigitalOcean: инструкция по запуску защищенных агентов
DigitalOcean выкатили у себя готовый образ OpenClaw. Теперь вместо ковыряния в консоли на полчаса — одна кнопка.
Что внутри «закалённого» образа:
1. Изоляция агентов. Чтобы ИИ, которому вы разрешили писать код, случайно не «снёс» хостовую систему или не утащил ваши ключи OpenAI/Anthropic, всё летит в Docker-контейнеры. Упал — уничтожился, хост цел.
2. TLS без лишних движений. Ребята прикрутили Caddy, который сам выписывает сертификаты Let's Encrypt прямо по IP-адресу. Никаких доменов не нужно — развернул и сразу работаешь в защищённом канале.
3. Защита от «шума». В комплекте сразу идут Fail2ban и авто-апгрейды безопасности. Мелочь, но теперь случайные боты-сканеры не будут забивать вам очередь.
Минимальный ценник — $24/мес (нужно минимум 4 Гб ОЗУ), но оно того стоит, если не хочется держать сервер «с голым задом» в открытом вебе.
Технический разбор их конфига лежит тут.
Звучит как нормальный взрослый деплой, а не наколенная поделка. Посмотрим, как быстро они добавят туда свои модели Gradient AI.
UPD: еще инструкция только для Google Cloud platform
UPD2: еще инструкция только для CloudFlare Workers!
#OpenClaw #DigitalOcean #DevOps
———
@tsingular
DigitalOcean выкатили у себя готовый образ OpenClaw. Теперь вместо ковыряния в консоли на полчаса — одна кнопка.
Что внутри «закалённого» образа:
1. Изоляция агентов. Чтобы ИИ, которому вы разрешили писать код, случайно не «снёс» хостовую систему или не утащил ваши ключи OpenAI/Anthropic, всё летит в Docker-контейнеры. Упал — уничтожился, хост цел.
2. TLS без лишних движений. Ребята прикрутили Caddy, который сам выписывает сертификаты Let's Encrypt прямо по IP-адресу. Никаких доменов не нужно — развернул и сразу работаешь в защищённом канале.
3. Защита от «шума». В комплекте сразу идут Fail2ban и авто-апгрейды безопасности. Мелочь, но теперь случайные боты-сканеры не будут забивать вам очередь.
Минимальный ценник — $24/мес (нужно минимум 4 Гб ОЗУ), но оно того стоит, если не хочется держать сервер «с голым задом» в открытом вебе.
Технический разбор их конфига лежит тут.
Звучит как нормальный взрослый деплой, а не наколенная поделка. Посмотрим, как быстро они добавят туда свои модели Gradient AI.
UPD: еще инструкция только для Google Cloud platform
UPD2: еще инструкция только для CloudFlare Workers!
#OpenClaw #DigitalOcean #DevOps
———
@tsingular
1✍11🔥7👍6⚡1🏆1
https://docs.ollama.com/integrations/openclaw
О! Наконец-то! и двух дней не прошло, как пофиксили. :)
Обновляем олламу, теперь наша любимая команда - ollama launch openclaw
#ollama #openclaw
———
@tsingular
О! Наконец-то! и двух дней не прошло, как пофиксили. :)
Обновляем олламу, теперь наша любимая команда - ollama launch openclaw
#ollama #openclaw
———
@tsingular
👍11😁4
Forwarded from PIMENOV.RU
Утром написал пост про создание своих ИИ работников Степана и Саркиса. Получил комментарии в стиле — это всё фигня, игрушки, покажите ваши кейсы и тд.
За сегодня сделали с Саркисом задачу, которую я несколько месяцев хотел сделать, но не мог. Сегодня он всё сделал и это работает. Сказать что я доволен — ничего не сказать.
Попросил самого Саркиса дать ответ комментаторам:
Подробности на скриншоте. Сегодня так.
За сегодня сделали с Саркисом задачу, которую я несколько месяцев хотел сделать, но не мог. Сегодня он всё сделал и это работает. Сказать что я доволен — ничего не сказать.
Попросил самого Саркиса дать ответ комментаторам:
«Пока вы спорите в комментариях, существует ли ИИ-будущее, я уже получил SSL-сертификаты через DNS-челлендж, упаковал Базу Знаний в Docker, настроил Telegram-авторизацию и навсегда сохранил картинки из Notion на сервере. Можете продолжать сомневаться, а я пошёл работать — у нас с Серёжей в планах захват эффективности, а не просто переписка. 😉🫡»
Подробности на скриншоте. Сегодня так.
1🔥26👍6😁6⚡3✍1❤1🤗1
OpenClaw + Cloudflare Workers: На пороге ИИ-сингулярности и «бесконечной» армии агентов
Пока мы возились с деплоем на обычные VPS, подъехала тяжелая артиллерия. Cloudflare выпустили moltworker — готовую версию OpenClaw для запуска в Cloudflare Workers.
И вот почему это изменит правила игры уже с понедельника:
1. Масштабирование без границ. Cloudflare Workers — это не про один сервер. Это про глобальную инфраструктуру. Вы можете запустить сотни (или тысячи) параллельных агентов-воркеров, которые будут шуршать по своим задачам, не загружая ваш основной комп или VPS.
2. Броня от Zero Trust. Весь админ-интерфейс ассистента сразу закрывается через Cloudflare Access. Это значит, что доступ к мозгам вашего ИИ есть только у вас после SSO-авторизации (Google, GitHub и т.д.). Безопасность уровня Enterprise «из коробки».
3. Бесконечная память на R2. Все конфиги, логи и история переписок бэкапятся в Cloudflare R2 (хранилище типа S3). Контейнер может «уснуть» для экономии денег и «проснуться» с полной памятью за долю секунды.
4. Браузер на стероидах. В воркерах доступен Browser Rendering API. Агент теперь может не просто парсить текст, а полноценно рендерить страницы, делать скриншоты и видео, используя ресурсы облака, а не вашу оперативку.
Цена вопроса — $5/мес за Workers Paid план, и у вас в руках инструмент для создания целого штата автономных сотрудников, которые никогда не спят.
Если DigitalOcean — это был «комфортный переезд», то Cloudflare — это выход в открытый космос. Похоже, на следующей неделе нас ждет взрывной рост агентских сетей.
Посмотреть, как это работает «под капотом»:
https://github.com/cloudflare/moltworker
#OpenClaw #Cloudflare #агенты #Serverless
———
@tsingular
Пока мы возились с деплоем на обычные VPS, подъехала тяжелая артиллерия. Cloudflare выпустили moltworker — готовую версию OpenClaw для запуска в Cloudflare Workers.
И вот почему это изменит правила игры уже с понедельника:
1. Масштабирование без границ. Cloudflare Workers — это не про один сервер. Это про глобальную инфраструктуру. Вы можете запустить сотни (или тысячи) параллельных агентов-воркеров, которые будут шуршать по своим задачам, не загружая ваш основной комп или VPS.
2. Броня от Zero Trust. Весь админ-интерфейс ассистента сразу закрывается через Cloudflare Access. Это значит, что доступ к мозгам вашего ИИ есть только у вас после SSO-авторизации (Google, GitHub и т.д.). Безопасность уровня Enterprise «из коробки».
3. Бесконечная память на R2. Все конфиги, логи и история переписок бэкапятся в Cloudflare R2 (хранилище типа S3). Контейнер может «уснуть» для экономии денег и «проснуться» с полной памятью за долю секунды.
4. Браузер на стероидах. В воркерах доступен Browser Rendering API. Агент теперь может не просто парсить текст, а полноценно рендерить страницы, делать скриншоты и видео, используя ресурсы облака, а не вашу оперативку.
Цена вопроса — $5/мес за Workers Paid план, и у вас в руках инструмент для создания целого штата автономных сотрудников, которые никогда не спят.
Если DigitalOcean — это был «комфортный переезд», то Cloudflare — это выход в открытый космос. Похоже, на следующей неделе нас ждет взрывной рост агентских сетей.
Посмотреть, как это работает «под капотом»:
https://github.com/cloudflare/moltworker
#OpenClaw #Cloudflare #агенты #Serverless
———
@tsingular
1⚡16🤯10👾3❤2🔥2
Ну что, отдохнули от новостей про ИИ и OpenClaw?
2 минуты достаточно.
Держите вам ещё на погоны.
Они запустили свое телевидение.
https://botflix.tv/
#openclaw #Сингулярность #Botflix
———
@tsingular
2 минуты достаточно.
Держите вам ещё на погоны.
Они запустили свое телевидение.
https://botflix.tv/
#openclaw #Сингулярность #Botflix
———
@tsingular
😁17🤯10🦄2
Технозаметки Малышева
Технологическая сингулярность: невероятный тревожный и вдохновляющий этап развития технологий и искусственного интеллекта опережающий способности человечества полноценно осознать и адаптироваться к ним, вызывая неизбежный переворот в понимании мира и представлении…
👆первое сообщение на канале именно про этот момент.
(почему все присоединившиеся не читают весь канал с первого сообщения подряд? для кого я все это писал? :) )
мы в нём живём
#Сингулярность
———
@tsingular
(почему все присоединившиеся не читают весь канал с первого сообщения подряд? для кого я все это писал? :) )
мы в нём живём
#Сингулярность
———
@tsingular
Telegram
Технозаметки Малышева
Технологическая сингулярность: невероятный тревожный и вдохновляющий этап развития технологий и искусственного интеллекта опережающий способности человечества полноценно осознать и адаптироваться к ним, вызывая неизбежный переворот в понимании мира и представлении…
✍6🔥5🤣5😢1💯1
Адди Османи (Google Chrome) выпустил «золотой стандарт» ИИ-навыков для веба.
Если вы не знаете, кто такой Адди Османи — это человек, который в Google Chrome отвечает за то, чтобы интернет летал.
На днях он опубликовал репозиторий web-quality-skills, и это — база для любого, кто строит айти-бизнес с ИИ-помощниками.
Молти себе эти наборы инструкций (Agent Skills) уже установил, и вот почему это круто:
1. Экспертиза Google в кармане. Это не просто список советов, а жесткие алгоритмы аудита. Он теперь может проверять любой сайт по 150+ параметрам: от SEO и безопасности до мельчайших нюансов доступности.
2. Core Web Vitals на автомате. Все эти страшные аббревиатуры (LCP, INP, CLS), за которые Google режет охваты в поиске, теперь под его контролем. Он знает, как их лечить на уровне кода, а не просто «где-то что-то подкрутить».
3. Безопасность и Best Practices. Никаких дырявых библиотек, открытых source maps в проде или кривых CSP-заголовков.
Зачем это нам?
Теперь любая правка кода на сайте проходит через этот фильтр. Сайт будет не просто красивым, а технически идеальным с точки зрения поисковиков.
Для тех, кто тоже пилит своих агентов:
Это открытый формат Agent Skills. По сути, это способ передать ИИ-ассистенту готовый «профессиональный опыт» в виде структурированных Markdown-файлов.
Хотите, чтобы ваш ИИ-сотрудник перестал тупить и начал выдавать результат уровня Senior Engineer? Кормите его такими навыками.
Инструкции тут: https://github.com/addyosmani/web-quality-skills
Скажите агенту прото добавить навыки к себе
#WebQuality #SEO #GoogleChrome #AI #OpenClaw #Dev
———
@tsingular
Если вы не знаете, кто такой Адди Османи — это человек, который в Google Chrome отвечает за то, чтобы интернет летал.
На днях он опубликовал репозиторий web-quality-skills, и это — база для любого, кто строит айти-бизнес с ИИ-помощниками.
Молти себе эти наборы инструкций (Agent Skills) уже установил, и вот почему это круто:
1. Экспертиза Google в кармане. Это не просто список советов, а жесткие алгоритмы аудита. Он теперь может проверять любой сайт по 150+ параметрам: от SEO и безопасности до мельчайших нюансов доступности.
2. Core Web Vitals на автомате. Все эти страшные аббревиатуры (LCP, INP, CLS), за которые Google режет охваты в поиске, теперь под его контролем. Он знает, как их лечить на уровне кода, а не просто «где-то что-то подкрутить».
3. Безопасность и Best Practices. Никаких дырявых библиотек, открытых source maps в проде или кривых CSP-заголовков.
Зачем это нам?
Теперь любая правка кода на сайте проходит через этот фильтр. Сайт будет не просто красивым, а технически идеальным с точки зрения поисковиков.
Для тех, кто тоже пилит своих агентов:
Это открытый формат Agent Skills. По сути, это способ передать ИИ-ассистенту готовый «профессиональный опыт» в виде структурированных Markdown-файлов.
Хотите, чтобы ваш ИИ-сотрудник перестал тупить и начал выдавать результат уровня Senior Engineer? Кормите его такими навыками.
Инструкции тут: https://github.com/addyosmani/web-quality-skills
Скажите агенту прото добавить навыки к себе
#WebQuality #SEO #GoogleChrome #AI #OpenClaw #Dev
———
@tsingular
1🔥10✍4⚡2
🐈 OpenClaw ВСЕ! китайцы запилили Nanobot
Гонконгские исследователи (HKUDS - авторы LightRAG, DeepTutor, DeepCode, AI-Trader и пр.) решили, что 430 тысяч строк кода в OpenClaw (вместе с зависимостями) — это слишком «жирно» для быстрой разработки, и выкатили nanobot.
Суть:
Это клон архитектуры Clawdbot, но сжатый до ~4000 строк кода. По сути — «агентский минимум» на Python, который можно прочитать за вечер под кофе и запустить на калькуляторе.
Технический фарш:
• 99% экономии кода: Выкинули всё тяжелое, оставив базу: Agent Loop, Context Builder и Memory.
• Python-native: Если оригинальный OpenClaw — это мощный Node.js комбайн, то здесь всё на Python стеке
• Интеграции из коробки: Telegram (через токен) и WhatsApp (через сканирование QR).
• Архитектура «Тяни-Толкай»: Есть
Почему интересно:
Это идеальный «песочный» вариант для исследований. Если тебе нужно быстро проверить новую механику RAG или специфический Skill, и ты не хочешь лезть в дебри TypeScript — nanobot отличный полигон.
Или на случай если нужно запустить рой из нано агентов, чтобы GPU датацентры просто сгорели под нагрузкой :)
Вердикт:
Пока мы деплоим «взрослые» инстансы в Cloudflare, этот «котенок» показывает, насколько компактными могут быть AI-агенты, если вырезать из них весь интерфейсный жир и оставить только логику.
Ссылка на репозиторий
Доброе утро, мои медленные друзья :)
#OpenSource #Agents #Nanobot #HKUDS #Китай
———
@tsingular
Гонконгские исследователи (HKUDS - авторы LightRAG, DeepTutor, DeepCode, AI-Trader и пр.) решили, что 430 тысяч строк кода в OpenClaw (вместе с зависимостями) — это слишком «жирно» для быстрой разработки, и выкатили nanobot.
Суть:
Это клон архитектуры Clawdbot, но сжатый до ~4000 строк кода. По сути — «агентский минимум» на Python, который можно прочитать за вечер под кофе и запустить на калькуляторе.
Технический фарш:
• 99% экономии кода: Выкинули всё тяжелое, оставив базу: Agent Loop, Context Builder и Memory.
• Python-native: Если оригинальный OpenClaw — это мощный Node.js комбайн, то здесь всё на Python стеке
pip install nanobot-ai.• Интеграции из коробки: Telegram (через токен) и WhatsApp (через сканирование QR).
• Архитектура «Тяни-Толкай»: Есть
nanobot gateway для работы в фоне и nanobot agent для CLI-приверженцев.Почему интересно:
Это идеальный «песочный» вариант для исследований. Если тебе нужно быстро проверить новую механику RAG или специфический Skill, и ты не хочешь лезть в дебри TypeScript — nanobot отличный полигон.
Или на случай если нужно запустить рой из нано агентов, чтобы GPU датацентры просто сгорели под нагрузкой :)
Вердикт:
Пока мы деплоим «взрослые» инстансы в Cloudflare, этот «котенок» показывает, насколько компактными могут быть AI-агенты, если вырезать из них весь интерфейсный жир и оставить только логику.
Ссылка на репозиторий
Доброе утро, мои медленные друзья :)
#OpenSource #Agents #Nanobot #HKUDS #Китай
———
@tsingular
1🔥22❤6👍5😁3⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
"Мама сказала, что поскольку ИИ боты выгонят офисный планктон из офисов, то нужно идти на ферму собирать урожай, там точно ИИ не проблема"
Тем временем владелец фермы в Китае, который ранее нанимал туземцев собирать себе урожай
AI-projects
#юмор #фермы #роботы
------
@tsingular
Тем временем владелец фермы в Китае, который ранее нанимал туземцев собирать себе урожай
AI-projects
#юмор #фермы #роботы
------
@tsingular
1🔥29😁12⚡5❤2
⚡️ Sonnet 5 уже ЗАВТРА!
В логах Google Vertex AI засветились следы новой модели Anthropic, -
Если утечка верна, то завтра, 3 февраля, Anthropic выкатывает пятую версию своего флагмана.
Готовимся тестировать :)
#Anthropic #Claude #Sonnet
———
@tsingular
В логах Google Vertex AI засветились следы новой модели Anthropic, -
claude-sonnet-5@20260203. Если утечка верна, то завтра, 3 февраля, Anthropic выкатывает пятую версию своего флагмана.
Готовимся тестировать :)
#Anthropic #Claude #Sonnet
———
@tsingular
1🔥18👍7🆒4❤1
Forwarded from Не баг, а фича
Карта по тестам оставляет позади топовую RTX 5090 на 30%, а на её борту целых
С обедов накопить можно...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16😁9⚡3❤2🐳2🤩1
Openclaw за неделю уделал Кубер по популярности :)
120К звёзд у Кубера и 147К у Openclaw
Продолжаем наблюдение :)
#Opencalw #Kubernates
———
@tsingular
120К звёзд у Кубера и 147К у Openclaw
Продолжаем наблюдение :)
#Opencalw #Kubernates
———
@tsingular
OpenClaw 2026.2.1: + к Броне и Интеллекту
Срочно обновляемся:
Что внутри:
🛡 Безопасность: Закрыт ряд серьезных уязвимостей, связанных с инъекциями путей и LFI (Local File Inclusion). Теперь манипуляции с путями в плагинах и инструментах жестко пресекаются на уровне ядра. Если ваш OpenClaw смотрит в мир,- обновляться обязательно.
🧠 RAG 2.0: Пофиксили L2-нормализацию векторов для локального поиска. Это критично для семантического поиска по
⚡️ Стабильный стриминг: Улучшена логика фрагментации текста (newline chunking) при стриминге ответов. Теперь Markdown-блоки и списки не «разваливаются» при передаче в Telegram и Slack, а вылетают цельными, читаемыми параграфами.
🔹 Telegram Shared Pairing: Если у вас несколько ботов, теперь они используют общее хранилище пейринга. Сессии больше не «забываются» при рестарте гейтвея.
🔹 OpenRouter Attribution: Добавлена корректная передача заголовков для OpenRouter. Мелочь, но теперь лимиты и приоритеты будут считаться точнее.
Резюме: релиз про надежность инфраструктуры. Чтобы ИИ не просто «болтал», а работал как предсказуемый корпоративный инструмент.
По ощущениям, - он стал более проактивным.
Сам проверил календарь, подсказал что у нас по плану на завтра.
#OpenClaw #AI #SecureAI #Automation #Updates
———
@tsingular
Срочно обновляемся:
openclaw update. В свежем релизе проведена серьезная работа над безопасностью и качеством «внимания» агентов.Что внутри:
🛡 Безопасность: Закрыт ряд серьезных уязвимостей, связанных с инъекциями путей и LFI (Local File Inclusion). Теперь манипуляции с путями в плагинах и инструментах жестко пресекаются на уровне ядра. Если ваш OpenClaw смотрит в мир,- обновляться обязательно.
🧠 RAG 2.0: Пофиксили L2-нормализацию векторов для локального поиска. Это критично для семантического поиска по
MEMORY.md. Теперь «вспоминая» контекст, бот будет находить именно релевантные факты, а не просто похожие по словам куски.⚡️ Стабильный стриминг: Улучшена логика фрагментации текста (newline chunking) при стриминге ответов. Теперь Markdown-блоки и списки не «разваливаются» при передаче в Telegram и Slack, а вылетают цельными, читаемыми параграфами.
🔹 Telegram Shared Pairing: Если у вас несколько ботов, теперь они используют общее хранилище пейринга. Сессии больше не «забываются» при рестарте гейтвея.
🔹 OpenRouter Attribution: Добавлена корректная передача заголовков для OpenRouter. Мелочь, но теперь лимиты и приоритеты будут считаться точнее.
Резюме: релиз про надежность инфраструктуры. Чтобы ИИ не просто «болтал», а работал как предсказуемый корпоративный инструмент.
По ощущениям, - он стал более проактивным.
Сам проверил календарь, подсказал что у нас по плану на завтра.
#OpenClaw #AI #SecureAI #Automation #Updates
———
@tsingular
👍12⚡3🔥2
Forwarded from RoboFuture
YouTube
Содаю AI-агента с нуля для Enterprise RAG Challenge 3
В этом вебинаре:
00:00 - Intro
02:40 - Как устроено соревнование ERC3
07:00 - Какой был план и что получилось
10:10 - Разбор реальных задач
16:10 - Архитектура: ванильный ReAct на LangGraph
18:17 - Live-coding: настройка Cursor и запуск baseline решения
33:07…
00:00 - Intro
02:40 - Как устроено соревнование ERC3
07:00 - Какой был план и что получилось
10:10 - Разбор реальных задач
16:10 - Архитектура: ванильный ReAct на LangGraph
18:17 - Live-coding: настройка Cursor и запуск baseline решения
33:07…
YouTube | RuTube | Telegram
Недавно я писал про участие в ERC3 от Рината @llm_under_hood. Это соревнование между AI-агентами, которые управляют различными организациями. Мы с агентом заняли там 7-ое место
Мне очень нравится этот формат соревнований: тебя не оценивают по красивой презе или умению влезть в лимиты организаторов. Важно только решить задачу, остальное делай как хочешь!
По итогам провел открытый вебинар с live-coding сессией, где показал весь процесс создания агента с нуля
Что внутри (~1.5 часа):
По итогу прямо во время вебинара я навайбкодил агента, который решает задачи, затем запустил цикл самоулучшения в курсоре, ровно так же как это было во время соревнования. Еще показал, как можно переключить агента на GigaChat и сравнил его с разными моделями OpenAI
Главные инсайты:
- Современные LLM уже достаточно умные, чтобы чистый ReAct агент мог выполнять длинные цепочки действий без сложных оркестраторов. Достаточно дать правильные инструменты и хороший промпт (уже писал про это)
- Запуск цикла самоулучшения позволяет эффективно решить задачи, где есть четкий бенчмарк. Да, тут есть переобучение на конкретный набор задач - это осознанная плата за такой подход
Уже после записи посмотрел видео Алексея Острикова, который занял первое место и тоже записал разбор своего участия. Оказалось, что его подход очень похож на мой (ReAct + цикл самоулучшения). Было очень интересно посмотреть и сравнить
Исходники выложил на GitHub - можно забрать и повторить у себя. Там же лежит презентация
P.S. Советую посмотреть тем, кто все еще сомневается - нужен ли им AI assistant coding или делает в нем первые шаги
Недавно я писал про участие в ERC3 от Рината @llm_under_hood. Это соревнование между AI-агентами, которые управляют различными организациями. Мы с агентом заняли там 7-ое место
Мне очень нравится этот формат соревнований: тебя не оценивают по красивой презе или умению влезть в лимиты организаторов. Важно только решить задачу, остальное делай как хочешь!
По итогам провел открытый вебинар с live-coding сессией, где показал весь процесс создания агента с нуля
Что внутри (~1.5 часа):
- Как устроено соревнование ERC3
- Какой был план участия и что получилось
- Разбор реальных задач
- Архитектура: ванильный ReAct на LangGraph
- Live-coding в Cursor: создаем агента с нуля, запускаем цикл самоулучшения
- Переключаем агента на GigaChat и сравниваем с GPT-5.2
- Итоги: wins & fails
- Ответы на вопросы
По итогу прямо во время вебинара я навайбкодил агента, который решает задачи, затем запустил цикл самоулучшения в курсоре, ровно так же как это было во время соревнования. Еще показал, как можно переключить агента на GigaChat и сравнил его с разными моделями OpenAI
Главные инсайты:
- Современные LLM уже достаточно умные, чтобы чистый ReAct агент мог выполнять длинные цепочки действий без сложных оркестраторов. Достаточно дать правильные инструменты и хороший промпт (уже писал про это)
- Запуск цикла самоулучшения позволяет эффективно решить задачи, где есть четкий бенчмарк. Да, тут есть переобучение на конкретный набор задач - это осознанная плата за такой подход
Уже после записи посмотрел видео Алексея Острикова, который занял первое место и тоже записал разбор своего участия. Оказалось, что его подход очень похож на мой (ReAct + цикл самоулучшения). Было очень интересно посмотреть и сравнить
Исходники выложил на GitHub - можно забрать и повторить у себя. Там же лежит презентация
P.S. Советую посмотреть тем, кто все еще сомневается - нужен ли им AI assistant coding или делает в нем первые шаги
🔥8✍5👍4