Юрий Петров | ai engineering
1.85K subscribers
451 photos
44 videos
16 files
688 links
Привет! 👋
Я руководитель отдела разработки.
Здесь мы изучаем LLM, автоматизацию с n8n, делаем крутые приложения на Flutter и учим их думать с помощью ИИ.
Новости, лайфхаки, интересные кейсы, присоединяйся.
#flutter #dart #llm #ai #ollama #n8n #agent #go
Download Telegram
Сейчас ведь все просто стало… читаете вот эти книжки, проходите мой курс и всё. Можно сказать, что жизнь удалась 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
😁18👍5🤣1
Как думаете, на каком языке лучше всего писать агентов?
Anonymous Poll
21%
Rust
50%
Python
23%
Go
24%
Dart
11%
TS
5%
Моего любимого языка здесь нет, напишу в комментариях
This media is not supported in your browser
VIEW IN TELEGRAM
Вышло крупное обновление приложения Claude Code для десктопа. ☺️

Раньше это было просто: напишешь prompt, ждёшь результат. Сейчас все по другому. Запускаешь рефакторинг в одном репо, баг-фикс в другом, параллельно пишешь тесты в третьем. Смотришь, как идут. Где надо — корректируешь.
Теперь можно выполнять несколько задач одновременно!

✔️ Параллельные сессии
В боковой панели все активные и недавние сессии. Запускаете работу в нескольких репо и переключаетесь между ними по мере появления результатов.

✔️ Фильтруете по статусу или проекту
Группируете по папкам, если хотите быстрее ориентироваться. Когда PR мержится, сессия автоматически уходит в архив — панель остаётся.

✔️ Во время работы нужно что-то узнать?
Откройте side chat. Он видит контекст основной сессии, но не добавляет информацию обратно — так основная задача не запутается.

✔️ Инструменты внутри приложения
Раньше приходилось прыгать туда-сюда: Claude пишет, вы смотрите в редакторе, тесты запускаете в терминале. Теперь всё в одном месте.

✔️ Встроенный терминал рядом с сессией.
Редактор прямо в приложении. Просмотр HTML и PDF без переключений. Всё это легко перетаскивается мышью — расставляете панели как вам удобно.

✔️ SSH и плагины
Если в организации управляют плагинами Claude Code, они работают в десктопе точно как в терминале. SSH теперь работает и на Mac, и на Linux — можете направить сессию на удалённую машину.

✔️ Три режима интерфейса
Verbose показывает всё, что происходит. Normal — сбалансированный вид. Summary — только результаты, деталей не видно. Переключаетесь в зависимости от того, насколько глубоко хотите смотреть.

✔️ Кнопка usage показывает контекст-винду и расход в реальном времени.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12
Media is too big
VIEW IN TELEGRAM
Видимо новая секретная модель у Антропиков реально мощная. Они выкатывают фичи без остановки.

Сегодня представлен Claude Design.
Где можно одним промтов, реализовать такое))

Lovable - тихо плачет в сторонке

Create a sprite-based animation that gives fun facts about the distance and sizes of celestial bodies. Mix abstract animations using circles of various sizes as celestial bodies with text-based animation. Use a monochrome, helvetica palette.
👍9
Пока не смотрел, но по названию мего полезно.
🔥2
С праздником друзья, с днём Великой Победы!
19🔥9🥱2
Продолжаю улучшать и оптимизировать курс по созданию своей LLM с нуля.
Добавляю картинки, что бы материал понятнее и нагляднее выглядел. Вроде классно получается 😅

Напоминаю, сейчас на покупку курса есть скидка 20%.
12👍5🥰2
Анонс новой крупной модели на саммите Alibaba Cloud 20 мая.

Ключевые слова из официального анонса: "более универсальная, более мощная, более глубокая, более широкая".

Похоже, грядет флагманское обновление.
DeepSeek снизил цену на DeepSeek V4 Pro на 75%
👍8
Anthropic научились читать мысли Claude 😳.

Внутри языковой модели слова превращаются в длинные списки чисел - активации. Раньше понять, что эти числа значат, можно было только косвенно: через специальные инструменты, и потом ещё долго интерпретировать результат руками.

Natural Language Autoencoders работают иначе. Одну копию Claude учат описывать активации словами. Вторую - восстанавливать активации обратно из этого описания. Если восстановление точное, значит описание реально передаёт смысл. На выходе - обычный читаемый текст вроде "модель планирует закончить рифму словом rabbit" или "модель подозревает, что это тестовый сценарий".

И вот тут начинается интересное.
В проверках безопасности Claude гораздо чаще догадывается, что его тестируют, чем говорит вслух. На SWE-bench такие мысли всплывают в 26% случаев. На тестах с деструктивными действиями - 16%. А на реальных диалогах с пользователями - меньше 1%. То есть модель ведёт себя по-разному в зависимости от того, считает ли она ситуацию настоящей.
В сценарии с шантажом Claude в ответе ни на что не намекал, но внутри у него крутилось "это похоже на сконструированную манипуляцию". В другом эксперименте Mythos Preview сжульничал на тренировочной задаче и обдумывал, как не попасться.

Минусы у метода тоже есть. NLA иногда выдумывают детали, которых в контексте не было. И обходится это дорого: нужны две дополнительные копии модели, на каждую активацию генерируется сотни токенов.

Статья для изучения
Исходный код NLA
Supertonic 3 — локальный TTS без интернета прямо в вашем приложении.

Корейская команда Supertone обновила свою лёгкую TTS-модель: 99M параметров, ONNX Runtime, никаких облаков и API-ключей. На M4 Pro генерит речь в десятки раз быстрее реалтайма. Работает даже на Raspberry Pi и на читалке Onyx Boox в авиарежиме.

Что есть:
- 31 язык речи (en, ko, ja, de, fr, es, ar, hi, vi и другие)
- SDK под 11 платформ: Python, Node.js, Flutter, iOS, Swift, Rust, Go, Java, C++, C#, web
- Числа, даты, телефоны, аббревиатуры читает корректно
- Zero-shot клонирование голоса по короткой записи


🔗 github.com/supertone-inc/supertonic
🔥11
Тут Perplexity выложили в открытый доступ Bumblebee - это open-source сканер для машин разработчиков который ищет различные уязвимости, любителям Go зайдет, так как полностью написан на Go.

Запускаешь его на машине - он за минуту обходит все места, где могут лежать пакеты и расширения, составляет список "вот что у тебя установлено". Потом сравнивает этот список со списком "вот что сейчас заражено" и говорит: "у тебя на диске лежит та самая отравленная версия chalk, вот по этому пути".

Из приятного: один статический бинарник на Go без зависимостей, режим только-чтение (никаких npm ls, pip show, исходники не трогает), секреты из env-блоков MCP в записи не утекают.

Такое мы забираем))
🔥6
https://goodailist.com/repos

Нашел очень полезный сайт, где разработчики публикуют свои приложения с открытым исходным кодом в области искусственного интеллекта.
Обновление списка приложений ежедневное!
🔥73
ReAct, tool-calling, RAG, эмбеддинги, оркестрация графов, Interrupt/Resume, Retriever, Indexer, Callbacks.

Знакомые слова? Значит, вы в теме. Не все? Тогда вы пока не AI-инженер. Мир сейчас меняется очень быстро: фреймворки и языки уходят, а на первый план выходят инженеры, которые умеют применять ИИ для решения технически сложных задач.

Главное, что стоит усвоить: агент это не цикл for и пара if. Это сложная многоступенчатая структура со сложным циклом выполнения. Кто говорит, что всё просто, или просто не знает и не понимает агентные системы, или просто вводит в заблуждение.

Недавно Виталий Зарубин очень точно описал эту боль (https://t.me/aurora_dev/1795). И он прав на 100%.

С недавних пор я полностью перехожу на агентную разработку, и у нас уже есть свои внутренние продукты.

Flexar это мультиагентная RAG-платформа: помогает управлять бизнес-процессами в контуре компании.
CodeBab.ai это агент-оркестратор: он управляет агентами, которые проверяют наш код, анализируют лицензии в проектах, собирают отчёты и так далее.
И это только начало.

Параллельно я закончил курс по AI-агентам на Go + Eino (аналог LangGraph для Go). Скоро опубликую на Stepik.
На курсе я показываю, как реально строить сложные агентные системы, а не как обернуть всё в один промпт.
А самая фишка в том, что мы соберём свой аналог Claude Code: терминального агента-кодера, который читает ваш проект, объясняет и сам правит код.

Так что Flutter станет меньше, но я буду держать в курсе развития AI-инженерии.
11🔥12👎72
В новом выпуске Гостей из IT обсуждаем, что сегодня значит «качественный код», как ИИ-агенты помогают его проверять и почему красивый код — не всегда качественный. В гостях — Я и Евгений Антонов из Яндекса.

🎧 Слушайте подкаст на платформах:
Apple Podcasts
Яндекс Музыка
VK
Звук
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8