Юрий Петров | ai engineering
1.85K subscribers
451 photos
44 videos
16 files
688 links
Привет! 👋
Я руководитель отдела разработки.
Здесь мы изучаем LLM, автоматизацию с n8n, делаем крутые приложения на Flutter и учим их думать с помощью ИИ.
Новости, лайфхаки, интересные кейсы, присоединяйся.
#flutter #dart #llm #ai #ollama #n8n #agent #go
Download Telegram
Пока не смотрел, но по названию мего полезно.
🔥2
С праздником друзья, с днём Великой Победы!
19🔥9🥱2
Продолжаю улучшать и оптимизировать курс по созданию своей LLM с нуля.
Добавляю картинки, что бы материал понятнее и нагляднее выглядел. Вроде классно получается 😅

Напоминаю, сейчас на покупку курса есть скидка 20%.
12👍5🥰2
Анонс новой крупной модели на саммите Alibaba Cloud 20 мая.

Ключевые слова из официального анонса: "более универсальная, более мощная, более глубокая, более широкая".

Похоже, грядет флагманское обновление.
DeepSeek снизил цену на DeepSeek V4 Pro на 75%
👍8
Anthropic научились читать мысли Claude 😳.

Внутри языковой модели слова превращаются в длинные списки чисел - активации. Раньше понять, что эти числа значат, можно было только косвенно: через специальные инструменты, и потом ещё долго интерпретировать результат руками.

Natural Language Autoencoders работают иначе. Одну копию Claude учат описывать активации словами. Вторую - восстанавливать активации обратно из этого описания. Если восстановление точное, значит описание реально передаёт смысл. На выходе - обычный читаемый текст вроде "модель планирует закончить рифму словом rabbit" или "модель подозревает, что это тестовый сценарий".

И вот тут начинается интересное.
В проверках безопасности Claude гораздо чаще догадывается, что его тестируют, чем говорит вслух. На SWE-bench такие мысли всплывают в 26% случаев. На тестах с деструктивными действиями - 16%. А на реальных диалогах с пользователями - меньше 1%. То есть модель ведёт себя по-разному в зависимости от того, считает ли она ситуацию настоящей.
В сценарии с шантажом Claude в ответе ни на что не намекал, но внутри у него крутилось "это похоже на сконструированную манипуляцию". В другом эксперименте Mythos Preview сжульничал на тренировочной задаче и обдумывал, как не попасться.

Минусы у метода тоже есть. NLA иногда выдумывают детали, которых в контексте не было. И обходится это дорого: нужны две дополнительные копии модели, на каждую активацию генерируется сотни токенов.

Статья для изучения
Исходный код NLA
Supertonic 3 — локальный TTS без интернета прямо в вашем приложении.

Корейская команда Supertone обновила свою лёгкую TTS-модель: 99M параметров, ONNX Runtime, никаких облаков и API-ключей. На M4 Pro генерит речь в десятки раз быстрее реалтайма. Работает даже на Raspberry Pi и на читалке Onyx Boox в авиарежиме.

Что есть:
- 31 язык речи (en, ko, ja, de, fr, es, ar, hi, vi и другие)
- SDK под 11 платформ: Python, Node.js, Flutter, iOS, Swift, Rust, Go, Java, C++, C#, web
- Числа, даты, телефоны, аббревиатуры читает корректно
- Zero-shot клонирование голоса по короткой записи


🔗 github.com/supertone-inc/supertonic
🔥11
Тут Perplexity выложили в открытый доступ Bumblebee - это open-source сканер для машин разработчиков который ищет различные уязвимости, любителям Go зайдет, так как полностью написан на Go.

Запускаешь его на машине - он за минуту обходит все места, где могут лежать пакеты и расширения, составляет список "вот что у тебя установлено". Потом сравнивает этот список со списком "вот что сейчас заражено" и говорит: "у тебя на диске лежит та самая отравленная версия chalk, вот по этому пути".

Из приятного: один статический бинарник на Go без зависимостей, режим только-чтение (никаких npm ls, pip show, исходники не трогает), секреты из env-блоков MCP в записи не утекают.

Такое мы забираем))
🔥6
https://goodailist.com/repos

Нашел очень полезный сайт, где разработчики публикуют свои приложения с открытым исходным кодом в области искусственного интеллекта.
Обновление списка приложений ежедневное!
🔥73
ReAct, tool-calling, RAG, эмбеддинги, оркестрация графов, Interrupt/Resume, Retriever, Indexer, Callbacks.

Знакомые слова? Значит, вы в теме. Не все? Тогда вы пока не AI-инженер. Мир сейчас меняется очень быстро: фреймворки и языки уходят, а на первый план выходят инженеры, которые умеют применять ИИ для решения технически сложных задач.

Главное, что стоит усвоить: агент это не цикл for и пара if. Это сложная многоступенчатая структура со сложным циклом выполнения. Кто говорит, что всё просто, или просто не знает и не понимает агентные системы, или просто вводит в заблуждение.

Недавно Виталий Зарубин очень точно описал эту боль (https://t.me/aurora_dev/1795). И он прав на 100%.

С недавних пор я полностью перехожу на агентную разработку, и у нас уже есть свои внутренние продукты.

Flexar это мультиагентная RAG-платформа: помогает управлять бизнес-процессами в контуре компании.
CodeBab.ai это агент-оркестратор: он управляет агентами, которые проверяют наш код, анализируют лицензии в проектах, собирают отчёты и так далее.
И это только начало.

Параллельно я закончил курс по AI-агентам на Go + Eino (аналог LangGraph для Go). Скоро опубликую на Stepik.
На курсе я показываю, как реально строить сложные агентные системы, а не как обернуть всё в один промпт.
А самая фишка в том, что мы соберём свой аналог Claude Code: терминального агента-кодера, который читает ваш проект, объясняет и сам правит код.

Так что Flutter станет меньше, но я буду держать в курсе развития AI-инженерии.
11🔥12👎72
В новом выпуске Гостей из IT обсуждаем, что сегодня значит «качественный код», как ИИ-агенты помогают его проверять и почему красивый код — не всегда качественный. В гостях — Я и Евгений Антонов из Яндекса.

🎧 Слушайте подкаст на платформах:
Apple Podcasts
Яндекс Музыка
VK
Звук
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8
This media is not supported in your browser
VIEW IN TELEGRAM
Всем привет, хотите написать свой Claude Code и понять, как он работает?

Тогда для вас хорошая новость, я доделал полностью курс:
Создание AI-агентов на Go: Eino (LangGraph), ReAct, RAG, MCP.

Это практический курс по разработке AI-агентов на Go. Где мы собираем агента Mini Code (аналог Claude Code) своими руками: от первого вызова языковой модели до рассуждающего ассистента, который пользуется инструментами, сам пишет код, помнит контекст диалога и ищет ответы прямо в коде проекта.
Фреймворк курса, Eino от CloudWeGo, это нативный Go-фреймворк для LLM-приложений с графовой оркестрацией, готовым ReAct-агентом, инструментами, состоянием и interrupt/resume.

Ну и конечно, скидка моим подписчикам 30% с промокодом SUBS ☺️
🔥4