Юрий Петров | ai engineering

Продолжаю улучшать и оптимизировать курс по созданию своей LLM с нуля.
Добавляю картинки, что бы материал понятнее и нагляднее выглядел. Вроде классно получается 😅

Напоминаю, сейчас на покупку курса есть скидка 20%.

❤12👍5🥰2

1.22K views06:18

Юрий Петров | ai engineering pinned a photo

14:44

Юрий Петров | ai engineering

Анонс новой крупной модели на саммите Alibaba Cloud 20 мая.

Ключевые слова из официального анонса: "более универсальная, более мощная, более глубокая, более широкая".

Похоже, грядет флагманское обновление.

987 views13:55

Юрий Петров | ai engineering

DeepSeek снизил цену на DeepSeek V4 Pro на 75%

👍8

689 viewsedited 09:07

Юрий Петров | ai engineering

Anthropic научились читать мысли Claude 😳.

Внутри языковой модели слова превращаются в длинные списки чисел - активации. Раньше понять, что эти числа значат, можно было только косвенно: через специальные инструменты, и потом ещё долго интерпретировать результат руками.

Natural Language Autoencoders работают иначе. Одну копию Claude учат описывать активации словами. Вторую - восстанавливать активации обратно из этого описания. Если восстановление точное, значит описание реально передаёт смысл. На выходе - обычный читаемый текст вроде "модель планирует закончить рифму словом rabbit" или "модель подозревает, что это тестовый сценарий".

И вот тут начинается интересное.
В проверках безопасности Claude гораздо чаще догадывается, что его тестируют, чем говорит вслух. На SWE-bench такие мысли всплывают в 26% случаев. На тестах с деструктивными действиями - 16%. А на реальных диалогах с пользователями - меньше 1%. То есть модель ведёт себя по-разному в зависимости от того, считает ли она ситуацию настоящей.
В сценарии с шантажом Claude в ответе ни на что не намекал, но внутри у него крутилось "это похоже на сконструированную манипуляцию". В другом эксперименте Mythos Preview сжульничал на тренировочной задаче и обдумывал, как не попасться.

Минусы у метода тоже есть. NLA иногда выдумывают детали, которых в контексте не было. И обходится это дорого: нужны две дополнительные копии модели, на каждую активацию генерируется сотни токенов.

Статья для изучения
Исходный код NLA

715 views08:20

Юрий Петров | ai engineering

Supertonic 3 — локальный TTS без интернета прямо в вашем приложении.

Корейская команда Supertone обновила свою лёгкую TTS-модель: 99M параметров, ONNX Runtime, никаких облаков и API-ключей. На M4 Pro генерит речь в десятки раз быстрее реалтайма. Работает даже на Raspberry Pi и на читалке Onyx Boox в авиарежиме.

Что есть:
- 31 язык речи (en, ko, ja, de, fr, es, ar, hi, vi и другие)
- SDK под 11 платформ: Python, Node.js, Flutter, iOS, Swift, Rust, Go, Java, C++, C#, web
- Числа, даты, телефоны, аббревиатуры читает корректно
- Zero-shot клонирование голоса по короткой записи

🔗 github.com/supertone-inc/supertonic

GitHub

GitHub - supertone-inc/supertonic: Lightning-Fast, On-Device, Multilingual TTS — running natively via ONNX.

Lightning-Fast, On-Device, Multilingual TTS — running natively via ONNX. - supertone-inc/supertonic

🔥11

792 views07:35

Юрий Петров | ai engineering

Тут Perplexity выложили в открытый доступ Bumblebee - это open-source сканер для машин разработчиков который ищет различные уязвимости, любителям Go зайдет, так как полностью написан на Go.

Запускаешь его на машине - он за минуту обходит все места, где могут лежать пакеты и расширения, составляет список "вот что у тебя установлено". Потом сравнивает этот список со списком "вот что сейчас заражено" и говорит: "у тебя на диске лежит та самая отравленная версия chalk, вот по этому пути".

Из приятного: один статический бинарник на Go без зависимостей, режим только-чтение (никаких npm ls, pip show, исходники не трогает), секреты из env-блоков MCP в записи не утекают.

Такое мы забираем))

GitHub

GitHub - perplexityai/bumblebee: Read-only developer endpoint scanner for on-disk package, extension, and developer-tool metadata…

Read-only developer endpoint scanner for on-disk package, extension, and developer-tool metadata, built to check exposure to known software supply-chain compromises. - perplexityai/bumblebee

🔥6

798 views07:31

Юрий Петров | ai engineering

Тут подскаст вышел, где мы со Стасом за Flutter пояснили))

https://www.youtube.com/watch?v=-NrQ5hY7DTk

YouTube

OR: Flutter vs Native - выпуск 26

Не пропустите новые митапы и полезные выпуски - подписывайтесь на наш YouTube и канал в Telegram: https://t.me/meetups_evrone. Все анонсы и лучшие материалы в одном месте!

Одни команды выбирают Flutter за единую кодовую базу, быстрый выход на все платформы…

🔥15🐳1

806 views13:11

Юрий Петров | ai engineering

https://goodailist.com/repos

Нашел очень полезный сайт, где разработчики публикуют свои приложения с открытым исходным кодом в области искусственного интеллекта.
Обновление списка приложений ежедневное!

Goodailist

Good AI List

AI open source projects & developers

🔥7❤3

597 views13:15

Юрий Петров | ai engineering

ReAct, tool-calling, RAG, эмбеддинги, оркестрация графов, Interrupt/Resume, Retriever, Indexer, Callbacks.

Знакомые слова? Значит, вы в теме. Не все? Тогда вы пока не AI-инженер. Мир сейчас меняется очень быстро: фреймворки и языки уходят, а на первый план выходят инженеры, которые умеют применять ИИ для решения технически сложных задач.

Главное, что стоит усвоить: агент это не цикл for и пара if. Это сложная многоступенчатая структура со сложным циклом выполнения. Кто говорит, что всё просто, или просто не знает и не понимает агентные системы, или просто вводит в заблуждение.

Недавно Виталий Зарубин очень точно описал эту боль (https://t.me/aurora_dev/1795). И он прав на 100%.

С недавних пор я полностью перехожу на агентную разработку, и у нас уже есть свои внутренние продукты.

Flexar это мультиагентная RAG-платформа: помогает управлять бизнес-процессами в контуре компании.
CodeBab.ai это агент-оркестратор: он управляет агентами, которые проверяют наш код, анализируют лицензии в проектах, собирают отчёты и так далее.
И это только начало.

Параллельно я закончил курс по AI-агентам на Go + Eino (аналог LangGraph для Go). Скоро опубликую на Stepik.
На курсе я показываю, как реально строить сложные агентные системы, а не как обернуть всё в один промпт.
А самая фишка в том, что мы соберём свой аналог Claude Code: терминального агента-кодера, который читает ваш проект, объясняет и сам правит код.

Так что Flutter станет меньше, но я буду держать в курсе развития AI-инженерии.

11🔥12👎7❤2

472 views11:31

Юрий Петров | ai engineering

В новом выпуске Гостей из IT обсуждаем, что сегодня значит «качественный код», как ИИ-агенты помогают его проверять и почему красивый код — не всегда качественный. В гостях — Я и Евгений Антонов из Яндекса.

🎧 Слушайте подкаст на платформах:
Apple Podcasts
Яндекс Музыка
VK
Звук

Please open Telegram to view this post

VIEW IN TELEGRAM

Apple Podcasts

Код-ревью в 2026 году: как ИИ влияет на качество кода

Выпуск подкаста · Гости из IT · 1 июня · 53 мин.

🔥8

343 views06:07

Юрий Петров | ai engineering

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

Всем привет, хотите написать свой Claude Code и понять, как он работает?

Тогда для вас хорошая новость, я доделал полностью курс:
Создание AI-агентов на Go: Eino (LangGraph), ReAct, RAG, MCP.

Это практический курс по разработке AI-агентов на Go. Где мы собираем агента Mini Code (аналог Claude Code) своими руками: от первого вызова языковой модели до рассуждающего ассистента, который пользуется инструментами, сам пишет код, помнит контекст диалога и ищет ответы прямо в коде проекта.
Фреймворк курса, Eino от CloudWeGo, это нативный Go-фреймворк для LLM-приложений с графовой оркестрацией, готовым ReAct-агентом, инструментами, состоянием и interrupt/resume.

Ну и конечно, скидка моим подписчикам 30% с промокодом SUBS ☺️

🔥4

179 viewsedited 10:39

About

Blog

Apps

Platform