АйТиБорода
19.6K subscribers
297 photos
33 videos
7 files
1.31K links
Канал by @iamitbeard. Записи и контент про IT и технологии. Чат @itbeard_talk

Жыве Беларусь. Слава Україні.

Все мои проекты: itbeard.com
Эволюция Кода: evocoders.ai
Download Telegram
Forwarded from Осцилляции WaveCut (WaveCut)
Плотва старше половины современных AI-стартапов.

Она начиналась ещё в эпоху Skype, ICQ и была написана на PHP, жила в беларуском IT-чате, потом переехала в Telegram, обросла мини-играми, странными привычками и интерактивом. Где-то к 2020-му у неё появилось первое подобие “искусственного сознания”, а после LLM-бума всё окончательно вышло из-под контроля.

Исторически мне всегда хотелось, чтобы Плотва была живой, весёлой и при этом приватной. Бот может шутить, рисовать, нести чушь и воплощать искусственный разум, но пользовательские сообщения не должны без необходимости улетать в чужое облако просто ради ответа в чате.

Последние годы это было сложнее, чем хотелось бы. Нормальные локальные модели перестали влезать в мой сетап, и часть разговорных функций пришлось держать на внешних провайдерах. Это был вынужденный компромисс, который всё время меня грузил. Приватность и безопасность общения — один из базовых принципов Плотвы, даже если сама Плотва иногда ведёт себя как лошадь, которую пустили к клавиатуре.

За последние пару недель ситуация сильно изменилась.

🥔 Благодаря донатам и VIP в сетап приехала RTX 3090 на 24 ГБ. Спасибо всем, кто к этому приложился. Эта видеокарта куплена из денег, которые вы пожертвовали в проект.
Сейчас больше 99% обычных разговорных запросов обрабатываются локально. На железе в моём контуре, без отправки текста внешним LLM-провайдерам. Внешний fallback пока остаётся на случай перегруза или отдельных сложных сценариев, но направление понятное: максимум общения держать дома, а всё исходящее наружу постепенно заворачивать через очистку персональных данных. К слову об этом.

🧹 Я добавил локальный privacy-фильтр. Перед отправкой текста в модель Плотва умеет вырезать ФИО, телефоны, почты и другие персональные данные. Фильтр основан на OpenAI privacy-filter с русскоязычной донастройкой, потому что основная аудитория Плотвы пишет по-русски.

Ещё одна большая штука — новая память.

💾 Старая система отдельных “фактов” отправилась на пенсию. Теперь Плотва в фоне разбирает завершённые куски истории, выкидывает спам, форварды, ботов и одноразовую шелуху, а из нормального человеческого разговора собирает долговременные воспоминания. Пока это фоновый слой, ему нужно пожить, накопить контекст и перестать путать седло с жабрами.

Важный момент: приватное остаётся приватным. Воспоминания из личных чатов не попадают в группы, групповой контекст не сваливается в кашу.

🛡 Появился и Shield — safety-слой для чувствительных ситуаций. Если разговор уходит в темы самоповреждения, суицидальных мыслей, бредовых состояний, насилия, доксинга, сталкинга или опасных инструкций, Плотва подтягивает специальный safety-контекст и пытается деэскалировать ситуацию, не подливать бензина и вернуть разговор в безопасное русло.

Под капотом тоже стало меньше хаоса: очереди, лимиты, fallback при перегрузе, раздельная обработка диалогов и памяти, трассировка запросов, защита от дублей и от случаев, когда служебный мусор внезапно лезет пользователю в ответ. Скучные инженерные кишки, без которых нормальная жизнь быстро превращается в весёлую ферму.

Локальное железо — это домашний сетап, не ровня датацентру за сто-пятьсот денег. Иногда Плотва может отвечать чуть медленнее, особенно под нагрузкой. Зато у меня теперь сильно больше пространства для экспериментов, улучшений и нормального развития без постоянного ощущения, что каждый чих надо тащить во внешний API.

Короче, мой pet-проект никогда такого не было и вот опять вырос до неприличных размеров. Теперь это маленький рыбозавод с конюшней на столе и всё ещё та самая Плотва, которая приносит людям радость, странные разговоры и немного искреннего безумия .

Спасибо всем, кто пользуется, донатит, подписывается на VIP, пишет фидбек и просто держит эту рыбо-лошадь на плаву. Именно из-за вас я могу продолжать её пилить.
❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня узнал, что Грэй ушёл из Радиота...

Такое ощущение, знаете... Будто бы ушла эпоха. Радио-Т был первым моим подкастом (спасибо Саша, что показал когда-то!). Слушал я его в основном из-за разгонов Бобука и Грэя. Ни первого (количественно точно) ни второго в подкасте уже нет. Примерно с тех пор, как парни стали захаживать эпизодически, и сам подкаст как-то выветрился из моего подкастоприемника.

Удачи Радио-Т конечно. Но блин, мужики, вы - лучшие. Не пропадайте.
1
🔥 Запись онлайн-интервью с Глебом Моргачёвым — co-creator и главным инженером Gonka Protocol

Глеб — один из создателей Gonka наряду с братьями Либерманами и другими участниками команды.

Gonka — это децентрализованный блокчейн-протокол, задача которого — предоставлять пользователям децентрализованный инференс открытых моделей и потеснить монополистов-гиперскейлеров вроде OpenAI, Anthropic и других.

В этом интервью мы подробно разбираемся, как устроена Gonka, зачем она нужна и какую пользу может принести нам, разработчикам.

ПРО ЧТО ГОВОРИЛИ
- Что такое «протокол» в контексте децентрализованного AI
- Как происходят апгрейды сети: бинарники и голосование майнеров
- Философия AI-First: почему блокчейн здесь лишь инструмент
- Техническая реализация инференса на децентрализованных мощностях
- Обучение моделей: синхронизация градиентов и оффчейн-эксперименты
- Экономика проекта: токены GNK и Bitcoin-style реварды
- Динамическое ценообразование на инференс
- Доступные модели: Qwen, Kimi и критерии их выбора
- Proof-of-Compute: как верифицировать правильность ответа модели
- Процесс добавления новых моделей и роль DeepSeek
- Эффективность железа: конкуренция между H100 и B200
- Разделение логики: что остается On-chain, а что уходит Off-chain
- Метрики качества и общая пропускная способность сети
- Безопасность сети: защита от перехвата управления и стоимость атаки
- Разработчикам: как интегрировать Gonka в свой проект (SDK, Proxy)
- Проблема приватности и использование Trusted Execution Environments (TEE)
- Почему TEE — это не «серебряная пуля» для безопасности
- Для каких задач Gonka пока не подходит
- Внутренняя команда и внешние контрибьюторы
- Как стать контрибьютором: архитектура и DevShards
- Сессия вопросов и ответов (Q&A)
- Как реализован консенсус в связке с Cosmos SDK
- Прямые конкуренты: Bittensor, Ethereum, Ton

👉 Смотреть и слушать интервью в клубе
#evo_интервью
2
Forwarded from Осцилляции WaveCut (WaveCut)
ds4.c - — маленький inference engine под Metal для DeepSeek V4 Flash. 💻
C/Objective-C/Metal, свои GGUF, CLI, локальный сервер с OpenAI/Anthropic-compatible API, tool calls, streaming.

Двухбитный квант влазит в Маки со 128 ГБ памяти. q4 требует 256+ GB.
На MacBook Pro M3 Max 128 GB заявлено около 26.7 ток/с на коротком prompt и 21.5 ток/с после 11.7k токенов контекста. Движок не держит модель онлайн, загружает и выгружает её между запросами почти мгновенно, используя memory mapping.

Мой товарищ поднял это на MacBook M5 Max 128 GB и великодушно записал для нас демку. У меня челюсть, честно, немного отвисла при просмотре.

Для агентов там тоже есть мясо: ds4-server умеет /v1/chat/completions, /v1/messages, SSE streaming, tool calls и оффлод KV cache на диск. Клиенты любят присылать один и тот же огромный prefix заново, а движок умеет сохранять KV на диск и переиспользовать его между запросами. В README прямо советуют на 128 GB держать контекст где-то в районе 100–300k, потому что полный 1M контекст сам по себе отъедает десятки гигабайт.

Ограничения: Metal-only, один live graph/session, параллельные запросы ждут очередь, стандартный GGUF не подсунешь, CPU path лучше не трогать — автор пугает крашем macOS kernel и сухо резюмирует: software sucks.

Счастливые обладатели жирных MacBook’ов уже могут держать фронтир DeepSeek V4 Flash локально и закрывать им ежедневные LLM-задачи без похода во внешний API. Везунчики. Остальные — продолжаем почесывать свои маленькие VRAM и делать вид, что нам нормально😎.
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from на Вайбе
⚡️ 409 выпуск "на Вайбе" уже онлайн!

Сегодня разбираемся, как Anthropic сорвал куш в $40 млрд от Google и SpaceX, а Claude стал новым стандартом для кодинга и дизайна. Обсуждаем GPT-5.5 Instant от OpenAI, их секретный смартфон и планы заработать $100 млрд на рекламе в чате. Выясняем, зачем Google тайно ставит Gemini Nano в ваш Chrome и зачем вешать дата-центры на стены жилых домов. Также в выпуске: релиз Mistral Medium 3.5, Grok 4.3, мобильный агент Trae Solo и китайские хитрости вокруг Manus. Залетаем в мир ИИ-музыки от Spotify и ElevenLabs, смотрим на завод роботов Figure AI, обсуждаем суд между OpenAI и Маском, и рассказываем про модель, обученную на данных 1930-х годов.

👉 YouTube
👉 Apple Podcasts
👉 Spotify
👉 Скачать mp3
👉 RSS
💬 Обсудить в чате
Forwarded from на Вайбе
⚡️ 410 выпуск "на Вайбе" уже онлайн!

Сегодня обсуждаем главные анонсы Google I/O: от масштабной трансформации Antigravity, Gemini 3.5 Flash и Omni до очков Android XR и ноутбуков Google Book, разбираем финал эпичного суда Маска и Альтмана, громкий трансфер Андрея Карпатого в Anthropic, манифест «AI Leadership 2028» и китайский прорыв Qwen 3.7 Max. Оцениваем безумный кейс, где рантайм Bun переписали с Zig на Rust всего за 10 дней с помощью ИИ, тестируем огромную меху Unitree GD01 за $650,000 и изучаем энциклику Ватикана об этике вместе с тибетским монахом-андроидом.

В конце вас ждёт ламповый оффтоп про ностальгические пиратские переводы Людей Икс!

👉 YouTube
👉 Apple Podcasts
👉 Spotify
👉 Скачать mp3
👉 RSS
💬 Обсудить в чате
📰 ТОП-4 новости ИИ в программировании из 70го дайджеста клуба Эволюция Кода

🔸 Google представила новый флагман — Gemini 3.5 Flash
Несмотря на название, это уже не тот Flash, что был в линейке Gemini 3: модель позиционируется как новый флагман и обходит Gemini 3.1 Pro. При этом заявлена скорость до 300 токенов/с и сильные результаты на SWE-bench Pro (55,1%) и Terminal-Bench 2.1 (76,2%). Gemini 3.5 Pro обещают выпустить уже в следующем месяце.

🔸 Alibaba выпустила Qwen 3.7 Max
Первая модель семейства Qwen 3.7 показывает результаты уровня мировых лидеров: 69,7% на Terminal Bench 2.0, 60,6% на SWE-Pro и 80,4% на SWE-Verified. На фоне этих метрик Alibaba всё увереннее закрепляется среди лидеров AI-гонки, конкурируя с Anthropic и Google.

🔸 OpenAI добавила удалённое управление Codex в ChatGPT
Теперь агентом можно управлять со смартфона: приложение показывает скриншоты среды, логи терминала, результаты тестов и diff-файлы в реальном времени. Также появился Remote SSH для работы в корпоративной инфраструктуре; функция уже доступна на macOS и всех тарифах.

🔸 Йошуа Бенджио представил архитектуру GRAM
GRAM (Generative Recursive reAsoning Models) развивает идею рекурсивного рассуждения во внутренних состояниях модели без раздувания контекста. Ключевое новшество — стохастичность: модель исследует разные траектории решения и выбирает лучшую через reward-модель. На ARC-AGI система уже показывает около 52%.

💡 Всего в дайджесте 30+ новостей, в аудио, видео и текстовом форматах, так что присоединяйся к клубу 🧬
В «Эволюции Кода» стартует мини-серия из трёх воркшопов с Мишей Савченко — CEO INITE и нашим частым спикером.

Будем разбирать не просто «как сделать агента на коленке», а нормальную инженерную архитектуру для AI-систем: durable orchestration, память, время, границы, long-running workflows, provenance, Temporal, MCP/skills, SurrealDB, Dify/n8n и всё то, без чего мультиагентные системы быстро превращаются в весёлый, но плохо дебажимый хаос.

📅 29 мая в 16:00 UTC
Temporal как позвоночник мультиагентных систем

Почему agents без durable orchestration превращаются в хаос, чем Temporal сильнее очередей, почему RabbitMQ — это транспорт, а не архитектура процессов, и как строить long-running workflows для AI-систем.

📅 2 июня в 16:00 UTC
INITE Brain: память, время и границы для AI-агентов

Bitemporal facts, lifecycle, locale-pinning, retract/forget, decision log, provenance, scopes. Поговорим о том, почему «память агента» — это не RAG, а полноценная когнитивная инфраструктура.

📅 4 июня в 16:00 UTC
INITE Architecture: от AI-продуктов к субъектной операционной системе

Как INITE собирает agents, MCP/skills, Temporal, SurrealDB, Dify/n8n, вертикальные продукты и business interfaces в единую экосистему. Что уже готово, что in progress и куда всё это растёт.

Все три воркшопа пройдут внутри клуба «Эволюция Кода». Для участников они уже добавлены в календарь и клубного бота. Записи тоже будут доступны участникам клуба, так что можно будет посмотреть позже, если не получится прийти онлайн.

👉 Чтобы попасть на воркшопы, задавать вопросы заранее и получить доступ к записям — присоединяйтесь к «Эволюции Кода»: https://evocoders.ai

Будет плотно, технично и, кажется, очень полезно для всех, кто уже строит или собирается строить AI-продукты, агентов и нормальные production-ready системы вокруг них.
Ну и в качестве подарка, держите подгон от Эволюции Кода - митап с co-creator Gonka Protocol - Глебом Моргачёвым: https://youtu.be/Qh0N3MnXmSU

Глеб — один из создателей Gonka наряду с братьями Либерманами и другими участниками команды. Gonka — это децентрализованный блокчейн-протокол, задача которого — предоставлять пользователям децентрализованный инференс открытых моделей и потеснить монополистов-гиперскейлеров вроде OpenAI, Anthropic и других.

В этом интервью мы подробно разбираемся, как устроена Gonka, зачем она нужна и какую пользу может принести нам, разработчикам.
Forwarded from на Вайбе
⚡️ Вышел пятый выпуск премиум-шоу "После Вайба"!

В этот раз Вика проверяет на прочность безумную гипотезу: сможет ли человек с минимальным опытом пилотирования посадить огромный пассажирский Boeing 737 MAX, если в роли единственного штурмана выступит... искусственный интеллект?

Сценарий жесткий: кабина реалистичного авиасимулятора, пилоты без сознания, радиосвязь отключена, а на руках — сотни тумблеров и голосовой режим ChatGPT, Gemini и Grok.

Что внутри выпуска? Чистокровная драма, в которой всё пошло не по плану с первых минут! Вас ждет внезапный отказ автоматики, случайный улет в воздушное пространство Чехии из-за капризов нейросетей, паника из-за стремительного приближения к земле и фатальное решение сажать лайнер прямо в поле. Узнайте, спасут ли цифровые ассистенты Вику и Лёшу или ИИ пока рано пускать за штурвал реального самолета.

P.S. В кабине было ОЧЕНЬ шумно, но мы выжали из звука максимум, чтобы вы прочувствовали каждую секунду этого экшна! 🫠

"После Вайба" — это шоу для премиум-подписчиков. Став премом, вы получаете:
Доступ к эксклюзивным экспериментам, пересказам и сторителлингу;
Записи основного подкаста "на Вайбе" раньше всех, без цензуры и вырезанных кусков;
Доступ к закрытому премиум-чату и возможность отправлять СМС в прямой эфир;
Годовой доступ к клубу "Эволюция Кода" и приложению DeeDee (для уровня Ultra);
Нашу бесконечную благодарность и мощный плюсик в карму!

Поддержите любимый подкаст и забирайте свежий выпуск прямо сейчас: https://web.tribute.tg/l/1i8