АйТиБорода

Forwarded from Осцилляции WaveCut (WaveCut)

Плотва старше половины современных AI-стартапов.

⏳ Она начиналась ещё в эпоху Skype, ICQ и была написана на PHP, жила в беларуском IT-чате, потом переехала в Telegram, обросла мини-играми, странными привычками и интерактивом. Где-то к 2020-му у неё появилось первое подобие “искусственного сознания”, а после LLM-бума всё окончательно вышло из-под контроля.

Исторически мне всегда хотелось, чтобы Плотва была живой, весёлой и при этом приватной. Бот может шутить, рисовать, нести чушь и воплощать искусственный разум, но пользовательские сообщения не должны без необходимости улетать в чужое облако просто ради ответа в чате.

Последние годы это было сложнее, чем хотелось бы. Нормальные локальные модели перестали влезать в мой сетап, и часть разговорных функций пришлось держать на внешних провайдерах. Это был вынужденный компромисс, который всё время меня грузил. Приватность и безопасность общения — один из базовых принципов Плотвы, даже если сама Плотва иногда ведёт себя как лошадь, которую пустили к клавиатуре.

За последние пару недель ситуация сильно изменилась.

🥔 Благодаря донатам и VIP в сетап приехала RTX 3090 на 24 ГБ. Спасибо всем, кто к этому приложился. Эта видеокарта куплена из денег, которые вы пожертвовали в проект.
Сейчас больше 99% обычных разговорных запросов обрабатываются локально. На железе в моём контуре, без отправки текста внешним LLM-провайдерам. Внешний fallback пока остаётся на случай перегруза или отдельных сложных сценариев, но направление понятное: максимум общения держать дома, а всё исходящее наружу постепенно заворачивать через очистку персональных данных. К слову об этом.

🧹 Я добавил локальный privacy-фильтр. Перед отправкой текста в модель Плотва умеет вырезать ФИО, телефоны, почты и другие персональные данные. Фильтр основан на OpenAI privacy-filter с русскоязычной донастройкой, потому что основная аудитория Плотвы пишет по-русски.

Ещё одна большая штука — новая память.

💾 Старая система отдельных “фактов” отправилась на пенсию. Теперь Плотва в фоне разбирает завершённые куски истории, выкидывает спам, форварды, ботов и одноразовую шелуху, а из нормального человеческого разговора собирает долговременные воспоминания. Пока это фоновый слой, ему нужно пожить, накопить контекст и перестать путать седло с жабрами.

Важный момент: приватное остаётся приватным. Воспоминания из личных чатов не попадают в группы, групповой контекст не сваливается в кашу.

🛡 Появился и Shield — safety-слой для чувствительных ситуаций. Если разговор уходит в темы самоповреждения, суицидальных мыслей, бредовых состояний, насилия, доксинга, сталкинга или опасных инструкций, Плотва подтягивает специальный safety-контекст и пытается деэскалировать ситуацию, не подливать бензина и вернуть разговор в безопасное русло.

Под капотом тоже стало меньше хаоса: очереди, лимиты, fallback при перегрузе, раздельная обработка диалогов и памяти, трассировка запросов, защита от дублей и от случаев, когда служебный мусор внезапно лезет пользователю в ответ. Скучные инженерные кишки, без которых нормальная жизнь быстро превращается в весёлую ферму.

Локальное железо — это домашний сетап, не ровня датацентру за сто-пятьсот денег. Иногда Плотва может отвечать чуть медленнее, особенно под нагрузкой. Зато у меня теперь сильно больше пространства для экспериментов, улучшений и нормального развития без постоянного ощущения, что каждый чих надо тащить во внешний API.

Короче, мой pet-проект никогда такого не было и вот опять вырос до неприличных размеров. Теперь это маленький рыбозавод с конюшней на столе и всё ещё та самая Плотва, которая приносит людям радость, странные разговоры и немного искреннего ✨ безумия ✨.

Спасибо всем, кто пользуется, донатит, подписывается на VIP, пишет фидбек и просто держит эту рыбо-лошадь на плаву. Именно из-за вас я могу продолжать её пилить.

❤️

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

5.85K views21:20

АйТиБорода

Сегодня узнал, что Грэй ушёл из Радиота...

Такое ощущение, знаете... Будто бы ушла эпоха. Радио-Т был первым моим подкастом (спасибо Саша, что показал когда-то!). Слушал я его в основном из-за разгонов Бобука и Грэя. Ни первого (количественно точно) ни второго в подкасте уже нет. Примерно с тех пор, как парни стали захаживать эпизодически, и сам подкаст как-то выветрился из моего подкастоприемника.

Удачи Радио-Т конечно. Но блин, мужики, вы - лучшие. Не пропадайте.

БлоGнот

Про Радио-Т

Субботний выпуск подкаста Радио-Т был последним, в котором я участвовал. Хотя обстоятельства решения вышли несколько скандальными, само решение назрело давно.
С легкой руки Гриши Бакунова было принято …

4.8K viewsedited 01:26

АйТиБорода

Forwarded from Эволюция Кода / Анонсы

🔥 Запись онлайн-интервью с Глебом Моргачёвым — co-creator и главным инженером Gonka Protocol

Глеб — один из создателей Gonka наряду с братьями Либерманами и другими участниками команды.

Gonka — это децентрализованный блокчейн-протокол, задача которого — предоставлять пользователям децентрализованный инференс открытых моделей и потеснить монополистов-гиперскейлеров вроде OpenAI, Anthropic и других.

В этом интервью мы подробно разбираемся, как устроена Gonka, зачем она нужна и какую пользу может принести нам, разработчикам.

ПРО ЧТО ГОВОРИЛИ
- Что такое «протокол» в контексте децентрализованного AI
- Как происходят апгрейды сети: бинарники и голосование майнеров
- Философия AI-First: почему блокчейн здесь лишь инструмент
- Техническая реализация инференса на децентрализованных мощностях
- Обучение моделей: синхронизация градиентов и оффчейн-эксперименты
- Экономика проекта: токены GNK и Bitcoin-style реварды
- Динамическое ценообразование на инференс
- Доступные модели: Qwen, Kimi и критерии их выбора
- Proof-of-Compute: как верифицировать правильность ответа модели
- Процесс добавления новых моделей и роль DeepSeek
- Эффективность железа: конкуренция между H100 и B200
- Разделение логики: что остается On-chain, а что уходит Off-chain
- Метрики качества и общая пропускная способность сети
- Безопасность сети: защита от перехвата управления и стоимость атаки
- Разработчикам: как интегрировать Gonka в свой проект (SDK, Proxy)
- Проблема приватности и использование Trusted Execution Environments (TEE)
- Почему TEE — это не «серебряная пуля» для безопасности
- Для каких задач Gonka пока не подходит
- Внутренняя команда и внешние контрибьюторы
- Как стать контрибьютором: архитектура и DevShards
- Сессия вопросов и ответов (Q&A)
- Как реализован консенсус в связке с Cosmos SDK
- Прямые конкуренты: Bittensor, Ethereum, Ton

👉 Смотреть и слушать интервью в клубе
#evo_интервью

4.34K views23:40

АйТиБорода

Forwarded from Осцилляции WaveCut (WaveCut)

ds4.c - — маленький inference engine под Metal для DeepSeek V4 Flash. 💻
C/Objective-C/Metal, свои GGUF, CLI, локальный сервер с OpenAI/Anthropic-compatible API, tool calls, streaming.

Двухбитный квант влазит в Маки со 128 ГБ памяти. q4 требует 256+ GB.
На MacBook Pro M3 Max 128 GB заявлено около 26.7 ток/с на коротком prompt и 21.5 ток/с после 11.7k токенов контекста. Движок не держит модель онлайн, загружает и выгружает её между запросами почти мгновенно, используя memory mapping.

Мой товарищ поднял это на MacBook M5 Max 128 GB и великодушно записал для нас демку. У меня челюсть, честно, немного отвисла при просмотре.

Для агентов там тоже есть мясо: ds4-server умеет /v1/chat/completions, /v1/messages, SSE streaming, tool calls и оффлод KV cache на диск. Клиенты любят присылать один и тот же огромный prefix заново, а движок умеет сохранять KV на диск и переиспользовать его между запросами. В README прямо советуют на 128 GB держать контекст где-то в районе 100–300k, потому что полный 1M контекст сам по себе отъедает десятки гигабайт.

Ограничения: Metal-only, один live graph/session, параллельные запросы ждут очередь, стандартный GGUF не подсунешь, CPU path лучше не трогать — автор пугает крашем macOS kernel и сухо резюмирует: software sucks.

Счастливые обладатели жирных MacBook’ов уже могут держать фронтир DeepSeek V4 Flash локально и закрывать им ежедневные LLM-задачи без похода во внешний API. Везунчики. Остальные — продолжаем почесывать свои маленькие VRAM и делать вид, что нам нормально😎.

1:58

This media is not supported in your browser

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

5.21K views15:58

АйТиБорода

Forwarded from на Вайбе

⚡️ 409 выпуск "на Вайбе" уже онлайн!

Сегодня разбираемся, как Anthropic сорвал куш в $40 млрд от Google и SpaceX, а Claude стал новым стандартом для кодинга и дизайна. Обсуждаем GPT-5.5 Instant от OpenAI, их секретный смартфон и планы заработать $100 млрд на рекламе в чате. Выясняем, зачем Google тайно ставит Gemini Nano в ваш Chrome и зачем вешать дата-центры на стены жилых домов. Также в выпуске: релиз Mistral Medium 3.5, Grok 4.3, мобильный агент Trae Solo и китайские хитрости вокруг Manus. Залетаем в мир ИИ-музыки от Spotify и ElevenLabs, смотрим на завод роботов Figure AI, обсуждаем суд между OpenAI и Маском, и рассказываем про модель, обученную на данных 1930-х годов.

👉 YouTube
👉 Apple Podcasts
👉 Spotify
👉 Скачать mp3
👉 RSS
💬 Обсудить в чате

YouTube

Суд между Маском и OpenAI, Google "продался" Пентагону, смартфон от OpenAI и закат GitHub / ПНВ #409

Сегодня разбираемся, как Anthropic сорвал куш в $40 млрд от Google и SpaceX, а Claude стал новым стандартом для кодинга и дизайна. Обсуждаем GPT-5.5 Instant от OpenAI, их секретный смартфон и планы заработать $100 млрд на рекламе в чате. Выясняем, зачем Google…

4.82K views14:35

АйТиБорода

Forwarded from на Вайбе

⚡️ 410 выпуск "на Вайбе" уже онлайн!

Сегодня обсуждаем главные анонсы Google I/O: от масштабной трансформации Antigravity, Gemini 3.5 Flash и Omni до очков Android XR и ноутбуков Google Book, разбираем финал эпичного суда Маска и Альтмана, громкий трансфер Андрея Карпатого в Anthropic, манифест «AI Leadership 2028» и китайский прорыв Qwen 3.7 Max. Оцениваем безумный кейс, где рантайм Bun переписали с Zig на Rust всего за 10 дней с помощью ИИ, тестируем огромную меху Unitree GD01 за $650,000 и изучаем энциклику Ватикана об этике вместе с тибетским монахом-андроидом.

В конце вас ждёт ламповый оффтоп про ностальгические пиратские переводы Людей Икс!

👉 YouTube
👉 Apple Podcasts
👉 Spotify
👉 Скачать mp3
👉 RSS
💬 Обсудить в чате

YouTube

🔥 Gemini 3.5 и Gemini Omni, крах суда Маска, Карпатый в Anthropic, ИИ в Ватикане / ПНВ #410

Сегодня обсуждаем главные анонсы Google I/O: от масштабной трансформации Antigravity, Gemini 3.5 Flash и Omni до очков Android XR и ноутбуков Google Book, разбираем финал эпичного суда Маска и Альтмана, громкий трансфер Андрея Карпатого в Anthropic, манифест…

3.59K views17:14

АйТиБорода

Forwarded from Эволюция Кода / Анонсы

📰 ТОП-4 новости ИИ в программировании из 70го дайджеста клуба Эволюция Кода

🔸 Google представила новый флагман — Gemini 3.5 Flash
Несмотря на название, это уже не тот Flash, что был в линейке Gemini 3: модель позиционируется как новый флагман и обходит Gemini 3.1 Pro. При этом заявлена скорость до 300 токенов/с и сильные результаты на SWE-bench Pro (55,1%) и Terminal-Bench 2.1 (76,2%). Gemini 3.5 Pro обещают выпустить уже в следующем месяце.

🔸 Alibaba выпустила Qwen 3.7 Max
Первая модель семейства Qwen 3.7 показывает результаты уровня мировых лидеров: 69,7% на Terminal Bench 2.0, 60,6% на SWE-Pro и 80,4% на SWE-Verified. На фоне этих метрик Alibaba всё увереннее закрепляется среди лидеров AI-гонки, конкурируя с Anthropic и Google.

🔸 OpenAI добавила удалённое управление Codex в ChatGPT
Теперь агентом можно управлять со смартфона: приложение показывает скриншоты среды, логи терминала, результаты тестов и diff-файлы в реальном времени. Также появился Remote SSH для работы в корпоративной инфраструктуре; функция уже доступна на macOS и всех тарифах.

🔸 Йошуа Бенджио представил архитектуру GRAM
GRAM (Generative Recursive reAsoning Models) развивает идею рекурсивного рассуждения во внутренних состояниях модели без раздувания контекста. Ключевое новшество — стохастичность: модель исследует разные траектории решения и выбирает лучшую через reward-модель. На ARC-AGI система уже показывает около 52%.

💡 Всего в дайджесте 30+ новостей, в аудио, видео и текстовом форматах, так что присоединяйся к клубу 🧬

3.99K views00:38

АйТиБорода

Forwarded from Эволюция Кода / Анонсы

В «Эволюции Кода» стартует мини-серия из трёх воркшопов с Мишей Савченко — CEO INITE и нашим частым спикером.

Будем разбирать не просто «как сделать агента на коленке», а нормальную инженерную архитектуру для AI-систем: durable orchestration, память, время, границы, long-running workflows, provenance, Temporal, MCP/skills, SurrealDB, Dify/n8n и всё то, без чего мультиагентные системы быстро превращаются в весёлый, но плохо дебажимый хаос.

📅 29 мая в 16:00 UTC
Temporal как позвоночник мультиагентных систем

Почему agents без durable orchestration превращаются в хаос, чем Temporal сильнее очередей, почему RabbitMQ — это транспорт, а не архитектура процессов, и как строить long-running workflows для AI-систем.

📅 2 июня в 16:00 UTC
INITE Brain: память, время и границы для AI-агентов

Bitemporal facts, lifecycle, locale-pinning, retract/forget, decision log, provenance, scopes. Поговорим о том, почему «память агента» — это не RAG, а полноценная когнитивная инфраструктура.

📅 4 июня в 16:00 UTC
INITE Architecture: от AI-продуктов к субъектной операционной системе

Как INITE собирает agents, MCP/skills, Temporal, SurrealDB, Dify/n8n, вертикальные продукты и business interfaces в единую экосистему. Что уже готово, что in progress и куда всё это растёт.

Все три воркшопа пройдут внутри клуба «Эволюция Кода». Для участников они уже добавлены в календарь и клубного бота. Записи тоже будут доступны участникам клуба, так что можно будет посмотреть позже, если не получится прийти онлайн.

👉 Чтобы попасть на воркшопы, задавать вопросы заранее и получить доступ к записям — присоединяйтесь к «Эволюции Кода»: https://evocoders.ai

Будет плотно, технично и, кажется, очень полезно для всех, кто уже строит или собирается строить AI-продукты, агентов и нормальные production-ready системы вокруг них.

2.63K views14:46

АйТиБорода

Ну и в качестве подарка, держите подгон от Эволюции Кода - митап с co-creator Gonka Protocol - Глебом Моргачёвым: https://youtu.be/Qh0N3MnXmSU

Глеб — один из создателей Gonka наряду с братьями Либерманами и другими участниками команды. Gonka — это децентрализованный блокчейн-протокол, задача которого — предоставлять пользователям децентрализованный инференс открытых моделей и потеснить монополистов-гиперскейлеров вроде OpenAI, Anthropic и других.

В этом интервью мы подробно разбираемся, как устроена Gonka, зачем она нужна и какую пользу может принести нам, разработчикам.

YouTube

Как устроен Gonka Protocol / Интервью с co-creator протокола Глебом Моргачёвым

Глеб — один из создателей Gonka наряду с братьями Либерманами и другими участниками команды. Gonka — это децентрализованный блокчейн-протокол, задача которого — предоставлять пользователям децентрализованный инференс открытых моделей и потеснить монополистов…

3.08K views14:59

АйТиБорода

Forwarded from на Вайбе

⚡️ Вышел пятый выпуск премиум-шоу "После Вайба"!

В этот раз Вика проверяет на прочность безумную гипотезу: сможет ли человек с минимальным опытом пилотирования посадить огромный пассажирский Boeing 737 MAX, если в роли единственного штурмана выступит... искусственный интеллект?

Сценарий жесткий: кабина реалистичного авиасимулятора, пилоты без сознания, радиосвязь отключена, а на руках — сотни тумблеров и голосовой режим ChatGPT, Gemini и Grok.

Что внутри выпуска? Чистокровная драма, в которой всё пошло не по плану с первых минут! Вас ждет внезапный отказ автоматики, случайный улет в воздушное пространство Чехии из-за капризов нейросетей, паника из-за стремительного приближения к земле и фатальное решение сажать лайнер прямо в поле. Узнайте, спасут ли цифровые ассистенты Вику и Лёшу или ИИ пока рано пускать за штурвал реального самолета.

P.S. В кабине было ОЧЕНЬ шумно, но мы выжали из звука максимум, чтобы вы прочувствовали каждую секунду этого экшна! 🫠

"После Вайба" — это шоу для премиум-подписчиков. Став премом, вы получаете:
✅ Доступ к эксклюзивным экспериментам, пересказам и сторителлингу;
✅ Записи основного подкаста "на Вайбе" раньше всех, без цензуры и вырезанных кусков;
✅ Доступ к закрытому премиум-чату и возможность отправлять СМС в прямой эфир;
✅ Годовой доступ к клубу "Эволюция Кода" и приложению DeeDee (для уровня Ultra);
✅ Нашу бесконечную благодарность и мощный плюсик в карму!

Поддержите любимый подкаст и забирайте свежий выпуск прямо сейчас: https://web.tribute.tg/l/1i8

2.41K views17:38

АйТиБорода

Для моих подписчиков-беларусов: распавёў тутака Сашу Івуліну пра стан ШІ на сённяшні момант, прыемнага прагляду: https://youtu.be/SpVWn1oxzKE

YouTube

Мы будет жить вечно? Азаренка и Солодуху заменит ИИ? Угарная песня про Соболенко! / АЙТИБОРОДА

🔥Лукашенко стоял у истоков ИИ? Почему в Беларуси не работают самые популярные ИИ-сервисы? Заменят ли нейросети Азарёнка, Макса Коржа и Славу Комиссаренко? Гимн ябатек написал ChatGPT? Скоро БЧБшников начнут гонять роботы, а Тайвань захватят собаки с автоматами?…

2.86K viewsedited 10:58

About

Blog

Apps

Platform