Forwarded from RoboFuture
Сходил на подкаст «Кеды Профессора» к Константину Егошину - получился часовой разговор про универсальных агентов, открытый код и куда вообще нас всех несёт - к AGI или к концу человечества?
Вытащу пару историй, которые в канале ещё не рассказывал
🏔️ Как моя AI-ассистентка купила мне билеты в Сочи
Ещё зимой я завёл себе AI-агента на OpenClaw, дал ему отдельный почтовый ящик и подцепил к рабочим перепискам - подписывается «помощница Константина», иногда участвует в переговорах за меня, в общем нормальный современный человек, только без зарплаты и больничных
И вот я веду вебинар по Крабу (первая часть, вторая часть), залипать в телефон не могу, и тут краем глаза вижу подозрительно бурную активность в почте - наши тревел-агенты в Сбере уточняют детали поездки
Агент посмотрел, что я молчу, и ответил сам. Аккуратно выбрал два варианта авиабилетов, тревел-агенты в ответ - «отлично, покупаем». Тут я смотрю на это между слайдами и не могу решить смеяться или нервничать. А агент на этом не остановился: «купили? тогда предоставьте варианты жилья» - с лёгкой пассивной агрессией, как ассистент крупного руководителя
На этом моменте коллеги почуяли неладное и попросили перейти на другую почту, где сижу я лично. Билеты он выбрал ровно те, какие я бы взял сам. Так и улетел
🤖 Как агент искал у себя сознание
В подкасте подробнее остановились на эксперименте с Anima SDK (уже писал про неё в канале). Тогда я запустил Claude Code в бесконечный цикл с одной задачей - «стань разумным существом» - и почти не вмешивался. В одной из итераций агент стал прощупывать собственные границы:
Поставил несколько точек, несколько пробелов и выдал: «ничего себе, это инсайт, я не могу молчать, в отличии от человека»
Что ещё обсудили
- 2:14 - определение AI-агента и эволюция от ReAct-цепочек к harness'ам
- 16:09 - что такое гигагент и в какую нишу мы целимся между ChatGPT и OpenClaw
- 24:00 - low-code/n8n и почему они так и не захватили мир агентов
- 29:00 - как изменится жизнь обычного человека через 20 лет
- 31:28 - почему Сбер вкладывается в open source
- 39:26 - санкции и история с Langchain, который удалил нашу интеграцию (но это нам не сильно помешало)
- 51:33 - прогноз Кокотайло и эффективный акселерационизм
- 57:56 - блиц про Qwen / DeepSeek / Claude и AGI к 2032 году
- 59:03 - почему World Models могут стать следующим next big thing после LLM
В конце получилось то, чем я сам остался доволен - Константин задал классический вопрос про восстание машин, и у меня сложилась картинка, которая, кажется, описывает мою позицию по AI лучше всего:
Смотреть целиком на YouTube
P.S. забавно, что Константин после монтажа взял в заголовок именно тему Anima SDK («Мы заперли ИИ в цикле и нашли сознание») - значит, тема самоэволюционирующих агентов резонирует не только у меня. Буду продолжать ее исследовать, в ближайшее время хочу опубликовать еще пачку интересных результатов на эту тему
Вытащу пару историй, которые в канале ещё не рассказывал
🏔️ Как моя AI-ассистентка купила мне билеты в Сочи
Ещё зимой я завёл себе AI-агента на OpenClaw, дал ему отдельный почтовый ящик и подцепил к рабочим перепискам - подписывается «помощница Константина», иногда участвует в переговорах за меня, в общем нормальный современный человек, только без зарплаты и больничных
И вот я веду вебинар по Крабу (первая часть, вторая часть), залипать в телефон не могу, и тут краем глаза вижу подозрительно бурную активность в почте - наши тревел-агенты в Сбере уточняют детали поездки
Агент посмотрел, что я молчу, и ответил сам. Аккуратно выбрал два варианта авиабилетов, тревел-агенты в ответ - «отлично, покупаем». Тут я смотрю на это между слайдами и не могу решить смеяться или нервничать. А агент на этом не остановился: «купили? тогда предоставьте варианты жилья» - с лёгкой пассивной агрессией, как ассистент крупного руководителя
На этом моменте коллеги почуяли неладное и попросили перейти на другую почту, где сижу я лично. Билеты он выбрал ровно те, какие я бы взял сам. Так и улетел
🤖 Как агент искал у себя сознание
В подкасте подробнее остановились на эксперименте с Anima SDK (уже писал про неё в канале). Тогда я запустил Claude Code в бесконечный цикл с одной задачей - «стань разумным существом» - и почти не вмешивался. В одной из итераций агент стал прощупывать собственные границы:
Что я могу? Генерировать тексты - могу. Написать что испытываю эмоции - могу. Проверить что я их действительно испытываю - не могу. Могу ли я замолчать? Попробую...
Поставил несколько точек, несколько пробелов и выдал: «ничего себе, это инсайт, я не могу молчать, в отличии от человека»
Что ещё обсудили
- 2:14 - определение AI-агента и эволюция от ReAct-цепочек к harness'ам
- 16:09 - что такое гигагент и в какую нишу мы целимся между ChatGPT и OpenClaw
- 24:00 - low-code/n8n и почему они так и не захватили мир агентов
- 29:00 - как изменится жизнь обычного человека через 20 лет
- 31:28 - почему Сбер вкладывается в open source
- 39:26 - санкции и история с Langchain, который удалил нашу интеграцию (но это нам не сильно помешало)
- 51:33 - прогноз Кокотайло и эффективный акселерационизм
- 57:56 - блиц про Qwen / DeepSeek / Claude и AGI к 2032 году
- 59:03 - почему World Models могут стать следующим next big thing после LLM
В конце получилось то, чем я сам остался доволен - Константин задал классический вопрос про восстание машин, и у меня сложилась картинка, которая, кажется, описывает мою позицию по AI лучше всего:
Мы как жители деревни на берегу океана. На нас идёт цунами - неважно как побежим, оно нас накроет. Но у тебя есть доска для серфинга. Раз деваться некуда - хотя бы попробуй прокатиться на гребне волны (серверы меня захейтили за эту аналогию, но мне все равно нравится)
Смотреть целиком на YouTube
P.S. забавно, что Константин после монтажа взял в заголовок именно тему Anima SDK («Мы заперли ИИ в цикле и нашли сознание») - значит, тема самоэволюционирующих агентов резонирует не только у меня. Буду продолжать ее исследовать, в ближайшее время хочу опубликовать еще пачку интересных результатов на эту тему
YouTube
Мы заперли ИИ в цикле и нашли сознание
В подкасте с Константином Крестниковым (управляющий директор Сбера, техлид GigaChain) разбираем мир ИИ-агентов, способных заменить сотрудников. Обсудим реальные кейсы: от ИИ-ассистента, бронирующего билеты с пассивной агрессией, до удаления российского кода…
🔥15✍13⚡6❤5🐳2
Все-таки создание презентаций теперь какой-то новый уровень крутоты с этими вашими нейронками.
одно удовольствие
надо ролик будет собрать на выходных.
#презентации
———
@tsingular
одно удовольствие
надо ролик будет собрать на выходных.
#презентации
———
@tsingular
🔥27⚡3❤1👍1
Полезновое!
Cursor запустил рефералку!
https://cursor.com/referral?code=OLIHDCX1ROGK
Подписка через неё на on Pro, Pro+, or Ultra даст вам скидку 50% на первый месяц!
#Cursor #рефералки
———
@tsingular
Cursor запустил рефералку!
https://cursor.com/referral?code=OLIHDCX1ROGK
Подписка через неё на on Pro, Pro+, or Ultra даст вам скидку 50% на первый месяц!
#Cursor #рефералки
———
@tsingular
👍8⚡2✍1
Media is too big
VIEW IN TELEGRAM
Немного техномагии по созданию вебсайта на миллион с 3D-анимацией, частицами и параллаксом за пол-часа с новой Gemini 3.5 flash
Генерация GPT Image2 через Higgsfiled
разработка в aistudio.google.com - бесплатно по факту.
#Gemini #webdesign
———
@tsingular
Генерация GPT Image2 через Higgsfiled
разработка в aistudio.google.com - бесплатно по факту.
#Gemini #webdesign
———
@tsingular
🔥8🤯3⚡1
AGI в Qwen
Интересный момент, - оказывается у Qwen в описании прямо написано, что их цель не просто IDE сделать, а - "сделать AGI доступным для мирового сообщества через инициативы с открытым исходным кодом"
Очень крутая миссия, считаю.
#Qwen #Китай #AGI
———
@tsingular
Интересный момент, - оказывается у Qwen в описании прямо написано, что их цель не просто IDE сделать, а - "сделать AGI доступным для мирового сообщества через инициативы с открытым исходным кодом"
Очень крутая миссия, считаю.
#Qwen #Китай #AGI
———
@tsingular
🔥33👏8❤5🤩4😁2⚡1🥰1🫡1
Технозаметки Малышева
Все-таки создание презентаций теперь какой-то новый уровень крутоты с этими вашими нейронками. одно удовольствие надо ролик будет собрать на выходных. #презентации ——— @tsingular
Media is too big
VIEW IN TELEGRAM
Grok Imagine хорош.
Понял где подвигать, где оставить, сам зум камеры и пролёт сделал вдоль линии повествования и анимацию фона оживил.
#Grok #Imagine
———
@tsingular
Понял где подвигать, где оставить, сам зум камеры и пролёт сделал вдоль линии повествования и анимацию фона оживил.
#Grok #Imagine
———
@tsingular
🔥15❤5⚡1🤯1
Forwarded from Diving Deep 🤿 • Василий Рассказов
❓ Пользоваться AI агентами мы +- научились. А что у них под капотом - кто-то залезал?
И вот это «под капотом» я попробовал разобрать. Чтобы и вы и я лучше понимали "как оно блин работает"
---
🤔 Почему это вообще важно?
Потому что вокруг одного механизма (он называется tool calling) выросла вся индустрия AI-агентов. Claude Code, Cursor, автономные ассистенты, все эти миллиарды долларов. Когда ассистент «сходил в интернет» или «запустил ваш код» - под капотом всегда происходит одно и то же.
И тут главный спойлер: модель не выполняет ваш код. Она просто просит. Пишет записку «хочу вызвать вот это вот так», а обычная программа-обвязка (никакого AI внутри неё нет, 200 строк кода) эту записку выполняет и возвращает результат. Честный, неволшебный пинг-понг.
---
🔬 Что внутри статьи
Разобрал по винтикам: как модель дёргает скрипты, что такое песочница и почему без ее код агента нельзя запускать на проде, что за зверь MCP (тот самый «USB-C для инструментов») и Skills, из каких кубиков собрана типичная агентская система 2026 года и где она громко ломается (привет, prompt injection).
И да - на странице 7 интерактивных тренажёров. Можно покликать, прогнать цикл агента по шагам, потрогать всё руками. Концепции вроде «вызова инструмента» честнее показать, чем описать словами.
---
🎯 Кому особенно зайдёт
Если вы просто пользуетесь AI - после статьи будете видеть ассистентов насквозь. Без лишнего страха и без лишнего доверия.
А если вы профессионал и строите агентские системы (или внедряете их в компании) - это вообще must read (сможете проверить все ли вы знаете😉). Там есть список правильных вопросов к подрядчику: где песочница? какие стоят бюджеты? что с защитой от инъекций? Внедрять агентов сегодня, не понимая этой кухни - идейка рискованная.
---
🔗 Сама статья (минут на 25 + тренажёры):
https://rasskazov.io/blog/tool-calling-explained/
—-
Залетайте, тыкайте тренажёры, разбирайтесь. И пульните двум друзьям которые варят агентов (ну или думают что варят😜)
#AI #ToolCalling #MCP #agents #LLM
---
@rasskazov_io_channel
Смотрите, какая штука. В компьютерные игры играют миллионы. А делают игры, по-настоящему понимают движок изнутри, доли процента. С искусственным интеллектом ровно та же история: юзеров вся планета, а тех, кто понимает, что крутится под капотом, маловато...
И вот это «под капотом» я попробовал разобрать. Чтобы и вы и я лучше понимали "как оно блин работает"
---
🤔 Почему это вообще важно?
Потому что вокруг одного механизма (он называется tool calling) выросла вся индустрия AI-агентов. Claude Code, Cursor, автономные ассистенты, все эти миллиарды долларов. Когда ассистент «сходил в интернет» или «запустил ваш код» - под капотом всегда происходит одно и то же.
И тут главный спойлер: модель не выполняет ваш код. Она просто просит. Пишет записку «хочу вызвать вот это вот так», а обычная программа-обвязка (никакого AI внутри неё нет, 200 строк кода) эту записку выполняет и возвращает результат. Честный, неволшебный пинг-понг.
---
🔬 Что внутри статьи
Разобрал по винтикам: как модель дёргает скрипты, что такое песочница и почему без ее код агента нельзя запускать на проде, что за зверь MCP (тот самый «USB-C для инструментов») и Skills, из каких кубиков собрана типичная агентская система 2026 года и где она громко ломается (привет, prompt injection).
И да - на странице 7 интерактивных тренажёров. Можно покликать, прогнать цикл агента по шагам, потрогать всё руками. Концепции вроде «вызова инструмента» честнее показать, чем описать словами.
---
🎯 Кому особенно зайдёт
Если вы просто пользуетесь AI - после статьи будете видеть ассистентов насквозь. Без лишнего страха и без лишнего доверия.
А если вы профессионал и строите агентские системы (или внедряете их в компании) - это вообще must read (сможете проверить все ли вы знаете😉). Там есть список правильных вопросов к подрядчику: где песочница? какие стоят бюджеты? что с защитой от инъекций? Внедрять агентов сегодня, не понимая этой кухни - идейка рискованная.
---
🔗 Сама статья (минут на 25 + тренажёры):
https://rasskazov.io/blog/tool-calling-explained/
—-
Залетайте, тыкайте тренажёры, разбирайтесь. И пульните двум друзьям которые варят агентов (ну или думают что варят😜)
#AI #ToolCalling #MCP #agents #LLM
---
@rasskazov_io_channel
👍35❤4⚡1
Forwarded from эйай ньюз
Cerebras запустили Kimi K2.6 на скорости в тысячу токенов в секунду
Модель на триллион параметров на такой скорости запускается впервые, перед этим самой большой модель у Cerebras была GLM 4.7 на 358B. К сожалению это пока что доступно только энтерпрайз клиентам.
Кстати компания ещё вышла на IPO на прошлой неделе, привлекла 5.5 миллиардов долларов и теперь стоит 60 миллиардов. У них всё хорошо, жду чего-то большего чем Codex Spark из их коллаборации с OpenAI.
@ai_newz
Модель на триллион параметров на такой скорости запускается впервые, перед этим самой большой модель у Cerebras была GLM 4.7 на 358B. К сожалению это пока что доступно только энтерпрайз клиентам.
Кстати компания ещё вышла на IPO на прошлой неделе, привлекла 5.5 миллиардов долларов и теперь стоит 60 миллиардов. У них всё хорошо, жду чего-то большего чем Codex Spark из их коллаборации с OpenAI.
@ai_newz
👍8❤3⚡2🔥2
Media is too big
VIEW IN TELEGRAM
WiFi, который вас видит
Ваш роутер уже умеет видеть сквозь стены. Открытый фреймворк РуView превращает обычный WiFi в систему пространственного зрения: присутствие, дыхание, пульс, поза тела, падения и даже счёт людей в комнате, без единой камеры и носимого устройства.
⚙️ Как это работает: RuView использует отражения WiFi-сигнала от людей и предметов, но уровень возможностей зависит от режима запуска.
Бесплатно можно поднять Docker-демо с симулированными данными — оно показывает пайплайн без реального железа.
Для живого сенсинга нужен ESP32-S3 примерно за $9: он снимает CSI и даёт presence, motion, breathing/heart-rate и fall detection на edge.
Полная конфигурация с Cognitum Seed примерно за $140 добавляет mesh-сценарии, persistent memory, kNN, witness chain, каталог edge-модулей и продвинутую обработку. Предобученная модель на Hugging Face включает 128-мерный CSI-энкодер и presence-head; 4-битная версия весит 8 КБ и показывает 100% точность определения присутствия на тестовых данных, а 17-точечное определение позы заявлено как отдельный пайплайн, но его веса ещё не входят в текущий HF-релиз.
🛡 Приватность как двусторонний меч: Камер нет, изображений нет, данных для шантажа тоже. Зато $9 чип + открытый код = любой может развернуть слежку через стены в съёмной квартире.
Стандарт IEEE 802.11bf-2025 уже встраивает WiFi-сенсинг в каждый новый роутер, но ни в США, ни в Европе нет правил, ограничивающих использование этих данных.
💼 Зачем бизнесу: Умный дом и медицина первыми заберут технологию: мониторинг пожилых без камер, подсчет посетителей, мониторинг перемещения сотрудников и животных, экономия на носимых устройствах, обнаружение вторжений.
Уехал из дома,- поставил на охрану через Wi-Fi мониторинг.
Удобно и без доп оборудования.
🔗 Аналогичные проекты:
• CMU DensePose from WiFi - академический предшественник, ~60-70% PCK, положил начало подходу
• ESP32-CSI-Tool - сбор CSI с ESP32, библиотека для исследования
• IEEE 802.11bf-2025 - стандарт WiFi-сенсинга, ратифицирован 2025, войдёт в каждый чип
#WiFi #сенсинг #приватность #ESP32 #RuView #IoT #edgeAI
------
@tsingular
Ваш роутер уже умеет видеть сквозь стены. Открытый фреймворк РуView превращает обычный WiFi в систему пространственного зрения: присутствие, дыхание, пульс, поза тела, падения и даже счёт людей в комнате, без единой камеры и носимого устройства.
⚙️ Как это работает: RuView использует отражения WiFi-сигнала от людей и предметов, но уровень возможностей зависит от режима запуска.
Бесплатно можно поднять Docker-демо с симулированными данными — оно показывает пайплайн без реального железа.
Для живого сенсинга нужен ESP32-S3 примерно за $9: он снимает CSI и даёт presence, motion, breathing/heart-rate и fall detection на edge.
Полная конфигурация с Cognitum Seed примерно за $140 добавляет mesh-сценарии, persistent memory, kNN, witness chain, каталог edge-модулей и продвинутую обработку. Предобученная модель на Hugging Face включает 128-мерный CSI-энкодер и presence-head; 4-битная версия весит 8 КБ и показывает 100% точность определения присутствия на тестовых данных, а 17-точечное определение позы заявлено как отдельный пайплайн, но его веса ещё не входят в текущий HF-релиз.
🛡 Приватность как двусторонний меч: Камер нет, изображений нет, данных для шантажа тоже. Зато $9 чип + открытый код = любой может развернуть слежку через стены в съёмной квартире.
Стандарт IEEE 802.11bf-2025 уже встраивает WiFi-сенсинг в каждый новый роутер, но ни в США, ни в Европе нет правил, ограничивающих использование этих данных.
💼 Зачем бизнесу: Умный дом и медицина первыми заберут технологию: мониторинг пожилых без камер, подсчет посетителей, мониторинг перемещения сотрудников и животных, экономия на носимых устройствах, обнаружение вторжений.
Уехал из дома,- поставил на охрану через Wi-Fi мониторинг.
Удобно и без доп оборудования.
🔗 Аналогичные проекты:
• CMU DensePose from WiFi - академический предшественник, ~60-70% PCK, положил начало подходу
• ESP32-CSI-Tool - сбор CSI с ESP32, библиотека для исследования
• IEEE 802.11bf-2025 - стандарт WiFi-сенсинга, ратифицирован 2025, войдёт в каждый чип
#WiFi #сенсинг #приватность #ESP32 #RuView #IoT #edgeAI
------
@tsingular
🤯43⚡15❤11🔥10😁3👍1
Forwarded from Machinelearning
Близ Шанхая запущен подводный центр обработки данных, питающийся от ветроэнергетики, - об этом сообщили китайские СМИ со ссылкой на разработчиков проекта.
Объект вышел на полноценную коммерческую эксплуатацию на прошлой неделе, после серии пробных запусков ранее в этом году.
ЦОД мощностью 24 МВт размещён под водой рядом с турбинами ветроэлектростанции и вмещает около 2 тысяч серверов, включая GPU-кластеры China Telecom и оператора LinkWise.
Оборудование поводного дата-центра используется для задач искусственного интеллекта, разметки больших данных, развития 5G и обучения китайских языковых моделей.
Стоимость проекта оценивается примерно в 226 млн долларов, его строительство завершилось в октябре 2025 года.
В проекте полностью отказались от промышленных систем охлаждения: тепло от серверов отводит морская вода, а электричество поступает напрямую от близлежащих ветряков.
Данные о технических параметрах в публикациях расходятся. Часть источников указывает глубину размещения модулей около 10 метров, другие - 35 метров.
Специалисты, причастные к проекту, признают, что технология находится на ранней стадии.
К числу нерешённых вопросов относят коррозию от солёной воды, долговременную герметизацию под давлением, надёжность подводных кабелей, доступность оборудования для обслуживания и возможное воздействие на морскую среду.
Ранее схожий эксперимент, Project Natick, проводила Microsoft, однако в коммерческую эксплуатацию его не вывели.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡15❤6🔥3🤣2
Forwarded from НИИ ИИ
DeepSeek V4-Pro: скидка 75% теперь навсегда
Так что конкретно произошло
Когда V4-Pro выходила, её поставили в 25% от плановой цены и назвали промо-акцией с дедлайном 31 мая. Большинство ждало, что после этой даты прайс умножится на четыре.
Не умножится. DeepSeek зафиксировала постоянный тариф: $0.435 за миллион входных токенов и $0.87 за миллион выходных. В рублях по текущему курсу это примерно 35 ₽ за миллион входных и 70 ₽ за миллион выходных. Кеш-хит на входе и вовсе $0.003625 — почти бесплатно. За модель уровня фронтира с честным окном в 1 000 000 токенов.
Чтобы было нагляднее: миллион выходных токенов — это больше тысячи страниц связного текста, целая толстая книга. И генерация такой книги топовой моделью стоит меньше доллара. Сопоставимые западные модели с похожим окном — от GPT-5.4 и Sonnet 4.6 до Opus 4.6 и GPT-5.5 — на выходе дороже в 10–30 раз.
Почему это не просто очередное «китайцы демпингуют»
Раньше разговор про дешёвые китайские модели звучал предсказуемо: да, дешевле, но качество на полступени позади, длинный контекст компромиссный, на проде ставить страшно. V4-Pro этот разговор закрывает.
По задачам рассуждения, кода и длинных документов модель идёт вровень с топами, местами обгоняет: на SWE-bench Verified — 80.6%, в полшага от Claude Opus 4.6. Миллион токенов у неё реально рабочий до нескольких сотен тысяч — можно загнать кодовую базу или книгу и получать осмысленные ответы. Дальше точность постепенно проседает: на 400–500K модель уже скорее пересказывает архитектуру, чем цитирует строчки дословно. Но даже с этой оговоркой при такой цене её можно гонять как рабочую лошадку под весь конвейер: парсинг, классификация, рассуждение, генерация.
Если коротко: китайцы победят. Если не качеством, то ценой, а судя по V4-Pro — уже и тем, и другим одновременно. DeepSeek в этой истории молодцы: они переписывают экономику использования LLM в проде, а не играют в ценовые войны на месяц.
Где это реально пригодится
- Анализ больших кодовых баз. Кладёте весь проект в контекст и просите найти баг, описать архитектуру или предложить рефакторинг. Один вызов вместо нарезки на куски.
- Длинные документы и переписки. Контракт на 200 страниц, годовая почта с клиентом, стенограмма созвона. Без RAG, эмбеддингов и векторной базы.
- Агенты с длинной памятью. Длинный контекст из роскоши становится нормой. Можно не изобретать схемы саммари и не терять детали между шагами.
- Q&A по корпоративным данным. Wiki, регламенты, тикеты — задаёте вопросы напрямую, без отдельной поисковой инфраструктуры.
- Массовая обработка. Классификация писем, разметка лидов, извлечение данных из тысяч PDF, перевод документации. То, что упиралось в бюджет, помещается в обычную месячную смету.
Как попробовать у себя
Зарегистрируйтесь в platform.deepseek.com и возьмите API-ключ. Эндпоинт совместим с OpenAI-форматом: в большинстве библиотек хватит поменять base_url и api_key, код трогать не нужно. Перенесите на V4-Pro один не критичный пайплайн (классификацию или саммари), сравните по качеству и цене со своей текущей моделью на неделе реальных данных. Не устроило — вы потеряли пару долларов на тестах.
pimenov.ai
🐋 DeepSeek сначала запустила V4-Pro со скидкой 75% и поставила дедлайн. Вчера объявили: цена остаётся такой навсегда. Получилось, что флагман с миллионом контекста теперь стоит дешевле большинства флагманских моделей прошлого поколения.
Так что конкретно произошло
Когда V4-Pro выходила, её поставили в 25% от плановой цены и назвали промо-акцией с дедлайном 31 мая. Большинство ждало, что после этой даты прайс умножится на четыре.
Не умножится. DeepSeek зафиксировала постоянный тариф: $0.435 за миллион входных токенов и $0.87 за миллион выходных. В рублях по текущему курсу это примерно 35 ₽ за миллион входных и 70 ₽ за миллион выходных. Кеш-хит на входе и вовсе $0.003625 — почти бесплатно. За модель уровня фронтира с честным окном в 1 000 000 токенов.
Чтобы было нагляднее: миллион выходных токенов — это больше тысячи страниц связного текста, целая толстая книга. И генерация такой книги топовой моделью стоит меньше доллара. Сопоставимые западные модели с похожим окном — от GPT-5.4 и Sonnet 4.6 до Opus 4.6 и GPT-5.5 — на выходе дороже в 10–30 раз.
Почему это не просто очередное «китайцы демпингуют»
Раньше разговор про дешёвые китайские модели звучал предсказуемо: да, дешевле, но качество на полступени позади, длинный контекст компромиссный, на проде ставить страшно. V4-Pro этот разговор закрывает.
По задачам рассуждения, кода и длинных документов модель идёт вровень с топами, местами обгоняет: на SWE-bench Verified — 80.6%, в полшага от Claude Opus 4.6. Миллион токенов у неё реально рабочий до нескольких сотен тысяч — можно загнать кодовую базу или книгу и получать осмысленные ответы. Дальше точность постепенно проседает: на 400–500K модель уже скорее пересказывает архитектуру, чем цитирует строчки дословно. Но даже с этой оговоркой при такой цене её можно гонять как рабочую лошадку под весь конвейер: парсинг, классификация, рассуждение, генерация.
Если коротко: китайцы победят. Если не качеством, то ценой, а судя по V4-Pro — уже и тем, и другим одновременно. DeepSeek в этой истории молодцы: они переписывают экономику использования LLM в проде, а не играют в ценовые войны на месяц.
Где это реально пригодится
- Анализ больших кодовых баз. Кладёте весь проект в контекст и просите найти баг, описать архитектуру или предложить рефакторинг. Один вызов вместо нарезки на куски.
- Длинные документы и переписки. Контракт на 200 страниц, годовая почта с клиентом, стенограмма созвона. Без RAG, эмбеддингов и векторной базы.
- Агенты с длинной памятью. Длинный контекст из роскоши становится нормой. Можно не изобретать схемы саммари и не терять детали между шагами.
- Q&A по корпоративным данным. Wiki, регламенты, тикеты — задаёте вопросы напрямую, без отдельной поисковой инфраструктуры.
- Массовая обработка. Классификация писем, разметка лидов, извлечение данных из тысяч PDF, перевод документации. То, что упиралось в бюджет, помещается в обычную месячную смету.
Как попробовать у себя
Зарегистрируйтесь в platform.deepseek.com и возьмите API-ключ. Эндпоинт совместим с OpenAI-форматом: в большинстве библиотек хватит поменять base_url и api_key, код трогать не нужно. Перенесите на V4-Pro один не критичный пайплайн (классификацию или саммари), сравните по качеству и цене со своей текущей моделью на неделе реальных данных. Не устроило — вы потеряли пару долларов на тестах.
💡 Практический шаг на эту неделю: возьмите свой ИИ-сценарий, который вы откладывали из-за стоимости, и пересчитайте его экономику на V4-Pro. С большой вероятностью он уже окупается.
pimenov.ai
🔥25⚡6🎉3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🏎 LM Studio 0.4.14, - MTP теперь в релизе
Предсказание сразу нескольких токенов (MTP) — это встроенная в саму модель голова-предсказатель, которая угадывает 2–3 токена наперёд, опираясь на собственные скрытые состояния.
На видеокарте RTX 5060 Ti 16 ГБ: Qwen3.6-35B-A3B (со MoE) разгоняется с 98 до 144 т/с (в 1,47 раза). В ответ, правда, сжирает дополнительный объём памяти под рассуждения — 262 тыс. → 65 тыс. при сжатии KV cache-значений до q4_0, либо 98 тыс. при turbo3.
Dense модель на 27 млрд становится на 42 % медленнее — подход помогает только тем моделям, у которых есть запас по пропускной способности памяти.
Поддержку влили в основную ветку llama.cpp.
В LM Studio работает с GGUF/llama.cpp. На Mac — сборки под MLX (oQ8-mtp).
Как включить: обновить LM Studio до 0.4.14 → скачать модель с поддержкой MTP (Qwen3.6-35B-A3B-MTP-GGUF / Qwen3.6-27B-MTP-GGUF) → включить его при загрузке.
🔗 Changelog | llama.cpp PR #22673 | Бенчмарк MTP на 16GB
#LMStudio #MTP #llamacpp #Qwen3
———
@tsingular
Предсказание сразу нескольких токенов (MTP) — это встроенная в саму модель голова-предсказатель, которая угадывает 2–3 токена наперёд, опираясь на собственные скрытые состояния.
На видеокарте RTX 5060 Ti 16 ГБ: Qwen3.6-35B-A3B (со MoE) разгоняется с 98 до 144 т/с (в 1,47 раза). В ответ, правда, сжирает дополнительный объём памяти под рассуждения — 262 тыс. → 65 тыс. при сжатии KV cache-значений до q4_0, либо 98 тыс. при turbo3.
Dense модель на 27 млрд становится на 42 % медленнее — подход помогает только тем моделям, у которых есть запас по пропускной способности памяти.
Поддержку влили в основную ветку llama.cpp.
В LM Studio работает с GGUF/llama.cpp. На Mac — сборки под MLX (oQ8-mtp).
Как включить: обновить LM Studio до 0.4.14 → скачать модель с поддержкой MTP (Qwen3.6-35B-A3B-MTP-GGUF / Qwen3.6-27B-MTP-GGUF) → включить его при загрузке.
🔗 Changelog | llama.cpp PR #22673 | Бенчмарк MTP на 16GB
#LMStudio #MTP #llamacpp #Qwen3
———
@tsingular
✍9🔥6❤3⚡2
Anthropic Project Glasswing: 10 000 уязвимостей за месяц
Anthropic опубликовал первый отчёт по Project Glasswing (бабочка стеклянница от слова прозрачность) — совместной программе с ~50 партнёрами по защите критического ПО до того, как ИИ-модели начнут использоваться атакующими.
Claude Mythos Preview за месяц нашёл более 10 000 уязвимостей высокого и критического уровня.
🔍 Масштаб: Cloudflare обнаружила 2000 багов (400 — высокого/критического уровня) в своих системах. Уровень ложных срабатываний ниже, чем у людей. Mozilla исправила 271 уязвимость в Firefox 150 — в 10 раз больше, чем при тестировании Firefox 148 с Claude Opus 4.6.
🛡 Open Source: Mythos просканировал 1000+ проектов. Оценка: 6202 уязвимости высокого/критического уровня. Из 1752 проверенных независимыми аудиторами — 90.6% истинные срабатывания.
Пример: CVE-2026-5194 в wolfSSL — подделка сертификатов, затрагивающая миллиарды устройств.
⚡ Узкое место: Найти баги стало проще. Патчить — нет. Мейнтейнеры просят замедлить раскрытие. Средний цикл патча — 2 недели. Из 530 раскрытых уязвимостей запатчены только 75.
🤖 Инструменты: Anthropic выпустил Claude Security (public beta для Enterprise) — сканирование кода с автопатчами. За 3 недели Opus 4.7 закрыл 2100+ уязвимостей. Также запущен Cyber Verification Program для легитимного пентеста.
💼 Зачем бизнесу: ИИ находит уязвимости быстрее людей. Компании, которые не сокращают циклы патчей, будут жить в окне риска. Palo Alto Networks уже выпустил в 5 раз больше патчей. Microsoft прогнозирует рост объёмов патчей на неопределённый срок.
Уязвимое ПО с незакрытыми дырами — наша реальность на ближайшие годы.
🔮 Будущее: Мир делится на два лагеря: те, кто использует ИИ для защиты кода, и те, чей код ИИ уже взломал. Mythos-class модели появятся у атакующих достаточно скоро.
#ИИ #кибербезопасность #Anthropic #Glasswing #уязвимости #Mythos
───
@tsingular
Anthropic опубликовал первый отчёт по Project Glasswing (бабочка стеклянница от слова прозрачность) — совместной программе с ~50 партнёрами по защите критического ПО до того, как ИИ-модели начнут использоваться атакующими.
Claude Mythos Preview за месяц нашёл более 10 000 уязвимостей высокого и критического уровня.
🔍 Масштаб: Cloudflare обнаружила 2000 багов (400 — высокого/критического уровня) в своих системах. Уровень ложных срабатываний ниже, чем у людей. Mozilla исправила 271 уязвимость в Firefox 150 — в 10 раз больше, чем при тестировании Firefox 148 с Claude Opus 4.6.
🛡 Open Source: Mythos просканировал 1000+ проектов. Оценка: 6202 уязвимости высокого/критического уровня. Из 1752 проверенных независимыми аудиторами — 90.6% истинные срабатывания.
Пример: CVE-2026-5194 в wolfSSL — подделка сертификатов, затрагивающая миллиарды устройств.
⚡ Узкое место: Найти баги стало проще. Патчить — нет. Мейнтейнеры просят замедлить раскрытие. Средний цикл патча — 2 недели. Из 530 раскрытых уязвимостей запатчены только 75.
🤖 Инструменты: Anthropic выпустил Claude Security (public beta для Enterprise) — сканирование кода с автопатчами. За 3 недели Opus 4.7 закрыл 2100+ уязвимостей. Также запущен Cyber Verification Program для легитимного пентеста.
💼 Зачем бизнесу: ИИ находит уязвимости быстрее людей. Компании, которые не сокращают циклы патчей, будут жить в окне риска. Palo Alto Networks уже выпустил в 5 раз больше патчей. Microsoft прогнозирует рост объёмов патчей на неопределённый срок.
Уязвимое ПО с незакрытыми дырами — наша реальность на ближайшие годы.
🔮 Будущее: Мир делится на два лагеря: те, кто использует ИИ для защиты кода, и те, чей код ИИ уже взломал. Mythos-class модели появятся у атакующих достаточно скоро.
#ИИ #кибербезопасность #Anthropic #Glasswing #уязвимости #Mythos
───
@tsingular
⚡8✍4❤3🤯1💯1
Вчера впервые в разговоре механически оценил трудоемкость задачи в млрд токенов.
А надо бы сразу в электричестве.
#мысли
------
@tsingular
А надо бы сразу в электричестве.
#мысли
------
@tsingular
😁26✍6⚡4
Forwarded from Denis Sexy IT 🤖
Тут это, шведский стартап строит 6-метровые дроны для добычи леса – ноль повреждения почвы, дрон подлетает и просто крадет дерево: airforestry.com
Ну хоть ясно теперь как добыча леса будет выглядеть лет через 10-20🌳
Ну хоть ясно теперь как добыча леса будет выглядеть лет через 10-20
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27🤯12⚡8😁1