Гостев из будущего

Посмеяться на нелепыми падающими роботами – видео прилагается.
...

Посмеялись?
Теперь серьезно – это тестовые забеги роботов, которых готовят к Пекинскому Марафону, который будет в это воскресенье. Заявилось на участие 126 роботов, 70 команд от 26 брендов!

Год назад, в первом полумарафоне участвовал 21 робот, из которых до финиша добралось только 6. Победитель осилил 21 км за 2 часа 40 минут.

...
В России, тем временем, компания Aidol, робот которых красиво упал на сцене в ноябре, трубит в СМИ о том, что подписала контракт на поставку аж в саму Японию!

Но дьявол, конечно, в деталях. Из описания становится понятно, что поставят анонимным японцам настольную модель, тупо говорящую голову, стоимостью от 5 млн рублей. При сумме контракта в $250 000 – это видимо 5 штук…

@gostev_future

😁9

806 viewsedited 08:36

Гостев из будущего

Вернемся к нашим баранам – Иишке и кибербезу.

Пока Антропик нагнетает и интригует с Mythos, дав лимитированный доступ 30-40-50 компаниям (кстати, заметили что никто из этих компаний не выступает с опровержениями относительно мощности модели, а весь хайп – как в сторону преуменьшения угрозы, так и наоборот – исходит от тех, кто Mythos в глаза не видел? ) – OpenAI относительно тихо взял и выпустил GPT-5.4-Cyber

Это не публичная модель, а специализированный вариант GPT-5.4 для верифицированных специалистов по кибербезопасности.
Ключевая новая возможность — binary reverse engineering: анализ скомпилированного ПО на уязвимости без доступа к исходному коду.

OpenAI меняет подход: вместо ограничений на то, что модель умеет — верификация того, кто получает доступ. Новые уровни программы Trusted Access for Cyber открывают более мощные возможности по мере прохождения проверки личности.

Понятно, что доступ не планируется давать всяким там русским, китайским и прочим плохишам.

Но что-то мне подсказывает, что в реальности все получится по-другому, а реверсить бинари там будут даже северокорейцы. Ну, какое-то время 😂

А вот детектировать малвару при помощи такой штуки я бы не стал – фалсить будет ужасающе, фейл Краудстрайка положившего Windows – покажется цветочками.

@gostev_future

👍4❤1🤔1🤡1

997 viewsedited 10:07

Гостев из будущего

Сергей Гордейчик написал «Манифест созидателя»

Это могло бы стать кейноут докладом на PHDays, но но …

Автор разбирает, как AI обесценил код и переворачивает IT-индустрию с ног на голову.

Про то, почему трехлетние планы — уже труп, как должна работать M&A в 2026, и почему одиночка с идеей теперь может больше, чем весь R&D департамент.

https://teletype.in/@sergey_gordey/dZijhpp2f3M

Teletype

Манифест созидателя

Ещё один агент сегодня.

👍17🤔4🔥1🤓1

1.33K viewsedited 05:15

Гостев из будущего

Тем временем, наша с Лехой Андреевым книга получила некую новую плашку на сайте издательства Эксмо.

Мы так и не поняли в какой конкретно Топ-100 рейтинг она попала, но ведь попала!

Книг этого тиража, кстати, осталось совсем мало - так что, если вы еще не приобщились — самое время.

А то может и не будет больше никакого Эксмо…

@gostev_future

🔥18❤3👍1

757 views11:18

Гостев из будущего

Anthropic долго и серьёзно объясняла, почему Mythos нельзя показывать широкой публике. Широкая публика прочитала это и нашла Mythos за несколько часов.

Группа энтузиастов из тематического Discord-канала («ищем модели до релиза, это хобби такое») получила доступ в тот же день, что и официальный анонс.

Метод проникновения достоин отдельного восхищения: они просто угадали адрес модели в интернете.

Угадали — зная, как Anthropic обычно называет свои вещи. Плюс у одного участника нашёлся знакомый, работающий у подрядчика Anthropic.

С тех пор группа пользуется Mythos регулярно и даже устроила Bloomberg живую демонстрацию.

Anthropic расследует. Внутренние системы, по заявлению пресс-службы, не пострадали.

Лучший способ привлечь внимание к секрету — громко рассказать, какой он секретный 😂

@gostev_future

😁22❤2

1.04K views07:39

Гостев из будущего

💥 На днях вышли две статьи об ИИ в кибербезопасности — и вместе они хорошо дополняют друг друга.

Positive Technologies рассказали про ByteDog: нейросеть на трансформерной архитектуре, которая анализирует файлы напрямую в виде байтов, без предварительной разметки и распаковки. Компания заявляет превосходство над классическими ML-моделями на 20% и detection rate не ниже 90%.

А вот исследователи Elastic Security Labs опубликовали работу с противоположным углом зрения. Они не защищали — они атаковали. Сначала протестировали Claude Opus 4.6 как инструмент реверс-инжиниринга: модель решила 40% задач на обфусцированных бинарниках, но при многослойной обфускации — ноль успехов и взрывной рост стоимости до $10 за попытку.

Затем сделали следующий шаг: использовали ту же модель, чтобы разработать обфускацию, специально заточенную против LLM-анализа. За один длинный выходной сделали три рабочих метода. Почитайте, там прикольно.

Именно здесь два материала вступают в некое противоречие.

PT утверждает, что ByteDog находит угрозы, «даже если вирус спрятан сложным способом». Elastic показывает: целенаправленная LLM-таргетированная обфускация разрабатывается быстро, дёшево и стабильно ломает автоматизированный анализ. Matryoshka Wall с 100 000 слоёв шифрования выполняется нативно за 55 миллисекунд — и стоит атакующему ничего. Анализ той же модели обходится в $10 и заканчивается провалом.

Не говорю о том, что ByteDog плохой прототип. Это не LLM-агент, а трансформерная модель другого класса (классификатор на уровне байтов). Elastic тестировали LLM-агента с инструментами реверсинга. Это разные подходы, и LLM-таргетированная обфускация бьёт скорее по агентам, чем по байтовым классификаторам напрямую.

Проблема в том, что заявленные 90% — это цифра на исторических датасетах.

И пока защитники измеряют detection rate на прошлогодних образцах, атакующий уже тестирует следующую итерацию против конкретной модели защитника — и делает это быстрее, чем вендор успевает переобучиться.

@gostev_future

👍11🔥5❤1

833 views06:05

Гостев из будущего

💫 Все развивается очень стремительно. То, что ты сначала видишь как прогноз, через несколько дней становится реальностью.

Так что текст ниже это не предсказание — это записки из будущего 🤓

ИИ-инфраструктура как следующий таргет для киберпреступности

Доступ к мощным frontier-моделям стоит денег, да еще и предоставляется не всем — примеры Mythos и GPT Cyber показывают как будет развиваться идея — в спецмодели для спец индустрий.

Это классическая формула для киберпреступников: есть ценный ресурс с барьером доступа → будет атака.

Исторически так происходило с каждым новым дефицитным ресурсом: чужие CPU майнили биткоин, чужие серверы рассылали спам, чужие аккаунты стримили контент. ИИ-вычисления — следующий в очереди. И в отличие от предыдущих волн, здесь ставки интересней: мощные модели могут сами помогать атакующему масштабировать следующие атаки.

Векторы потенциальных атак:

❗️Кража API-ключей и credential stuffing
Самый очевидный вектор. Ключи утекают через открытые GitHub-репозитории, скомпрометированные CI/CD пайплайны, фишинг. Атакующий получает доступ к чужому аккаунту и использует квоту — жертва узнаёт из счёта в конце месяца.

❗️Компрометация self-hosted инфраструктуры
Компании всё активнее разворачивают модели локально — Ollama, vLLM, LM Studio. Открытые порты, дефолтные конфиги, отсутствие аутентификации. Атакующий находит незащищённый эндпойнт через Shodan и получает бесплатный инференс или использует его как анонимный прокси для вредоносных запросов.

❗️Атаки на облачные GPU-пулы
Захват инстансов с A100/H100 через уязвимости в оркестраторах. Цель — не данные, а вычислительная мощность. Дообучение модели на украденных GPU — это тысячи долларов сэкономленных ресурсов.

❗️Supply chain через вендоров
Предположим что периметр AI-компаний защищён лучше, чем их подрядчики. Вектор входа — среда третьей стороны с доступом к модели. Вчерашняя история про получение не пойми кем доступа к Mythos — как раз про это.

❗️Prompt injection как lateral movement
В агентных системах инструкции из внешних источников переопределяют поведение агента: отправка данных на внешний сервер, выполнение команд в терминале, изменение файлов.

(Продолжение следует)

@gostev_future

👍5💯3🔥2

673 viewsedited 08:05

Гостев из будущего

⚡️ Как следствие, из вышеописанного — вытекают некоторые базовые и очень очевидные вещи для защиты, но начать с них стоит уже сейчас:

🖍 Ротация и мониторинг API-ключей — алерты на аномальный расход токенов.

Большинство компаний это не настраивают, потому что OpenAI и Anthropic дают базовую статистику в дашборде, но не алертинг.
Нужно либо строить его самостоятельно через billing API, либо использовать сторонние инструменты (Helicone, LangSmith, собственный прокси-слой)

🖍 Rate limiting плюс поведенческие паттерны использования.

Система учится, как конкретный пользователь или приложение обычно взаимодействует с моделью: длина промптов, тематика, частота, время суток. Отклонение от baseline — триггер для алерта или автоматической блокировки. Пример: корпоративный Copilot используется для написания кода. Внезапно через тот же ключ начинают идти запросы про сетевые уязвимости и эксплойты — это аномалия, даже если rate limit не превышен. Классические WAF и IDS это не поймают, потому что запросы валидные с точки зрения протокола.

🖍 Изоляция self-hosted моделей — никаких открытых портов, обязательная аутентификация.

Ollama по умолчанию слушает только 127.0.0.1 — но стоит пользователю выставить OLLAMA_HOST=0.0.0.0, эндпойнт открывается в сеть без какой-либо аутентификации. 175 000 открытых хостов по данным SentinelLABS и Censys.
Ставить firewall, VPN или reverse proxy с аутентификацией перед эндпойнтом модели.

🖍 Sandboxing агентов — ограничение доступа к инструментам и внешним данным.

Минимальные права, изоляция в контейнере, запрет исходящих соединений к произвольным адресам, логирование всех действий агента — и делать это должен не тот же самый агент!

Золотые времена настают для инноваций.

@gostev_future

🔥10✍1🤔1

577 views09:32

Гостев из будущего

Не хочется брюзжать как старикан, но все же эти игры смахивают на попытки изобрести велосипед. Все это уже проходили, не далее как в нулевые — пакеры, протекторы, обфускаторы — в какой-то момент их стало так много, что снимать каждый отдельной процедурой было уже нецелесообразно. Поэтому просто взяли и сделали эмулятор, прямо в антивирусных базах.

Да, конечно, он брал не все, а противники с той стороны фронта постоянно подбирали анти-эмуляционные трюки. Может помните, по черным форумам постоянно была реклама "Продам чистяк, сделаю криптор" ? Те файлы, что эмулировались слишком долго или не выдавали в итоге чистый бинарный код — проще было сразу объявлять малварой, потому что нормальные файлы в принципе себя так вести и не должны. End of story.

Теперь идем по спирали — компании опять пытаются эмулировать код, но уже с использованием ИИ, и я клянусь вам, мы снова увидим рекламу "Продам анти-аиэмулятор, без смс и регистрации".

@gostev_future

😁10❤1💯1🤝1

1.29K views12:17

Гостев из будущего

Белый дом выпустил меморандум NSTM-4 — первый официальный правительственный документ, который называет промышленную дистилляцию американских ИИ-моделей угрозой национальной безопасности.

США официально признали, что Китай системно крадёт возможности frontier-моделей через дистилляцию — и теперь это не просто жалобы OpenAI, а государственная позиция.

Обещают бороться за все хорошее против всего плохого (делиться разведданными с американскими ИИ-компаниями, создать механизмы привлечения иностранных акторов к ответственности)

Есть очевидное противоречие, которое меморандум аккуратно обходит стороной.

Американские frontier-модели обучались на данных из всего интернета — без особого разбора происхождения. Это включает китайский контент, европейский, данные авторов, журналистов, программистов, которые никакого согласия не давали. OpenAI, Anthropic, Google судятся за это прямо сейчас.

Позиция США звучит примерно так: «Обучать модель на чужих данных без разрешения — это нормально. Обучать модель на выходах нашей модели без разрешения — это кража и угроза нацбезопасности.»

Разница, которую приводят в защиту этой позиции:
• Дистилляция через API нарушает Terms of Service — это контрактное нарушение
• Использование прокси-аккаунтов и джейлбрейкинга — это уже активное мошенничество
• Масштаб и координация делают это похожим на промышленный шпионаж

Но честно говоря — это слабое основание для морального превосходства. «Мы нарушали авторские права в открытую, они нарушают ToS тайно» — не самая сильная позиция.

Меморандум это противоречие не признаёт вообще. Что само по себе говорит о многом: документ написан не для философской дискуссии, а для легитимизации конкретных действий против конкретного конкурента.

@gostev_future

👍12❤2🔥2

699 viewsedited 16:21

Гостев из будущего

Мои экс-коллеги Виталий Камлюк и Хуан «Андреич» опубликовали от лица SentinelOne интересную находку.

Они обнаружил ранее неизвестный фреймворк для кибератак fast16, датированный 2005 годом — за 5 лет до Stuxnet, который считался первой операцией государственного уровня против промышленных систем.

fast16 не крадёт данные и не шифрует файлы. Он делает кое-что куда более коварное: незаметно искажает результаты высокоточных физических расчётов на инфицированных машинах.

fast16.sys — драйвер-саботажник (июль 2005)
Загружается при старте системы раньше всего остального. Встраивается в файловую систему между диском и ОС, перехватывая чтение всех .EXE-файлов прямо в памяти.

Драйвер содержит 101 правило патчинга — он ищет в исполняемых файлах конкретные последовательности байт и на лету подменяет их в памяти. Атака нацелена исключительно на программы, скомпилированные Intel C++ Compiler — то есть разработчики заранее знали, каким компилятором собраны цели.

Один из патчей особенный: блок инструкций FPU (математический сопроцессор), который масштабирует значения во внутренних массивах вычислительных программ. Результат — систематические, но невидимые ошибки в точных расчётах.

Прогон правил патчинга по программам эпохи 2000-х дал совпадения с тремя конкретными продуктами, из которых наиболее интересен один:

LS-DYNA напрямую связан с публичными данными об иранских исследованиях ядерных зарядов — что указывает на вероятную цель операции.

В 2017 году хакеры ShadowBrokers слили инструменты АНБ США. Среди них — файл drv_list.txt с именами драйверов, которые операторы АНБ должны были распознавать как «свои» и не трогать при работе в чужих сетях.

В этом списке оказался fast16 с уникальной пометкой:
*«fast16 *** Nothing to see here – carry on **»

Это подтверждает что fast16 был инструментом государственного уровня, включённым в базу АНБ.

fast16 переписывает историю кибервооружений: первый известный случай государственного программного саботажа, нацеленного на научные вычисления, датируется не 2010, а 2005 годом.

@gostev_future

SentinelOne

fast16 | Mystery ShadowBrokers Reference Reveals High-Precision Software Sabotage 5 Years Before Stuxnet

A previously unknown 2005 cyber sabotage framework patches high-precision calculation software in memory to silently corrupt results.

🔥24❤1

902 views05:10

Гостев из будущего

Директор по стратегическому маркетингу «Яндекса» Андрей Себрант прочитал результаты опросов Forbes и JPMorgan — миллиардеры активно пользуются ИИ — и сделал красивый вывод: богатые используют ИИ, потому что он единственный говорит им правду. Вокруг — льстецы с ипотеками и бонусами, а ChatGPT ничего не боится и никому не служит.

Романтично. Но я готов оспорить. Не как миллиардер, конечно 😇

Да, проблема «да-людей» реальна. Когда ты можешь уволить человека за неудобный ответ, честная обратная связь становится редкостью. И в этом смысле ИИ действительно выбивается из привычной иерархии — ему незачем молчать из страха.

Но назвать его честным — значит перепутать отсутствие мотивов с наличием принципов.
ИИ не нейтрален. Он обучен на текстах, написанных людьми с их предубеждениями, социальными иерархиями и желанием понравиться. Исследователи давно фиксируют феномен цифрового подхалимажа: модели соглашаются с пользователем, шлифуют его заблуждения, избегают конфликта. Разница с живым аналитиком есть, но она тоньше, чем кажется.

Главное: настоящую честность не заменяет отсутствие мотивов. Честность требует понимания контекста, жизненного опыта, моральной ответственности за сказанное.

ИИ не рискует ничем. Он может дать катастрофически плохой совет — и завтра об этом не вспомнит. Ну, кроме судьи, если слепо следовать плохим советам.

Хороший советник рискует репутацией — и именно это делает его мнение весомым.

Тогда в чём реальная ценность?
Билл Гейтс суммирует встречи. Лефкофски проверяет идеи пять раз в день. Это не поиск экзистенциальной честности — это удобство и скорость.

Миллиардеры используют ИИ не потому, что он честнее людей, а потому что он быстрее и дешевле как первый фильтр.

Но есть кое-что ещё, о чём обычно не говорят вслух.

ИИ позволяет задавать вопросы, которые неловко задавать людям. Проверить сырую идею, не роняя авторитет. Признаться в незнании, не теряя лица. Поиграть с мыслью, которая кажется глупой, — анонимно, без последствий для отношений.

Это безопасная песочница для мышления.

Себрант назвал это честностью. Я бы назвал это приватностью мышления. Разница небольшая — но возможно в ней вся суть.

@gostev_future

👍20❤3👏2🤔2👌2

856 viewsedited 11:30

Гостев из будущего

Экономика AI-бума

Хочется поговорить об экономике AI-бума: где в нём настоящие деньги, где уже начинается религия, какие последствия будут для рынка и как всё это в итоге отразится на кибербезопасности.

Сразу важное: инвестиционных рекомендаций здесь не будет. В "клуб юных миллионеров за 30 дней" тоже не записываю.
Но свои тезисы я стараюсь проверять не только словами.

26 марта писал, что ARM начинает делать собственные чипы, и на этой новости акции выросли примерно на 20%. В тот же день я сам купил ARM — за месяц позиция дала ещё +56%.
Про Marvell я тогда не писал, но тоже купил. Сейчас там уже +82%.

Это не история про “повторяйте за мной”. Повторять поздно, да и вообще не надо.

Это история про то, что у меня постепенно сложилось видение, куда будет двигаться экономика AI в ближайшие пару лет. Не в смысле “какая акция вырастет завтра”, а в смысле — где в этой огромной машине действительно возникает стоимость.

Пока вижу пять больших тем.

1. Инфраструктура
Чипы, память, сети, дата-центры, энергия, охлаждение, облака. Всё то скучное и дорогое, без чего никакой магии не будет.

2. Где деньги
Кто реально зарабатывает на AI-буме, а кто пока продаёт надежду. Почему выручка, capex и красивые презентации — это три разные реальности.

3. Агенты
Почему “AI-агенты” станут главным словом ближайшего года — и почему часть этого рынка закончится разочарованием.

4. Обёртки
Какие AI-стартапы станут компаниями, а какие окажутся просто кнопками внутри Microsoft, Google, OpenAI, Anthropic, Salesforce или Adobe.

5. AI-security
Почему безопасность AI станет отдельным рынком, но при этом значительную его часть могут забрать сами AI-вендоры.

Не всё будет про инвестиции. Но всё будет про экономику.
Потому что AI-бум — это уже давно не только про модели. Это про инфраструктуру, капитал, энергию, дистрибуцию, регулирование и будущую борьбу за маржу.

Продолжение — точнее, начало — следует.

И да, это всё по-прежнему не инвестиционная рекомендация.

@gostev_future

👍15❤3

638 viewsedited 05:49

Гостев из будущего

2026-й — это не год AI. Это год инфраструктуры.

Пока все обсуждают агентов и новые модели, настоящий рынок выглядит иначе: GPU, ASIC, память, сети, охлаждение, энергия, облака, интеграция и наблюдаемость. Gartner оценивает AI-расходы в 2026-м в $2,52 трлн — и большая часть этих денег уходит не в приложения, а в фундамент под ними.

Это строительный бум. Буквально.

Как в Калифорнии 1849 года: пока одни ищут золото, другие продают лопаты. В AI выиграют не только те, кто сделает очередного ассистента или красивый интерфейс. Выиграют те, кто продаёт compute, чипы, дата-центры, облака, электричество, охлаждение и инструменты для управления всей этой сложностью.

Первый слой — чипы и железо. Публичные ставки очевидны: NVIDIA, AMD, Broadcom, Marvell, TSMC. NVIDIA остаётся главным символом AI-инфраструктуры, но рынок уже сложнее. AMD наращивает долю в дата-центрах, Broadcom и Marvell делают кастомные ASIC для гиперскейлеров, TSMC загружена на годы вперёд.

Но интереснее смотреть и на следующий уровень: компании, которые делают специализированные AI-чипы под конкретные задачи. Groq — на inference-ускорителях, Cerebras — на wafer-scale чипах для обучения, Etched — на чипах, заточенных исключительно под трансформеры. Если архитектура моделей стабилизируется, специализированное железо может начать выигрывать у универсального.

Второй слой — память. Одно из главных узких мест всей индустрии. Без неё современные GPU не работают на полной мощности. Sandisk, Hynix и Micron уже стали очевидными ставками на этот тренд. Дальше стоит смотреть на тех, кто пытается решить проблему архитектурно: например, компании вроде Tenstorrent, где память и вычисления сближаются. Нейроморфная ставка — MRAM.

Третий слой — энергия и охлаждение. Это, возможно, самый недооценённый сектор всего AI-бума. Дата-центры потребляют электричество как небольшие города — и это только начало. Vertiv и Eaton зарабатывают на охлаждении и питании. Constellation Energy и Vistra — на чистой энергии, которую гиперскейлеры покупают по долгосрочным контрактам.

Отдельная тема — ядерная энергетика и микрогенерация. Oklo, Kairos Power, X-Energy и другие компании становятся частью разговора о будущем AI-инфраструктуры не потому, что это модно, а потому что дата-центрам нужна стабильная, дешёвая и масштабируемая энергия. Microsoft, Google и Amazon уже подписывают соглашения в этой области.

Четвёртый слой — облака и альтернативный compute. AWS, Azure и Google Cloud — очевидные победители инфраструктурного цикла. Но рядом формируется рынок neocloud-провайдеров: CoreWeave, Nebius Воложа, Lambda Labs, Together AI. Они продают GPU-мощности тем, кому не хватает ресурсов у гиперскейлеров.

Пятый слой — сети. AI-кластеры требуют новой архитектуры: тысячи GPU должны обмениваться данными почти без задержек. Arista Networks — очевидная публичная ставка на этот тренд. Из частных компаний интересна Enfabrica, которая делает сетевые чипы специально для AI-инфраструктуры.

Шестой слой — интеграция и наблюдаемость. Кто-то должен всё это соединять, мониторить и чинить. Чем сложнее инфраструктура, тем больше денег уходит в инструменты управления. ServiceNow, Datadog, Elastic, Grafana — компании, которые зарабатывают на каждом новом слое сложности.
Появляется и LLM-observability: Weights & Biases, Arize AI, Langfuse помогают отслеживать, тестировать и контролировать AI-системы. Их плюс в том, что им не нужно угадывать победившую модель. Они обслуживают саму инфраструктуру.

И ещё один момент, который многие пропускают: этот бум уже упирается в физику!
Amazon, Microsoft и Google сталкиваются с давлением из-за потребления воды и энергии. Часть проектов дата-центров отменяется или задерживается из-за сопротивления местных сообществ. К 2027-му вопрос «кто имеет право сжигать электричество ради моделей» станет не только технологическим, но и политическим.

Чем ближе компания к физике и чем дальше она от конкретной модели, тем устойчивее её позиция. Модели меняются каждые два месяца. Интерфейсы копируются. А электричество, охлаждение, память, сети и compute нужны всем и всегда.

@gostev_future

🔥17✍2❤2👌1

693 viewsedited 06:18

Гостев из будущего

Период «почти бесплатного волшебства» заканчивается.

Дальше будет дорого. Ещё год назад AI стоил $20 в месяц. Апрель 2026-го выглядит иначе: Claude и OpenAI выстроили похожую лестницу $20 → $100 → $200. Google держит не только Pro за $19,99, но и более дорогой Ultra-tier. По сторонним оценкам, прогнозы убытков OpenAI в 2026-м доходили до $14 млрд — inference costs растут всё быстрее.

Дешёвый AI финансировался капиталом инвесторов. Теперь монетизация проявляется жёстче: подписки $100–200, лимиты, usage-based billing, контроль стоимости каждого запроса.

Есть контртренд. При подписке $200/мес математика домашнего сервера начинает работать: RTX 5090 за $2000 теоретически отбивается за год, если заменяет дорогую облачную подписку. Дальше маржинальная стоимость локального inference резко падает. NVIDIA уже ответила: DGX Spark — персональный AI-компьютер с 128GB памяти и моделями до 200B параметров. Рынок персональных AI-серверов только открывается — прямой ответ на рост стоимости облака. Плюс полная приватность!

AI-видео обсуждают широко: обучающие ролики, видео-инструкции, персонализированные письма в продажах. Но видео в разы дороже текста — а результат часто не лучше. AI-видео останется там, где визуальный формат незаменим: реклама, медиа, развлечения.

К 2027-му рынок начнёт задавать вопрос: сколько денег приносит каждый доллар, вложенный в GPU?
Тогда станет видно разделение: компании, которые реально встроили AI в рабочие процессы и снизили costs или увеличили revenue — и компании, которые просто прикрутили «AI» к продукту и подняли valuation. Вторых начнуть резать.

Настоящий enterprise — не «агент для всего», а узкие сценарии с понятной экономикой: code review, compliance, fraud detection, document processing. Победит модель, которую кто-то сможет внедрить в SAP, Jira, Salesforce и адский Excel на 48 вкладок. OpenAI уже ставит на интеграторов — Accenture, Capgemini, Infosys, PwC, TCS.

Показательна сделка вокруг Cursor. SpaceX получила опцион на покупку AI-coding платформы за $60 млрд. Cursor — мультимодельный нейтральный слой поверх OpenAI, Anthropic, Gemini, xAI. Если он перестанет быть нейтральным, Anthropic и OpenAI рискуют потерять один из главных каналов к разработчикам.
Это и есть настоящая война — не за лучшую модель, а за точку входа к пользователю.

AI-coding — сегмент, где ROI считается в часах разработчика. На виду GitHub Copilot, Cursor, Windsurf, Tabnine — но война шире: туда уже пришли OpenAI, Anthropic, Amazon и IDE-вендоры.

Datadog, Weights & Biases, Arize AI — инструменты мониторинга расходов, качества и производительности AI — становятся обязательными, когда компании начинают считать стоимость каждого запроса.

На рынке персональных и корпоративных AI-серверов — отдельная история. NVIDIA с DGX Spark задаёт ориентир. Dell ожидает, что AI-server revenue вырастет примерно вдвое — до $50 млрд в fiscal 2027. Super Micro, Lenovo, HPE и ASUS растут вместе с рынком.

И неожиданно Apple: Mac Studio с M4 Max уже используют как домашние AI-серверы благодаря эффективной unified memory.

2026-й — год веры. 2027-й — год инвойсов.

@gostev_future

👍10🔥2

893 viewsedited 10:57

Гостев из будущего

Фабрика ПО: IPO на Мосбирже
ИИ-подразделение Softline выходит на биржу с оценкой 12 млрд руб. Книга заявок закрывается 29 апреля.

Бизнес реальный: выручка 25,5 млрд руб., рост 15%, EBITDA маржа почти 19%. Лидер рынка заказной разработки — впереди Ланита и дочки Ростелекома. Клиенты — Сбер, ВТБ, Альфа. По мультипликаторам оценена в ~2,5x EV/EBITDA, для российского ИТ дёшево.

Но есть один вопрос, который портит всё.

Западные аналоги — EPAM, Accenture, Globant — за последний год потеряли от 37% до 70% капитализации. Причина простая: клиенты подключают GitHub Copilot, один разработчик делает работу троих, и компании начинают нанимать меньше людей. Выручка не падает резко, но оплачиваемых часов становится меньше — рынок закладывает этот тренд в цену уже сейчас.

Фабрика ПО делает то же самое, что EPAM. Та же модель — продаём часы разработчиков корпоративным клиентам.

Разница в том, что у них есть собственный инструмент Autocode, который генерирует код автоматически. Если он реально работает, выгода от автоматизации остаётся внутри компании: те же люди делают больше проектов, маржа растёт. Именно это они показывают — плюс 20% EBITDA на разработчика за год.

Проблема в том, что Autocode построен на чужих языковых моделях. Завтра Сбер или Яндекс выпускают модель для разработки, клиент подключает её напрямую — и посредник не нужен. Это та же угроза, что убивает EPAM, просто с задержкой.

Выход один — уйти от продажи часов к продаже результата по подписке. Они об этом говорят, доля рекуррентной выручки уже 35%. Если получится — чужой ИИ становится их преимуществом.

Если нет — история как у EPAM, только позже и на Мосбирже.

Не является инвестиционной рекомендацией.

@gostev_future

👍6💯3

774 views12:15

Гостев из будущего

В последнем посте про экономику AI-бума я упомянул контртренд против повышения цен за облака — домашние АИ серверы.

Решил посмотреть на ситуацию глазами реального потребителя.

Хочу локальный AI. Это же просто, да?

Нет.

Открытые модели наконец стали нормальными. DeepSeek V4-Flash, Qwen 3.6-27B — это уже не игрушки. Реально заменяют ChatGPT/Claude для большинства задач. Бесплатно, локально, ваши данные никуда не уходят.
Берёшь сервер, запускаешь, всё работает. Казалось бы.

Но нет.

Для нормальных моделей нужно минимум 128 ГБ памяти. Звучит как технический нюанс. На практике — это ад.

Mac Studio M4 Max 128 ГБ — идеальная машина. Но недоступна нигде на планете. Глобальный дефицит RAM. Производители памяти отдают всё AI-датацентрам, на потребительские устройства не хватает.

DGX Spark / Dell Pro Max GB10 — есть в наличии, $3 700–4 700, полный CUDA стек, DeepSeek V4 запустился в день релиза. Но это сервер, не компьютер. И память в три раза медленнее чем у Mac — 273 ГБ/с против 819 ГБ/с. На генерации токенов разница огромная.

GMKtec EVO-X2 — китайский мини-ПК, те же 128 ГБ за $2 000. Раскупают мгновенно везде где появляется.

А может подождать M5?
Mac Studio M5 анонсируют скорее всего на WWDC 8 июня. Но аналитики уже намекают на октябрь из-за тех же проблем с памятью. И даже если выйдет в июне — 128 ГБ конфигурации снова будут в дефиците.

Что реально можно купить сейчас:
M3 Ultra 96 ГБ — доставка через месяц. Не 128 ГБ, старый чип, нет CUDA. Но 819 ГБ/с — быстрее всех конкурентов на инференсе. 96 ГБ тянет 70B модели нормально.
Универсальный компьютер — macOS, тихий, встаёт на стол. Включил и работает.

Dell GB10/DGX Spark лучше только если AI-разработка — основная работа. Fine-tuning без ограничений, весь PyTorch-стек, новые инструменты в день релиза. Но токены генерирует медленнее, и это не компьютер — это сервер.

Контртренд против облачных цен существует. Отличные открытые модели существуют и бесплатны. Но пока выглядит так: подписки дорожают, а железо для обычного пользователя — не купить.

@gostev_future

👍9😭2

704 views06:05

Гостев из будущего

Агент Смит в корпоративной Матрице

Deloitte: 74% компаний глобально планируют внедрять агентный ИИ в течение двух лет. Сегодня таких — около 23%.

Слово “планируют” здесь важно. Именно планируют — не внедрили, не считали экономику. Примерно столько же компаний в 2021-м планировали серьёзно заняться метавселенной.

Логика волны понятна. Чат-бот отвечает. Агент делает.

После двух лет игр в “спроси у ИИ что угодно” бизнес хочет услышать “ИИ сделает работу за тебя”. Поэтому в 2026-м агенты появляются везде — в поддержке клиентов, продажах, финансах, найме, безопасности, закупках.

Но массовая реальность будет прозаичнее. Большинство “агентов” окажутся сложными скриптами автоматизации с языковой моделью внутри: получить запрос → классифицировать → вызвать инструмент → отправить человеку на подтверждение.

Раньше это называлось автоматизацией. Теперь — агентный ИИ.

В 2027-м корпоративные заказчики начнут душнить скучными вопросами:

— Что агенту разрешено делать?
— Кто проверяет его действия?
— Где логика принятия решения?
— Можно ли воспроизвести ошибку?
— Кто отвечает, если он сделал не то?

Последний вопрос сломает больше всего отношений с поставщиками. Самого агента к ответственности не привлечёшь. Но можно привлечь того, кто дал ему права, встроил в процесс или нажал “одобрить”, не понимая последствий.

Кто сейчас на рынке

Реально покупают агентов те, у кого уже куплена платформа. Salesforce с момента запуска закрыл более 29 000 сделок по Agentforce, ARR продукта достигла $800 млн, рост — 169% год к году. Microsoft заявил о 15 млн платных мест Microsoft 365 Copilot. SAP, ServiceNow, Adobe — все встроили агентов в существующие системы, а не продают отдельно.

Агент — это новый модуль в старой подписке.

Побеждает не тот, кто сделал самого умного агента, а тот, у кого уже есть контракт, данные клиента и место в его процессах. Новый игрок без базы продаёт в разы тяжелее.

Кто выиграет

Инфраструктурный слой: журналы действий, управление доступом, мониторинг, контроль затрат. Скучно, но с долгосрочными контрактами.

Отдельно — кибербезопасность для агентов. Раньше управляли доступом людей, теперь нужно управлять доступом машинных агентов, которые работают круглосуточно.

Нужен будет мониторинг их действий в реальном времени — что-то вроде EDR/SIEM для автономных процессов: что агент видел, какие инструменты вызывал, какие данные трогал и кто дал ему право это сделать.

Узкие вертикальные решения. Агент для одной отрасли с понятной зоной ответственности побьёт универсального “цифрового сотрудника”.

Кто проиграет

Продавцы универсальной автономности. “Модель так решила” — не ответ для корпоративного договора.

Консалтинговые компании, продавшие агентные проекты на фиксированных бюджетах без учёта стоимости ошибок и ручного вмешательства.

Компании, срезавшие найм под обещание агентов. Агент ошибётся, человека уже нет, экспертизу быстро не восстановишь.

Интересная ставка на горизонте двух лет — первый страхуемый агент. Когда страховщик готов взять на себя риск его действий — значит рынок научился измерять этот риск.

До этого момента — практический совет: если вам продают агента и не могут ответить на вопрос “кто виноват при ошибке” — это ещё не продукт. Это демо.

@gostev_future

🔥9👍2❤1

672 viewsedited 06:17

Гостев из будущего

OpenAI выпустил план из 5 пунктов по киберзащите.

Главный тезис: ИИ уже используется в кибератаках — ограничивать его для защитников бессмысленно, потому что злоумышленники всё равно возьмут всё доступное.

Единственный ответ — вооружать доверенных защитников быстрее, чем противники успевают адаптироваться.

Вот 5 столпов плана OpenAI:

1. Демократизация киберзащиты
Открывают доступ к специальным версиям моделей с ослабленными ограничениями для всех верифицированных уровней власти — от федеральных агентств до местных органов. Раньше программа Trusted Access for Cyber была доступна лишь избранным партнёрам.

2. Координация между правительством и индустрией
Единое понимание угроз, ускоренный обмен разведданными, подключение к уже существующим государственным каналам киберзащиты и реагирования на инциденты.

3. Безопасность вокруг продвинутых ИИ-возможностей
Модели уже достигли уровня, при котором могут создавать рабочие zero-day эксплойты против хорошо защищённых систем. OpenAI планирует каждый новый релиз оценивать как потенциально «высокоопасный» по Preparedness Framework.

4. Видимость при развёртывании
Доступ к более разрешительным моделям (GPT-5.4-Cyber) сопровождается ограничениями — в частности, нельзя использовать Zero-Data Retention там, где у OpenAI меньше прямой видимости в пользователя и цель запроса.

5. Защита рядовых пользователей
Кибербезопасность не должна быть уделом только государств и крупных корпораций — миллионы пользователей уже применяют ChatGPT для проверки подозрительных сообщений, и OpenAI хочет расширить эти инструменты для домохозяйств и малого бизнеса.

Важный контекст — позиция Anthropic vs OpenAI:
Anthropic выпустил модель Mythos через закрытый консорциум Project Glasswing, считая, что более осторожный подход нужен для замедления гонки вооружений. OpenAI, напротив, хочет «распахнуть двери» — считая, что нельзя резервировать защиту только для Fortune 50.

@gostev_future

OpenAI

Cybersecurity in the Intelligence Age

OpenAI outlines a five-part action plan for strengthening cybersecurity in the Intelligence Age, focused on democratizing AI-powered cyber defense and protecting critical systems.

🔥3

749 views00:54

Гостев из будущего

Вдогонку к новости выше: ChatGPT уже получает более 15 миллионов сообщений в месяц с просьбой проверить, является ли что-то мошенничеством.

Это громадная цифра и им придется реагировать — а своей экспертизы недостаточно. Значит, мой прогноз от декабря, что грядут покупки ИИ-вендорами компаний кибербеза — все реальней.

@gostev_future

💯2👍1

676 views01:19

Гостев из будущего

Спасибо за исследование рынка, дальше мы сами

Каждый день появляется новый ИИ-сервис.
ИИ для написания текстов.
ИИ для расшифровки звонков.
ИИ для обработки фотографий.
ИИ для резюме.
ИИ для составления писем.
ИИ для людей, которые устали от других ИИ.

AI-стартапы забирают огромную долю венчурных денег. Вопрос в том, куда эти деньги реально уходят.

Схема часто одна и та же. Стартап привлекает раунд. Платит за доступ к чужой модели. Покупает серверы у облачного провайдера. Тратит на маркетинг, чтобы привлечь пользователей.

Пользователи приходят — и остаются, пока функция не появилась внутри платформы, которой они и так пользуются.

Потом она появляется.

Otter, Fireflies и Grain строили бизнес на расшифровке и резюмировании совещаний. Потом Zoom, Microsoft и Google встроили похожие функции прямо в свои платформы.

Jasper привлёк $125 млн на генерации текстов поверх модели OpenAI. Потом ChatGPT стал доступен напрямую. Jasper не исчез. Но ему приходится доказывать, что он не просто удобная витрина для модели OpenAI. А это гораздо сложнее, чем расти на волне “напиши мне пост для LinkedIn”.

Помните отдельные приложения для удаления фона с фотографий? Samsung, Apple и Canva уже встроили похожие функции в стандартные инструменты.

Каждый раз деньги инвесторов к этому моменту уже потрачены.

Расчёт “нас купит гигант” — тоже ловушка. Это не всегда покупка бизнеса. Чаще это покупка людей, лицензии.

Google забрал сооснователей Character AI. Microsoft похожим образом забрал ключевую команду Inflection и поставил Мустафу Сулеймана во главе Microsoft AI.

Для основателя это иногда хороший исход.

Для инвестора — не всегда. Особенно если он входил на высокой оценке и ждал венчурные 10x.

Для сотрудников — лотерея.
Для продукта — часто конец истории.

Но транзитом проходят не только деньги инвесторов. Транзитом проходят и деньги обычных пользователей.

Человек оформляет подписку на AI-сервис за $10–20 в месяц. Пользуется полгода. Потом та же функция появляется в телефоне, браузере, почте или офисной программе.

Подписка становится ненужной.

Но данные, настройки, история и привычки остаются внутри сервиса.

Если сервис закрывается или меняет модель — переноса обычно нет. Экспорта нет. Есть только письмо “мы прекращаем работу” и кнопка “download your data”, если повезло.

Это особенно неприятно с AI-менторами, дневниками, трекерами привычек, коучами и другими сервисами, куда люди загружают не файлы, а личную жизнь.

Стартап-обёртка нужен рынку. Он первым находит сценарии, показывает спрос, придумывает интерфейсы и учит пользователей.

Он — разведка боем.

Но деньги — и венчурные, и пользовательские — часто проходят через него транзитом и оседают у тех, кто владеет моделями, облаками, операционными системами и платформами.

Разведка боем за чужой счёт.

А потом платформы говорят: спасибо, дальше мы сами.

Не все AI-стартапы обречены. Те, у кого есть собственные данные, глубокая интеграция в процесс, отраслевой контекст, безопасность, аудит или ответственность перед регулятором, могут строить настоящий бизнес.

Но для остальных главный вопрос остаётся прежним:

Почему ваш стартап это продукт, а не кнопка в чужом интерфейсе?

@gostev_future

👍13

749 viewsedited 06:26

About

Blog

Apps

Platform