Грин еще не робот 🤖 - AI vs Human
5.36K subscribers
1.02K photos
431 videos
2 files
420 links
Здесь я исследую, как ИИ, роботы и биотех постепенно превращают нас из простых смертных в нечто более продвинутое.

Серьезно-ироничный анализ , иногда немного научпопа.

Давай вместе понаблюдаем за последней битвой человечества за форму и содержание.
Download Telegram
Alibaba представила ZeroSearch — метод, который учит ИИ искать информацию без настоящих поисковиков.
Модель сама генерирует псевдорезультаты и учится на них. Постепенно уровень «шума» повышается — чтобы улучшать устойчивость к плохим данным.
В итоге:
— точность такая же или выше,
— стоимость обучения падает на 88%,
— API и внешние поиски — не нужны.

И что?
Поиск больше не нужен как инфраструктура. Его можно сымитировать внутри модели.
Если ты строишь ИИ-продукт — тебе не нужен доступ к выдаче Google, чтобы тренировать retrieval.
Если ты запускаешь свой LLM — ты можешь с нуля задать, как выглядит мир, в котором он учится.
Теперь не интернет формирует модель, а модель формирует свой интернет.
Контент, поиск, обучение — всё можно изолировать и контролировать.

Pdf в комментариях
3👨‍💻3
Быстрые как ИИ новости от 12 мая


FDA обсуждает с OpenAI внедрение ИИ в разработку и одобрение новых лекарств.
И что?
ИИ может стать частью официальной экспертизы. Для healthtech это значит новое окно: если FDA допустит модели в работу — откроется рынок инструментов под аудит, прогнозы, аналитику. Приложения с доступом к GPT могут стать стандартом для всей индустрии.

Meta вернула топа из DeepMind — Роберта Фергуса — и отдала ему весь AI-ресёрч Facebook.
И что?
Meta начинает заново. Снова делает ставку на R&D, чтобы вытащить свой стек на уровень OpenAI. Значит: появятся фонды, новые open-weight модели и усиление всей экосистемы Llama. Если ты строишь вокруг Meta — скоро будет, с кем говорить.

Amazon делает свою кодилку — Kiro. Будет с агентами, мультимодальностью и явно встроена в AWS.
И что?
Идёт война за среду разработки. Copilot, Cursor, теперь ещё и Amazon. У кого доступ к IDE — тот владеет будущим кодом. Если ты в edtech или devtools — время искать, как встроиться в рабочие потоки, пока они не закрылись.

Augment Code показали Remote Agent — агент, который продолжает писать код в облаке, даже когда ты закрыл ноут.
И что?
Следующая волна — фоновый ИИ. Не кнопка, не ассистент, а полноценный процесс. Всё, что требует внимания, устаревает. Если ты строишь AI-продукт — думай не про UX, а про «как не мешать ИИ работать».

Hugging Face выпустили агента, который умеет сам кликать, вводить и выполнять действия на компьютере — медленно, но работает.
И что?
Это зачаток нового интерфейса: агент, который делает за тебя. Сначала простые задачи — потом бухгалтерия, таблички, автоматизация рутины. Кто первым упакует это в нормальный продукт — соберёт рынок.

Shopify прокачал Sidekick: теперь он сам пишет тексты и генерит изображения для товаров.
Amazon запустил Enhance My Listing — аналогичный инструмент для продавцов прямо внутри маркетплейса.

И что?
Контент теперь внутри платформ. Всё, что ты раньше продавал отдельно, стало встроенной функцией.

Что делать, если у тебя сервис для продавцов:
— Займись мультиплатформенными панелями: один инструмент для Shopify, Amazon, Ozon, Wildberries. Продавцы не хотят прыгать между интерфейсами.
— Делай аналитику: сравнение карточек, автоматическая подмена контента, отслеживание, что реально продаёт.
— Построй систему A/B-тестов, которая работает поверх платформ: меняет текст — меряет продажи.
— Продавай стратегию, не слова. Как зайти на новый рынок, как адаптировать карточки под страну, как обойти конкурента.
— Интегрируйся через API. Не иди в лоб — стань незаметным помощником внутри Shopify, а не снаружи.


Или напиши свои идет в коментариях.
🔥41
Media is too big
VIEW IN TELEGRAM
Figma на Config показала, как ИИ превращает дизайн-платформу в полный цикл:

— Набросал макет — Figma сама пишет код и показывает живой прототип.
— Жмёшь Publish — получаешь рабочий сайт, без верстальщиков.
— Нужно лого на презентацию? Там же рисуешь кривую «от руки», ИИ доводит до чистовой.
— Баннеры, тексты, картинки для рекламы — в том же окне: нажал, получил.

И что?
Figma забирает сразу четыре ниши: Webflow, Framer, Canva и часть фронта.
Агентствам «дизайн-верстка-контент» придётся продавать стратегию, трафик и A/B-тесты, а не пиксели.
Стартапу — можно проверить спрос за день: макет → код → реклама.
Инвестору — видно, как экосистема с миллионами юзеров превращает сторонние SaaS в кнопку.
🔥84
Microsoft + OpenAI — снова за столом и снова делят деньги и доступ.

Что происходит
— Microsoft вбухала $13 B, но держит паузу: не подписывает перевод коммерческого блока OpenAI в PBC и тормозит выход в IPO.
— OpenAI хочет урезать долю Microsoft с 20 % до 10 % к 2030-му (к тому моменту у себя в модели рисуют $174 B выручки).
— OAI параллельно флиртует с конкурентами по проекту Stargate и лезет к тем же enterprise-клиентам, на которых рассчитывает Azure.
— Microsoft давит ответно: «Хотим пожизненный доступ к технологиям, иначе нет сделки».

И что?
— Партнёрство у Альтмана не очень получаются: Microsoft платит за эксклюзивность, а получает конкурента в собственном облаке.
— Если они не договорятся, OpenAI придётся искать деньги и GPU в другом месте, а Microsoft — готовить план B на базе собственного модели Phi-3 или покупки кого-то поменьше.
— Стартапам и корпам, которые сидят на Azure + OpenAI API, стоит заложить риск: ценообразование и приоритеты доступа могут резко измениться.
— Инвесторам сигнал простой: права на IP и каналы дистрибуции важнее оценок и хайпа. Кто контролирует ключ, тот контролирует рынок.
4
Быстрые как ИИ новости за 12 мая


Apple тестирует AI-поиск в Safari через OpenAI, Anthropic и Perplexity. Вместо ссылок — прямые ответы моделей.
И что?
Сайты, живущие на SEO, потеряют трафик. Кейс для медиа и сервисов: интегрироваться в ответы ассистентов через API. Для продуктов — перестать гнать людей на сайты и научиться конвертировать прямо внутри ответа.

Anthropic дал Claude доступ к «живому» интернету через Web Search API. Теперь модель сама ищет свежие факты и цитирует источники.
И что?
Любой чат-бот, аналитический сервис или саппорт может в моменте проверять факты и давать ссылки на источники.
Кейс: финтех-приложение, которое тут же сравнивает банковские условия и даёт ссылку на документ. Или юридический сервис, который сразу вытаскивает актуальную судебную практику и цитирует решения.

Google обновил Gemini 2.0 Flash: теперь можно массово генерировать картинки с чётким текстом и меньше фильтров.
И что?
Маркетинг-отделы и e-commerce получают бесплатного дизайнера в виде кнопки. Кейс: товарный маркетплейс сам генерит тысячи баннеров с актуальными ценами и скидками, экономя неделю работы и бюджет на дизайнера.

Netflix внедрил AI-поиск через OpenAI: спрашиваешь разговорно, сразу получаешь подборку.
И что?
Отказ от сложных фильтров и списков ускорит покупки и просмотры. Кейс для EdTech и SaaS: студенты и пользователи будут искать курсы и услуги не фильтрами, а запросами вроде «курс SQL для аналитика за вечер» или «CRM для салона красоты без лишних функций». Заработает тот, кто внедрит такой формат первым.

LinkedIn запустил AI-поиск вакансий на естественном языке.
И что?
Рекрутинговым платформам придётся уходить от простой выдачи и продавать аналитику: скоринг кандидатов, сравнение условий по рынку, прогнозирование карьерного роста. Кейс: внутрикорпоративная система, которая сама ищет подходящие вакансии для текущих сотрудников и помогает с внутренними перемещениями.

Ace Studio выпустила ACE-Step — open-source модель, которая за 20 секунд генерирует 4 минуты музыки с контролем структуры через текстовый запрос.
И что?
Любой сервис, где нужен уникальный саунд, получает бесконечную музыкальную библиотеку бесплатно и без лицензий.
Кейсы: приложение для тренировок делает треки под скорость и тип упражнений, рекламная сеть генерит уникальные джинглы под каждого рекламодателя, видеоблогеры и подкастеры получают музыку одним кликом. Бесплатно и с авторскими правами на нее.

В сухом остатке:

Скорее всего появилась надежда: поиск наконец станет честным и релевантным.
Компании, продающие дерьмо красивыми лендингами, вряд ли смогут продолжать в том же духе, когда пользователь будет получать
полную картину исходя из своего контекста.
Открытым остаётся вопрос — а нужно ли это людям?
4👍4🔥2
Google обновил логотип — впервые за 10 лет . Теперь логотип стал больше похож на логотип Gemini. Официально компания о смене логотипа не объявляла.

И что?
Это не редизайн. Это подмена идентичности. Google больше не про поиск, а про ИИ.
Старый логотип ассоциировался с выдачей, ссылками, браузером. Новый — с моделью.
Бренд сдвигается туда, где теперь сила: не «найти», а «сгенерировать».
💯4
Mass General Brigham показали FaceAge — ИИ, который по обычному селфи оценивает «биологический возраст» и точнее прогнозирует, сколько пациенту с раком осталось.

Почему этому модно доверять:

— Модель натренировали на десятках тысяч лиц, научили считывать микроморщины и текстуру кожи.
— В среднем онко­пациенты выглядят на 5 лет старше паспорта; чем выше FaceAge, тем короче выживаемость.
— Врачам дали риск-скор FaceAge + клинические данные — позволило точнее угадывать, дотянет ли пациент до полугодового контроля;
— Предсказания бьются с экспрессией «гена старения» CDKN2A — то есть модель ловит то, что не видно специалисту.

Что изменится в нашей жизни если все получится

Раньше онколог смотрел на фото пациента, пожимал плечами и ставил галочку — «выглядит усталым». Теперь прогноз 🪦

У клиники было — биопсия, КТ, неделя ожидания. Стало — фото на приёме, и система сразу подсвечивает, нужен ли этот набор или пусть идет домой.

У страховщика был паспортный возраст и анкета «курили — не курили». Стало — объективный фотоскор, и база для расчета тарифа.

У фармы был отбор в испытания по дате рождения. Стало — критерий «стареешь быстрее нормы», значит, терапия покажет реальный эффект.

И что?

Любое фото — паспорт, пропуск в офис, случайный сторис — превращается в медицинскую карту.
HR увидит, как быстро вы стареете под стрессом. Страховая — пересчитает тариф. Дейтинг-апп подскажет, сколько лет осталось вашему метаболизму.
Камере будет достаточно секунды, чтобы выдать диагнозы, о которых вы ещё не догадываетесь.

Готовы жить в мире, где внешность читается точнее, чем анализы?
8🤪1
Media is too big
VIEW IN TELEGRAM
Tesla выложила новое видео — Optimus танцует так, будто учился у Boston Dynamics.

Трос на поясе — страховка, всё остальное-— чистое RL в симуляции, потом «залито» в железо. Милан Ковач - руководитель направления роботов.


- Движения тренируются в облаке, прошиваются сразу на весь парк.

- Маск целит 10 000 ботов к 2025-му, цена < $20 000 при миллионной серии.


И что?

Бизнес
Робот становится платформой: новые жесты загружаются файлом. Завод платит подписку, а не интегратору-программисту.

Производство
Сначала «танец» → завтра хватание коробок → послезавтра сборка электроники. Стартапы могут продавать готовые motion-сценарии — «упакуй», «инспектируй», «таскай».

Инвесторам
10 000 ботов × даже $100 за месячное обновление движений = $12 млн ARR на ровном месте. Расти будут сенсоры, модульные «руки», маркетплейс движений.

Жизнь
Версия сегодня — шоу. Версия завтра — рабочая смена на конвейере. Робот обновляется, как смартфон: процессов менять будем мы, а не он. Готовы?
👍54
Четыре студента из MIT в 2022-м решили, что IDE — тормоз, если модель уже знает весь GitHub. Собрали грубый плагин, который понимал контекст файла и дописывал функции. Назвали Anysphere, показали OpenAI — те с ходу вложили $8 млн и дали доступ к приватным весам. Переименовали плагин в Cursor и за полгода догнали Copilot по качеству автодополнения, но добавили поиск по коду и «объясни, что тут происходит» в один клик.

Дальше всё на ускорении:

• весна-2023 — публичная бета;
• осень-2024 — $60 млн, оценка $400 млн;
• декабрь-2024 — $105 млн, $2,6 млрд;
• апрель-2025 — $900 млн, $9 млрд.

Команда — 35 человек, маркетинг ≈ нулю: продукт разлетелся по Slack-чатам инженеров. Сегодня Cursor генерит миллиард строк кода в день и висит в тулбаре у Spotify, Stripe, Midjourney.

И что?

1. Скорость разработки стала переменной → идея превращается в MVP за неделю.
Можно повторить: AI-генератор автотестов; «одно предложение → Terraform для кластера»; миграция легаси-SQL в современный ORM.

2. Рынок переносит ценность с manpower на workflow.
Можно повторить: вертикальный CI/CD для геймдев-студий, где билд, тест и релиз описаны на естественном языке; дизайнерская Figma-плагин-кнопка «сверстай и задеплой».

3. Технический барьер входа исчез.
Можно повторить: нишевой SaaS, где главная боль не код, а домен — например, «AI-аудитор GDPR» для европейских SMB; платформа, которая конвертирует клинические протоколы в API-эндпоинты для health-apps.

4. Деньги идут к скорости. Инвесторы видят траекторию Cursor и готовы ставить на команды < 10 человек, если кривая ретеншн растёт быстрее burn rate.

И что?(продолжение) : кто использует AI не как фичу, а как двигатель разработки, может за два года вытянуть идею из спальни до много-миллиардной оценки. Главное — выбрать узкую боль, убрать всё, кроме core-workflow, и дать модели писать грязную работу.
🔥11👨‍💻3
Быстрые как ИИ новости за 13 мая

SoftBank притормозил обещанные $100 млрд для гигантского дата-центра Stargate, который OpenAI хочет строить в США.
Первая трещина в мантре «денег на ИИ сколько угодно». Японцы боятся пошлин на оборудование и взлетающих цен на энергию и охлаждение.

И что?
Инфраструктура выходит на передний план: кто поможет снизить CAPEX (модульные ЦОД, жидкостное охлаждение, дешёвая “зелёная” электроэнергия) — получит контракты раньше «ещё одной LLM».

Google DeepMind запустил AI Futures Fund. Стартапам дают чек, инжиниринговую команду и доступ к закрытым моделям Gemini. Это альтернатива фонду OpenAI.

И что?
Если у вас проект про сложную робототехнику, RL или multi-модальные агентов — можно торговаться: Compute-for-Equity вместо «покупать GPU на чёрном рынке».

Perplexity (поисковик-ассистент, который сразу отвечает, а не сыплет ссылками) поднимает $500 млн с оценкой $14 млрд.
Компания выросла из «умной Википедии» в сервис, где остаются искать даже профессионалы.

И что?
Контент-экономика смещается: важен не поток кликов, а доверие к ответу. Медиа и SaaS-доки должны интегрироваться как «проверенный источник» — иначе есть риск потери аудитории.

FDA (американский регулятор лекарств) разворачивает ИИ по всей структуре до конца июня.
На пилоте задачи, которые занимали у экспертов три дня, сократились до минут.

И что?
Health-стартапы получают шанс пройти регистрацию быстрее — если умеют упаковать данные в машинно-читаемый вид. Нишевые продукты которые можно собрать: генератор досье для препарата, AI-помощник по клиническим данным, симулятор отчётов для фармы.

Саудовская Аравия объявила Humain — национальную AI-платформу под крылом крон-принца.
Цель — стать ближневосточным хабом ИИ, как ОАЭ с Dubai-AI.

И что?
Бюджет у Королевства традиционно «сколько нужно». Появится спрос на арабские LLM, локальные финтех-KYC, gov-чаты. Под арабский мир мало готовых решений — низкая конкуренция, быстрые пилоты. Нет планов и обязательств, пакуйте чемоданы и за деньгами.

Carnegie Mellon выложил LegoGPT — модель, которая по тексту собирает устойчивые конструкции из кубиков.
Это не игрушка, а демонстрация пространственного «мышления» модели.

И что?
Далее это — 3D-конфигураторы мебели, упаковки, роборуки для быстрой сборки. B2B-дизайн-платформы могут дать клиенту возможность описать изделие словами — остальное сделает AI.



В сухом остатке

Деньги всё ещё дают, но инфраструктура стала узким горлышком. Регуляторы и государства строят свои стеки, а поиск уплывает к ответ-ассистентам. Зарабатывать будут те, кто:

1. снижает цену вычислений,
2. превращает регуляторные данные в машинный формат,
3. локализует модели под новые рынки,
5👍1
Инженер с 20-летним стажем, $150 k в год.

2008 — вылетает после краха ипотечного рынка.
2020 — под раздачу ковид-сокращений.
2024 — последняя точка: компанию перекраивают под AI-стек, место seniorа занимает модель.
800 откликов → 0 офферов.

Сейчас он развозит заказы из трейлера и говорит: «Обесценивание профессий доберётся до всех».


И что?

1. Опыт в строках, а не в решениях, обнуляется.
Если ваш скилл = «знаю синтаксис и паттерн», модель знает его лучше и дешевле.

2. Кризисы стали циклом апдейта.
2008 — финансы, 2020 — удалёнка, 2024 — ИИ. Каждые ~7 лет рынок сносит слой специалистов, которые не успели переупаковать ценность.

3. Тихая жизнь — не стратегия.
Пока вы «пересматриваете путь», модель обучается на вашем публичном коде и блогах.

4. Что делать разработчику, чтобы не оказаться в трейлере?
– Превращать навыки в продукт: плагины, API-надстройки, микросервисы с обороткой.

– Брать на себя результат целиком (метрика бизнеса), а не коммиты.

– Учиться продавать: идея-→-прототип-→-пилот, а не «выполнил задачу из Jira».

– Диверсифицировать доход: консалт, ревшэр, доля в стартапе, а не ставка «full-time и всё».

5. Для основателей и инвесторов.

– Игроки, которые предлагают «AI как удочка, а не рыба», будут расти: обучение моделей на данных клиента, интеграция с legacy, guardrails.

– Рынок труда провиснет: найдутся таланты без работы — наймите их под ревшэр до того, как они уйдут в курьеры.

Линия проста: навыки, которые не масштабируются самим специалистом, масштабирует рынок без него.
👍74
Windsurf (бывший Codeium) всегда жил поверх чужих LLM: брал GPT-4 / Claude, заворачивал в удобную IDE и продавал «код-ассистента». На прошлой неделе просочилась новость, что OpenAI готов отдать за сервис $3 млрд — крупнейшая покупка в их истории.

И вот через пару дней Windsurf выкатывает собственный двигатель: линейку SWE-1.

Компания говорит так:
- SWE-1 full достанется платным пользователям и в внутренних тестах уступает только «фронтиру» (Claude 3 Sonnet, GPT-4o).
- SWE-1 lite уйдёт всем бесплатно вместо старой Cascade Base.
- SWE-1 mini можно крутить локально, чтобы ИИ не видел корпоративный код.


Ключевое отличие — модель обучали не просто дописывать функции, а «жить» во всём цикле: редактор, терминал, браузер. Под это придумали flow awareness: ИИ ведёт единую хронологию действий, поэтому разработчик может бросить задачу и вернуться без потери контекста, а агент — подхватить работу дальше.

И что?

Для CTO-команд
- Сценарий “смена-бот” Ставите SWE-1-lite в тестовый репозиторий: бот закрывает мелкие баг-фиксы и правит конфликты мерджей ночью → утренний стендап короче, релиз не откладывается.
- On-prem режим SWE-1-mini запускается локально; значит, можно подключить AI к приватному монолиту без вывоза кода в облако и не спорить с информационной безопасностью.

Для стартапов-интеграторов
- Сервис “Flow plug-in” Подвязываете метрики CI/CD к тайм-линии модели → авто-онаружение узких мест (долгие тесты, ручные проверки, медленные билд-степы). Клиент получает сокращение Lead-time, вы — ежемесячную плату за отчёты.
- Магазин motion-скриптов (по аналогии с marketplace Copilot) — продаёте готовые “рецепты” действий для SWE-1: миграция с Jest на Vitest, настройка Terraform, генерация e2e-тестов Playwright. Раз поменяли → тысяча команд скачали.

Для продуктов
- Feature-flags без рук Модель видит, что фича застряла в ревью, и сама подсвечивает нужный киш-код, предлагает тест и правку. Ваша команда тратит часы, а не дни.
- Документация из истории чата Flow awareness хранит контекст — эти данные можно выгружать в Confluence: “как и почему здесь принято решать задачу”. Экономит онбординг junior-инженеров.

Для инвесторов
- Смотрим на компании, которые снижают compute-cost (оптимизация inference, кастомные GPU-дашборды) или расширяют горизонт применений (security-сканер на базе SWE-1).
- Чисто «UI-клонам Copilot» пора проходить мимо: без собственного движка и оффлайн-варианта вы будете конкурентом, а не партнёром крупнейших LLM-провайдеров.

Для специалистов
- Если ваша ценность — «пишу код по ТЗ», готовьтесь к ценовому давлению.
- Если умеете формулировать задачу, разложить фичу на подзадачи, взять ответственность за метрику — модель станет вашим мультипликатором.
👍65
Год назад Gemini жил в браузере — тихий чат-бот рядом с поисковой строкой.

Теперь гугл рассказал "что было дальше"

Gemini станет единой мозговой прослойкой для всего, где крутится Android.

Схема релизов простая:
сначала — часы на Wear OS: летом спрашиваешь на бегу «нормален ли мой пульс?», ответ — прямо в наушник;

следом — Google TV: «хочу фильм про стартапы, меньше 2 ч» — получаешь плей-лист без меню;

потом — Android Auto: ассистент читает почту, ищет зарядку, перестраивает маршрут;

финал — грядущая XR-гарнитура, где все жесты и голос сразу понимает Gemini.

И что?

1. Один ассистент → сквозная работа. Пользователь, привыкший к Gemini в машине, автоматически ждёт те же функции на ТВ и часах. Кто делает сервисы для Android-экосистемы, должен готовить “Gemini-Action” вместо отдельного навыка под каждое устройство.

2. Новые «точки захвата» бизнеса.

Fitness-приложение: тренер на часах разговаривает, на ТВ показывает форму, в машине подскажет, что купить в спортпите по дороге.

EdTech: урок начинается на диване, продолжается в XR, тестируется голосом в авто.

3. Продуктовый сдвиг: UI → intent-слой.
Владельцу контента нужно не приложение, а семантическая интеграция: фильм, товар, курс должны находиться по описанию, а не по клику.

4. Для инвесторов.
Спрос уход в сторону “AI-middleware”: компании, которые упакуют сервисы в форматы intent-/ action-Gemini, будут покупать экосистема-партнёры быстрее, чем классические мобильные студии.

Самое главное зачем вы это прочитали: пока Apple только намекает на «Siri-2», Google кладёт LLM-ядро под весь Android-парк. Кто встроится в эту прослойку первым, получит пользователя везде — от запястья до лобового стекла.
9👍6🔥3
Пятьдесят лет назад двое молодых математиков спорили за кофе и нашли хитро́сть: матрицы можно перемножать семью умножениями вместо восьми. Формула Штрассена мгновенно перекочевала в учебники, а потом в каждый видеочип. Благодаря ей ускорились графика, обработка сигналов, тренировка нейросетей — всё, где крутятся огромные массивы чисел.

С тех пор рекорд не двигался: лучшие умы перебрали все понятные приёмы, а ручной перебор новых идей занял бы годы. При этом вокруг лежат десятки похожих задач — расписания серверов, оптимальные маршруты, загадки теории чисел — и все упёрлись в потолок «человеческой смекалки».

Чтобы потолок снова треснул, в Google собрали агента AlphaEvolve. Он работает как электронный селекционер. Gemini Flash сочиняет сотни крошечных программ-идей, Gemini Pro тут же гоняет их на тестах, слабые отбрасывает. Выжившие куски кода «скрещиваются», параметры слегка мутируют — и цикл повторяется всю ночь без участия людей.

Первый выхлоп: агент сократил ещё одну операцию в алгоритме Штрассена. Для дата-центров это сразу минус киловатты и короче время обучения моделей. Дальше цепная реакция: AlphaEvolve придумал расписание, которое загрузило серверы Google на 0,7 % плотнее; на критичном ядре тренировки Gemini выжал 23 % скорости; в макете будущего TPU нашёл короче проводники и проверил, что всё компилируется.

Чтобы проверить, не счастливый ли это случай, агенту дали пять десятков открытых математических задач из геометрии, комбинаторики и теории чисел. В трёх из четырёх кейсов он воспроизвёл лучший мировой результат, а в каждой пятой задаче улучшил рекорд: например, разместил 593 сферы в 11-мерном пространстве, подняв знаменитый «kissing number», и нашёл короче Голомбову линейку на 29 отметок.

И что?

ИИ перестаёт писать код «как человек» и начинает добывать проценты роста прямо из математики.

— Бизнес может сэкономить на железе и штатах PhD: запустить цикл эволюции на паре A100 дешевле, чем строить новую серверную.
— Продукты, чей selling point — «мы оптимизируем графики и расписания», услышат вопрос: почему не AlphaEvolve?
— Инвестору стоит смотреть на команды, которые умеют скрещивать алгоритмы, а не только прикручивать готовые модели. Настоящая альфа теперь сидит в формуле, которая режет издержки, а не в очередном дэшборде.

PDF в коментариях
🔥195👍5
Пять лет назад Google выложил в open-source трансформер и случайно нажал кнопку «пуск» для всей сегодняшней ИИ-гонки.
У них — полный набор победителя: 136 млрд кликов в месяц в поиске, 73 млрд просмотров на YouTube, собственные TPU-фермы, армия ресёрчеров. Даже «папа ИИ» Джефф Хинтон долгие годы сидел у них в офисе.

Но вся эта мощь обслуживала рекламу: каждая ссылка и каждый ролик должны приносить клик. Пока внутри пересчитывали CPC, OpenAI показал окно «спросил → получил ответ» — без кликов и баннеров. У Google есть Gemini, но его держат на поводке: честный ответ не продаёт рекламу. История знает подобные сюжеты: Nokia берегла кнопки, Kodak — плёнку.

И что?
• Предпринимателям: любую нишу из поиска можно вырезать и отдавать ответ сразу. Пользователь уже готов к zero-click сервисам.
• Маркетологам: классическое SEO и баннеры тают. Готовьтесь работать там, где продажи идут без перехода на сайт.
• Инвесторам: ставьте на команды, которые обходят страницу поиска. Если Google не сломает модель «клик → деньги», его рекламный триллион уйдёт к тем, кто отвечает без посредников.
👍8
Два года назад Codex научил Copilot подсказывать строчки кода. Сегодня OpenAI выкатывает Codex-Agent — уже не подсказчик, а удалённый «мидл», который сидит в отдельной облачной песочнице и параллельно делает несколько задач сразу. Его ядро — codex-1, версия модели o3, натасканная только на софт-инжиниринг.

Как это выглядит в деле
ты пушишь в репозиторий AGENTS.md — там пишешь: «при добавлении фичи обновляй тесты, следуй нашему линтеру, не трогай legacy-папку». Codex-Agent читает инструкцию, лезет в изолированный контейнер, пишет новую функцию, фикстит баг, запускает тест-раннер и в конце выдаёт diff. Всё без доступа к продовому ключу и без рисков уронить деплой.

Пока агент доступен Pro-, Enterprise- и Team-пользователям ChatGPT. Дальше будет тариф по лимиту запросов: надо больше параллельных задач — докупаешь слоты.

И что?

— Тимлиду: можно делегировать рутину — миграции, регрессы, документацию — и оставить людям продуктовую логику.
— Стартапу: один разработчик + Codex-Agent = мини-команда, которая закрывает хвосты и держит velocity.
— CTO-инвестору: следи за бюджетом CI/CD — если агент справляется, резать аутсорс проще, чем нанимать ещё одного джуниора.

Почему это стыкуется с покупкой Windsurf за $3 B? Всё просто: Codex-Agent живёт в облаке и пишет код, а Windsurf — уже встроен в IDE тысяч разработчиков. OpenAI берёт канал к клавиатуре и тут же подсовывает своего облачного коллегу. Код появляется в песочнице, прыгает в IDE Windsurf, а GitHub остаётся смотреть со стороны.
👨‍💻2
Осень 2007-го. Два дизайнера из Сан-Франциско надувают три матраса в своей гостиной, ставят простенький сайт и предлагают ночлег за 80 долларов тем, кто не нашёл номера на конференцию. Через неделю у них первые трое постояльцев, через год — тысячи объявлений по США, а ещё через пару лет гостиничные сети вводят собственные сервисы «дом для отдыха», понимая, что привычка «снять номер» сменилась на «снять чью-то квартиру». Мини-команда показала: достаточно пары точных шагов, чтобы тихо сдвинуть норму целого рынка.

Небольшая группа способна менять правила, даже если речь идёт о совсем простых цифровых существах. Учёные из Университета Лондона проверили это на сотне автономных ИИ-агентов.

Как шёл эксперимент
1. Агентов посадили в общий чат-«комнату».
2. Каждый раунд случайную пару просили придумать слово-метку для одного и того же объекта. Совпали — оба получают очко, промахнулись — штраф.
3. Память у бота минимальная: он хранит два последних удачных слова. Никакого координатора или «главного» нет.

Спустя примерно 200 раундов почти все агенты уже использовали одну и ту же метку — общий язык возник самостоятельно. Затем в систему добавили пятёрку упорных «новичков», которые писали другое слово. Через 40 раундов новая метка стала нормой для всей сотни.

Это показало две вещи:

- коллективные правила формируются без центра управления;

- маленькая, но настойчивая подгруппа может повернуть этих правил в свою сторону.


И что?

Для разработчиков продуктов
Если в вашем сервисе живут боты-агенты (торговые, рекомендательные, игровые), они способны сами придумать «сленг» взаимодействия. Полезно строить механику мониторинга: отслеживать, какие новые шаблоны решений появляются, и вовремя оценивать, безопасны ли они для пользователя.

Для кибербезопасности
Появляется задача «социального антивируса»: ловить ранние сигналы того, что маленькая группа агентов продвигает нежелательную норму (например, завышает цену или фильтрует контент). Это отдельный слой наблюдения рядом с классической защитой от взлома.

Для бизнеса и стартапов
Механизм «маленькая группа → массовый стандарт» можно использовать и конструктивно. Допустим, нужно внедрить новый протокол обмена данными в отрасли: обучаете ограниченный пул агентов работать по нему и подключаете к открытой сети. При корректной настройке наград они со временем «заразят» остальных правильным форматом без долгих переговоров.

Для инвесторов
Обратите внимание на команды, которые разрабатывают инструменты поведения и наблюдения за мульти-агентными системами: аналитика микро-трендов, раннее обнаружение «тipping-point», инструменты перезапуска культуры агентов. Эти решения станут востребованы по мере того, как компании начнут подключать ИИ-ассистентов к реальным процессам.

Ps. Прошу прощения, за очень длинный пост.
2🔥125👨‍💻1
Быстрые как ИИ новости за 19 мая

OpenAI готовит GPT-5: Codex, Deep Research, Memory и Operator сольются в одну модель.
И что? Меньше переключений разработчиков, но жёсткий lock-in: весь пайплайн будет зависеть от ценника OpenAI. У нишевых LLM-стартапов появляется ниша «анти-lock-in»-модулей.

Китай вывел первые 12 спутников «Three-Body Computing» (план — 2 800). Вычисления идут прямо на орбите.
И что? Гео-аналитика, IoT и снимки Земли получат секунды вместо минут. Всё, что экономит ватт или грамм в космосе (радиа-стойкие чипы, компактное охлаждение, edge-inference), станет горячим B2B-товаром.

Британия отказалась требовать раскрытие обучающих датасетов; Элтон Джон назвал это «кражей в особо крупных».
И что? Суды за контент усилятся, а «белые» каталоги музыки и медиа подорожают. Лицензированный датасет превращается в аргумент на переговорах с корпклиентами.

xAI откатила Grok после «несанкционированного патча», из-за которого бот зациклился на теме ЮАР.
И что? LLM-безопасность = контроль версий весов. Компаниям придётся внедрять CI/CD и логирование для моделей, иначе чужой weight-patch может незаметно исказить продукт.

Grok теперь строит графики прямо в диалоге (уже работает в браузере).
И что? Мгновенные визуализации удерживают пользователей внутри бота. BI-сервисы без instant-charts рискуют потерять аудиторию к чат-интерфейсам.

Synyi AI открыла в Саудовской Аравии клинику, где виртуальный врач сам ставит диагнозы и выписывает рецепты.
И что? Если страховщики одобрят формат, себестоимость первички рухнет. Окно для health-стартапов продавать «Software-as-Physician» на рынках GCC.

Университет Токио показал микроскоп-ИИ, который видит образование тромбов в реальном времени во время обычного анализа крови.
И что? Диагностика переходит из «сдать — ждать» в «увидеть сразу». Производители реагентов смогут продавать умные одноразовые наборы по подписке, вытесняя громоздкие приборы.
👍7
Быстрые как ИИ новости. Сделал покороче. Как вам?
Anonymous Poll
58%
Короче - лучше 🔥
39%
Лучше как было🤔
3%
Напишу в коментариях ✏️
👨‍💻3