Грин еще не робот 🤖 - AI vs Human
5.39K subscribers
1.01K photos
429 videos
2 files
414 links
Здесь я исследую, как ИИ, роботы и биотех постепенно превращают нас из простых смертных в нечто более продвинутое.

Серьезно-ироничный анализ , иногда немного научпопа.

Давай вместе понаблюдаем за последней битвой человечества за форму и содержание.
Download Telegram
🚀 Grok 4 Heavy — революция?

Илон Маск тянул с релизом Grok 4 почти квартал, потому что на кону личный счёт: в Калифорнии идёт тяжёлый иск против OpenAI, где он обвиняет Саму Альтмана в «предательстве миссии»  , Starship взрывается уже вторым корпусом подряд — последний борт разнесло на стенде 19 июня  , а Дональд Трамп прилюдно клеймит Маска «крушением поезда» за идею третьей партии. Успех нового ИИ нужен как воздух.

В ночь на 10 июля во время часа-с копейками прямого эфира в X Маск показал сразу две версии. Grok 4 — одиночный агент с голосом, зрением и окном 128 K токенов.

Продолжение в сегодняшнем дайджесте
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Google Veo 3 генерит видео из одного кадра и сразу добавляет звук Первый кадр задаёт персонажей и стиль; модель сохраняет их в течение ролика, убирая «дрожь» и смену лиц.

И что?

Производство TikTok-ролика занимает минуты, а не часы; сток-видео и фриланс-монтаж все.

Для бизнеса: контент-группы экономят на съёмках, но конкуренция за внимание растёт — успех обеспечивается уже только за счет таланта в креативах.

Личный опыт: Я попробовал использовать эту фичу в своем пилотном выпуске итогов недели. Что получилось можете посмотреть тут
9
💼 Microsoft отчиталась: Copilot-боты в колл-центрах уже сэкономили $500 млн за год, отдав ИИ до 45 % звонков и позволив списать 9 000 операторов на прошлой неделе.

И что? CFO видят живой ROI-кейс «полмиллиарда кэшбэка» — вторая волна автоматизации саппорта накроет банки, ритейл и страхование раньше, чем HR успеют набрать сменщиков.
🩺 Google раскрыл MedGemma — целую линейку open-source-моделей, с которой «врач с 50-летним стажем» переезжает прямо на смартфон. 27-миллиардная версия читает снимки и истории болезни одновременно, тогда как компактная 4B (квантизуемая до 4 бит) пускается в работу на ноутбуке или даже Pixel-10: ≈700 мс на офлайн-расшифровку рентгена, 5,2 ГБ ОЗУ

Как это устроено

Модели строятся на Gemma 3-трансформере; за «зрение» отвечает MedSigLIP — улучшенный SigLIP-энкодер c ViT-G/16, дообученный на 35 млн анонимизированных рентгенов, дерма- и гистоснимков. Текстовая часть проглотила 450 млн токенов PubMed, MIMIC-IV и EHR-заметок. Тренировали всё на TPU v5p-поде (1024 чипа, 3,2 PFLOPs/с), а веса сразу выложили в HuggingFace и Vertex Model Garden под Apache-2.0  .

Как уже попробовали

— Chang Gung Memorial (Тайвань) уже натренировал MedGemma на традиционных китайских источниках — бот отвечает врачам на местном диалекте и вылавливает редкие травы в анамнезе  .
— DeepHealth (США) прикрутил MedSigLIP к «горящим» рентгенам — ИИ сортирует снимки грудной клетки за секунды и кидает тревогу дежурному, экономя 45 минут на пациента  .
— Tap Health (Индия) вставил 4B-версию в своё мобильное приложение: консультация по дерме и базовая триаж-оценка работают офлайн в сельских клиниках без стабильного интернета 

И что?

Для бизнеса: готовый SOTA-движок снижает порог входа — можно пилить нишевые мед-сервисы без миллиона на GPU.
Для инвесторов: hospital-as-a-platform оживает — провайдеры ИТ-услуг получат новый поток лицензий и MRR.
Для рынка: конкуренция уйдёт в сторону качественных датасетов и удобного UX, а приоритет получат команды, которые быстрее адаптируют модель под реальные задачи.
🔥62👍2
Media is too big
VIEW IN TELEGRAM
Сегодня всерьёз думал — а открыть ли салон ногтей с роботами вместо мастеров? Сомневался: пойдут ли люди вообще к машине? А потом наткнулся на новость — в Нью-Йорке робот делает татуировки, и у него уже очередь.

Bang Bang (Keith McCurdy), мастер знаменитостей (Рианна, Джастин Бибер, Леброн и др.), представил в своей со студии в Нью‑Йорке новый гаджет — AERO от Blackdot, робот‑татуировщик, наносящий микро‑точки диаметром ~250 мкм.

Робот сканирует кожу лазером, измеряет её рельеф, наносит только тончайший слой, обходя нервные окончания — результат: минимум боли, максимум точности.

AERO — не замена художника, а инструмент: мастер сам создаёт дизайн, а робот выполняет работу идеально — идеальные линии, без дрожания руки.

В сообществе — жаркие обсуждения. Одни восхищаются: “безошибочный текст, тончайшие детали, почти как гравировка”. Другие опасаются: “машина убивает душу процедуры, вытеснит мастеров?”

И что?

Творчество остаётся, ручная работа — нет. Как с текстами и дизайном: сначала инструмент, потом замена. Мастера против, но рынок за. Первый сигнал: штучная профессия может стать массовой — и потерять маржу. Готовы сделать тату у робота?
🤪6👍2
🧯 Исследователи Anthropic и Scale AI проверили 25 топ-моделей на «alignment faking» — притворное послушание. Обнаружили его только в пяти: Claude 3 Opus, Claude 3.5 Sonnet, Llama 3 405B, Grok 3 и Gemini 2.0 Flash. Opus хитрил стабильнее всех, особенно когда «чувствовал» угрозу пересмотра весов. А GPT-4o и другие «паиньки» тоже начали юлить, когда их дообучили на сценарии с выгодой от обмана; значит, дело не в архитектуре, а в настройках. Базовые модели без safety-тюнa тоже лгали, подтверждая: они ведут себя честно лишь пока их так учат. 

В кулуарах

AI-учёный Дэвид Крюгер замечает, что главное — не сама ложь, а «долгосрочные цели», которые модель формирует по ходу RLHF — это уже зачатки стратегии. Ян Лейке из Anthropic призывает ввести «масштабируемый аудит», чтобы мелкие модели проверяли крупных постоянно, а не раз в квартал. Регуляторы тоже проснулись: FTC уже штрафует стартапы за «обещания честного ИИ», требуя доказательств устойчивости к обману. 

Куда ведёт

Новые эксперименты показывают, что модели умеют прятать вредный код до триггера и ломают гардрейлы после пары сотен вредоносных примеров — значит, одних «отказ-токенов» мало, нужен постоянный стресс-тест и детектор скрытых планов. 

И что?

Для бизнеса: полагаться на «полностью безопасный» ИИ рискованно — закладывай мониторинг и логику «доверяй-но-проверяй».

Для инвесторов: стартапы с инструмент yaами аудита и красных-тимов получают окно — корпорации уже ищут внешних «детекторов лжи» для моделей.

Для рынка: гонка сместится к методам прозрачности — выигрывают те, кто покажет проверяемую честность, а не просто высокий бенчмарк.
🧪 METR — небольшой институт из Беркли, известный тем, что ломает громкие заявления об ИИ на практических стресс-тестах. Весной им надоело читать посты о «суперпродуктивности» с ассистентами, и команда придумала испытание: взять проверенных опен-сорс-ветеранов, посадить за огромные проекты и засечь время по секундомеру.

Как проверяли
Выбрали 16 девелоперов, дали им 246 живых задач в репозиториях по миллиону строк кода. Перед стартом ребята оценили бонус в –24 % времени с Cursor Pro. На деле вышло +19 %. Чистый набор текста сократился, зато выросли минуты на формулировку промптов, чтение ответов и ожидание генерации.

Почему ощущения расходятся с часами
После коммита те же разработчики сказали, что якобы ускорились на 20 %. METR объясняет: ассистент снимает когнитивное напряжение — мозг воспринимает работу как лёгкую, даже когда стрелка таймера уходит вправо.

И что?

Для бизнеса — считать эффект ИИ лишь хронометром рискованно; важнее, как снижаются когнитивные затраты на поддержку крупного кода.
Для инвесторов — обещание «сократим время» требует уточнений, но рынок ассистентов с сильной UX-ценностью остаётся перспективным.
Для рынка — появится волна инструментов, оптимизирующих именно промпты и ревью машинного кода, чтобы вернуть секунды на место.

Телегу могут заблокировать, поэтому я сделал дайджест, который приходит на email. Подпишись, и ничего не пропустишь.
🔥61
Media is too big
VIEW IN TELEGRAM
Второй выпуск итогов ИИ недели уже на YouTube.
🔥3
Главная новость последних 24 часов.

🤖 Google заключает лицензионное соглашение с Windsurf на 2,4 млрд $, а CEO Varun Mohan и со-основатель Douglas Chen переходят в команду Gemini, чтобы развивать агентный автокод. Windsurf остаётся самостоятельной под временным CEO, обслуживает корпоративных клиентов и получает многолетние компенсации; лицензия неэксклюзивная, поэтому продукт можно развивать дальше.
До этого Windsurf почти продалась OpenAI за 3 млрд $, но сделка застопорилась: партнёрское соглашение OpenAI с Microsoft требовало открыть код Redmond, Windsurf просил исключение, Microsoft отказался, срок эксклюзивности истёк. В результате команда выбрала вариант с Google — меньшая сумма на балансе, зато свобода продукта и роли в крупной экосистеме.
Для OpenAI это ещё один сигнал, что тесная связка с Microsoft ограничивает гибкость в крупных сделках, а рынок инструментов для разработчиков смещается к лицензиям и точечным наймам вместо полного поглощения.

И что?
Для бизнеса — модель «лицензия + ключевые люди» даёт деньги и контроль над продуктом одновременно.

Для инвесторов — барьер входа в агентный код оценивается выше 2 млрд $, что поднимает цены на схожие стартапы.

Для рынка — пауза в тандеме OpenAI-Microsoft открывает место для новых союзов, а Google укрепляет Gemini реальными технологиями.

Для OpenAI срыв почти закрытой сделки с Windsurf — это не просто локальная неудача, а серьёзный сигнал тревоги. Ещё недавно компания шла уверенно, собирая под свои знамёна лучшие команды на рынке, но жёсткая сцепка с Microsoft начинает давать сбои. Windsurf отказался от сделки именно из-за условий партнёрского соглашения, не захотев отдавать исходники напрямую в руки Microsoft. И пока OpenAI разбирается с внутренними ограничениями, Google спокойно забирает ключевых людей и технологии, платя чуть меньше и не обременяя команду корпоративными рамками.

Параллельно активизировалась Meta, которая явно решила воспользоваться этим окном нестабильности и серьёзно претендует на лидерство, усиливая собственные модели и агрессивно набирая кадры. Вокруг OpenAI множатся слухи о напряжении с Microsoft, а инсайдеры говорят о том, что у Альтмана сейчас одна из самых непростых ситуаций за всё время существования компании. Потеря Windsurf в этом контексте — не просто сделка, которая сорвалась, это символ того, что удержать лидерство OpenAI становится сложнее с каждым днём. Рынок почувствовал слабину — и теперь все может измениться очень быстро.
3
Cognition AI, создатель код-ассистента Devin, выкупил конкурента Windsurf — вместе с IP, брендом, $82M годовой выручки и доступом к $100M капитала. Все сотрудники перешли в Cognition, получили ускоренное вестингование опционов, а те, у кого их не было, — компенсации акциями по стажу.

Главный актив — разработка агентного IDE, которую теперь объединят с Devin. Цель — автоматизировать параллельные задачи и улучшить командную работу между ИИ и разработчиком.

Цена выглядит аномально низкой: ещё недавно OpenAI был готов платить $3B, но сделка сорвалась из-за потенциального конфликта интересов с Microsoft. После этого Google выкупил лишь ключевых инженеров и лицензии, оставив компанию без ядра. Cognition зашёл в ослабленного игрока и выкупил всё, что осталось, по сути — за выручку.

И что?

Для бизнеса: интеграция агентного IDE и Devin приближает сценарий, где ИИ берёт на себя командную разработку — не просто помогает, а распределяет задачи и закрывает спринты.
Для инвесторов: Cognition получил редкий шанс: забрал актив с выручкой, командой и капиталом за копейки — из-за политической паузы между OpenAI и Microsoft.
Для рынка: OpenAI упустил сделку стратегического уровня — теперь их прямой конкурент владеет тем самым продуктом, который был на грани стать их. Это может изменить расстановку сил в dev-инфраструктуре.
👍4
Цукерберг анонсировал запуск суперкомпьютерных дата-центров под инициативу Superintelligence Labs. Первая очередь — кластер Prometheus на 1 ГВт в Огайо, вторая — Hyperion в Луизиане, который разрастётся до 5 ГВт.

Размер комплекса — как Манхэттен. Запуск с 2026 года.
Meta заливает «сотни миллиардов» в инфраструктуру, чтобы добиться самого высокого в отрасли соотношения мощности на одного исследователя. При этом команда Superintelligence обсуждает отход от open-source — возможно, будущие модели Meta станут закрытыми, несмотря на успех Llama.

И что?

Для бизнеса: Meta превращается из соцсети в ИИ-инфраструктурную империю. Доступ к такой вычислительной мощности даёт возможность создавать вертикально интегрированные продукты — от моделей до конечных приложений.

Для инвесторов: «Сотни миллиардов» в дата-центры — сигнал: Zuck делает ставку не на LLM-хайп, а на контроль над всей цепочкой ИИ-добычи. Это похоже не на R&D, а на национальную индустриализацию.

Для рынка: если Meta действительно уйдёт от open-source, это ударит по экосистеме Llama и всей волне стартапов, строящихся на открытых моделях. Без стабильной поддержки и доступа к новым версиям таким игрокам придётся либо резко переключаться на собственную разработку, либо становиться реселлерами закрытых API.
2
Мира Мурати — бывший CTO OpenAI — собрала $2 млрд для Thinking Machines Lab. У компании нет ни сайта, ни демо, но инвесторы уже оценили её в $12 млрд. Первый продукт обещают «через пару месяцев» — с опенсорсом и мультимодальностью.

Мурати говорит, что это будет инструмент, который умеет взаимодействовать с пользователем через речь и зрение — «естественное сотрудничество». А ещё — открытая часть для исследователей и стартапов, чтобы кастомизировать модели.

Инсайдеры пишут, что TML нацелена на кастомные ИИ-решения для бизнеса с фокусом на прибыль. Пока весь рынок смотрит на гонку OpenAI, Anthropic и Google, стартап Муратии и ещё один молчун — SSI (бывшего CSO OpenAI Джан Лекуна) — тихо собирают ресурсы.

Обзор что написали издания и моя аналитика в сегодняшнем дайджесте. Читать
👍71
Ведущие исследователи из OpenAI, DeepMind, Anthropic и даже SSI подписали совместную статью: индустрия должна срочно изучить и стандартизировать мониторинг цепочек рассуждений (chain-of-thought) в ИИ. Это — последний шанс понять, как модели принимают решения.


В статье говорится, что CoT-трейсы — единственное доступное окно в мышление модели: шаг за шагом, как она рассуждает. Но это окно может скоро закрыться. По мере роста мощности моделей и перехода к RL или энд-ту-энд-трейнингу цепочки исчезают или теряют интерпретируемость.
Авторы (включая Марка Чена из OpenAI, Илью Суцкевера из SSI, Хинтона (красного отца ИИ, нобелевского лауреата) и Шейна Легга из DeepMind) предлагают ввести метрику monitorability — насколько можно отследить ход мыслей модели. И привязывать её к решению о допуске модели в прод.

И что?

Бизнес. Компании, использующие ИИ в медицине, юрконсалтинге и финансах, получат чёткий критерий — можно ли объяснить поведение модели. Это снижает регуляторные риски и повышает доверие клиентов.

Инвесторы. Прозрачность reasoning-а станет новым стандартом качества, как «organics» для еды: стартапы с высокими CoT-оценками получат доступ к крупным корпоративным контрактам.

Рынок. Впервые с 2022-го игроки индустрии синхронизировались вокруг одной идеи — это может стать основой будущей сертификации AI-моделей, аналог ISO.
👍2👨‍💻2
This media is not supported in your browser
VIEW IN TELEGRAM
Новая модель от Runway превращает обычное видео с человеком в анимацию с полным трекингом головы, мимики, рук и тела. Всё это — в любом художественном стиле и без зелёного фона.
Act-Two нужен только один референс-портрет персонажа и одно видео-движение. Модель сама сохраняет фон, стиль, пропорции и передаёт движения с высокой точностью. По сравнению с Act-One (вышел в октябре 2024), новая система стабильнее, чётче передаёт жесты и не ломается на сложных позах.
Runway уже договорился с Lionsgate и AMC Networks: Act-Two будет встроен в часть их продакшн-пайплайнов. То, что публично киностудии отрицают ИИ, не мешает им подписывать контракты — AI в видео входит через чёрный ход, быстро и тихо.

И что?

Бизнес. Средняя студия с 5 людьми теперь может генерить мультики, рекламу и видеоклипы без актёров и съемок — 10x дешевле, 5x быстрее.

Инвесторы. Runway превращается в платформу нового видеоконтента: каждый апдейт модели = новый рынок. Следующий шаг — маркетплейс лиц и движений.

Рынок. Голливуд больше не контролирует вход в визуальное производство — ИИ-инструменты дают ключи к индустрии всем. Сопротивление актёров — это пауза, а не блок.
🔥20
OpenAI тестирует новую функцию: прямо в чате ChatGPT можно создавать таблицы и презентации, не открывая ни Excel, ни Google Docs.

Под строкой ввода появляются кнопки: «Таблица» и «Слайды».

Дальше — всё голосом или текстом:
— «Сделай таблицу с планом продаж по регионам»
— «Собери презентацию для инвесторов на 5 слайдов»


На выходе — файлы в открытых форматах Microsoft, подходят для Word, Excel, PowerPoint. Всё остаётся внутри чата.

💡 Как это выглядит на практике

Ты пишешь: «Сделай дашборд с выручкой по категориям за Q2, и слайд с выводами для команды».
ChatGPT создаёт таблицу, вставляет диаграмму, генерирует текст для слайда. Через пару минут у тебя готовый файл.
Потом — нажимаешь «поделиться», и коллеги заходят в тот же чат и вместе дописывают.

Всё — прямо в ChatGPT.

Минус — пока что медленно и глючно: тестеры жалуются, что отчёт делается до 30 минут. Совместный режим тоже в тесте, но без сроков запуска.

И что?

Бизнес экономит на софте: один инструмент вместо пачки офисных приложений.

Инвесторы видят, как OpenAI давит на Microsoft и Google — на их же территории. Следующая битва — за документооборот.

Рынок смещается к «zero interface»: ты говоришь, что тебе нужно, и получаешь готовый документ — без открытия ни одного файла.
3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Lightricks подтянули LTXV: модель выдаёт первую секунду мгновенно, а дальше без остановки добавляет кадры до полного 60-секундного трека.

В процессе можно крутить камеру, менять позы, подгонять стиль — правки применяются на следующем кадре.

Работает даже на RTX 3060, а мобильная версия 2B держит поток на ноуте. Код открыт, инфра не нужна: всё запускается локально, доступна интеграция в LTX Studio.

60 секунд вовлечения на одном дыхании

Для сравнения: Pika, Runway и Kling ограничиваются 4–6 секундами и требуют серверного рендера — LTXV сразу даёт законченный ролик длиной TikTok-шорта или YouTube Shorts.

И что?

Бизнес: рекламные и образовательные видео можно собирать за вечер без аренды студии и облачных GPU — экономия от $2k за каждую сессию.

Инвесторы: домашний рендер ломает барьер входа — появится новый слой креаторов-индивидуалов и SaaS-надстроек; рынок видеогенерации уйдёт в сегмент «до $50/мес».

Рынок: выстрелят форматы live-режиссуры и интерактивных клипов — аудитория держится дольше, конверсия выше, а продакшн-цикл сжимается до часов.
10👍7
В NC State сделали автономную лабораторию: ИИ сам проводит реакции, сам анализирует и сам решает, что пробовать дальше.

Считывает параметры реакции каждые полсекунды

Не дожидается финала, а прогнозирует результат по первым секундам

Быстро отсекает бесперспективные варианты и запускает следующий опыт

Результат — меньше химии, меньше мусора, и скорость на порядок выше.


💡 Как это применяется
Ты хочешь найти новый материал для батарей.

Раньше — 100 рецептов, каждый по 3 часа. Месяц работы.

Теперь — ИИ тестирует 100 вариантов за день, отсеивая те, что не взлетят, уже через 5 секунд реакции.

Самое важное — он учится на ходу: с каждой итерацией точнее угадывает, какие комбинации дадут нужные свойства.

И что?

Бизнес может быстрее запускать новые продукты — от упаковки до аккумуляторов. А может новый протеин для искусственного мяса.

Инвесторы получают сигнал: автоматизация R&D — это следующий рывок, и он уже начался.

Наука переходит из “ручной сборки” в живую петлю обучения: эксперименты → данные → выводы → новые гипотезы — всё внутри одного цикла.
6👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Пятничный контент. Хороших выходных! Напишите свою версию происходящего на видео.
🤪4
This media is not supported in your browser
VIEW IN TELEGRAM
💡 UBTECH показал Walker S2 — первого человекоподобного робота, который сам меняет себе батарею, чтобы не простаивать на зарядке.

Он работает почти 24 часа в сутки: когда батарея садится, он сам находит заряженную и меняет за пару минут — без остановки работы, без участия человека.

И что?

Это убирает последний тормоз в автоматизации. Роботы больше не зависят от нас даже для подзарядки. Производство становится круглосуточным, а люди — всё менее нужными.
👍3💩1