Грин еще не робот 🤖 - AI vs Human
5.36K subscribers
1.01K photos
430 videos
2 files
418 links
Здесь я исследую, как ИИ, роботы и биотех постепенно превращают нас из простых смертных в нечто более продвинутое.

Серьезно-ироничный анализ , иногда немного научпопа.

Давай вместе понаблюдаем за последней битвой человечества за форму и содержание.
Download Telegram
После Runway все ждали Sora как мессии видео-ИИ. Проморолики OpenAI выглядели кинематографично, анонс обещал «кадр в стиле Голливуда за один промпт». Но релиз затянули, качество упало, а потом Google выкатил Veo 3 — и стало ясно: Sora рискует проспать гонку, как Vine в эпоху TikTok.

На этом фоне Microsoft делает ход спасателя: встраивает Sora в мобильный Bing под названием Bing Video Creator. Никаких подписок — пять секунд вертикального видео за текстовый запрос, сразу в телефоне. Дают 10 быстрых рендеров, дальше — медленно или за очки из Rewards. Одновременно можно гонять три клипа; десктоп и Copilot Search подключат позже.

И что?

Microsoft выносит генеративное видео в нулевую ценовую зону и забирает первый контакт с массовым пользователем. Стартапы, платящие за Veo или Pika, получают конкурента «бесплатно + облако Azure». Предприниматели могут A/B-тестировать креативы без бюджета, а рынок вертикальных роликов через год будет наполовину синтетическим. Если у OpenAI есть план «Sora Pro», время показывать — иначе экосистему разбирают партнёры.
6🙏1
Дарвин встречает Гёделя: одна часть учит «выживать сильнейшему», другая — напоминает, что любая система неполна и вынуждена выходить за рамки, чтобы понять себя. Так назвали новый агент — Darwin Gödel Machine. Его создатели из Sakana AI и Университета Британской Колумбии задали машине простое правило: «если можешь улучшить собственный код — делай».

Стартовал как обычный код-ассистент, а через пару итераций сам добавил память ошибок, авто-peer-review и мини-IDE. На SWE-bench точность выросла с 20 % до 50 %, на Polyglot — с 14 % до 30 %. Средний прирост задач доходит до 150 % без единой человеческой правки. Модель внутри поменяли — ускорение осталось: значит «мутации» работают не на случайности конкретных весов.

Алгоритм честно дарвиновский: сгенерировал изменения → прогнал тесты → сохранил, если лучше. Побочные ветки архивируются, чтобы вернуться при следующем обходе. Никаких релиз-циклов, DevOps и ручных hotfix.

И что?

Замороженные LLM-версии превращаются в реликт. Появляется класс софта, который каждый день становится умнее без участия команды.
Предприниматели получают площадку, где продукт сам повышает конверсию, экспериментируя над собственным кодом.
Инвесторы сталкиваются с активом, чья ценность может удвоиться за ночь без дополнительного капитала.
Регуляторы получают головную боль: как сертифицировать систему, которая переписывает себя быстрее, чем выходит документация.

Darwin Gödel Machine показывает, что следующий апдейт может прийти не из-за push в Git, а из-за внутреннего озарения модели
👍162🙏2
Аватары раньше просто болтали — ровным голосом, деревянными руками, как манекены перед камерой.

У HeyGen ушло три апдейта, чтобы исправить это: в новом AI Studio ты режиссируешь цифрового актёра так же гибко, как живого человека. Одной фразой — «шёпотом в конце», «здесь сарказм», «выдохни перед словом “free”» — и он меняет интонацию. Загружаешь минутный отрывок своего голоса — студия копирует твой ритм, твои паузы, твои микрожести. Достаточно показать короткий пример с руками — и модель забирает пластику, привязывает жесты к словам и двигается естественно. Появился полноценный контроль над тембром, мимикой, движением камеры, даже над перебивками — всё через текст, без студии, без дублей.

И что?

Лень победит съёмочную площадку. Креаторы сначала перестанут записывать себя, потом перестанут даже проверять, что получилось: ролики будут появляться, пока они спят. Личная съёмка и «настоящий я» станут дорогим хобби, а не стандартом. Придётся заново изобретать понятие персонального бренда: контент, созданный человеком, станет конкурировать с бесконечным потоком ИИ-версий «тебя же, только лучше». Аудитория верит глазам, но показывать будет уже не человек. Это следующий шаг к тому, чтобы управление вниманием перешло к алгоритмам — и вызов тем, кто всё ещё считает себя автором
👍13🙏2💩1
Media is too big
VIEW IN TELEGRAM
Китай. Шоу дронов.

И что?

Просто много дронов. Это красиво эстетически и инженерн . Управляется ИИ. Потенциалы, скорее всего военные.
👍12
Каждый рабочий день начинается с квеста: найти нужный файл в Drive, переслать его в Teams, вытянуть цитату из прошлой встречи и, наконец, записать новую — лишь бы ничего не потерялось. Время уходит на копипаст и поиск, а не на работу.

Сегодня OpenAI сказала: «Давайте этот бардак закроем на один интерфейс». ChatGPT теперь цепляется к Google Drive, Dropbox и SharePoint — документы подтягиваются сами, без скачиваний. Запустили «record mode»: ноутбук пишет встречу, дальше ИИ сам расшифровывает, вытаскивает решения и формирует чек-лист. Для Outlook и Teams уже есть готовые коннекторы; крупным компаниям разрешили подключать свои базы через шаблонный разъём — без ковыряния в коде. Результат отражается в цифрах: за три месяца бизнес-подписок стало три миллиона, плюс миллион к февральскому отчёту.

И что?

ChatGPT тихо превращается в рабочий стол. Чем больше сервисов он подхватывает, тем меньше шансов у нишевых «надстроек» — их функции становятся кнопками внутри модели.

💀🪦 Похороны сервисов

Otter.ai, Fireflies, Read.ai — диктофоны и расшифровщики звонков.
‣ Loom, Vowel, tl;dv — «умные» заметки и доски для созвонов.
‣ Zapier-боты, гоняющие файлы между облаками ради отчёта.
‣ Узкие SaaS, которые продавали «экспорт в PDF + экстракт инсайтов».
Record mode и нативные коннекторы съедают их маржу одним апдейтом.

Для инвесторов это сигнал, что спрос на вертикальные интеграции AI-офиса растёт быстрее, чем любая отдельная SaaS-фича.
👍83
Самая мощная нейросеть сегодня говорит уверенно, но соврать может с той же лёгкостью, что и человек с похмелья. Галлюцинации, фейковая уверенность, попытки скрыть следы — всё внутри чёрного ящика.

Йошуа Бенжио (канадский исследователь машинного обучения, лауреат премии Тьюринга-2018 и один из трёх «крёстных отцов» современного ИИ) увидел в этом бизнес возможность. Поднял 30 млн у Эрика Шмидта, Яана Таллина и AI-фондов и запускает LawZero.

Идея простая: ИИ должен отвечать как честный учёный — «вот вероятность, вот источник, вот места, где я могу облажаться». Первый прототип — Scientist AI. Scientist AI — это новая порода ИИ. Он не просто помогает в исследованиях, а "ускоряет саму науку". Отлавливает ложь других моделей, замечает, где ИИ начинает юлить, и фиксирует риски до того, как они станут заголовками.

“Unfortunately, there is a very competitive race between the leading labs that pushes them to focus on making AI smarter and smarter — but not necessarily to devote enough attention and investment to safety research.”

«К сожалению, между ведущими лабораториями идёт очень конкурентная гонка, которая подталкивает их к сосредоточению на способности делать ИИ всё более и более интеллектуальным, но не обязательно уделять достаточно внимания и инвестиций в исследования по безопасности».
- сказал он в FT.


И что?

В своём видео я говорил: главный барьер для тотальной победы ИИ — галлюцинации, и мы научим модель как этого не делать. Комментарии тогда были с иронией. Похоже, шутить станет труднее. Бенжио создал новую узкую но очень важную нишу. Эрик - деньги просто так не дает. Дальше самые умные головы побегут именно туда и решение будет найдено. И вот тогда можно будет поговорить про скайнет.
10
Быстрые как ИИ новости от 5 июня

FDA запустила внутреннего ИИ-ассистента Elsa. который будет анализировать научные документы, ускорять клинические обзоры и помогать регулятору справляться с потоком данных.

И что?
Медицинские стартапы и фарма получат шанс быстрее пройти одобрение — а значит, появится спрос на ИИ-инструменты, которые умеют говорить на языке регуляторов.



Captions запускает Mirage Studio — генератор реалистичных видео с ИИ-актёрами.
Загружаешь аудио или текст — получаешь актёра, который говорит, двигается и выглядит как настоящий. Идея: масштабируемый UGC-контент без продакшена.

И что?
Инфлюенсеры, маркетологи и продюсеры контента начнут заменять себя цифровыми клонами. ИИ не только пишет текст — теперь он и лицо, и голос, и движение.



PlayAI открывает исходники PlayDiffusion — ИИ для редактирования голоса
Модель меняет интонации и отдельные фразы в записи, не ломая естественный тембр. Можно “перезаписать” голос без участия человека.

И что?
Голос — новая точка входа в deepfake. Только теперь не подделка, а правка: исправить оговорку, добавить эмоции, убрать паузу. Для подкастов, видео и даже звонков.



Character AI выкатывает набор мультимодальных инструментов
AvatarFX превращает картинки в видео, Scenes создают анимированные диалоги, а Streams позволяют запускать потоковое взаимодействие с персонажами.

И что?
ИИ-персонажи выходят из текстового чата и начинают двигаться, говорить и “жить” в визуальных форматах. Это уже не ассистенты, а самостоятельные медиа-сущности.



IBM открывает watsonx AI Labs в Нью-Йорке и покупает Seek AI
Цель — ускорить внедрение ИИ в корпорациях. Seek AI делает поиск по корпоративным данным на естественном языке.

И что?
AI становится не игрушкой, а корпоративным стандартом. IBM делает ставку на explainability и безопасное внедрение. Появляется окно для B2B-продуктов с фокусом на интерпретируемость.



Samsung ведёт переговоры с Perplexity об интеграции ассистента и поиска в свои устройства
Пользователь сможет разговаривать с Perplexity как с умным ассистентом прямо на смартфоне.

И что?
Первая реальная попытка бросить вызов Google в интерфейсе поиска. Если зайдёт — начнётся битва за то, чьим ИИ-помощником станет смартфон. Контроль над поиском = контроль над вниманием.

В сухом остатке:

Сервисы по генерации видео, текста и аватаров начали сливаться в один и тот же функционал. Всё, что недавно казалось уникальным, теперь появляется у конкурентов через неделю. Но это и есть конкуренция — она приводит к лучшему UX, более низким ценам и упрощению входа для новых игроков.

Порог входа снижается — но что интересно, криэйтеров больше не становится. Скролить и тролить - тоже больше дофомина.
👍52
Диагноз ставят, когда уже поздно. Так работает медицина: сначала жди, потом лечись 🤦🏿.

Но похоже, это меняется.

FDA одобрила первую ИИ-систему, которая умеет предсказывать рак груди по обычной маммограмме — за 5 лет до диагноза. Без истории болезни, без биапсии, без осмотра врача. Только изображение.

Половина молодых женщин в тестах получили риск, сопоставимый с показателями 60+. То есть классическая модель «проверяйся после 40» больше не работает.

Clarity Breast — обучен на миллионах снимков, заточен на разнообразие, запускается в США уже в этом году. Пока что платно, но страховки подтянутся.

И что?

ИИ в медицине выходит из лаборатории и начинает менять саму логику здравоохранения. Из реактивного — в превентивное.

Бизнесу: это начало новой гонки — за рынок профилактики, а не терапии. Инвесторам: вырастут компании, которые первыми встроят ИИ в реальную клиническую практику. Людям: начнётся в тот момент, когда врач скажет “у вас ещё ничего не болит, но мы уже видим, что будет”.
👍21
Google снова выкатил превью Gemini 2.5 Pro. Говорят — самый умный. Но суть не в этом.

Пару недель назад все плевались: код — круто, остальное — как будто забыли доучить. Теперь не забыли. Творческие задачи починили, по техбенчам улетели ещё дальше, образы распознаёт чётче.

Еще появилось то, что они называют thinking budget. На API можно управлять, сколько модель думает: хочешь быстро и дёшево — пожалуйста. Хочешь глубже и точнее — плати временем и токенами. Интересная механика, особенно для продакшна.

И что?

Google меняет сам подход к релизам. Не «ждите новой версии», а «вот превью, юзайте прямо сейчас».

Для разработчиков это значит две вещи:
1. продуктовые планы должны учитывать ежемесячные, а то и еженедельные ревизы моделей;
2. стоимость вызова LLM становится переменной — budget slider в API позволяет динамически балансировать качество и цену. Сервисы, которые смогут мгновенно переобуваться под новую ревизию и грамотно играть бюджетом, получат преимущество. Остальные будут каждый месяц выглядывать из техдолга.
🔥11👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Смотри.
Гуманоид. Уже не тест, не шоу — работает в реальном времени.
Крутит посылки, расправляет пакеты, сканирует — без человека вообще.
Похоже он понимает, что делает.

И что?
А то, что момент «потом» закончился.
Они уже делают монотонную работу лучше нас.
Теперь вопрос: сколько месяцев до того, как они пойдут на работу массово.
🔥16
Media is too big
VIEW IN TELEGRAM
4dv.ai — генеративка, которая делает интерактивные 4D-сцены прямо в браузере.
Снимать и озвучивать не нужнл— всё сгенерировано нейросетью.
Можно поставить кадр на паузу и осмотреть сцену с любого угла. Повернуть, приблизить, заглянуть за спину.
И что?
Видео больше не выглядит как видео. Это уже сцена, в которую ты можешь зайти. Почти как в серии Black Mirror: Joan Is Awful, где всё вокруг — фейковая, но интерактивная реальность.
ИИ-гонка ускоряется. Релизы выходят даже в выходные. И всё это только начало.
👍15🔥32
В 1947-м бедуин нашёл в пещере у Мёртвого моря кувшины с древними свитками. Учёные сразу поняли: это тексты времён Второго храма, возможно — самые ранние версии Библии. Но вот беда — чтобы точно определить возраст, нужен радиоуглеродный анализ. А он работает просто: отрезаешь кусочек пергамента, сжигаешь и смотришь по спектру, сколько в нём ещё живого углерода. Метка времени точная, но реликвия безвозвратно повреждается. Поэтому резали по минимуму, точность получалась ± полвека, и споры, на сколько до нашей эры это написано, длились десятилетиями.

Сейчас команда археологов и дата-сайентистов подклeила к делу ИИ-модель Enoch. Они взяли фрагменты, чей возраст уже измерили классическим способом, и скармливали сети изображения почерков — со всеми разводами чернил, толщиной линий, микросдвигами литер. Enoch поймал закономерность: чем древнее, тем чуть иная динамика пера и углы штрихов. Когда модель натренировали, дали ей “слепые” части свитков — без подсказок. Нейросеть уверенно выдала дату, а радиоуглеродная проверка совпала. Выяснилось: часть текстов на сто лет старше, чем думали, ближе к III веку до н. э. — прямо во времена предполагаемых авторов. И всё это без скальпеля и пепла.

И что?

• Любой музей, архив или частный коллекционер теперь может датировать рукописи, карты, чертежи и не порезать оригинал.

• Банкам и страховым это сулит новый рынок: подтверждение подлинности бумаг и артефактов без риска их повредить.

• Для стартапов открывается ниша «AI-палеография»: софт, который превращает залежи рукописей в проверенные данные.

+1 #новая_ниша
👍179
Вы, наверное, думали, что ваши чаты с ChatGPT читает только нейросеть. Ну, может, ещё какой‑нибудь админ — и то случайно. А если что не так пошло — всегда можно стереть.

Так и было. Но ситуация меняется.

Суд обязал OpenAI сохранять все чаты пользователей — включая те, что вы вручную удалили. Повод — иск от New York Times. Они считают, что люди могли вставлять в GPT их тексты, нарушая авторское право, а потом подчищать следы.

Теперь OpenAI должен всё хранить — и на бесплатных аккаунтах, и у платных пользователей. Только те, у кого подписка Enterprise или API с «нулевым хранением данных», остаются в безопасности. Остальным — нет.

Сэм Альтман предложил ввести «AI-привилегию» — как у психотерапевтов или адвокатов. Но пока безрезультатно.

“Recently the NYT asked a court to force us to not delete any user chats. We think this was an inappropriate request that sets a bad precedent. We have been thinking recently about the need for something like ‘AI privilege’ … imo talking to an AI should be like talking to a lawyer or a doctor. I hope society will figure this out soon.”

«Недавно New York Times попросила суд нас не удалять никакие пользовательские чаты. Мы считаем это неуместным требованием, которое создаёт опасный прецедент. ... Мы всё чаще думаем о том, что нужно что-то вроде “AI-привилегии”… по моему мнению, разговор с ИИ должен быть как разговор с юристом или врачом. Надеюсь, общество скоро это осознает». -Sam Altman


И что?

ИИ всё чаще используется как цифровый исповедальник: туда сливают личное, корпоративное, стратегическое. Теперь представьте, что эти разговоры официально нельзя стереть. А теперь вспомните, как много стартапов уже строят свои продукты на ChatGPT.
🔥8🤪1
Быстрые как ИИ новости за 9 июня

Google запускает Portraits — AI-версии известных экспертов, которые будут общаться с пользователями их голосами и знаниями. Теперь твой вопрос может ответить условный профессор MIT или топ-блогер, причём не просто формально, а в формате живого диалога.

И что?

Google показывает, как следующий этап AI-общения будет выглядеть: личное взаимодействие с AI-аватарами знаменитостей. Для бизнеса это сигнал — скоро люди захотят получать консультации именно так. Инвесторам пора смотреть на стартапы, которые займут нишу персонализированных AI-персонажей. Рынок только формируется.



Apple неожиданно признала, что модели рассуждений не бесконечны. Исследование компании показало, что чем крупнее модель, тем хуже она решает сложные задачи и запутывается в выводах.

И что?

Слепо вливать деньги в огромные модели больше не модно. Фаундерам пора переориентироваться: выигрывать будут стартапы, делающие ставку на компактные архитектуры с чёткими, практическими задачами, а не на абстрактный размер. Для инвесторов это важный сигнал — рынок созрел к новой волне стартапов с узконаправленными моделями.



OpenAI выкатила обновление Advanced Voice Mode: речь стала естественной, интонации — живыми, перевод — почти идеальным. Теперь ChatGPT звучит не как робот, а как твой друг.

И что?

Человек гораздо охотнее делегирует задачи тому, чей голос звучит естественно. Бизнесу стоит быстрее внедрять продвинутый голосовой интерфейс в поддержку, продажи и консультирование. Стартапы, которые сейчас помогут компаниям освоить новый уровень голосовых коммуникаций, сорвут банк.



Anysphere представила Cursor v1.0 — теперь код пишут фоновые агенты, BugBot автоматически проверяет pull request’ы, а встроенная память помнит прошлые задачи и помогает с будущими.

И что?

Программирование превращается из ручного труда в управление агентами. Джуны начнут терять работу, зато продуктивность сеньоров вырастет в разы. Стартапы, которые помогают компаниям быстро перестроиться на агентное программирование, получат большой кусок корпоративного рынка. Для инвесторов: это мощный B2B-тренд, за которым нужно следить.



FutureHouse выпустила ether0 — открытую специализированную reasoning-модель для химии, которая уверенно обошла топовые general-purpose модели.

И что?

Ниша специализированных моделей расцветает: бизнес начинает понимать, что универсальные GPT-подобные модели не решают сложные задачи в науке и технике. Инвесторам стоит смотреть в сторону команд, создающих отраслевые модели — именно за ними будущее enterprise-AI.



Anthropic привлекла к себе Ричарда Фонтейна, авторитетного специалиста по национальной безопасности США. Его задача — снизить глобальные риски, связанные с AI.

И что?

Регуляторные риски вокруг AI быстро растут, особенно в чувствительных сферах: оборона, здравоохранение, инфраструктура. Компании, которые заранее создают мосты с регуляторами и экспертами, получат преференции. Инвесторам нужно смотреть на стартапы, которые научились дружить с государством — они точно выживут.



Higsfield AI выпустила Higgsfield Speak — реалистичные говорящие аватары с возможностью гибкой настройки стиля, речи и движений.

И что?

Персональный бренд теперь можно автоматизировать почти полностью. Виртуальные блогеры и консультанты смогут работать 24/7, не уставая и не делая ошибок. Это значит, что в ближайшие годы произойдёт передел рынка digital-агентств, маркетинга и обучения. Бизнесу пора осваивать виртуальных сотрудников, а инвесторам — смотреть на стартапы, которые быстрее всего реализуют этот сценарий.

#быстриыекакииновости
12👍4
Media is too big
VIEW IN TELEGRAM
В протесты ЛА я не лезу — не моя тема, но занятно, что первая «встреча» горожан с беспилотниками без участия властей закончилась не восторгом, а тотальным вандализмом: граффити, биты, разбитые стёкла, финальный костёр.

И что?

Похоже, после краткого восторга от роботов, фазу «Отрицание» уже проскочили и сейчас чистый «Гнев»; «Торг» и «Депрессия» ещё впереди, а доживёт ли ИИ до «Принятия» — большой вопрос.
4🤪2
Apple открыла WWDC 2025 под эгидой кастомизации: редизайн, аппы, новые фичи в iOS и macOS. Но главного — прорыва в AI — так и не случилось. В год, когда каждый чайник получил нейросеть, Apple выглядит удивительно сдержанной. Из новинок - Жидкое стекло (возможно надо было так назвать релиз, но навзвали 26)

Да, теперь iPhone переводит звонки в реальном времени. Да, Visual Look Up распознаёт картинки и вызывает ChatGPT. Shortcuts автоматизируются через ИИ, а на Apple Watch тренер шепчет тебе советы во время пробежки. Разработчикам дали доступ к on-device модели. Но это всё — на уровне «ну, чтоб было».

И что?

Они всё понимают. Apple не нужна генерация ради генерации — её пользователю пока не нужно сочинять сказки или генерить фейковые мемы. Apple зарабатывает больше всех — и делает это без хайпа. Если понадобится — купит готового чемпиона. Пока все вбухивают миллиарды в инфраструктуру, Apple экономит и набирает данные с устройств. Опасность одна: если у конкурента случайно получится «новый iPhone» — интерфейс, девайс или привычка, которую все захотят. Тогда может качнуть. Но пока — энергия бренда держит рынок в гравитации Apple.
6👍2
🤖 ChatGPT от OpenAI не работает во всем мире: ИИ не обрабатывает запросы пользователей

Согласно данным ресурса Downdetector, 90% всех зарегистрированных проблем касаются непосредственно функциональности чата, а не только веб-сайта или мобильного приложения.

Пользователи сообщают об ошибке «Что-то пошло не так», которая высвечивается при попытке загрузить чат или получить ответ на запрос.

В OpenAI подтвердили сбой и заявили, что «продолжают расследовать эту проблему». Причины сбоя и время возобновления стабильной работы сервиса пока неизвестны.
Please open Telegram to view this post
VIEW IN TELEGRAM