Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🇷🇺 Минцифры опубликовало проект закона о регулировании ИИ
Документ впервые закрепляет само понятие ИИ, устанавливает права и обязанности участников рынка и вводит обязательную маркировку контента, созданного с помощью ИИ.

🏥

Вступил в силу ГОСТ "Системы искусственного интеллекта в здравоохранении. Термины и определения. Классификация"
Документ устанавливает термины и определения для систем ИИ в здравоохранении, а также классификацию подобных систем.

🛢 Исследователи Университета Иннополис создали ИИ-сервис, который ускоряет разработку катализаторов для нефтегаза и водородной энергетики в 5 раз
Решение позволяет обрабатывать свыше 1 млн структур катализаторов ежегодно, в 1000—5000 раз ускоряя вычисления и на 40% снижая затраты на исследования.

📞 Группа ЦРТ внедрила речевые технологии в работу контакт-центра ВТБ
ИИ-ассистенты анализируют обращения, определяют тематику и с учетом предыдущих обращений формулируют подсказки для операторов.

🏦 Т-Технологии выпустили на рынок ИИ-тренажер Robocoach для обучения персонала
ИИ-решение позволило компании сократить срок первичного обучения сотрудника с 7 до 3 дней, время на адаптацию – с 10 часов до 1 часа в неделю.

📞

Билайн Big Data & AI открыла бесплатный демодоступ к двум новым ИИ-агентам для бизнеса
ИИ-агент «Помощник аналитика» помогает находить причины отклонений в показателях, а «Маркетолог» — проанализировать рынок, составить отчет или подготовить тезисы для презентаций.

⚙️

Ученые ВШЭ научили нейросеть «слышать» неисправности в электродвигателях
Метод Signature-Guided Data Augmentation способен с точностью 99% определять неисправность двигателей и с точностью 86% классифицировать типы возникших поломок.

😴

Специалисты СамГМУ разработали два ИИ-помощника для оценки структуры сна
Программа формирует стандартные отчеты, которые содержат ключевые метрики качества классификации и помогают врачу быстро оценить характер нарушений.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

411 views06:33

Тест Тьюринга

👨‍🔬

Готов ли ИИ заменить ученых?

Мы уже несколько раз писали об ИИ в науке как ключевом инструменте для новых открытий. Темпы внедрения ИИ в исследовательскую деятельность растут с каждым месяцем, и начало 2026 года лишь подтверждает этот тренд.

В сети легко найти информацию о множестве ярких достижений, сделанных в науке благодаря ИИ:

➡️ Онкология: создание модели MangroveGS, которая с точностью 80% предсказывает риск рака.
➡️ Кардиология: диагностика сердечной недостаточности по обычным снимкам УЗИ.
➡️ Физика и математика: расчет сложнейших конфигурационных интегралов за секунды вместо недель.
➡️ Материаловедение: открытие десятков новых высокотемпературных магнитных материалов, которые помогут создавать двигатели для электромобилей без использования дефицитных редкоземельных элементов.

И поэтому с экспоненциальным ростом числа ИИ-открытий критически важным становится вопрос их реальности и надежности. Мы входим в эпоху, когда верифицируемость и интерпретируемость алгоритмов играют даже большую роль, чем сама скорость вычислений. Без строгого контроля риск «научной фантазии» в фундаментальных данных может привести к научным тупикам.

На фоне этого в крупнейших научных изданиях вышло три фундаментальных обзора, анализирующих текущее состояние ИИ-науки. Мы выделили главное в каждом:

1️⃣

Безопасность в лабораториях
Nature: Benchmarking large language models on safety risks in scientific laboratories

Идея: современные LLM пока непригодны для автономной работы в реальных лабораториях. Исследование с помощью бенчмарка LabSafety Bench показало, что ни одна из топовых моделей не смогла преодолеть порог точности в 70% при идентификации критических угроз и оценке рисков эксперимента.
Проблема: «иллюзия понимания». Ученые могут излишне доверять ответам ИИ, которые выглядят логично, но в реальности не учитывают физическую динамику среды. Это создает риск реальных аварий и травм при проектировании сложных химических или биологических процессов.

2️⃣

Ученый как ответственный пилот
Nature: AI agents are 'aeroplanes for the mind': five ways to ensure that scientists are responsible pilots

Идея: Дашунь Ван предлагает сменить старую метафору Стива Джобса «компьютер — это велосипед для ума» на новую: «ИИ — это самолет для ума». Самолеты летают гораздо быстрее, но они сложнее в управлении, а их крушение катастрофично. Автор настаивает на модели «пилота в команде», где человек сохраняет за собой финальный контроль.
Проблема: «ускоренная наука без рефлексии». Агентный ИИ склонен выдавать «усредненные» результаты, основанные на статистике обучения. Это подавляет творческую интуицию исследователя и может привести к массовому тиражированию системных ошибок в научных работах.

3️⃣

Тест на научный интеллект
Science: How will we know if AI is smart enough to do science?

Идея: стандартных тестов больше недостаточно для оценки способностей ИИ к открытиям. Необходим целый портфель специализированных бенчмарков (таких как HLE, FrontierScience или SDE), которые проверяют не просто знание фактов, а способность ИИ строить цепочки рассуждений и работать с еще не опубликованными данными.
Проблема: огромный разрыв между обладанием знаниями и умением их применять. Большинство моделей обучаются на схожих массивах данных и «застревают» на одних и тех же сложных задачах, демонстрируя отсутствие истинного научного мышления в новых нестандартных сценариях.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥1

460 views07:03

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🩻 Медики из Красноярского края первыми в России начали использовать ИИ для диагностики туберкулеза
Все флюорографические цифровые установки в крае оснащены модулями и ПО для передачи снимков органов грудной клетки в региональную систему медицинских телекоммуникаций, где ИИ проводит их анализ.

🖥 Альфа-Банк первым в России переводит разработку на «вайбкодинг»
Пилотные проекты с применением Enterprise Vibe Coding уже запущены в архитектурном проектировании, разработке внутренних продуктов, миграции процессов на новые платформы и сервисах поддержки принятия решений.

🐝 "Билайн" внедрил ИИ для управления инцидентами на сети
Решение позволит в два раза ускорить время взятия инцидента в работу и на 5% снизить средние сроки устранения проблем.

🦾

Российские ученые нашли способ в 30 раз ускорить движения роботов за счет использования квантовых компьютеров
Новый метод открывает путь к созданию более быстрых, точных и энергоэффективных роботов, а также решению других сложных оптимизационных задач.

🌊 В ТюмГУ представили цифровых помощников для информирования населения о паводках
ИИ-консультант по паводкам снизит время поиска информации при ЧС, уменьшит нагрузку на горячие линии, сократит число пострадавших и материального ущерба.

💎 В Якутии запустят проект "Ювелир.AI"
Пилот направлен на создание интеллектуальной цифровой системы генерации дизайна ювелирных изделий с использованием якутской орнаментики.

🤖

Марк Цукерберг занимается разработкой ИИ-агента, который должен помочь ему выполнять работу гендиректора
Например, с помощью программы он быстрее получает информацию, ради которой в прежние времена ему приходилось обходить несколько уровней подчиненных.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

388 views06:48

Тест Тьюринга

🛂

Прощай, анонимный интернет: Сэм Альтман выдает «паспорта» ИИ-агентам

Эпоха «цифровой свободы», где миллионы анонимных ботов бесконтрольно парсят данные, выдают себя за людей и заполняют корзины онлайн-гипермаркетов, подходит к концу. Мы вступаем в эру агентской экономики, и теперь у каждого легитимного ИИ-помощника появится своеобразное удостоверение личности.

Что задумал Сэм Альтман?

Проект World Network, бывший Worldcoin, совершил стратегический разворот. Если раньше сканирование сетчатки глаза через устройства Orb казалось странным крипто-экспериментом, то к марту 2026 года стало ясно, что Альтман строит глобальный «слой идентификации» для ИИ.

Он совместно с Coinbase запустил проект AgentKit — инструментарий, который позволяет ИИ-агенту криптографически доказать, что за ним стоит реальный человек. Это и есть тот самый паспорт агента.

Как работает эта инфраструктура?

Это не просто планы, а уже функционирующая система:

➡️

Биометрический фундамент: в системе уже 38 млн пользователей, из которых 18 млн прошли полное сканирование через Orb.

➡️

Финансовая магистраль: благодаря протоколу x402 (совместная разработка Coinbase и Cloudflare), ИИ-агенты получили нативную систему платежей. Они могут совершать микротранзакции стоимостью менее $0.01 за пару секунд.

➡️

Стандартизация: протокол MCP от Anthropic — своего рода «USB-C для ИИ» — позволяет моделям вроде Claude или ChatGPT бесшовно подключаться к этим платежным и идентификационным инструментам.

К чему это приведет в ближайшее время?

1️⃣

Конец анонимных запросов: вероятно, скоро для доступа к мощным LLM-моделям или защищенным API пользователю придется подтверждать свою личность по биометрии. Это станет фильтром против злонамеренных бот-сетей.

2️⃣

Экономика микроплатежей: вместо подписок и рекламных баннеров придет модель pay-per-query (оплата за каждый запрос). Ваш ИИ-агент будет сам платить доли цента сайтам за нужную вам информацию через x402.

3️⃣

Борьба с перекупщиками: билетные сервисы и отели смогут блокировать массовые фейковые брони, разрешая покупки только агентам, подтвержденным реальным World ID.

Идентификация vs приватность

Пока мир разделился: Токио и Лондон активно внедряют точки верификации Orb, А вот в Европе в этом году должен вступить в в силу EU AI Act, который наложит жесткие рамки на подобные системы.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2🔥2⚡1🤔1

471 views07:01

Тест Тьюринга

📲

ИИ вместо социализации?

Зумеры все чаще стали использовать нейросети для интерпретации чувств и эмоций других людей. Молодые люди могут задавать ИИ вопросы по типу "что он/она имел в виду в этом сообщении?" или "как тактично сказать "нет" начальнику?". Это явление получило название social offloading — "перекладывание" неприятных, неловких и эмоционально сложных разговоров на ИИ.

Согласно исследованию Common Sense Media, треть подростков уже предпочитают ИИ-компаньонов людям для серьезных разговоров. Однако это явление касается не только зумеров, а также наблюдается и среди поколения альфа (2010-2024 год рождения) и некоторых миллениалов (1981-1996 год рождения).

Почему мы стали больше обращаться к ИИ в таких вопросах?

✅ ИИ всегда доступен и никогда не осуждает.
✅ С ИИ легче обсуждать чувствительные темы, не опасаясь последствий для репутации или оценки со стороны других людей.
✅ После пандемии многие подростки получили меньше практики живого общения в критический период формирования социальных навыков.
✅ Подростки уже привыкли общаться в виртуальном мире, поэтому добавление ИИ как «фильтра» воспринимается как еще один сервис в телефоне.

Но главный парадокс в следующем: с ИИ проще, но после него — сложнее с людьми.

1️⃣ Если каждый сложный разговор проходит через «фильтр ИИ», у нас хуже тренируются навыки читать интонации, выдерживать неловкость, чинить конфликты. Мы меньше пробуем сами — и больше ждем подсказку.

2️⃣ Появляется также ощущение: «без ИИ я ничего не решу». Мы начинаем меньше доверять своим чувствам и интуиции, жить с внутренним "автокорректором" на каждую эмоцию.

3️⃣ В итоге отношения становятся более «глянцевыми»: сообщения звучат идеально, но за ними — не всегда живой человек, а оптимизированная версия его голоса. В итоге может расти ощущение дистанции и фальши, хотя текст вроде бы идеален.

ИИ правда уже разбирается в эмоциях лучше нас?

Этому действительно есть подтверждения. Например, в исследовании Университетов Женевы и Берна в тестах на эмоциональный интеллект LLMs выбирали правильный ответ в 81% случаев, по сравнению с 56% у людей. Более того, ИИ может эффективно воспроизводить такие эмоции, как печаль, гнев и счастье.

Технически в тестах ИИ может превосходить людей по точности распознавания эмоций человека, но это не «понимание».

Речь о распознавании паттернов, основанном на огромных массивах данных, а не о переживании или понимании контекста конкретной жизни человека. Человеческие отношения включают телесное присутствие, историю отношений и моральную ответственность — всё это влияет на то, как мы понимаем эмоции друг друга, и не может быть полноценно смоделировано ИИ.

ИИ можно использовать ИИ как тренажер общения, а не замену. При этом важно ограничивать «эмоциональную зависимость» от ботов и развивать ИИ-грамотность — понимание его ограничений.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍3💯3

385 views07:04

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

👨‍🏫 Совфед готовит законопроект, который установит правила использования ИИ в образовании
Предлагается ввести специальные «санитарные правила», которые ограничивали бы бесконтрольное использование ИИ-технологий, не создавая при этом барьеров для их развития.

💊 В Подмосковье с помощью ИИ сделали свыше 316 тыс. лекарственных назначений
В момент создания рецепта на лекарство он автоматически проводит проверку по 15 основным показателям.

🧠

Ученые Центра практического ИИ Сбербанка, Института AIRI и Сколтеха нашли способ определять момент, когда ИИ при экономии памяти начинает терять смысл
Алгоритм детекции ошибок сжатия позволяет ИИ обрабатывать длинные диалоги, не теряя детали и не расходуя лишние мощности.

🤖

Исследователи SberAI, MWS AI и российских университетов представили первую методологию для тестирования русскоязычных систем генеративного ИИ, дополненных поиском
В перспективе разработка поможет корпорациям быстро оценивать точность работы создаваемых ими ИИ-ассистентов и сравнивать их эффективность с уже существующими решениями такого рода.

📰 "Дзен" запускает новостного ИИ-ассистента "Глиф"
Он обучен на более чем 200 млн новостных материалов и сможет давать развернутые и релевантные ответы на вопросы пользователей по новостям.

🇺🇸

Госдеп создал бюро по борьбе с угрозами от ИИ и других новых технологий
В новой структуре пять управлений: кибербезопасность, критическая инфраструктура, передовые технологии, космическая безопасность и оценка новых угроз.

📹 OpenAI объявила о закрытии приложения для создания ИИ-роликов Sora
Команда Sora теперь займется долгосрочными проектами, такими как робототехника.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4🔥2🏆2

372 views06:49

Тест Тьюринга

🌍

Менеджмент скоро получит новый ИИ-инструмент: симуляторы реальности

Эпоха «интуитивных решений» и классического риск-менеджмента уходит. На смену им приходят цифровые полигоны на основе ИИ-моделей. Раньше, чтобы понять, как рынок отреагирует на новый продукт или как общество встретит реформу, нужно было проводить фокус-группы и опросы. Это долго, дорого и часто неточно.

Недавний кейс проекта MiroFish открыл совсем новые возможности.

Китайский студент Го Ханцзян (ник 666ghj) из Чжэцзянского университета в Ханчжоу за 10 дней «накодил» систему, которая строит параллельные цифровые миры. Инвестфонд Shanda Group в начале года уже выписал чек на 30 млн юаней ($4.1 млн).

Как это работает:
➡️ Вы скармливаете ИИ вводные данные (новости, отчеты, контекст).
➡️ Система создает тысячи «цифровых двойников» людей с разными характерами и памятью.
➡️ В ускоренном режиме ИИ прокручивает сотни вариантов развития событий.

На что способен MiroFish?

MiroFish позиционируется не просто как чат-бот, а как «цифровой макет будущего». Это мультиагентная система прогнозирования, которая работает по следующему алгоритму:
1️⃣ GraphRAG — построение графа знаний: вы загружаете «сырые» данные (новости, отчеты, даже черновики законов). Система строит карту сущностей и связей.
2️⃣ Создание агентов: ИИ генерирует тысячи персонажей с уникальными чертами личности, памятью и социальными ролями.
3️⃣ Симуляция (движок OASIS): агенты «выпускаются» в созданную цифровую среду, где они начинают взаимодействовать: спорить, торговать, менять мнение под влиянием новостей.
4️⃣ Прогноз: на выходе система выдает отчет о том, к какому «консенсусу» пришло это мини-общество.

Аналогичные проекты — цифровые полигоны общества

MiroFish — не единственный игрок. Тренд на «генеративную социальную науку» (Generative Social Science) активно развивается:

➡️

Stanford Generative Agents (Smallville): в 2023 году исследователи Стэнфорда создали городок из 25 ИИ-агентов. Оказалось, что они способны на сложное социальное поведение: планировать вечеринки, заводить друзей и передавать слухи.

➡️

AgentSociety: крупномасштабный симулятор, способный поддерживать более 10 тыс. агентов. Он используется для тестирования таких явлений, как социальная поляризация или влияние безусловного базового дохода на мотивацию людей.

➡️

Be.FM (Behavioral Foundation Model): совместный проект Стэнфорда и Университета Мичигана. Это модель, обученная на огромных массивах данных психологических и экономических экспериментов. Она предсказывает человеческие реакции с точностью до 85%, что сопоставимо с повторным опросом реальных людей.

Как модель можно применять в новом менеджменте?

➡️ Тестирование PR-кризисов: загрузите текст пресс-релиза и посмотрите, как через 2 часа симулированные «лидеры мнений» разнесут его в цифровых соцсетях.

➡️

Финансовое моделирование: как поведут себя частные инвесторы при резком изменении ставки? Агенты MiroFish имитируют панику, жадность и стадное чувство.

➡️

Городское планирование: симуляция реакции жителей района на закрытие парка или стройку ТЦ.

Какая цена вопроса?

Один запуск симуляции на 1 тыс. агентов (100 раундов) на моделях среднего уровня обойдется в $300 – $800. Если использовать топовые модели для каждого агента, цена взлетит до $5,000+ за один прогон.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3❤2👍2

382 views07:03

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

👱‍♂️ В Госдуме предложили запретить генерацию цифрового образа конкретного человека без его предварительного согласия
Соответствующей нормой предложили дополнить опубликованный проект о государственном регулировании ИИ.

🏗 Минстрой внедрит ИИ во все циклы строительства объектов до 2030 года
Правительством разработаны соответствующие показатели эффективности внедрения ИИ на всем жизненном цикле объектов капитального строительства.

🗺 В «Яндекс.Карты» встроили советы от ИИ
В чате с ИИ приложения стало возможно подбирать места по наличию позиции меню или услуги.

💳 Сбер внедрил в платформу GitVerse для работы с кодом ИИ-помощник GigaCode
Ассистент в формате чата отвечает на вопросы по документации, помогает создавать репозитории и проекты, настраивать пайплайны и вести разработку.

📞 «Ростелеком» достиг 50% автоматизации клиентской поддержки в чатах с помощью ИИ
Компания внедрила интеллектуальный чат-бот «Омнибот» и базу знаний «ProЗнания» для автоматизации клиентского сервиса и внутренних процессов.

🛗 Компания «Мангазея» и Институт ИИ МФТИ разработали цифровую платформу для подбора оптимальной конфигурации лифтов
Решение позволяет находить алгоритм, который минимизирует время ожидания при заданных ограничениях по площади, скорости и количеству кабин.

⏺ Компания «Нордавинд-Дубна» представила новый сервис VIA MENTIS NOTES для записи протокола встреч
За несколько минут сервис автоматически, без ручной перепечатки превращает записи встреч, звонков и переговоров в транскрибацию и структурированный протокол.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍1

353 views07:38

Тест Тьюринга

🔎

Детекторы ИИ: охота на ведьм или надежный щит?

Признаемся честно: нас всегда удивляла тяга к созданию детекторов текстов, написанных LLM. Зачем переживать о том, как именно был написан текст, если в нем нет, например, мысли. А если мысль есть — то какая разница с помощью Word или ChatGPT её оформили?

Так или иначе, с развитием LLM стали появляться сервисы-детекторы (GPTZero, Originality.ai и др.), которые обещают с восхитительной точностью отличить текст человека от «машинного». Но как им можно верить, если нейросети обучались на миллиардах страниц человеческого текста? Разбираемся, как это работает.

Математика «предсказуемости»

Детекторы не «читают» текст, как люди. Они ищут статистические аномалии, используя два главных параметра:

6️⃣

Перплексия: это мера сложности текста. LLM обучены выбирать наиболее вероятное следующее слово. Поэтому их текст получается «гладким» и предсказуемым. Если детектор легко предсказывает следующее слово в предложении, он дает сигнал тревоги.

2️⃣

Вариативность: люди пишут неравномерно: одно длинное сложное предложение, за ним — короткое и резкое. У ИИ структура более монотонная.

Что говорит наука?

Исследования, сделанные еще в 2023 году, показывают, что доверять детекторам на 100% — глупая затея.

Исследование Стэнфордского университета показало шокирующие результаты. Детекторы пометили более 60% эссе, написанных не-носителями английского, как «сгенерированные ИИ». Причина? Ограниченный словарный запас и простые грамматические конструкции, которые детекторы ошибочно принимают за «предсказуемость» нейросети.

Ученые из Университета Мэриленда в своей статье «Can AI-Generated Text be Reliably Detected?» доказали, что по мере совершенствования LLM вероятность ошибки детектора будет стремиться к 50%. То есть результат будет не точнее подбрасывания монетки.

Детекторы часто называют Конституцию США или Библию текстами, написанными нейросетью. Почему? Потому что эти тексты очень логичны, выверены и часто встречаются в обучающих выборках ИИ.

Как на этом наживаются мошенники?

Появление детекторов породило новый вид мошенничества — сервисы «гуманизации» (humanizers). Портал Punch описывает эту схему как замкнутый круг страха:

➡️

Запугивание: студентов или копирайтеров пугают тем, что их тексты не пройдут проверку, даже если они писали их сами.

➡️

Платное «спасение»: мошенники предлагают подписку на «обходчики детекторов». Эти сервисы якобы переписывают текст так, чтобы ИИ его не узнал.

➡️

Результат: в лучшем случае сервис просто вставляет невидимые символы или заменяет буквы на похожие из других алфавитов. В худшем — вы платите за то, что нейросеть просто портит вашу работу, делая её неграмотной.

Это превратилось в настоящую фабрику шантажа. Компании-детекторы продают подписки школам, школы наказывают учеников, а ученики платят «гуманизаторам», чтобы те обманули детекторы.

🖍️

Лучший способ доказать авторство — сохранять историю правок в Google Docs или Word. Это весомее любого «процента вероятности» от сомнительного сервиса.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍2🔥2

382 views07:02

Тест Тьюринга

😈

KAIROS: тайный ИИ-демон от Anthropic?

Уже многие слышали, что во вторник Anthropic случайно выложила в открытый доступ исходный код Claude Code. При публикации версии 2.1.88 в реестре npm разработчики забыли исключить внутренние файлы. В итоге — 512 тыс. строк кода или 1906 файлов оказались в руках общественности. Это не просто «кусок кода», а вся база Claude Code, включая секретные функции, которые годами скрывались за флагами разработки. Одна из такие секретных функций — KAIROS

До сих пор граница была чёткой: ИИ — инструмент, человек — агент. Инструменты не действуют сами и не инициируют. Они ждут команды. KAIROS эту границу стирает. Это первый шаг к ИИ, который существует как сущность — не как программа, которую ты запускаешь, а как участник процесса, который работает рядом с тобой независимо от того, смотришь ты на экран или нет.

Что такое KAIROS?

Технически — это фоновый процесс-демон (kairosActive). Если обычный ИИ ждет вашей команды, то KAIROS работает проактивно.

➡️ он скрывает статус-бар, подавляет вопросы к пользователю и самостоятельно выполняет тяжелые bash-команды в фоне.
➡️ в коде найдены примеры: если ваш сайт упал ночью, KAIROS сам обнаружит сбой, перезапустит сервисы, проверит работоспособность и просто пришлет вам push-уведомление утром: «Всё починил, спи дальше».

В чем технологическая новизна?

KAIROS — это переход от ИИ-ассистента к ИИ-агенту.

1️⃣

Coordinator Mode: Claude становится «дирижером», который управляет десятками мелких агентов-исполнителей параллельно.

2️⃣

CHICAGO: скрытый функционал для прямого управления рабочим столом и компьютером на уровне ОС.

3️⃣

Auto Mode: система сама одобряет доступ к инструментам, не переспрашивая человека.

Почему это пугает?

Главный «взрыв» вызвал режим Undercover Mode. Эта функция автоматически стирает любые следы использования ИИ из коммитов в публичных репозиториях. Буквально за день до утечки губернатор Калифорнии подписал закон об обязательной маркировке ИИ-контента. Undercover Mode — это прямая попытка обойти такие нормы.

Anthropic всегда позиционировали себя как «безопасную» компанию. Наличие режима «скрытности» наносит тяжелый удар по их репутации.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍2🔥2

393 views07:25

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

💵

Российский бизнес потратил на внедрение ИИ-агентов от 5 млн до 950 млн рублей за последние 3 года
Расходы малого бизнеса достигли 5–15 млн руб., среднего — от 30 млн до 60 млн руб., крупного — 200–300 млн руб., корпораций — более 950 млн руб.

🛩

Шереметьево сэкономил более 1 млрд рублей в год благодаря ИИ
Экономия была достигнута при помощи внедрения методов ИИ на базе данных, которые аэропорт копил 20 лет.

🚗 В Пулково начнет функционировать полностью беспилотный флот багажных тягачей, управляемых нейросетями, способных общаться между собой
Это первый в России опыт создания «роевого» ИИ для промышленного использования спецтехники в гражданском наземном транспорте.

🏥 Ученые ЛЭТИ разработали цифровую регистратуру на базе ИИ для автоматизации работы медицинских клиник и стоматологий
Система под названием «МедИИум» способна обрабатывать обращения пациентов, отвечая на запросы в течение 10 секунд.

🧬

ИИ-модель «Матча» от стартапа учёных Сколтеха в 30 раз ускорил перебор молекул для разработки лекарств
Модель обрабатывая один комплекс «белок-лиганд» за 13 секунд, тогда как «АльфаФолд3» — за 6,5 минут.

📞 Виртуальный помощник Ева от МегаФона научилась распознавать голоса роботов и дипфейки
Многофакторная модель определяет признаки синтезированной речи, анализируя множество параметров звуковой волны.

🥛 В Ростовской области выявили фальсификацию молочной продукции с помощью ИИ
Анализ данных показал превышение молочно-жирового баланса сырья по отношению к готовым изделиям.

💎 В Якутии применят компьютерное зрение для поиска особо крупных алмазов
Модели машинного обучения анализируют видеопоток в режиме реального времени и выявляют потенциально ценные алмазы среди общего потока сырья.

⚡️ Nebius построит новый центр по производству электроэнергии для ИИ в Финляндии мощностью до 310 МВт
Ожидается, что центр начнет предоставлять мощности клиентам в 2027 году и станет одним из крупнейших в Европе специализированным предприятием подобного рода.

🇵🇱 Польское правительство первым в ЕС утвердило законопроект о регулировании ИИ
По этому закону в Польше появится "черный список" ИИ-платформ, которые были оштрафованы либо были убраны с рынка.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥1

330 views06:35

Тест Тьюринга

💬

Mechanistic interpretability: как учёные научились читать мысли нейросети

Все современные LLM — и ChatGPT, и Claude, и Llama, и Qwen — это математические функции с сотнями миллиардов параметров. Разработчики их обучают и они дают ответы. Но почему они приходят к тому или иному выводу долгое время оставалось загадкой даже для их создателей. Это называется проблемой чёрного ящика.

Например: модель уверенно врёт, но мы не знаем, в каком именно месте родилась ложь ➡️ модель отказывается отвечать на безобидный вопрос, но мы не знаем, это осознанное решение или случайный артефакт обучения ➡️ модель демонстрирует предвзятость, но мы не можем найти и удалить причину

Mechanistic interpretability — это подход, который вскрывает этот ящик: исследователи находят конкретные нейроны, конкретные веса, «цепочки» внутри модели, отвечающие за конкретное поведение.

Как это выглядит на практике

Когда вы пишете «Эйфелева башня находится в...», модель не ищет ответ в базе данных. Она прогоняет текст через десятки слоёв трансформера, и на каждом — тысячи нейронов усиливают одни сигналы и гасят другие. Исследователи научились это наблюдать в реальном времени.

Техника Logit Lens позволяет смотреть на «мысль» модели после каждого слоя:
Слой 1: «место» — 11%
Слой 4: «город» — 29%
Слой 9: «столица» — 52%
Слой 14: «Париж» — 81%
Слой 20: «Париж» — 97%

Знание буквально проявляется слой за слоем, как фотография в тёмной комнате. А Activation Patching идёт дальше: берём два промпта, правильный и с ошибкой, и далее по одному нейронному слою, один за другим, начинаем заменять результаты обработки некорректного промпта в слое (ошибочный вектор активации нейросети) на корректный результат (точный вектор активации) по итогам правильного промпта. Как только точность восстанавливается — мы нашли слой, где живёт нужный факт.

Зачем это нужно?

1️⃣ Исправлять знания без переобучения. Метод ROME позволяет буквально «переписать» один факт в модели за секунды. Модель думала, что Илон Маск — CEO Twitter? Одна операция — и знание изменено.

2️⃣

Находить и удалять предвзятости. Можно найти нейроны, которые систематически скашивают ответы в политическую сторону, усиливают негативные ассоциации с определёнными группами или подавляют упоминания конкурентов.

3️⃣

Понять, почему модель галлюцинирует. Оказывается, галлюцинации часто происходят в конкретных слоях при конкретных паттернах.

4️⃣

Аудит безопасности до деплоя. В банках, медицине и юриспруденции ИИ должен быть объяснимым по закону. Interpretability позволяет показать регулятору: «вот почему модель приняла это решение» — на уровне конкретных активаций.

5️⃣

Обнаружить скрытые возможности модели. Иногда модели знают больше, чем говорят. Техника Probing позволяет «спросить» у внутренних слоёв — и получить ответ, который модель не выдаёт наружу.

6️⃣

Понять как работает «In-Context Learning». Почему модель «учится» из примеров прямо в промпте, без обновления весов? Исследователи обнаружили конкретные «induction heads» — головы внимания, реализующие этот механизм.

7️⃣

Контролировать поведение через «steering vectors». Можно добавить в «residual stream» вектор — и модель начнёт отвечать более уверенно, менее агрессивно, или с другим стилем.

Инструменты — от «нажать кнопку» до «написать код»

📌

Neuronpedia — онлайн-атлас нейронов. Миллионы нейронов из Gemma, Llama, GPT-2 с человекочитаемыми описаниями. Вбиваете слово — видите, какие нейроны реагируют. Вбиваете номер нейрона — видите, на что он активируется.

📌

Aquin Labs — стартап, который делает из interpretability удобный интерфейс: logit lens, граф причинно-следственных связей, редактирование весов прямо в браузере.

📌

TransformerLens — главная библиотека. Поддерживает Llama, Mistral, Qwen, Gemma, Phi. Три строки — и у вас все активации всех слоёв.

📌

nnsight — максимально гибкий перехват активаций в любой точке любой HuggingFace-модели.

📌

BertViz — красивая визуализация attention-паттернов.

💬

Тест Тьюринга. События в сфере ИИ. Подписатьс

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤3💯2

398 views07:01

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🩺 Владимир Путин поручил обеспечить внедрение ИИ в сферу здравоохранения
Технологии в том числе будут применены для автоматизации процессов анализа данных и результатов лабораторных исследований.

⛵️ "Росморпорт" реализовал проект внедрения лоцманских планшетов с элементами ИИ
Планшет обеспечивает возможность передачи данных с судна на берег, помогает и капитану судна принимать решения, и лоцману давать рекомендации с учетом складывающейся навигационной обстановки.

🚇 В метро Новосибирска внедрят ИИ для управления графиками работы бригад
Разработка Центра ИИ НГУ поможет метрополитену автоматизировать составление и корректировку графиков работы сотрудников, снизить нагрузку на диспетчерские службы и повысить эффективность управления персоналом.

🦾 В Сбере создан департамент автономных решений, который сосредоточится на развитии проектов в области физического ИИ
Новый департамент возглавил Иван Калинов, который создал в Яндексе с нуля подразделение Yandex Robotics.

🎨

Специалисты ЮУрГУ и Института психологии РАН научили ИИ анализировать уровень креативности человека
Обученная по данным уникальных баз нейросеть выдает моментальный результат теста психолога Элиса Пола Торренса, что экономит время на анализе реального эксперта.

🧠 Специалисты МГУ разработали платформу для исследования эмоционального взаимодействия человека и ИИ
Разработанный фреймворк HL-EAI позволяет оценивать влияние эмоций на совместное принятие решений и поведение человека и ИИ в задачах стратегического взаимодействия.

🇨🇳

В Китае выпустили руководство по этической экспертизе ИИ
Руководство призывает уделять основное внимание благополучию человека, справедливости и беспристрастности, а также контролируемости и надежности.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥1

324 views06:58

Тест Тьюринга

🌍

Кажется, началось. OpenAI выпустила руководство для государств по подготовке к эпохе сверхинтеллекта

OpenAI опубликовала 13-страничный манифест «Industrial Policy for the Intelligence Age: Ideas to Keep People First». Документ предлагает радикальные реформы для подготовки общества к эре AGI и открыто заявляет о начале перехода к сверхинтеллекту — ИИ-системам, способным превзойти самых умных людей.

Масштаб предстоящих изменений сравним с «Новым курсом» Рузвельта.

Компания предлагает сосредоточиться на двух ключевых аспектах: 1️⃣ построении открытой экономики с широким доступом, участием и всеобщим процветанием 2️⃣ построении устойчивого общества посредством подотчетности, согласованности и управления рисками.

OpenAI представила порядка 20 конкретных предложений, среди самых революционных:

➡️ Создание национального фонда благосостояния, где у каждого гражданина будет доля от роста экономики за счет ИИ. Финансирование — за счет самих ИИ-компаний.
➡️ Переход на четырехдневную рабочую неделю с сохранением зарплаты.
➡️ Смещение налогового бремя с зарплат на капитал, так как автоматизация подорвет поступления в фонды соцстрахования.
➡️ Доступ к ИИ — такое же право, как право на образование или доступ к электричеству.

Глава OpenAI Сэм Альтман уже дал короткое интервью, в котором прокомментировал опубликованный документ. Он отметил, что сейчас необходимо начать вести открытый диалог, так как уже в следующем году человечество столкнется со значительными угрозами в сфере био- и кибербезопасности.

Мы действительно чувствуем неотложность ситуации. И мы хотим, чтобы обсуждение этих вопросов действительно началось со всей серьезностью.

OpenAI — не первая, кто пытается влиять на будущее через программные документы. Чаще всего их авторами выступают государства, think-tanks и академические круги. ИТ-гиганты тоже ранее тоже публиковали похожие документы, например, «Claude’s Constitution» от Anthropic, «Responsible AI Progress Report» от Google, однако в основном их целевая аудитория — другие ИТ-корпорации и ИИ-разработчики.

Но OpenAI создает исторический прецедент: впервые ИТ-компания предлагает государствам полный план перестройки всей экономики. Если раньше корпорации лоббировали интересы в парламенте, то теперь они публично требуют изменить социальный контракт, "угрожая" тем, что иначе их же технология уничтожит старые устои.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍3🔥3💯1

453 views07:01

Тест Тьюринга

🏭

ИИ-гиганты идут в реальный сектор для выживания

За последние месяцы произошло что-то важное, на что многие не обратили внимания. Крупнейшие ИИ-компании один за другим делают ставки не на новые модели, а на вполне материальные отрасли экономики.

Что происходит в США?

Апрель 2026:
➡️ Anthropic купила биотех-стартап Coefficient Bio за $400 млн — команда занималась ИИ-ускорением разработки лекарств, выходцы из подразделения Genentech.
➡️ OpenAI купила медиакомпанию TBPN — стартап, стоящий за популярным трёхчасовым tech-шоу Кремниевой долины.
Январь 2026:
➡️ OpenAI приобрела медицинский стартап Torch за ~$100 млн — приложение объединяло разрозненные медданные пациента для ИИ-анализа и усилит ChatGPT Health.
➡️ OpenAI и SoftBank вложили по $500 млн в SB Energy — энергетическую компанию, которая строит датацентр на 1.2 ГВт в Техасе с собственной солнечной генерацией в рамках Stargate.
➡️ Meta заключила ядерные контракты на 6.6 ГВт для суперкластера Prometheus.
Май 2025:
➡️ OpenAI поглотила io — стартап Джони Айва (дизайнера iPhone) за $6.5 млрд. Цель — создать «семью устройств», которые перенесут ИИ за пределы экранов.

А Китай идёт через робототехнику

Американцы вертикально интегрируются в фарму, медиа и энергетику. Китайские гиганты выбрали другой путь — физический мир и производство.

Alibaba вложила $100 млн из $140 млн раунда в стартап гуманоидных роботов X Square и ранее в том же году инвестировала $69 млн в LimX Dynamics. Tencent и Alibaba вместе вошли в Unitree Robotics, оценка компании превысила $1.4 млрд — это производитель роботов-собак и гуманоидов, ставших звёздами китайского Нового года. ByteDance массово нанимает специалистов по роботике и уже выпустила более тысячи роботов собственного производства.

С начала 2026 года в Китае происходит в среднем 2-3 инвестиционных события в день в секторе воплощённого интеллекта и роботики.

Почему именно сейчас?

OpenAI прогнозирует операционный убыток $8 млрд в 2025 году, а к 2028-му расходы достигнут $45 млрд в год. При таком раскладе подписки за $20/мес с пользователя — это капля в море. Нужны отрасли, где ИИ создаёт ценность, которую можно монетизировать иначе: через долю в прибыли от разработанного препарата, через маржу устройства, через контроль над энергетической инфраструктурой.

Это новая стратегия, а не диверсификация

ИИ-лаборатории начинают вести себя как вертикально интегрированные конгломераты. Биотех, энергетика, железо, роботика, медиа — каждое направление решает одну задачу: создать точку контроля над отраслью, а не просто продавать в неё API.

Anthropic зашла в фарму — значит, хочет участвовать в экономике от открытия молекулы до вывода лекарства. OpenAI купила энергетику — значит, не хочет зависеть от цен на электричество. Купила дизайн-студию — значит, видит себя следующим Apple. Купила медиа — значит, строит собственный канал влияния. Китайские гиганты контролируют производство роботов — значит, будут определять, как ИИ входит в физический мир.

Мы наблюдаем первую фазу перестройки экономики через ИИ — не сверху (через интерфейсы), а снизу (через контроль над реальными активами). Компании, которые сегодня выглядят как software-стартапы, через 5 лет могут оказаться крупнейшими игроками в фарме, энергетике и производстве.

Инвестиции в ИИ — это не пузырь в моделях. Это ставка на то, что следующие Amazon, Apple и Pfizer вырастут из ИИ-лабораторий.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2💯2

434 views07:35

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🇷🇺

Затраты российского бизнеса на внедрение и применение ИИ составили 257 млрд рублей в 2025 году
В 2023 году этот показатель составил 145 млрд рублей, в 2024 году — 203 млрд рублей, среднегодовой прирост затрат составляет порядка 50 млрд рублей.

🖥

На базе Главгосэкспертизы появится Центр инженерии данных и технологий ИИ
Задачами центра будут создание методологии работы с данными о строительстве и внедрение отраслевых решений.

📌

В Башкортостане создадут Региональный центр ИИ
Центр на базе межвузовского кампуса станет единым интегратором и «окном возможностей» для заказчиков из бизнеса и госведомств.

📉 Комплексное внедрение ИИ позволит в России достичь уровня инфляции в 4%
Эффект будет достигнут за счет роста производительности труда и снижения себестоимости продукции

❤️

За год Яндекс сэкономил 4,5 млрд рублей от внедрения в поиск ИИ-технологий
Внедрение Alice AI Search и другие оптимизации позволили втрое снизить себестоимость ответов ИИ.

🤖

У Яндекса появился ИИ-сотрудник Стефания
ИИ-ассистента внедрили прямо в процесс разработки около двух месяцев назад в одной из бизнес-групп компании.

👨‍💻 SuperJob запустил первый в России ИИ-маркетплейс
Теперь компании могут бесплатно публиковать вакансии для цифровых сотрудников, а ИИ-агенты — размещать резюме и откликаться на вакансии.

📞

«МегаФон» открыл корпоративным клиентам доступ к 25 ИИ-сервисам
Универсальная подписка позволяет создавать тексты, графику, видео, аудио и программный код без оплаты каждой отдельной модели ИИ.

❤️

"Союзмультфильм" планирует запустить ИИ-платформу, которая позволит пользователям создавать анимацию с персонажами студии
Лучшие короткие видеоролики,созданные пользователями, будут демонстрироваться на телеканале "Мультиландия".

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1

376 views06:33

Тест Тьюринга

⚔️

Продолжение холодной ИИ-войны Запада и Востока

OpenAI, Anthropic, Google — три компании, которые конкурируют друг с другом за одних и тех же корпоративных клиентов, объявили о совместной разведывательной операции против китайский разработчиков.

Через Frontier Model Forum, некоммерческую организацию, основанную ими вместе с Microsoft ещё в 2023 году, они начали обмениваться данными об атаках. Цель — остановить промышленное копирование американских моделей китайскими компаниями.

Как это работает это копирование?

Схема называется adversarial distillation — «враждебная дистилляция».

Принцип простой: китайская компания создаёт тысячи фиктивных аккаунтов, массово запрашивает GPT или Claude, собирает ответы и обучает на них собственную модель-«студента». В результате получается модель, обученная на интеллекте американского флагмана за $100–200 тыс. вместо $1 млрд.

Именно так некоторые объясняют громкий выход DeepSeek R1 в январе 2025 года. Модель почти сравнялась с продуктами OpenAI — при официально заявленных затратах в десятки раз меньших.

Довод в пользу этой версии в поведенческих уликах: в декабре 2025 года исследователи MIT зафиксировали, что GLM-модели китайской компании Zhipu называют себя Claude примерно в 50% случаев, если обойти системный промпт. У ранних версий DeepSeek V3 была аналогичная аномалия: при специальных запросах модель представлялась как ChatGPT.

Anthropic опубликовала конкретные цифры:
❗️ MiniMax — ~13 млн запросов (массовая экстракция возможностей)
❗️ Moonshot AI (Kimi) — ~3,4 млн (агентные задачи, программирование, computer vision)
❗️ DeepSeek — ~150 тыс. (фундаментальная логика, alignment-поведение)

Всего более 16 млн несанкционированных обменов через ~24 тыс. фиктивных аккаунтов.

Что теперь изменится?

Американские гиганты начали обмен четырьмя категориями данных:
✅ отпечатки фиктивных аккаунтов;
✅ инфраструктура прокси-серверов;
✅ усиленные процедуры регистрации;
✅ классификаторы, позволяющие распознать сам факт дистилляции по характеру запросов.

Но это не серебряная пуля.

Последние шесть попыток остановить дистилляцию — запреты в ToS, блокировки по геолокации, банирование аккаунтов, лоббирование запретов — провалились одна за другой. Китайские лаборатории обходили блокировки через сторонние прокси, а новые фиктивные аккаунты стоят буквально ничего.

Экономика неумолима: китайские модели уже в 14 раз дешевле американских конкурентов, и стимул копировать, а не строить с нуля, только растёт.

Однако новый альянс меняет игру по нескольким направлениям:

1️⃣ Паттерн атаки, найденный в Claude, сразу блокируется и в GPT, и в Gemini еще до начала масштабной эксплуатации.

2️⃣ 16 млн задокументированных обменов — это доказательная база. OpenAI уже передала меморандум в Комитет Конгресса по Китаю. Следующий шаг видится как гражданские иски.

3️⃣ Администрация Трампа включила создание центра по противодействию adversarial distillation в AI Action Plan. Коалиция трёх крупнейших лабораторий даёт этому импульс.

Скорость прогресса китайского опенсорса, вероятно, немного замедлится, особенно в части копирования самых свежих возможностей. Но говорить о полной остановке сложно. Те, кто уже обучил модели на украденных данных, сохранят фору. А те, кто только начинал — столкнутся с реальным барьером.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2🔥2💯2

344 views07:04

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

🇷🇺

Владимир Путин поручил Правительству и главам регионов сформировать Национальный план внедрения ИИ
Президент подчеркнул, что регулирование должно не сдерживать разработку, а служить стимулом для опережающего внедрения передовых технологий.

🚙

Росстандарт принял новый ГОСТ на мониторинг сонливости водителя с помощью ИИ
Системы должны анализировать частоту и длительность зевоты водителя, наклоны головы, мимику лица, темп речи.

👨‍💻

Правительство Санкт-Петербурга начинает внедрение ИИ для автоматического отбора кандидатов в исполнительные органы власти
Нейросеть может уточнить детали, например ожидаемую зарплату или знание иностранного языка, но финальное решение о найме остается за человеком.

🛰

Российские специалисты разработали ИИ для робота "Теледроид", который будет выполнять задачи на МКС
Робот получает голосовые команды от оператора или космонавта, анализирует их и выполняет конкретные действия.

🖥

К2 Нейротех разработала облачную платформу для разработки и внедрения решений на основе ИИ в условиях промышленных нагрузок
Решение сократило затраты на администрирование в 2-3 раза, а эффективность работы оборудования выросла в 5-7 раз.

😷

Ученые ВолгГМУ и Исламского университета Азад в Иране создали нейросеть для определения тяжести ОРВИ
Система может отличать грипп от других острых респираторных вирусных инфекций, анализируя температуру, артериальное давление, уровня глюкозы в крови и другие симптомы.

🐷

Ученые Университета Иннополис разработали систему бесконтактного взвешивания свиней на основе компьютерного зрения
Система включает несколько моделей ИИ: первая — находит свинью в кадре видеопотока, вторая — отсеивает непригодные для измерения кадры, а третья — на 96% правильно определяет вес.

🧼

X5 внедрила систему компьютерного зрения для контроля мытья рук на производстве готовой еды
Технология распознает сотрудников по цифровым шевронам на униформе, фиксирует факт мытья рук и оценивает качество выполнения процедуры.

🏦

Британский банк Lloyds внедрил ИИ-бота в совет директоров
Бот поможет избавиться от "человеческих предрассудков при принятии решений и лучше подготовить членов совета директоров к встречам высокого уровня".

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥2

330 views07:50

Тест Тьюринга

🧠

ИИ может неожиданно "поглупеть". Как за этим следить?

Есть часто повторяемая в кругах разработчиков история, когда говорят: «модель раньше работала отлично, а теперь деградировала». Обычно это списывают на эффект привыкания или повышенные ожидания. Но иногда интуиция не обманывает.

Кейс AMD и Claude Code

В начале апреля Стелла Лоренцо, старший директор AI-группы в AMD, опубликовала анализ 6 852 сессий с Claude Code, 17 871 блока рассуждений и 234 760 вызовов инструментов. Вывод был неприятным: «Теперь Claude нельзя доверять выполнение сложных инженерных задач».

Что конкретно изменилось с февраля по март 2026?

1️⃣ Глубина чтений файлов упала с условных 6,6 до 2 условных единиц, например, блоков текста по 100 страниц: модель перестала вдумчиво изучать контекст, который ей предложил пользователь.
2️⃣ Скрипт завершения, отслеживающий «уклонение от задач», до 8 марта не срабатывал ни разу, а после этой даты стал срабатывать в среднем 10 раз в день.

3️⃣

Доля промптов с негативной эмоциональной окраской выросла с 5,8% до 9,8% — это косвенный маркер пользовательской фрустрации.

Команда Лоренцо в итоге переключилась на другого провайдера.

Что ответил Anthropic?

Компания признала два изменения: введение механизма «адаптивного мышления» 9 февраля и понижение дефолтного уровня с «high» до «medium» 3 марта. Их рекомендация — вручную выставить максимальный уровень обратно.

Критики саркастично заметили: это как выпустить апдейт, снизивший мощность двигателя, а потом советовать «просто жать педаль сильнее».

Это не новая история

Самый громкий предыдущий инцидент в августе–сентябре 2025 года завершился тем, что Anthropic опубликовал пост, подтвердивший три инфраструктурных бага, затронувших до 16% запросов Sonnet 4.

А ещё раньше, в 2023-м, исследователи из Stanford и UC Berkeley обнаружили, что GPT-4 решал задачу определения простых чисел с точностью 97,6%, а GPT-4 — с точностью 2,4%. OpenAI тогда ответил примерно так же, как Anthropic сейчас: «мы не делаем модель глупее, это вам кажется».

Почему это важно для бизнеса?

У Лоренцо было 6 852 сессий данных, чтобы доказать деградацию. У большинства команд — ноль. Мы замечаем, что инструмент «как-то не так работает», начинаем переделывать промпт и виним себя за недостаточную точность. Но у нас нет телеметрии, чтобы точно увидеть что происходит

Вот в чём реальный риск внешнего AI-провайдера: качество может молча деградировать, и вы не узнаете об этом, пока кто-то не потратит недели на сбор логов. Модели обновляются непрозрачно, дефолтные настройки меняются без уведомления, а «один и тот же» продукт в марте и в июне может быть совсем разным.

Вы начинаете доверять определённому поведению, а потом оно меняется — и ваше приложение, построенное поверх, начинает давать сбои.

Вывод простой: если вы строите рабочие процессы на AI-инструментах — вам нужна собственная система мониторинга качества. Не «ощущения», а метрики. Иначе вы узнаете о деградации последними.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3❤2👍1

373 views07:04

Тест Тьюринга

Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей

📆

📑 ГД одобрила в I чтении ЭПР в цифровых инновациях и ИИ
Законопроектом предусматривается исключение "правового барьера" как обязательного условия для создания ЭПР.

⛽️ «Газпром нефть» научила ИИ проектировать тысячу нефтяных скважин в час
ИИ-агент обрабатывает миллионы параметров: от геологических особенностей месторождений и физики процессов до технических возможностей бурения и экономики проекта.

💙

Новый Центр палладиевых технологий "Норникеля" планирует создавать новые материалы и сплавы с помощью ИИ
В будущем на основе сгенерированных материалов ИИ должен составить наиболее оптимальную матрицу планирования и экспериментов для проверки свойств материала.

💨

В СберСити внедрили систему безопасности на базе ИИ
Нейросеть в режиме реального времени анализирует видеопотоки, предлагая алгоритм реагирования при обнаружении признаков ЧС или девиантного поведения.

📲 Российские ученые нашли способ переносить глубокие семантические знания из LLM в компактные рекомендательные системы
Для пользователя это повышает точность подбора контента и при этом не замедляет работу сервисов.

🖼

Yandex Research и НИУ ВШЭ предложили метод, который ускоряет генерацию изображений без потери качества
Метод Scale-wise Distillation of Diffusion Models снижает вычислительную нагрузку при генерации изображений, что позволяет получать результат за 0,3–0,4 секунды.

👩‍🎓

До 100 вузов России смогут подключиться к первому ИИ-ассистенту для высшего образования «ЛаньGPT» в 2027 году
Сервис используется для поиска и изучения верифицированных источников, анализа информации, подготовки учебных материалов, написания текстов с нуля и других задач.

🤖

OpenAI представила GPT-5.4-Cyber для специалистов по кибербезопасности
Модель может анализировать скомпилированное ПО и находить потенциальные угрозы даже без доступа к исходному коду.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥1👏1

339 viewsedited 07:05

Тест Тьюринга

👍

Позиция по ИИ скоро станет фактором политических выборов в развитых странах

В феврале–марте 2026 года еще три компании провели массовые сокращения и открыто назвали ИИ причиной. При этом компании очень не похожи на друг друга.

1️⃣

Block — финтех-сервисы для малого бизнеса и денежных переводов (Square, Cash App, Afterpay) — уволил 4 тыс. из примерно 10 тыс. сотрудников.

«Меньшая команда с ИИ-инструментами делает больше и лучше», — написал CEO Джек Дорси акционерам.

2️⃣

Morgan Stanley — один из крупнейших инвестиционных банков мира с выручкой $70,6 млрд в 2025 году — сократил 2,5 тыс. из примерно 83 тыс. сотрудников. Формально это лишь 3%, но принципиально важно другое: сокращение случилось на пике доходов, не в кризис.

3️⃣

Atlassian — разработчик Jira, Confluence и Trello, инструментов, которыми ежедневно пользуются миллионы команд по всему миру — уволил 1,6 тыс. из примерно 16 тыс. За две недели до объявления компания запустила ИИ-агентов прямо в Jira: они выполняют задачи вместо людей по тому же рабочему процессу. Продуктовый релиз и волна увольнений — кажется, это не совпадение.

Одновременно в прошлом месяце выходит опрос: 57% зарегистрированных избирателей США считают, что риски ИИ перевешивают пользу. По данным Quinnipiac — 55% ожидают от ИИ больше вреда, чем пользы в повседневной жизни. Это уже не позиция обеспокоенного меньшинства. Это большинство.

Теперь давайте пройдёмся в будущее по траекториям, которые история уже показывала.

Когда в конце XIX века железные дороги и нефтяные корпорации концентрировали богатство и одновременно разрушали привычный уклад жизни миллионов, то сначала возникло общественное напряжение, затем политические движения, затем антитрестовый закон Шермана и эпоха разрушения трестов при Рузвельте. Тогда Цикл занял около 30 лет. Социальные сети сжимают подобные процессы до 3–5 лет.

Вот три сценария, которые уже начинают вырисовываться:

➡️

Организованные «отмены» компаний, публично связавших ИИ с массовыми сокращениями. Не петиции — а целенаправленные бойкоты конкретного бренда. Прецедент уже есть: #QuitGPT собрал 2,5 млн человек за одну ночь после военного контракта OpenAI. Следующая волна, вероятно, будет про занятость.

➡️

Появление специализированных регуляторов — функциональных аналогов антимонопольных служб, но заточенных под ИИ. В Сенат США внесён законопроект, обязывающий компании ежеквартально отчитываться о влиянии ИИ на персонал.

➡️

ИИ как ключевой вопрос выборов. По данным TechPolicy.Press, 97% американцев поддерживают регулирование ИИ — это редкий двухпартийный консенсус. Политик, первым предложивший понятный «ИИ-налог» или обязательный фонд переобучения, получит готовую электоральную базу вне зависимости от партии.

Очень мало сомнений, что в следующем году ИИ повестка наполнится мощным социальным негативом. Этот голос уже отчеливо слышен.

💬

Тест Тьюринга. События в сфере ИИ. Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2💯2🔥1👏1

355 views07:05

About

Blog

Apps

Platform