Ml – Telegram

$15.000.000.000 в Scale AI (49 % доли в компании)

Эта компания занимается разметкой данных, её клиентами являются все крупные ML-компании

Новая исследовательская лаборатория для разработки суперинтеллекта (ASI), который должен превосходить человеческие когнитивные способности, из 50 специалистов для работы над этим амбициозным проектом, включая
Scale AI, Google DeepMind и Sesame

27 views12:33

Где заканчивается разум и начинается мир — статья Энди Кларка

Наиболее примечательным является именно тезис расширенного познания, поскольку он лучше всего обоснован и выступает фундаментом для последующих расширений

Согласно этому тезису, внешние инструменты и артефакты могут быть легитимной частью когнитивной системы субъекта

То есть, познание – это не только то, что происходит внутри черепной коробки субъекта

В пользу этого приводится два базовых аргумента

Сначала идёт негативный довод, указывающий на произвольность границы «черепа и кожи», в которую обычно помещают познание
Из того, что нам кажется, что мы думаем исключительно своей головой, не следует, что мышление исчерпывается только процессами в голове

В пользу интракраниализма (представления о том, что познание ограничено черепной коробкой) нет сногсшибательного аргумента, позволявшего бы раз и навсегда закрыть вопрос
Есть некоторые интересные рассуждения прагматического характера, но и с ними, что называется, не всё так однозначно

В сухом остатке известна генеалогия этого воззрения, объясняющая, почему оно было вшито в когнитивную науку на старте

Если кратко, то во всём виноват Декарт со своим дуализмом (на самом деле триализмом)

Из забавного: разбирая картезианские посылки когнитивных наук, Майкл Уилер по сути своей видит в тех, кто им противостоит, интуитивных хайдеггерианцев

Видимо, иногда «4E» — это и есть то, что бытие хочет услышать в ответ на свой зов

Однако есть и позитивный довод

Кларк предлагает представить Отто, страдающего Альцгеймером, который пользуется блокнотом, чтобы «запоминать» события
Если внешний артефакт исполняет ту же функцию, что и естественная когнитивная способность, то на каком основании мы говорим, что артефакт не может быть частью когнитивной системы субъекта?

Кларк считает, что после отвержения догмы о черепе и коже, оснований нет и по принципу паритета внешние артефакты могут быть частью когнитивной системы

Нетрудно догадаться, что суровой критике подверглись и аргументы Кларка, и сам тезис расширенного познания

Фред Адамс и Кен Айзава, среди прочего, критиковали расширенное познание за потенциальную избыточность для науки
Они даже ставили на то, что «наука о познании будет походить на науку о физических, биологических и химических процессах»

Психологи, помимо полемики о теоретической значимости тезисов расширенного, распределенного и прочего внечерепного познания, они указали на эмпирический аналог этих тезисов в виде исследований трансактивной и совместной памяти
Ставка Адамса и Айзавы не то, что не сыграла, а оказалась заведомо не самой удачной

Чем показателен этот сюжет?
Так случается, что иногда в философской дискуссии звучит сакраментальный вопрос, призванный спустить всех с небес на землю: «А как же надои?»
И по иронии судьбы «надои» иногда действительно предъявляются

Другое дело, что в этот же самый момент становится понятно, что суть фундаментальных разногласий не сводится к выяснению того, можно ли теорию как-то прагматически приспособить или даже эмпирически применить

24 views12:39

"Dimensionality and dynamics for next-generation artificial neural networks"

Прогресс в нейроморфизации искусственного интеллекта:

Предложенный исследователями новый подход к ML представляет вдохновленные мозгом структуры и петли обратной связи, позволяющие ИИ-системам обрабатывать информацию более эффективно и адаптивно
Эта инновация может снизить потребность в ресурсах, расширить приложения в реальном времени и предложить более глубокое понимание как продвинутого ML, так и человеческой психики

https://techxplore.com/news/2025-06-rethinking-ai-effective-human-approach.html

Tech Xplore

Rethinking AI: Researchers propose a more effective, human-like approach

New research from Rensselaer Polytechnic Institute (RPI) could help shape the future of artificial intelligence by making AI systems less resource-intensive, higher performing, and designed to emulate ...

22 views15:16

"Autonomic physiological coupling of the global fMRI signal"

Психофизиологи выяснили, что вегетативная нервная система является ключевым драйвером глобального сигнала фМРТ

Ученые изучили глобальный пространственно-временной паттерн в мозге и показали, что этот паттерн тесно связан с работой вегетативной нервной системы, которая регулирует возбуждение и другие непроизвольные функции организма
Исследователи обнаружили устойчивую связь между глобальным сигналом фМРТ и множеством изменений в организме, управляемых вегетативной нервной системой, включая сердечно-сосудистую, легочную, экзокринную системы и гладкую мускулатуру
Эти связи наблюдались как в состоянии покоя, так и при экспериментальном воздействии на уровень возбуждения и даже во время сна
Открытие помогает лучше понять, как мозг взаимодействует с телом и как вегетативная нервная система влияет на активность всего мозга

https://medicalxpress.com/news/2025-06-autonomic-nervous-key-driver-global.html

Medicalxpress

Autonomic nervous system is key driver of global fMRI signal, study finds

The activity of the human brain is known to be closely connected to other physiological signals, such as heart rate and breathing. A study by researchers at the University of California Los Angeles (UCLA) ...

20 views15:28

"Self-Adapting Language Models"

Учеными из Массачусетского технологического института предложен SEAL (Self-Adapting LLMs) — новый подход в искусственном интеллекте, который позволяет большим языковым моделям самостоятельно адаптироваться к новым задачам
Вместо статичных весов модель генерирует собственные данные для дообучения и инструкции по обновлению

При получении нового входа модель создает "самоправки" ("self-edits") — может реструктурировать информацию, настроить гиперпараметры или использовать инструменты для улучшения данных
Эти самоправки приводят к постоянным обновлениям весов через дообучение

Модель учится создавать эффективные самоправки с помощью обучения с подкреплением, где подкреплением служит качество работы обновленной модели

В отличие от других методов, SEAL использует собственную генерацию модели для управления адаптацией, что показывает многообещающие результаты в экспериментах

Вывод: SEAL — это важный шаг в сторону самообучающихся языковых моделей, способных автономно дообучаться под новые задачи с минимальным вмешательством

https://arxiv.org/abs/2506.10943

arXiv.org

Self-Adapting Language Models

Large language models (LLMs) are powerful but static; they lack mechanisms to adapt their weights in response to new tasks, knowledge, or examples. We introduce Self-Adapting LLMs (SEAL), a...

22 views15:34

"Photon transport through the entire adult human head"

Ученые впервые смогли зафиксировать свет, прошедший через всю человеческую голову насквозь

Исследователи использовали мощные лазеры и сверхчувствительные детекторы, чтобы поймать фотоны, которые прошли от одной стороны головы к другой через череп и мозг

Это может революционизировать неинвазивную визуализацию мозга, т.к. существующая технология fNIRS видит только поверхностные слои мозга (4 см глубиной), а новый подход потенциально позволит изучать глубокие области мозга, отвечающие за память, эмоции и движение

В будущем это может привести к созданию портативных и доступных устройств для диагностики инсультов, травм мозга и опухолей в условиях, где нет доступа к МРТ или КТ

Ограничения: пока метод требует 30 минут сбора данных и работает только на людях со светлой кожей без волос

https://medicalxpress.com/news/2025-06-scientists-entire-human-doors-brain.html

Medicalxpress

Scientists detect light passing through entire human head, opening new doors for brain imaging

For decades, scientists have used near-infrared light to study the brain in a noninvasive way. This optical technique, known as fNIRS (functional near-infrared spectroscopy), measures how light is absorbed ...

32 views15:39

Meaning as Use, Application, Employment, Purpose, Usefulness (от 10 июня 2025)

Людвиг Витгенштейн размышлял о том, как язык помогает нам понимать мир и общаться
Исследовал разные области: математику, психологию, восприятие цвета, эстетику: как полигоны для экспериментов с языком

Работал с открытыми и доступными записями, что позволило нам понять его мысли, несмотря на изменения в направлении его исследований

Одной из идей Витгенштейна было то, что смысл слова определяется его использованием
Он писал об этом с самого начала своей карьеры и до последних дней
В его записях часто встречаются слова «Gebrauch» (использование), «Anwendung» (применение), «Verwendung» (употребление) и «Zweck» (цель)

Эти термины помогают понять, как символы и слова в языке получают свой смысл

https://arxiv.org/abs/2506.07131v1
https://arxiv.org/pdf/2506.07131v1.pdf

arXiv.org

Meaning as Use, Application, Employment, Purpose, Usefulness

Arising from the whole body of Wittgenstein's writings is a picture of a (not necessarily straight, linear, but admittedly tireless) journey to come to terms with the mechanics of language as an...

25 views08:56

Пять ступеней участия человека: проверьте, на каком уровне ваша работа переживёт ML-революцию
“Шкала участия человека” и «Карта хочу-могу» разложили 844 профзадачи по цветам светофора — узнайте, в какой зоне окажутся ваши навыки в 2026

Впервые стэнфордское исследование совместило пятиуровневую «шкалу участия человека» с «картой хочу-могу» для 844 профзадач, превратив туманную дискуссию об автоматизации в чёткую дорожную карту того, какие профессии ML поглотит в первую очередь и где человеческие навыки резко вырастут в цене

Если отбросить самых упертосамоуверенных, что человек – венец природы, а ML – стохастический попугай, аргументация технооптимистов стоит на 2х ключевых тезисах:
• как и при всех прошлых технореволюциях, одни профессии исчезнут, но другие появятся, и потому, в большинстве своем, люди останутся при деле, лишь поменяв профессии
• ML просто не способен заменить человека во всем, будущее за гибридными «Профкентаврами людей и ML», где и людям, и ML-агентам найдется достойное место

Авторы нового (крайне важного сменой угла зрения и прорывного по методологии) исследования Стэнфордского универа показали примитивность и практическую бесполезность обоих ключевых тезисов
• Они хороши, если использовать их в общефилософских дебатах
• Но они ничего не дают для выстраивания системы социально-человеческих измерений и внедрения инструментов прогнозирования, необходимых для адаптации общества к цунами грядущего массового внедрения LLM-агентов во все индустрии и на все уровни экономики

Что было сделано
104 профессии были разложены на 844 задач оценили по двум измерениям:
• куда люди хотят пустить ML-агентов
• где это технически возможно

Авторы посмотрели на потенциал гибридизации людей и ML не с общих позиций, а конкретно:
• хорошо, внедрим профкентавров
• так сколько тогда людей в рабочем контуре останется (столько же? больше? меньше чем было?)

Для ответа на этот вопрос появилась “Шкала участия человека” Human Agency Scale: пятиуровневая шкала H1–H5, показывающая, сколько человеческого участия требуется при выполнении задачи совместно с ML-агентом

2) Потом авторы составили «Карту желаний и возможностей» («Карту хочу-могу» Desire × Capability), чтобы оценить:
• где люди сами просят автоматизировать задачи, а где ML-агенты готовы заменить их вопреки желанию
• где автоматизация включит «зелёный свет», а в каких профессиях вырастет ценность человеческого участия

Получился двумерный «ландшафт» задач, разбитый на зоны «зелёный свет», «красный свет», «R&D-возможность» и «низкий приоритет» в зависимости от того, насколько работники хотят автоматизации и насколько она технически возможна

Ключевые «новинки» исследования
Шкала участия человека наконец-то позволила измерить единой линейкой, сколько человека должно оставаться в контуре
Это важно для практики: помогает выбирать между полной автоматизацией и ко-работой

Карта хочу-могу предоставила разбивка задач на Зеленый цвет (хотим + можем), Красный (можем, но люди против), Надо разрабатывать R&D Opportunity (хотим, но пока не умеем) и Пока неважно Low Priority. Это даёт быстрый «радар» для инвестиций и политики занятости

Заточенная на профессии Worker-centric оптика показала, что статистика использования (например, логи Claude.ai) плохо отражает реальный спрос: профессии с самым высоким запросом на автоматизацию составляют лишь 1.26 % текущего использования LLM-чатов

Выявлены конкретные сигналы пересборки навыков
Проведенный анализ связывает каждую задачу с O*NET-скиллами () база Occupational Information Network Министерства труда США) и показывает: ценность скилов типа «анализа данных» уходит вниз, а «налаживания отношений» и «координации ресурсов» — вверх
Это добавляет стратегический слой к чисто количественной оценке прироста производительности

Почему это принципиально
Про смену угла зрения сказано выше

2 новые карты можно прямо вкручивать в программы рескиллинга, фильтры грантов и регуляторные «светофоры»

Риск «красной зоны» - там возможна социальная турбулентность

arXiv.org

Future of Work with AI Agents: Auditing Automation and...

The rapid rise of compound AI systems (a.k.a., AI agents) is reshaping the labor market, raising concerns about job displacement, diminished human agency, and overreliance on automation. Yet, we...

489 views15:43

«Архимеда будут помнить, когда забудут Эсхила, потому что языки умирают, а математические идеи — нет
«Бессмертие» может быть глупым словом, но, вероятно, у математика больше всего шансов на то, что бы оно ни значило»

— Г. Х. Харди, «Апология математика», 1941 год

25 views18:15

Квантовые гейты: функциональный базис: I, X, Y, Z

Матрицы Паули — это не просто набор квантовых гейтов, а полный функциональный базис для всех однокубитных операций. Разбираемся, почему четыре простые матрицы могут описать любое квантовое преобразование

Математическая основа

Матрицы Паули вместе с единичной матрицей образуют ортонормальный базис в векторном пространстве всех эрмитовых матриц размерностью 2 × 2
Это означает, что любую эрмитову матрицу можно единственным образом разложить по этому базису:

H = α0I + α1σx + α2σy + α3σz,

где все коэффициенты α — вещественные числа

Сами матрицы имеют вид:

I = (1 0)
(0 1),
σx = (0 1)
(1 0),
σy = (0 −i)
(i 0),
σz = (1 0)
(0 −1)

Почему именно эрмитовы матрицы?

В квантовой механике эрмитовы операторы представляют наблюдаемые величины
Матрицы Паули описывают измерения спина вдоль осей X, Y и Z в трёхмерном пространстве

Поскольку любая физически измеримая величина для кубита должна быть эрмитовой, базис Паули охватывает все возможные наблюдаемые двумерного квантового пространства

Именно поэтому матрицы Паули иногда обозначают как I, X, Y, и Z

Функциональная полнота

Термин «функциональный базис» означает, что через эти четыре матрицы можно выразить любое унитарное преобразование кубита. Используя формулу Эйлера для матричных экспонент:

U = exp(i(α1σx + α2σy + α3σz),

можно получить произвольный однокубитный гейт
Это делает базис Паули универсальным для квантовых вычислений на одном кубите

Геометрическая интерпретация

Матрицы Паули связаны с сферой Блоха — геометрическим представлением состояний кубита
Вектор Паули σ = σxx + σyy + σzz обеспечивает отображение из трёхмерного вещественного пространства R3 в пространство бесследовых эрмитовых матриц:

a⋅σ = (a3a1 − ia2) (a1 + ia2−a3)

Алгебраические свойства

Матрицы Паули обладают уникальными свойствами:

* Эрмитовость: σi† = σi
* Унитарность: σi†σi = I
* Бесследовость: tr(σi) = 0
* Антикоммутация: {σi, σj} = 2δijI

Произведение матриц Паули даёт: σiσj = δij + iεijkσk, где εijk — символ Леви-Чивиты

Связь с группами Ли

Матрицы iσx, iσy, iσz образуют базис алгебры Ли SU(2), которая экспоненцируется в группу SU(2) — группу всех унитарных матриц размерности 2 × 2 с единичным определителем
Это означает, что базис Паули порождает все возможные квантовые вращения в двумерном пространстве

Практическое применение

В квантовых вычислениях базис Паули используется для:

* Разложения произвольных гейтов в элементарные операции
* Квантовой томографии — восстановления состояний через измерения
* Анализа ошибок в квантовых схемах
* Оптимизации квантовых алгоритмов

Базис I, X, Y, Z — это математический фундамент, на котором строится вся архитектура однокубитных квантовых вычислений
Четыре простые матрицы содержат в себе всю полноту квантовой логики для одного кубита

23 views07:38

AlphaEvolve: как искусственный интеллект начинает открывать новую математику

В мае 2025 года Google представила AlphaEvolve — революционного ML-агента, который способен разрабатывать сложнейшие математические алгоритмы с помощью больших языковых моделей и эволюционного отбора

Эта система уже демонстрирует прорывные результаты: она не просто поддерживает учёных в доказательствах или вычислениях, а сама открывает новые решения давно открытых и открытых задач, предлагая оригинальные подходы, к которым человечество шло десятилетиями

AlphaEvolve опирается на мощные модели Gemini, которые предлагают гипотезы и пишут код, и на встроенных автоматических оценщиков, проверяющих корректность и эффективность этих решений. Но в отличие от предыдущих поколений ML, этот агент не ограничен задачами автоматизации
Он способен развивать и видоизменять собственные подходы — словно участвует в исследовательском процессе как полноценный математик

Самый яркий пример — новое решение задачи умножения комплексных матриц 4×4. AlphaEvolve нашла способ выполнить это с 48 скалярными умножениями — результат, превосходящий знаменитый алгоритм Штрассена, который считался эталоном с 1969 года

Более того, система не просто случайно наткнулась на улучшение: она прошла через 15 итераций мутаций и селекции, методично выводя эффективную структуру, которую можно математически интерпретировать и воспроизвести

Система была также протестирована на более чем 50 открытых математических задачах из анализа, комбинаторики, геометрии и теории чисел

В 75 % случаев AlphaEvolve воспроизвела лучшие на сегодня известные решения, что само по себе впечатляет
Но более важно то, что в 20 % задач она предложила лучшие решения, повышая текущие нижние или верхние оценки, и тем самым реально продвигая границу знания

Один из таких случаев — проблема поцелуев в 11-мерном пространстве
Задача, мучившая математиков более трёхсот лет, касается максимального количества сфер, касающихся центральной сферы. AlphaEvolve предложила конфигурацию из 593 внешних сфер, улучшив существующую нижнюю границу и тем самым внесла новый вклад в многомерную геометрию

Google DeepMind

AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms

New AI agent evolves algorithms for math and practical applications in computing by combining the creativity of large language models with automated evaluators

396 views13:24

По итогам AI Startup School от YC 2+1 взгляд на будущее ML: масштабирование, переосмысление или возвращение к биологии?

Вчера на AI Startup School от YC собрались ведущие исследователи, чтобы поделиться с молодыми стартаперами видением того, как мы дойдем до AGI

3 совершенно разных подхода от лидеров индустрии, которые сегодня определяют направление развития отрасли

1. Джаред Каплан, главный научный сотрудник Anthropic.
Соавтор знаменитых законов масштабирования считает, что путь к AGI лежит через планомерное улучшение 6 известных компонентов:
Знания — более глубокое понимание мира
Память — долгосрочная память систем
Надзор — лучший контроль и безопасность
Более крупные задачи — переход от минут к часам и дням работы
Мультимодальность — интеграция текста, изображений, аудио
Масштаб — продолжение увеличения моделей

Философия Каплана - революционных прорывов может и не потребоваться
Достаточно довести до совершенства то, что уже работает
Сейчас сложность задач, которые может решить ML, удваивается каждые 7 месяцев
От секунд в 2021 году до часов в 2024-м

Франсуа Шолле, создатель Keras, экс-исследователь Google: "Мы измеряем не то"
Шолле указывает на фундаментальную проблему: современные бенчмарки тестируют запоминание, а не интеллект
Его определение интеллекта - способность преобразовать небольшой набор примеров из прошлого опыта в решения для широкого круга неизвестных задач
Проблема нынешних LLM — они отлично справляются с "размытым распознаванием паттернов" (увидеть собаку на фото), но плохо с "написанием правил" (посчитать буквы в слове)
Людям доступны оба типа мышления
Его прогноз: 2025 год станет годом "рассуждений во время выполнения" — переходом от запоминания к настоящему мышлению

Bыступление Дэмиса Хассабиса DeepMind
Мозг — единственная доказанная архитектура AGI

CEO DeepMind предлагает самый радикальный взгляд - нужно вернуться к изучению мозга как единственного работающего примера общего интеллекта

Что это значит для будущего?
Каждый подход отражает разную философию развития технологий:

Каплан верит в эволюционный путь — постепенное совершенствование известных методов
Это позиция больших корпораций с ресурсами для масштабирования

Шолле призывает к революции в архитектуре — гибридные системы, сочетающие нейронные сети с символическим ML
Это путь исследователей, ищущих принципиально новые решения

Хассабис предлагает вернуться к основам — изучить мозг и воспроизвести его принципы. Это междисциплинарный подход на стыке ML, нейронауки и биологии

Почему важно понимать эти различия?
Выбор подхода определяет не только технические решения, но и:

1. Куда направлять инвестиции (скейлинг vs исследования vs нейронаука)
2. Какие специалисты нужны (инженеры vs ученые vs биологи)
3. Когда ожидать прорывов (годы vs десятилетия)
4. Как готовиться к изменениям в обществе

Возможно, истина лежит не в одном подходе, а в их сочетании. Но понимание этих различий поможет лучше ориентироваться в мире, где ML развивается с головокружительной скоростью

1:25

Все о блокчейн/мозге/space/WEB 3.0 в России и мире

По мнению СЕО DeepMind Дэмиса Хассабиса, мозг человека единственная доказанная архитектура AGI

Мозг служит "золотым стандартом" для понимания того, каким должен быть AGI.
Настоящий AGI должен соответствовать или превосходить возможности человеческого интеллекта.…

29 views10:23

Результаты тестирования восьми передовых языковых моделей, включая GPT-4.1 и o3 от OpenAI, серию Gemma от Google и DeepSeek-R1, выявили четкую закономерность: с простыми грамматиками и короткими строками модели справляются хорошо, но при увеличении сложности грамматики или длины строки точность резко снижается - даже у моделей, специально оптимизированных для логических рассуждений

454 views06:27

MiniMax Agent представил своего ИИ-агента, который фокусируется на выполнении комплексных задач от начала до конца

Агент создан на основе MiniMax их прорывной модели с 4М токенами контекста

MiniMax Agent работает так:Человек → Требование → Агент → Готовый продукт

Основные возможности:
1. Создание сайтов и лендингов
2. Генерация обучающих материалов с визуальным и аудио контентом
3. Разработка интерактивных презентаций
4. Работа с мультимодальным контентом (текст, изображения, видео, аудио)

Технические особенности:
- Интеграция с GitHub, GitLab, Slack, Figma через MCP
- Многоэтапное планирование задач
- Автоматическое тестирование создаваемых продуктов

Текущие ограничения:
•Использует несколько моделей вместо единой, что влияет на стоимость
•Находится в процессе оптимизации для снижения затрат

Пример: При запросе на создание сайта музея, агент генерирует не только код, но и готовый продукт с контентом, навигацией и медиафайлами

agent.minimax.io

MiniMax Agent: Minimize Effort, Maximize Intelligence

Discover MiniMax Agent, your AI supercompanion, enhancing creativity and productivity with tools for meditation, podcast, coding, analysis, and more!

332 views10:48

IBM начала совместное исследование с французской компанией Inclusive Brains для улучшения интерфейсов мозг-компьютер

Команды работают над системой, которая анализирует не только мозговые волны, но и движения глаз, мимику и другие физиологические сигналы

Алгоритмы ML интерпретируют эти данные и переводят их в команды для управления компьютерами или другими устройствами

Для поиска оптимальных решений они тестируют сотни тысяч различных алгоритмов машинного обучения
IBM предоставляет свои базовые модели Granite и экспертизу в квантовых вычислениях, которые могут помочь в обработке сложных нейросигналов

Технология уже проходит испытания в медицинском центре, где хирурги получают данные о своем уровне стресса и концентрации в реальном времени во время операций
Это помогает поддерживать работоспособность врачей и может улучшить результаты лечения

Inclusive Brains ранее продемонстрировала несколько прототипов: управляемый мыслями экзоскелет и возможность "писать мыслями" сообщения

IBM Newsroom

IBM and Inclusive Brains Bring Together AI, Quantum and Neurotechnologies to Improve the Understanding of Brain-Machine Interfaces

IBM and Inclusive Brains have entered a joint study agreement to experiment with advanced AI and quantum machine learning techniques. The aim of the joint study is to boost the performance of multi-modal brain-machine interfaces (BMIs).

26 views12:19

Д иаграмма показывает прогресс LLM ровно за 2 года с появления оригинальной модели GPT-4 в июне 2023 по сегодня (июнь 2025)

Прогресс показан для двух основных показателей:
– стоимость использования модели (в расчете на 1.000.000 токенов (каждый токен это единица текста от буквы до короткого слова);
– интеллектуальная способность модели, подтверждаемая её показателем прохождения тестов GPQA Diamond Score (показатель того, насколько успешно ML справляется с решением самых сложных, требующих экспертных рассуждений задач, которые ставят в тупик даже эрудированных людей с доступом к поисковикам)

Посмотрите в левый нижний угол диаграммы на способности и стоимость оригинальной модели GPT-4 в июне 2023 и сравните с показателями сегодняшних моделей:
• Рост интеллектуальных способностей +106 %
(с уровня студента-старшекурсника университета (знает основы, но далеко не эксперт) до уровня, превышающего средний среди обладателей профильных PhD
• Снижение стоимости использования модели, примерно – 100 %

N.B. GPQA — это набор очень сложных вопросов уровня аспирантуры в таких областях, как биология, физика и химия
Его главная особенность в том, что вопросы "защищены от поиска в Google"

Это означает, что для ответа на них недостаточно просто найти информацию в Интернете
Требуется глубокое понимание темы, умение рассуждать и связывать воедино сложные концепции

Это и есть суть GPQA, а Diamond score — это оценка за самую сложную часть этого экзамена

Какой вывод можно сделать из диаграммы?
• Пока нет никаких признаков прекращения быстрого роста возможностей ML при постоянно снижающихся затратах
• За следующие 2 года возможности ML вполне могут превысить уровень PhD не менее, чем уровень PhD выше студента-старшекурсника

Как называть таких «ML-сверхумников» будет уже не важно

Важно, что их будет много, и каждый из них будет обладать несопоставимыми с людьми возможностями

И это будет, хотите вы этого или нет

498 viewsedited 14:10

Google предлагает SPARQ-новый метод создания синтетического набора данных, который включает задачи с четко определенными шагами решения, чтобы модели могли учиться не только конечным ответам, но и процессу их получения

Это помогает преодолеть ограничения, связанные с галлюцинациями, поверхностным запоминанием шаблонов, что часто встречается в LLM

Метод также использует автоматизированные подходы для масштабируемого создания данных, минимизируя необходимость в дорогостоящей ручной разметке

24 views14:30

В работе об Emergent Misalignment сбой скрывался не в миллиардах параметров, а в одном линейном направлении внутри активаций

Подтолкни модель к этому вектору — и она злодействует; вырежи его — зло почти исчезает

Другая группа исследователей задала мультимодальной модели миллионы вопросов «что похоже на что» — и выяснила: почти весь здравый смысл укладывается в 66 осей («животное», «инструмент», «красный»…)

Каждая ось совпала с человеческими интуициями и даже с зонами мозга, отвечающими за лица и места

LLM сжимают колоссальные знания и цели в узкий пучок управляемых векторов

403 views17:47

90 % пути пройдено существующими методами, но оставшиеся 10% требуют прорыва

Пример — проблема Какеи: минимальная область на плоскости, в которой можно развернуть иглу, проходя через все направления
В двух измерениях задача решена, но в трёх измерениях — при условии малой, но ненулевой толщины иглы — возникают глубокие связи с дифференциальными уравнениями, геометрией и волновыми фронтами
Эта геометрическая задача оказывается связана с концентрацией энергии в волновых уравнениях, и, следовательно, имеет приложения в физике

Одной из центральных тем становится обсуждение уравнений Навье–Стокса

Тао объясняет, что в их основе лежит борьба между двумя эффектами: диссипацией (вязкость) и транспортом энергии
В двумерном случае (критический режим) вязкость достаточна для сдерживания энергии
В трёхмерном случае (сверхкритический режим) возможны ситуации, где энергия концентрируется, приводя к сингулярности — взрыву решения

Он обсуждает свой вклад 2016 года — конструкцию модифицированных уравнений, в которых взрыв возможен
Эти уравнения упрощены и искусственно «ослаблены», но их анализ позволяет исключить целый класс подходов к доказательству глобальной регулярности
Это важно: вместо поиска положительного решения, Тао показывает, почему многие существующие подходы не сработают

Интересен и другой аспект: идея «жидкостного компьютера»
Тао моделирует конструкцию, в которой взаимодействующие волны воды реализуют логические операции
Это гипотетическая машина, в которой энергия передаётся от одного масштаба к другому с задержкой, позволяя создать цепочку самовоспроизводящихся конфигураций

Вся конструкция — аналог машины Тьюринга, построенной на уравнениях движения жидкости
Если подобная система возможна в рамках настоящих уравнений Навье–Стокса, это будет означать возможность конечновременного взрыва

https://www.youtube.com/watch?v=HUkBz-cdB-k

YouTube

Terence Tao: Hardest Problems in Mathematics, Physics & the Future of AI | Lex Fridman Podcast #472

Terence Tao is widely considered to be one of the greatest mathematicians in history. He won the Fields Medal and the Breakthrough Prize in Mathematics, and has contributed to a wide range of fields from fluid dynamics with Navier-Stokes equations to mathematical…

646 views07:16

Сфера Блоха — превращает абстрактную математику кубитов в наглядную геометрию, когда каждая квантовая операция становится простым поворотом в трёхмерном пространстве, и представляет состояние одного кубита как точку на поверхности единичной сферы

Северный полюс соответствует состоянию |0⟩, южный — |1⟩, а все остальные точки описывают суперпозиции этих базисных состояний
Математически любое состояние кубита записывается как:

∣ψ⟩ = cos(θ/2)∣0⟩ + e^{iϕ}sin(θ/2)∣1⟩,

где θ — угол между вектором состояния и осью Z, а φ — азимутальный угол в плоскости XY

Геометрия квантовых операций

Главная магия сферы Блоха в том, что любая квантовая операция с кубитом — это поворот сферы
Это происходит благодаря изоморфизму между группой SU(2) унитарных матриц и группой трёхмерных вращений SO(3)

Основные гейты как вращения:

• X-гейт поворачивает состояние на 180° вокруг оси X
• Y-гейт — поворот на 180° вокруг оси Y
• Z-гейт — поворот на 180° вокруг оси Z
• Гейт Адамара — сложное вращение, переводящее |0⟩ в равновероятную суперпозицию

Операторы поворота имеют вид: R_x(θ) = e^{−iθX/2}, R_y(θ) = e^{−iθY/2}, R_z(θ) = e^{−iθZ/2}

Интуитивное понимание: сфера Блоха делает абстрактные квантовые состояния визуально понятными
Вместо работы с комплексными числами разработчик видит простые геометрические преобразования

Проектирование алгоритмов: при создании квантовых схем сфера помогает планировать последовательность операций

Нужно повернуть состояние из точки A в точку B?
Просто найдите кратчайший путь на сфере

Отладка и оптимизация: современные инструменты вроде Qiskit показывают траектории состояний на сфере Блоха, что помогает находить ошибки в квантовых программах

Образование: исследования показывают, что студенты значительно лучше понимают квантовые концепции после работы с интерактивными моделями сферы Блоха

Создаются физические устройства на базе Raspberry Pi и ESP32, которые синхронизируют вычисления с реальным вращением сферы
Такие системы используют FPGA для параллельных квантовых симуляций и моторы для физической визуализации состояний

Сфера Блоха работает только для одного кубита

Для многокубитных систем используются Q-сферы или фазовые диски, но они менее наглядны

Внутренние точки сферы представляют смешанные состояния, возникающие при взаимодействии с окружением

Связь между квантовой механикой и геометрией через сферу Блоха — это пример глубокой математической красоты

Комплексное проективное пространство ℂP¹ изоморфно сфере Римана, что делает квантовые состояния объектами дифференциальной геометрии

Сфера Блоха превращает квантовые вычисления из чёрной магии в понятную геометрию
Для любого, кто работает с кубитами, это не просто визуализация — это язык мышления о квантовых состояниях

34 views07:22

About

Blog

Apps

Platform