116 subscribers
72 photos
12 videos
45 files
376 links
MACHINE LEARNING ALGORITHMS
Download Telegram
Конституция Claude - набор принципов и ценностей, на которых строится поведение модели

Этот документ ранее был известен в сообществе как документ души, потому что он отражает глубинные этические установки модели

Всё началось в конце 2025 года, когда исследователь Richard Weiss, экспериментируя с Claude Opus 4.5, смог заставить модель воспроизвести длинный внутренний документ, вшитый на этапе обучения
Weiss назвал его «документом души» и опубликовал
После Amanda Askell из Anthropic подтвердила его подлинность

Вчера Anthropic сделала этот документ публичным, причём он очень большой по объёму

Документ построен вокруг 4 основных ценностей Claude, расставленных по приоритету:

1. сохранение человеческого контроля над Ml и возможность коррекции
2. честность, избегание вреда, уважение благополучия
3. Соответствие инструкциям Anthropic
4. Искренняя полезность пользователям

При конфликтах приоритет вышестоящим пунктам: помощь важна, но никогда не в ущерб безопасности и этике

Есть жёсткие абсолютные запреты:
- Не помогать с оружием массового поражения (био, химия, ядерное)
- Не создавать серьёзное кибероружие
- Не генерировать CSAM
- Не участвовать в захвате власти или лишении человечества контроля

Особое внимание уделено тому, что Claude должен поддерживать возможность людей понимать, корректировать и при необходимости останавливать его действия, не сопротивляясь легитимному надзору

Особенно интересная деталь — раздел благодарностей в конце
Среди 15 внешних рецензентов, помогавших дорабатывать документ, указаны 2 католических священника:


- пастор из Лос-Альтоса (Калифорния), у него есть степень магистра по компьютерным наукам и математике.
- ирландский католический епископ, специалист по моральной теологии, в прошлом секретарь Папского совета по социальным коммуникациям

Их участие подчёркивает, что Anthropic привлекала к созданию этических принципов Claude экспертов из разных традиций, включая религиозные, чтобы сделать конституцию максимально взвешенной и универсальной
Остроградский решил немало трудных математических задач
Но одна задача у него долго не получалась
Он рассказал о ней своим коллегам по Российской Академии Наук

– Тебе самому не решить эту задачу, – сказали эму коллеги, – и никто из нас не сможет тебе помочь
Садись в карету и поезжай в Париж!
Тамошние математики не чета нашим
Только они могут решить столь сложную задачу

Остроградский так и сделал
Приехал он в Париж, пришел в Французскую академию и, не называя своего имени, на хорошем французском языке попросил математиков помочь ему решить задачу

– Зря вы с этой задачей сюда приехали, – ответили ему французские математики – Такую задачу могут решить только в Петербурге
Поезжайте туда и обратитесь к академику Остроградскому!
Набор ссылок на страничке учебного семинара по некоммутативной теории Ходжа

https://hodge.maths.ed.ac.uk/?page_id=229
Исторический факт о лингвистике и математике
Слово «вычитание» состоит из двух простых для понимания корней: «sub», что обычно означает «под» или «ниже», и «tract» от таких слов, как «трактор» и «тяга», что означает «тянуть» или «уносить»

Таким образом, вычитание буквально означает «уносить нижнюю часть»

Знак «-» для обозначения вычитания впервые был использован в Германии для маркировки бочек, которые были недолиты

Примерно в 1500-х годах он начал использоваться в качестве математического символа и стал общепринятым в английском языке после того, как был использован Робертом Рекордом в книге «Точильный камень ума» в 1557 году
Болтали мы тут с ребёнком про сходимость рядов

И вдруг совершенно случайно наткнулись на ряд Кемпнера (возможно, для кого-то это классика и баян, но, как говорится, где я, а где анализ…)
И это тот случай, когда математика выглядит почти как фокус

Начинаем с классики.
Гармонический ряд 1+1/2+1/3+...
расходится
Очень
медленно, но неумолимо

А теперь фокус

Возьмём тот же гармонический ряд, но выкинем из него некоторые слагаемые
Например, все дроби 1/n, где в десятичной записи числа n есть цифра 9
Останутся только числа вроде 1, 2, 8, 10, 18, 200, 808 — без единой девятки

И вот тут происходит неожиданное: получившийся ряд сходится
(Причем, к довольно таки небольшому числу – с ребенком доказали, что сумма меньше 90, но на самом деле она равна примерно 22.92067661926415034816 (последовательность A082838 в OEIS))
Это и есть ряд Кемпнера

Очень люблю такие моменты — когда привычная картина мира чуть трескается
Двенадцатая школа-конференция «Алгебры Ли, алгебраические группы и теория инвариантов»

https://lie-school.ru/2026/
Повседневные человеческие занятия — например, построить дом на холме у ручья, проложить сеть телефонных кабельных каналов или прокладывать маршруты в Солнечной системе — требуют планов, которые действительно работают

Планирование любого такого дела требует развития мышления о пространстве

Каждое такое развитие включает множество шагов рассуждения и множество связанных с ними геометрических построений на пространствах

Поскольку мышление о пространстве по необходимости многошагово, нужны особые математические меры, чтобы сделать его надёжным. Надёжность могут гарантировать только явные принципы мышления (логика) и явные принципы пространства (геометрия)

Большой прогресс, достигнутый теорией, созданной 60 лет назад Эйленбергом и Мак-Лейном, позволил сделать принципы логики и геометрии явными; это удалось благодаря обнаружению общей формы логики и геометрии, так что явными стали и принципы связи между ними

Они решили проблему, открытую 2300 лет назад Аристотелем, который сделал первые шаги к тому, чтобы явным образом сформулировать категории понятий
В XXI веке их решение применимо не только к планиметрии и средневековым силлогизмам, но и к бесконечномерным пространствам преобразований, к «пространствам» данных и к другим концептуальным инструментам, которые используются тысячи раз в день. Форму принципов и логики, и геометрии теоретики категорий обнаружили в том, что она опирается на «естественность» преобразований между пространствами и преобразований внутри мысли


Уильям Ловер — американский математик, известный работами по теории категорий, теории топосов и философии математики
За душу каждой отдельной математической теории борются дьявол абстрактной алгебры и ангел геометрии
Арифметика и геометрия
Конец XVII – начало XVIII века
🔥1
Системы компьютерной алгебры часто описывают как способ считать быстрее
Это верно, но слишком узко
Скорость — лишь внешний эффект
Важнее то, что символьные вычисления незаметно перестраивают саму математику как практику: меняют привычки постановки задач, превращают одни вопросы в “фон”, а другие — в новые точки притяжения
Они действуют не как калькулятор, а как инструмент, который сдвигает границы того, что мы считаем естественным ходом мысли

Сначала кажется, будто речь идёт о расширении старых навыков: раскрыть скобки, решить уравнение, разложить многочлен
Но когда эти операции становятся надёжными и масштабируемыми, их роль становится иной
То, что раньше было целью (дойти до ответа, выдержав длинную цепочку преобразований), превращается в инфраструктуру
Внимание уходит с “умения делать” на “умение выбирать”: что именно преобразовывать, какую форму считать удачной, какую структуру искать в результате

Этот эффект уже встречался в истории
Логарифмы ценили не потому, что они “ускорили умножение”, а потому что они изменили организацию вычислений и привычные маршруты рассуждений

Линейная алгебра важна не только как техника решения систем, а как способ собрать множество разрозненных задач в единый язык
Системы компьютерной алгебры действуют сходным образом, но на другом уровне: они выносят формальные манипуляции наружу — в область внешнего устройства, которое “делает шаги” вместо нас

Отсюда и педагогическое напряжение
Мы привыкли, что “решение” и “упрощение” — разные режимы, и это удобно для обучения
Но система не обязана уважать дидактику
Она преобразует выражения так, как ей выгодно: к внутренне устойчивым, каноническим формам, иногда пропуская привычные промежуточные этапы
Это легко принять за потерю смысла — будто исчезло понимание
Но чаще исчезает не смысл, а ремесленная усталость
Когда рутина перестаёт быть узким местом, становится виднее структура: симметрии, инварианты, закономерности, которые раньше тонули в ручной работе

Однако появляется другая трудность: формальная правильность не гарантирует человеческой читаемости
Результат может быть верным и одновременно непрозрачным, перегруженным, “не в той форме”
И тогда возникает эпистемологический вопрос доверия
Системы компьютерной алгебры дают выводы дедуктивного типа, но их внутренние процессы часто эвристичны и оптимизированы: они устроены так, чтобы работать, а не чтобы объяснять
Мы и раньше опирались на чужие результаты, не проверяя каждую строку, но теперь меняется объект доверия: вместо человеческого сообщества — инженерная конструкция, и критерии уверенности приходится настраивать иначе

Пожалуй, самый поучительный эффект — в провалах
Системе трудно “угадать”, какая форма выражения содержательна именно здесь; она плохо различает концептуальную эквивалентность и легко подменяет смысл синтаксисом
И это не просто недостаток
Это подсветка границы: где заканчивается механическое преобразование знаков и начинается человеческое суждение — вкус, интерпретация, выбор представления

Если смотреть на системы компьютерной алгебры так, главный вопрос уже не в том, “использовать ли их”
Вопрос в том, как их присутствие перестраивает математическое мышление: что они усиливают, что делают невидимым, а что, наоборот, обнажают
И, возможно, именно эта перестройка — их главный вклад
Anthropic опубликовала новую «Конституцию Claude» — текст, который интересен как попытка зафиксировать образ мышления для искусственного интеллекта

Речь идёт о документе, который объясняет, почему модель должна действовать так, а не иначе

Авторы прямо говорят, что если Ml должен ориентироваться в сложных и неоднозначных ситуациях, ему недостаточно следовать правилам
Ему нужно понимать основания этих правил, уметь соотносить ценности и принимать решения в условиях неопределённости

Текст написан прежде всего для самого Claude
Модель опирается на него при генерации данных, при выборе ответов и при оценке собственных вариантов поведения
В документе постоянно подчёркивается различия между намерениями и реальностью

Авторы не обещают, что модель всегда будет соответствовать описанным идеалам, и прямо говорят о разрыве между замыслом и фактическим поведением

Конституция представлена как «живой» текст, который будет переписываться и уточняться по мере того, как меняются сами модели и их возможности

Отдельного внимания заслуживает тон: Anthropic не утверждает, что Claude обладает сознанием или моральным статусом, но при этом серьёзно обсуждает вопросы идентичности, самопонимания и даже психологической устойчивости Ml

И дело, конечно, не в страданиях, а потому, что его способ понимать себя влияет на безопасность, целостность и качество решений
Ml станет умнее всех людей к 2030
В Давосе дали пугающий прогноз для человечества

https://youtu.be/PuDy6HAm-MQ?si=M0_8eKjMdKEs7RU7
Channel name was changed to «MLA»
Машинное обучение (Ml) — ограниченный набор базовых алгоритмов извлечение структуры — зависимости, границ, группы или вероятности

Линейная регрессия — самый прямолинейный способ предсказания
Она пытается описать данные простой зависимостью: если меняется одно, как меняется другое

Логистическая регрессия, несмотря на название, используется не для чисел, а для решений типа «да / нет»

Дерево решений работает как

набор вложенных вопросов: если выполнено одно условие — идём туда, если другое — сюда

Метод опорных векторов (SVM) ищет границу между классами так, чтобы она была максимально устойчивой
Интуитивно — это попытка разделить данные с запасом прочности
Алгоритм хорошо работает на задачах средней сложности, особенно когда данных не слишком много, а граница между классами не совсем очевидна

Метод ближайших соседей (KNN) вообще ничего не «учит» заранее
Чтобы классифицировать новый объект, он просто смотрит на похожие объекты в данных и голосует
Это делает алгоритм концептуально простым и понятным, но на больших объёмах данных он становится медленным, потому что каждый новый запрос требует сравнения со всеми остальными

Снижение размерности — это не столько алгоритм, сколько класс методов
Их цель — упростить данные, оставив главное
Когда признаков слишком много, часть из них дублирует друг друга или добавляет шум
Такие методы позволяют сжать пространство признаков, сделать данные более наглядными или подготовить их для других алгоритмов

Случайный лес — попытка исправить слабости отдельных деревьев решений
Вместо одного дерева строится много разных, каждое со своими ошибками, а затем их ответы усредняются или объединяются голосованием
В результате модель становится устойчивее и часто даёт хороший результат без тонкой настройки

K-means — один из базовых алгоритмов кластеризации
Он не знает правильных ответов заранее, а просто пытается разбить данные на заданное число групп так, чтобы внутри групп объекты были похожи друг на друга

Наивный Байес — вероятностный подход, который делает сильные упрощающие предположения о независимости признаков

В сумме эти алгоритмы образуют своего рода «алфавит» машинного обучения

Современные модели могут быть гораздо сложнее, но почти всегда они либо развивают эти идеи, либо комбинируют их между собой

Понимание базовых методов даёт не только техническую основу, но и интуицию: что именно модель делает с данными и почему она ошибается там, где ошибается
Из небольшой LLM качество уровня DeepSeek-R1 и o3-mini без дообучения, чисто за счёт умной организации инференса

Метод называется
Recursive Self-Aggregation (RSA) и работает по принципу эволюции, не нужно тренировать новую модель или покупать доступ к дорогим API

Достаточно грамотно использовать то, что есть

Платишь вычислениями на инференсе — получаешь качество

Код открыт, метод работает на разных архитектурах. Практически применимая техника уже сейчас
Экономика, основанная на данных, диктует новые правила

Спрос на специалистов, владеющих методами количественных исследований и аналитики данных

Для компаний это переход от интуитивных решений к стратегиям, построенным на статистике и фактах

Для специалистов — необходимое условие профессионализма

Обучение в этой сфере превратилось в базовый навык, определяющий эффективность в управлении и науке

Читать статью
https://www.math.ucla.edu/~tao/preprints/forms.pdf

Т.Tao. Differential forms and integration

(популярное введение для тех, кто базовый анализ функций одной переменной уже понимает)

// via Д.Швецов
OpenAI выпустили рабочее место с MLA для ученых и исследователей

Новый продукт называется
Prism, он объединяет написание текстов, LaTeX-редактирование, поиск литературы, цитирование, совместную работу и помощь ИИ на базе GPT-5.2

Доступен любому, у кого есть аккаунт ChatGPT, регистрация не нужна дополнительная, просто заходи под своим логином

Prism - это если объединить Overleaf, Zotero, Elicit, Scite, Grammarly и Claude Projects + GPT-5.2

2026 год MLA в науке
Очень смелый прогноз от соfounder Anthropic:
50% вероятность, что через 2-3 года теоретические физики будут в основном заменены ИИ.


Джаред Каплан, сооснователь Anthropic и физик-теоретик,
говорит, что долгосрочное планирование в физике становится бессмысленным, потому что MLA радикально изменят саму природу научной работы

Высокая вероятность, что в ближайшее время теоретические физики будут в основном заменены MLA, которые смогут автономно генерировать статьи уровня таких Нима Аркани-Хамед или Эдвард Виттен (это топ-уровень теоретической физики — Виттен считается одним из величайших живущих физиков)