Data Secrets
90K subscribers
6.89K photos
764 videos
20 files
3.07K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Увидимся на Дне открытых дверей магистерской программы «Исследования и предпринимательство в ИИ» ФКН НИУ ВШЭ и МТС? 👀

22 мая расскажут, как учат создавать и внедрять инновационные продукты, используя передовые методы: от больших языковых моделей и генеративных нейросетей до инструментов компьютерного зрения и NLP. Будет актуально для тех, кто задумывается о поступлении в магистратуру в 2026

Самое важное:
100% стоимости обучения (30 мест) финансирует МТС
проекты реализуются на виртуальной инфраструктуре компании
преподаватели — команда преподавателей ФКН НИУ ВШЭ и действующие эксперты из МТС и MWS AI
карьера после выпуска? Роль ML/AI-разработчика или специалиста по Data Science, собственный стартап в сфере ИИ или исследования в R&D-центрах коммерческих компаний

На встрече команда магистратуры:
— поделится деталями о программе, учебном плане и фокусах развития: исследовательском и предпринимательском
— обсудит особенности поступления в 2026 году и формат отбора
— расскажет о процессе обучения и результатах — в этом помогут сами студенты и выпускники

📍 Когда: 22 мая, 18:30
📍 Формат: онлайн
📍 Запись встречи: разместят в канале магистратуры

Чтобы не пропустить трансляцию и задать все вопросы, зарегистрируйтесь на сайте!
🤨13😁6🗿53🤯3👍1
Data Secrets
Нейросети думают сложными геометрическими структурами – новое исследование от Goodfire Эта статья вызвала в последние дни очень много интереса в сообществе. Исследователи из Goodfire впервые показали занятную вещь: внутреннее пространство активаций моделей…
Goodfire показали, как геометрически выглядит математика внутри LLM

Недавно у них вышло очень занятное исследование, в котором они ввели термин neural geometry и доказали, что нейросети "думают" сложными геометрическими структурами. Мы делали разбор этой статьи вот тут: t.me/data_secrets/9194.

Если кратко, суть в том, что внутреннее пространство моделей организовано в виде многомерных форм, поверхностей и траекторий. Эти многообразия вполне интерпретируемы. Например, дни недели лежат как бы на круге, в циклической структуре.

Сегодня лаба выпустила продолжение исследования: они разобрали, как модель "представляет" числа и совершает над ними операции.

Можно было бы ожидать, что в геометрии модели числа будут лежать на абстрактной числовой прямой или будут закодированы двоично, НО НЕТ: каждое число – это окружности. Каждая окружность соответствует числу по модулю некоторого основания, то есть остатку от деления. Например, число 17 было бы представлено как 1 на окружности по модулю 2, как 2 на окружности по модулю 5 и как 7 на окружности по модулю 10.

И это не что иное, как разложение Фурье! Кто бы мог подумать, что оно обнаружится внутри трансформера.

А когда модели нужно что-то посчитать, активируется целый геометрический калькулятор. Например, нужно сложить два числа. Для этого, на самом деле, решается сразу несколько параллельных задач на разных окружностях. Возмем 6 + 8. Модель отдельно считает: (6 mod 2) + (8 mod 2) = 0, (6 mod 5) + (8 mod 5) = 4, (6 mod 10) + (8 mod 10) = 4, и так далее. Все эти результаты вместе декодируются в число 14.

Это напоминает китайскую теорему об остатках. Древнейший математический трюк, который оказался встроен в нейросети совершенно автономно. Кстати, точно так же модели вычисляют разницу в датах, годах и днях недели.

Красивое 😍
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯181🔥6449👍12👌6🗿32
Microsoft сделали экзамен по вайбкодингу

Они запустили на GitHub сертификацию Agentic AI Developer (GH-600). Это буквально тест на то, насколько вы хороший оркестратор для агентов.

learn.microsoft.com/en-us/credentials/certifications/agentic-ai-developer/

По этой ссылке можно посмотреть, что будет в «билетах» (наверху скрин с общими положениями, а вот тут есть полноценный стади гайд). Есть также список материалов, которые они рекомендуют для подготовки + можно пройти мини-пробник в песочнице.

Сдать экзамен стоит 165$, в итоге вы получите полноценное подтверждение компетенции вайбкодера 👩‍🍳
Please open Telegram to view this post
VIEW IN TELEGRAM
😁175👍4224🔥3🍓3🦄22🤨1
«Норникель» заявил о создании первой в России ИИ-системы для проектирования промышленных зданий

Компания разработала систему, которая помогает проектировать объекты от фундамента до кровли и автоматически готовит инженерную документацию. По сути, это мультиагентная ИИ-система для промышленного проектирования, обученная на внутренней базе знаний компании, ГОСТах и СНиПах.

Агенты проводят расчеты, собирают цифровую модель здания, формируют спецификации и проверяют все на соответствие корпоративным стандартам и требованиям законодательства. Финальное решение все равно остается за инженером, но основной объем рутины с человека снимается, и это существенно бустит процесс.

А именно: задания на проектирование создаются на 83% быстрее, цифровые модели строятся на 80% быстрее, а выпуск документации ускорился примерно вдвое. При этом к текстовой части документации, по словам компании, практически нет замечаний.

Самое важное тут то, что это попытка встроить ИИ прямо в реальный инженерный воркфлоу крупной промышленной компании. Похоже, что один из самых сильных и недооцененных сценариев для AI в ближайшие годы – не чат-боты, а вот такие узкоспециализированные системы, встроенные в конкретные отраслевые процессы.

Следить за другими разработками Норникеля можно в тг-канале @nornickel_official
🔥131🗿53😁3016👍10🤔4👌4🤯32
У Sony Xperia произошла максимально нелепая демонстрация новой ИИ-фичи

Они прорекламировали ИИ-ассистента внутри камеры последнего смартфона линейки. Написали, что агент «подбирает выразительные варианты с настройками цвета, экспозиции и объектива для создания захватывающих дух фотографий».

Первые три картинки выше – это примеры, которые они выбрали для демонстрации функции.

Куда смотрели дизайнеры, не очень понятно, но, как вы понимаете, реакция общественности не заставила себя ждать. Мемы в комменты Sony посыпались градом ⬆️

Видимо кому-то из руководства ну очень хотелось «добавить эйай»
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁31518👍88🔥5🤯3
This media is not supported in your browser
VIEW IN TELEGRAM
FigureAI запустили 10-часовой эксперимент, в котором робот соревновался с человеком в сортировке посылок

Да, 10 часов сортировки пакетиков. Человек имеет право на перекуры по законодательству, робот работает непрерывно (и автономно!).

Трансляция шла вот здесь, и на Polymarker даже принимали ставки на победителя.

Многие, кстати, ставили на робота. Несмотря на то, что для гуманоида это все еще очень сложная задача (требуется быстрая реакция, мелкая моторика, какой-никакой ризонинг и тд), и человек бесспорно быстрее, расчет был на то, что человек устанет и замедлится, а робот – нет.

Так и произошло, но в итоге человек все-таки победил с небольшим отрывом. Парень отсортировал за 10 часов 12924 пакета, а робот – 12732. Их средняя скорость отличалась всего на 0.04 секунды.

Создатель Figure написал, дословно: «Это последний раз, когда человек победил».

Кстати, по окончании 10 часов работы человек открыл пиво, а робот продолжил сортировать посылки как ни в чем не бывало. Выводы делайте сами 🤷‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥209😁166🤯5514🔥12🗿3👍2
📉 Финансовая модель нестабильна? Возможно, проблема в признаках

Модель обучается, но результаты нестабильны? Метрики скачут, признаки мешают друг другу, а причина неочевидна. Часто проблема скрыта в данных: корреляция и мультиколлинеарность искажают результат.

🦾 На открытом уроке разберём, как выявлять зависимые признаки и работать с размерностью данных. Покажем, как применять метод анализа главных компонент (PCA) для выделения действительно значимой информации.

Вы увидите, как упрощать пространство признаков, повышать устойчивость моделей и улучшать качество прогнозирования, особенно в задачах временных рядов. Это важный этап, без которого сложно перейти от экспериментов к стабильным решениям.

➡️ Встречаемся 18 мая в 20:00 МСК в преддверии старта курса «Машинное обучение для финансового анализа». Принять участие: https://otus.pw/3FQR/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
🗿38😁94🔥4👍2🤨1
POV: ты пытался объяснить Claude Code, что надо сделать
1😁503👍5029🔥3💯3🤝3🤯2
CEO YCombinator Гэрри Тэн опенсорснул собственный модуль памяти для агентов

github.com/garrytan/gbrain

Гэрри пишет, что это продакшен-мозг, на котором работают его личные агенты OpenClaw и Hermes. Ну а на практике это что-то вроде живой базы знаний, которая сама себя обогащает.

Если обычные агенты не помнят контекст между сессиями или записывают что-то в MEMORY.md очень примитивным способом, то здесь предлагается многоуровневая архитектура построения глубокой памяти. Кратко:

– Вся база состоит из markdown файлов. Каждый человек, компания, концепция, встреча – это отдельный файл. Каждый файл – это саммари, которое перезаписывается при поступлении новых данных, и хронологический журнал упоминаний.

– По этой базе работает гибридный поиск. Когда агент что-то ищет, работают одновременно: векторный поиск, поиск по ключевым словам и поиск на графе.

– Граф связей, по которому осуществляется графовый поиск, тоже формируется автоматически и при этом даже без вызова LLM (с помощью регулярок и прописанных правил). То есть система сама себе рисует сеть: кто где работает, кто был на какой стрече, кто во что инвестирует и тд.

Обновляется все это с помощью одного файла RESOLVER.md, в котором прописаны 29 специальных скиллов. Например, meeting-ingestion: транскрипты митингов перерабатываются в режиме сна, чтобы обогощать файлы участников.

Конечно, пользоваться прямо всей этой махиной необязательно. Базовую версию можно поставить себе за 30 минут и использовать как MCP. Лицензия MIT.
89👍30😁15🗿9🔥5🫡3
1.3 миллиона долларов в месяц

Столько создатель OpenClaw тратит на токены в Codex. Это 603 миллиарда токенов и 7.6 миллионов запросов за 30 дней.

Если вы задаетесь вопросом «Как это возможно?», то вы не одиноки. Скриншот с тратами на API вызвал такой резонанс в соцсетях, что Питер написал отдельный пост про то, как он умудряется столько сжигать.

Суть в том, что у него одновременно и постоянно работают 100 агентов, которые проверяют каждый PR и issue. Они ищут дыры в безопасности, автоматически закрывают старые баги после фиксов, дедуплицируют issue, проверяют перформанс, банят спамеров и даже умеют поднимать временные окружения, логиниться в сервисы и записывать видео с демонстрацией фиксов.

Часть агентов вообще слушает митинги команды и начинает создавать PR прямо во время обсуждения новых фич.

Люди в шоке от наших расходов на AI. Но никто не видит главного: одна из причин, почему меня так вдохновляет работа над OpenClaw – мы пытаемся ответить на вопрос: как будет выглядеть разработка софта в будущем, если стоимость токенов перестанет иметь значение?
133😁44👍19🔥19🤯1712🗿4❤‍🔥2🐳2🫡2