Data Secrets
90K subscribers
6.89K photos
766 videos
20 files
3.07K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
У Sony Xperia произошла максимально нелепая демонстрация новой ИИ-фичи

Они прорекламировали ИИ-ассистента внутри камеры последнего смартфона линейки. Написали, что агент «подбирает выразительные варианты с настройками цвета, экспозиции и объектива для создания захватывающих дух фотографий».

Первые три картинки выше – это примеры, которые они выбрали для демонстрации функции.

Куда смотрели дизайнеры, не очень понятно, но, как вы понимаете, реакция общественности не заставила себя ждать. Мемы в комменты Sony посыпались градом ⬆️

Видимо кому-то из руководства ну очень хотелось «добавить эйай»
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁31718👍88🔥5🤯3
This media is not supported in your browser
VIEW IN TELEGRAM
FigureAI запустили 10-часовой эксперимент, в котором робот соревновался с человеком в сортировке посылок

Да, 10 часов сортировки пакетиков. Человек имеет право на перекуры по законодательству, робот работает непрерывно (и автономно!).

Трансляция шла вот здесь, и на Polymarker даже принимали ставки на победителя.

Многие, кстати, ставили на робота. Несмотря на то, что для гуманоида это все еще очень сложная задача (требуется быстрая реакция, мелкая моторика, какой-никакой ризонинг и тд), и человек бесспорно быстрее, расчет был на то, что человек устанет и замедлится, а робот – нет.

Так и произошло, но в итоге человек все-таки победил с небольшим отрывом. Парень отсортировал за 10 часов 12924 пакета, а робот – 12732. Их средняя скорость отличалась всего на 0.04 секунды.

Создатель Figure написал, дословно: «Это последний раз, когда человек победил».

Кстати, по окончании 10 часов работы человек открыл пиво, а робот продолжил сортировать посылки как ни в чем не бывало. Выводы делайте сами 🤷‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥210😁167🤯5614🔥12👍3🗿3
📉 Финансовая модель нестабильна? Возможно, проблема в признаках

Модель обучается, но результаты нестабильны? Метрики скачут, признаки мешают друг другу, а причина неочевидна. Часто проблема скрыта в данных: корреляция и мультиколлинеарность искажают результат.

🦾 На открытом уроке разберём, как выявлять зависимые признаки и работать с размерностью данных. Покажем, как применять метод анализа главных компонент (PCA) для выделения действительно значимой информации.

Вы увидите, как упрощать пространство признаков, повышать устойчивость моделей и улучшать качество прогнозирования, особенно в задачах временных рядов. Это важный этап, без которого сложно перейти от экспериментов к стабильным решениям.

➡️ Встречаемся 18 мая в 20:00 МСК в преддверии старта курса «Машинное обучение для финансового анализа». Принять участие: https://otus.pw/3FQR/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
🗿38😁94🔥4👍2🤨1
POV: ты пытался объяснить Claude Code, что надо сделать
1😁515👍5129🔥4💯3🤝3🤯2
CEO YCombinator Гэрри Тэн опенсорснул собственный модуль памяти для агентов

github.com/garrytan/gbrain

Гэрри пишет, что это продакшен-мозг, на котором работают его личные агенты OpenClaw и Hermes. Ну а на практике это что-то вроде живой базы знаний, которая сама себя обогащает.

Если обычные агенты не помнят контекст между сессиями или записывают что-то в MEMORY.md очень примитивным способом, то здесь предлагается многоуровневая архитектура построения глубокой памяти. Кратко:

– Вся база состоит из markdown файлов. Каждый человек, компания, концепция, встреча – это отдельный файл. Каждый файл – это саммари, которое перезаписывается при поступлении новых данных, и хронологический журнал упоминаний.

– По этой базе работает гибридный поиск. Когда агент что-то ищет, работают одновременно: векторный поиск, поиск по ключевым словам и поиск на графе.

– Граф связей, по которому осуществляется графовый поиск, тоже формируется автоматически и при этом даже без вызова LLM (с помощью регулярок и прописанных правил). То есть система сама себе рисует сеть: кто где работает, кто был на какой стрече, кто во что инвестирует и тд.

Обновляется все это с помощью одного файла RESOLVER.md, в котором прописаны 29 специальных скиллов. Например, meeting-ingestion: транскрипты митингов перерабатываются в режиме сна, чтобы обогощать файлы участников.

Конечно, пользоваться прямо всей этой махиной необязательно. Базовую версию можно поставить себе за 30 минут и использовать как MCP. Лицензия MIT.
92👍31😁15🗿10🔥5🫡3
1.3 миллиона долларов в месяц

Столько создатель OpenClaw тратит на токены в Codex. Это 603 миллиарда токенов и 7.6 миллионов запросов за 30 дней.

Если вы задаетесь вопросом «Как это возможно?», то вы не одиноки. Скриншот с тратами на API вызвал такой резонанс в соцсетях, что Питер написал отдельный пост про то, как он умудряется столько сжигать.

Суть в том, что у него одновременно и постоянно работают 100 агентов, которые проверяют каждый PR и issue. Они ищут дыры в безопасности, автоматически закрывают старые баги после фиксов, дедуплицируют issue, проверяют перформанс, банят спамеров и даже умеют поднимать временные окружения, логиниться в сервисы и записывать видео с демонстрацией фиксов.

Часть агентов вообще слушает митинги команды и начинает создавать PR прямо во время обсуждения новых фич.

Люди в шоке от наших расходов на AI. Но никто не видит главного: одна из причин, почему меня так вдохновляет работа над OpenClaw – мы пытаемся ответить на вопрос: как будет выглядеть разработка софта в будущем, если стоимость токенов перестанет иметь значение?
136😁45👍20🔥19🤯1913🗿4❤‍🔥2🐳2🫡2
Совет на ближайшие годы — изучайте ВАЙБ-КОДИНГ

ИИ уже пишет код, чинит баги, генерирует тесты, документацию и помогает запускать продукты быстрее, чем это делали классические команды разработки. И это уже не "будущее когда-нибудь", а реальность, которая меняет рынок уже сегодня

И те, кто научится вайбкодить сейчас, будут увереннее конкурировать на рынке и зарабатывать больше тех, кто по-прежнему делает всё вручную.

Стартовать с нуля поможет канал Вайб-кодинг. Там ребята круглосуточно мониторят более 320 российских и зарубежных источников и публикуют только главное: релизы, инструменты, гайды, курсы и практические кейсы.

Подписывайтесь, нас уже 40 тысяч: @vibecoding_tg
😁134🗿47198🤨44🔥3👍2😍2🫡1
xAI просила сотрудников продать личные налоговые декларации как обучающие данные для Grok

За каждую декларацию обещали 420 долларов. Это было всего пару месяцев назад, как раз в сезон подачи налогов в США перед дедлайном 15 апреля.

Но самое смешное – даже не сама попытка компании достать данные таким способом. Самое смешное – что сотрудникам по сей день так и не заплатили и платить, кажется, не собираются.

www.bloomberg.com/news/articles/2026-05-18/musk-s-xai-promised-staff-420-for-their-tax-returns-hasn-t-paid
😁165🔥9🤨95👍32🤔1🆒1
Строительство ЦОДов должно занимать не 2 года, а 9 месяцев

Только так можно обеспечить конкурентоспособность технологий. С таким заявлением на конференции “ЦИПР-2026” выступил вице-президент и технический директор Т-Банка Олег Щербаков. Он отметил, что технологии сейчас развиваются гораздо быстрее, чем инфраструктура, если не сокращать эту дельту, то к окончанию строительства инфраструктура уже устареет.

Чтобы ускорить строительство нужна прозрачная и понятная регулируемая цепочка, зеленый коридор для строительства, как, например, в Китае. Т-Банк, планирует построить ЦОДы за полтора года. 80% мощностей новых объектов, которые введут в 2027 году, уйдут под данные и инференс — самые растущие нагрузки.
141🔥62😁57🗿12👍53🤔1👌1
Data Secrets
Маск пообещал сделать Альтмана и Брокмана «самыми ненавидимыми людьми в Америке» Так он ответил Брокману после того как тот накануне суда предложил ему взаимный отказ от претензий: К концу этой недели вы с Сэмом станете самыми ненавидимыми людьми в Америке.…
Илон Маск проиграл дело против OpenAI

Жюри из девяти присяжных в федеральном суде Северной Калифорнии вынесло единогласный вердикт: все три основных требования иска Илона Маска против Сэма Альтмана и Грега Брокмана (нарушение благотворительного траста, содействие в таком нарушении и необоснованное обогащение) оказались отвергнуты из-за пропущенного срока исковой давности.

То есть, фактически, Альтмана и Брокмана не признали невиновными, но Маск все равно остается ни с чем. Ни компенсации, ни реструктуризации OpenAI, которой он добивался, уже не будет.

Судья согласилась с вердиктом присяжных и формально отменила все иски.
👍105🫡6343😁3111🤯10🗿55🔥4🤔1🤨1
Внутри Google сформировали специальный внутренний «комитет по компьюту»

Он распределяет доступ к кластерам TPU/GPU среди подразделений и проектов компании и решает, кто получает приоритет, а кто ждет в очереди.

То есть в условиях дефицита ресурсов даже сотрудникам Google приходится буквально конкурировать за железо и шлифовать продажные презентации для внутреннего комитета, чтобы получить квоту на вычисления.

Если квоту не дали, то ты со своим проектом либо останешься ждать в очереди, либо можешь пойти и слезно просить занять компьют у другой команды.

На фоне этого из Google начали уходить исследователи. В основном они перебираются в маленькие стартапы.
😁121🤔30🔥7🫡74👌1
Как усилить ИБ: управление данными и ML-технологии для защиты бизнеса

Когда киберриски растут, а требования к защите данных ужесточаются, перед компаниями стоит вопрос: как обеспечить высокий уровень ИБ без роста бюджета?

Эксперты «Инфосистемы Джет», Arenadata и «Аксель Про» проведут совместный митап, где подтвердят, что ответ в сочетании проверенных решений и современных технологий.

Что в программе?
🔹Реальные кейсы сбора данных в ИБ: когда выгоднее использовать готовые инструменты вместо самостоятельной разработки
🔹Тренды рынка ИБ: кто лидирует, какие технологии набирают популярность и куда двигаться дальше
🔹ML-кейсы для ИБ в реальной ИТ-среде: от анализа логов до задач с LLM
🔹Дата-контракты, карта данных и профилирование — как инструменты управления данными помогают ИБ
🔹Как управление данными и их качество повышают уровень ИБ

Когда: 26 мая в 11:00 МСК
Формат: онлайн

Регистрация на бесплатный митап на сайте.
🗿145👍3🔥3😁2🤯1🤓1
Google готовится релизнуть крутейшую видео модель

Сегодня у них пройдет ежегодная Google I/O, и они во всю раздают спойлеры. Судя по всему, нас ждет сильная омни модель – возможно, SOTA в генерации видео.

Например, вот такие видео выложили в преддверии мероприятия CEO Google Сундар Пичаи и главный источник сливов по Gemini Логан Килпэтрик.

Ждем
👍50🔥2011
Composer 2.5 от Cursor: качество Opus 4.7 и GPT-5.5 в 10 раз дешевле

Cursor удивили. Они выпустили очередного Composer, но если предыдущие версии были довольно слабые, то сейчас это уже можно назвать полноценным фронтиром.

cursor.com/blog/composer-2-5

Бенчмарки:
– SWE-Bench Multilingual: 79.8% (Opus 4.7: 80.5%, GPT-5.5: 77.8%).
– Terminal-Bench 2.0: 69.3% (Opus 4.7: 69.4%, GPT-5.5: 82.7%).
– CursorBench v3.1: 63.2% (Opus 4.7 max: 64.8%, GPT-5.5 default: 59.2%)

При этом стоит модель всего $0.50 за млн input / $2.50 за млн output. Это в 10 раз дешевле опуса. Fast-тариф стоит чуть дороже ($3.00 input / $15.00 output), но все равно дешевле Opus, примерно как Claude Sonnet 4.6. Единственное: публичного API нет, только внутри Cursor, CLI и веб.

Что касается внутрянки:
– Модель основана на Kimi K2.5 от Moonshot AI (как и Composer 2)
– Но базовые веса составили лишь 15% от потраченного компьюта, все остальное – кастомный RL и дообучение
– Из интересных приемов использовали Targeted RL with textual feedback. В классическом RL модель получает одну награду за весь ответ целиком, и непонятно, где именно она ошиблась. Cursor же делают так: когда модель делает локальную ошибку (например, вызывает несуществующий инструмент), прямо в это место вставляется подсказка, и веса как бы подталкиваются в сторону того, как модель повела бы себя с этой подсказкой.

Кстати, одновременно Cursor анонсировали следующую модель, которую они тренируют с нуля, используя в 10 раз больше компьюта, чем на Composer 2.5, на кластере Colossus 2 совместно с xAI. Конец 2026 года в AI-кодинге будет очень интересным.
51👍23😁138🔥1