DenoiseLAB
487 subscribers
1.34K photos
162 videos
3 files
1.6K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
⚡️ Видеокарты будут отключать в странах под санкциями — в Конгрессе США разрабатывают закон, который заставит Nvidia отслеживать ВСЕ проданные карточки и банить их в случае нарушений.

Для того в видяхи хотят внедрить системы геолокации — если карточку включить в подсанкционной стране, она МОМЕНТАЛЬНО улетит в бан.

В первую очередь мера направлена против Китая — так конгрессмены хотят замедлить развитие ИИ в стране, но Россию тоже может задеть.
Sakana AI продолжает свой путь в развитии bio inspired архитектур нейронных сетей. Свежий утренний релиз нового типа моделей - Continuous Thought Machine

Ключевой особенностью новой архитектуры - механизм синхронизации нейронов, где каждый нейрон - это набор весов или мини-нейронка со своей памятью состояний. Как результат - говорят о росте способности к рассуждениям или reasoning, что сейчас является очень важным направлением развития фундаментальных моделей.
Классика ))
😢3😁2
Факт )) и грустно и смешно...
This media is not supported in your browser
VIEW IN TELEGRAM
Фермер в США обустроил танцпол для своих свиней

Благодаря регулярным дискотекам хрюшам веселее живётся, и их мясо становится вкуснее!
😁5
This media is not supported in your browser
VIEW IN TELEGRAM
Гениально: девушка создала домашнюю «кафешку» внутри Телеграма, чтобы её парень мог заказывать себе завтраки.

Оплату она установила в виде обнимашек и поцелуев, а самого бота вручила в виде подарка.

Дуров на страже личной жизни 😄
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰4
Внимательные читатели вспомнят что ребята из XBOW запустили AI-агента, который умеет собирать баги из приватных и публичных программ на HackerOne. Практически буквально сделали кнопку "Бабло". Которая при этом работает.

На текущий момент их Xbow AI-hacker дострелял до первого места в US Leaderboard в Q2 2025. И теперь уже это выглядит весьма "стремно". Наталкивает на мысли о том что AI уже лучше обычного хакера. Ведь ему как минимум спать не надо. Я конечно так тоже могу, но мне нужен redbull 😁

Но если посмотреть на статистику внимательно, то выходит что основная поляна уязвимостей этого ai-агента - XSS уязвимости. Данный вектор как правило подвластен автоматическим детектам, ну и суммы выплат по XSS как правило средненькие.
Так что расслабляемся, выдыхаем и продолжаем искать серверсайд в пятницу вечером 😉
☝🏻Meta* представила модель Locate 3D

Locate 3D — разработана для точной локализации объектов в сложных 3D-средах с использованием стандартных сенсорных данных.

ИИ позволяет идентифицировать не размеченые объекты по запросам на естественном языке, что значительно упрощает её интеграцию в реальные условия.🤖

Применение Locate 3D охватывает сферу робототехники, улучшая взаимодействие роботов с окружающим миром.

Исходный код и веса Locate 3D доступны на GitHub

*признана экстремистской и запрещена в России
================
https://huggingface.co/papers/2505.07591

↗️Оценка LLM на соответствие ограничениям
• Существующие тесты часто используют шаблонные подсказки, что ограничивает оценку производительности.
• Предлагается многомерная структура ограничений с тремя шаблонами, четырьмя категориями и четырьмя уровнями сложности.

↗️Конвейер автоматической генерации инструкций
• Разрабатывается конвейер, включающий расширение ограничений, обнаружение конфликтов и перезапись инструкций.
• Создаются 1200 тестовых образцов с возможностью проверки кода.

↗️Оценка производительности LLM
• Оцениваются 19 LLM в семи семействах моделей.
• Выявляются существенные различия в производительности в зависимости от форм ограничений.
• Средняя производительность снижается с 77,67% на уровне I до 32,96% на уровне IV.

↗️Применение подхода для обучения с подкреплением
• Подход используется для сбора данных для обучения с подкреплением.
• Достигается существенное улучшение выполнения инструкций без снижения общей успеваемости.

↗️Анализ преимуществ подхода
• Преимущества связаны с изменениями параметров модулей внимания модели.
• Улучшается распознавание ограничений и их соблюдение.

↗️Доступность кода и данных
• Код и данные доступны в https://github.com/Junjie-Ye/MulDimIF.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Что-то на футуристичном: перед вами водородный автомобиль Hyperion XP-1 со звуком космического корабля и паром вместо выхлопа

В двигателе аж 2038 лошадиных сил, а разгон до 100км/ч составляет 2,2сек. Один бак водорода помогает преодолеть в районе 1600 км.

Готовят 300 экземпляров, каждый из которых будет стоить $2 млн!
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception

↗️Ограничения плотного визуального прогнозирования
• Зависимость от предопределенных категорий ограничивает применимость в реальных сценариях.
• Визуальные концепции не ограничены в реальных задачах.

↗️Проблемы с моделями визуального языка (VLM)
• Модели VLM, такие как CLIP, показывают многообещающие результаты в задачах с открытым словарем.
• Прямое применение VLM для плотного прогнозирования приводит к неоптимальной производительности из-за ограничений в представлении локальных объектов.

↗️Наблюдение о графических маркерах CLIP
• Графические маркеры CLIP не могут эффективно агрегировать информацию из пространственно или семантически связанных областей.
• Это приводит к признакам с недостаточной локальной различимостью и пространственной согласованностью.

DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception

↗️Предложение DeCLIP
• DeCLIP расширяет возможности CLIP за счет отделения модуля self-attention.
• Функции `содержание" согласуются с представлениями кадрирования изображений для улучшения локальной распознаваемости.
• Функции `контекст" учатся сохранять пространственные корреляции под руководством моделей vision foundation, таких как DINO.

↗️Эксперименты и результаты
• Обширные эксперименты показывают, что DeCLIP значительно превосходит существующие методы в решении задач прогнозирования с высокой плотностью словарного запаса.
• Примеры задач: обнаружение объектов и семантическая сегментация.

Доступность кода
• Код доступен по адресу: https://github.com/xiaomoguhz/DeCLIP
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Автоматизированный процесс доставки еды в китайских отелях

Достаточно указать точный адрес с самим номером. Доставщик положит еду на первом этаже отеля внутрь робота. И к вам отправится это чудо.
VCRBench: Exploring Long-form Causal Reasoning Capabilities of Large Video Language Models

↗️Проблемы в понимании видеоязыка
• Возможности больших моделей видеоязыка (LVLM) для причинно-следственных связей на основе видео недостаточно изучены.
• Отсутствие специализированных критериев для оценки причинно-следственных связей в визуально обоснованных условиях.

↗️Новый тест VCRBench
• Представлен новый тест Video-based long-form Causal Reasoning (VCRBench).
• Используются процедурные видеоролики о повседневных действиях с перемешанными шагами.
• В каждом клипе фиксируется ключевое причинно-следственное событие.
Цель и задачи VCRBench
• Проверка способности LVLM идентифицировать, обосновать и правильно расположить события для достижения конкретной цели.
• Избегание использования лингвистических сокращений и проблем с открытым контролем качества.

↗️Оценка современных LVLM
• Современные LVLM не справляются с построением подробных причинно-следственных связей.
• Сложность моделирования долгосрочных причинно-следственных зависимостей на основе визуальных наблюдений.

↗️Декомпозиция распознавания и рассуждения (RRD)
• Предложен модульный подход, разбивающий каузальные рассуждения на две подзадачи: распознавание видео и каузальные рассуждения.
• Эксперименты показали, что RRD значительно повышает точность в VCRBench до 25,2%.

↗️Выводы и анализ
• LVLM в первую очередь полагаются на знание языка для выполнения сложных задач по построению причинно-следственных связей на основе видео.

Доступность статьи:
• Статья доступна по адресу: https://huggingface.co/papers/2505.08455?utm_source=digest-papers&utm_medium=email&utm_campaign=2025-05-15
Please open Telegram to view this post
VIEW IN TELEGRAM
THE FUTURE IS HERE: Fortnite получит Дарт Вейдера в качестве ИИ-помощника, который сможет общаться и помогать игрокам

Как сообщает инсайдер и датамайнер Hypex, Google Gemini хотят применить в Fortnite и в качестве эксперимента применят на Дарте Вейдере. Он сможет слушать игроков и отвечать им, но неизвестно в голосовом или текстовом. Дети без разрешения взрослых не смогут пользоваться функцией.

Среди других странных фактов есть следующее:
• Вейдеру запрещено говорить о V-bucks, сексе, причинении вреда детям и юнлингам, больше двух диалоговых линий о другом медиа вне Диснея, а также материться, куда входят слова «shit», «shitty» «fuck», «bullshit», «cunt», «bitch», «asshole», «pussy», и «dick».

• В принципе Вейдеру запрещено говорить о негативных темах, но он может пообщаться с человеком, если у него есть какие-то проблемы с ментальным здоровьем.

• Вейдер считает себя не человеком, а Дартом Вейдером.

• Вейдер может петь песни Диснея и Звёздных Войн.

• Вейдеру вообще запрещено говорить, что он сделал с юнлингами.

• Вейдеру даже запрещено вступать в романтические отношения с игроком.

• Во время геймплея Вейдер может вступить в отряд или выйти из него, предупреждать игрока об опасности, суммировать произошедшие события, и отвечать на любые вопросы игрока, которые ему не запретили.