AI LAB | Лаборатория ИИ
1.86K subscribers
649 photos
441 videos
23 files
916 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca

Вопросы сотрудничества и соучастия
@j_fede
Download Telegram
Forwarded from Data Secrets
Media is too big
VIEW IN TELEGRAM
Claude теперь умеет генерировать и редактировать pdf-ки, табличные файлы и презентации

Не слишком часто пишем про новые фичи ботов, но это приятная и интересная. Даете промпт – а вам на выход файл. Или вы файл – вам на выход отредактированный вариант.

Работает это так: у Claude есть доступ к частному окружению, в котором он пишет и запускает код для создания файлов, которые затем отправляет пользователю в чат.

Теоретически такая система открывает много возможностей: продвинутый анализ данных, обработка всяких фото/видо/аудио, да и вообще работа со всеми видами файлов. Так что ждем и других агентских фичей от Anthropic, а пока наслаждаемся генерацией таблиц и документов.

www.anthropic.com/news/create-files
👍42🔥1
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Там ребята из ETH и MATS запилили интересную статью: придумали, как заставить текстовые нейронки подсвечивать свои галлюцинации прямо во время ответа.

Очень часто бывает так, что LLM пишут простыню, где половина фактов реальные, а половина уровня «Альберт Эйнштейн изобрёл Гугл в 2007 году». Поймать это раньше можно было только длинными и дорогими проверками через поиск.

Теперь же на внутренние слои модели повесили детектор ерунды. И он по токенам в реальном времени понимает, где имя/дата/ссылка выдуманы.

В итоге на длинных текстах детектор стал ловить враньё почти в полтора раза лучше, чем старые методы.

В идеале это приведёт к тому, что модели научатся не только отвечать, но и честно показывать, где они уверены, а где сами сомневаются.

Тут сама статья.
👍32
Forwarded from NN
Топовый генератор видео Hailuo AI стал полностью бесплатным на целую неделю.

Модель Hailuo 02 умеет создавать ролики, неотличимые от кадров из фильмов. Она выдает реалистичные кадры и не ломает законы физики.

Забираем по ссылке. Ограничений на число генераций нет до 17 сентября.
332👍1
#unrealneural
Анализ архитектурных планов

https://www.outerport.com/
👍321
#unrealneural
Нейронные сети проникают в студенческие работы будущих архитекторов ⚡️⚡️⚡️
133🔥2
#unrealneural
Посетил свой родной ВУЗ УГНТУ АСФ.
Это место все еще излучает вдохновение и вызывает желание изучать архитектуру как нечто большее, чем просто физические объекты 🔥
19👍115
Forwarded from iNeuro Lab IABS
ВСЕМ ПРИВЕТ!

Мы - лаборатория нейронного интеллекта Института перспективных исследований мозга МГУ.
Мы работаем уже несколько лет, и наконец готовы делиться с вами ☺️

🐁 Наша задача - разгадать механизмы интеллекта у животных и перенести эти принципы в искусственные системы.
Среди нас есть нейробиологи, специалисты по поведению животных, физики, программисты.

Мы занимаемся:
🟠исследованием нейронного кодирования поведения у животных
🟠механизмами долговременной памяти
🟠поиском нейронных коррелятов сознания
🟠разработкой новых подходов к анализу нейронных и поведенческих данных
🟠исследованиями процессов кодирования в искусственных нейронных сетях.

Наши инструменты есть на GitHub.

А об успехах и трудностях на нашем пути мы будем рассказывать в этом канале 🐀
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍21
#unrealneural #пытаюсьпонять
Почему мультимодальные LLM модели испытывают трудности с пространственным пониманием?

Это исследование показывает, что проблемы с пространственным восприятием у MLLM связаны не с дефицитом данных, а с архитектурой. Пространственная способность зависит от позиционных сигналов, получаемых от визуального кодировщика, поэтому необходим редизайн, например, внедрение функции точного таргетинга.
https://www.alphaxiv.org/abs/2509.02359v1
🤔5👍1
🤗
😁7
Media is too big
VIEW IN TELEGRAM
#unrealneural #врежимеожидания
MeshPad: генеративное создание 3D-сеток из эскизов

MeshPad — это подход для генерации 3D-сеток на основе эскизов, основанный на последовательности треугольников и модели Transformer. Редактирование выполняется через простые изменения в эскизе: удаление областей и добавление новой геометрии. Для ускорения используется стратегия спекулятивного прогнозирования, которая сокращает вычислительные затраты и позволяет завершать каждый шаг за несколько секунд. В экспериментах.
https://derkleineli.github.io/meshpad/
31🔥1
Media is too big
VIEW IN TELEGRAM
#unrealneural #врежимеожидания
PolyDiff: диффузионная модель для генерации 3D-сеток

PolyDiff — первая диффузионная модель, способная напрямую создавать реалистичные и разнообразные трёхмерные полигональные сетки. В отличие от методов, использующих неявные представления, PolyDiff работает непосредственно с сеточной структурой, учитывая как геометрию вершин, так и топологию граней. Модель рассматривает сетки как «треугольные супы», постепенно искажённые категориальным шумом, и обученный трансформер-шумоподавитель восстанавливает исходную структуру. На этапе генерации сетки формируются из полностью зашумлённых данных с последовательным устранением шума. Подход обеспечивает улучшение метрик качества: среднее снижение FID на 18,2 и JSD на 5,8 по сравнению с современными методами.
https://arxiv.org/abs/2312.11417
4👍21
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #ЛабораторияИИ #AILAB #Эксперименты
Вайб-проектирование

LLM для работы в Revit
Продолжаем эксперименты с Revit и LLM, которая по текстовым запросам моделирует внутри программы. Система тестируется под рабочими названиями Text2BIM, RevitMCP, RevitAI и Revit Copilot. Потенциал — автоматизация любых операций, включая оформление.
👍532🔥1
Forwarded from Data Secrets
Cursor на 28% улучшили фичу Tab с помощью RL

Для тех, кто не пользуется: Tab предсказывает, какое действие пользователь собирается сделать далее. Когда вы перемещаете курсор или начинаете писать какой-то код, Tab пытается понять, что вам нужно и, если она достаточно уверена в своем предсказании, то предлагает вам продолжение (чаще всего завершение кода).

Отличная фича, но часто предлагала шум. В общем, Cursor решили что-то с этим делать.

В других редакторах (например, в Copilot) подобную проблему пытались бороть обычными фильтрами: язык, были бы предыдущие предложения приняты или нет и тд.

Звучит в целом норм, но Cursor выбрали путь сложнее и интереснее, потому что они использовали RL с двумя сильными составляющими:

1. Сложная reward модель. Политика на каждом шаге предсказывает вероятности разных исходов + вероятность того, что предложение будет принято. Reward, исходя из этих вероятностей, поощряет принятые предложения и штрафует отклонённые. Например, если вероятность принятия ≥ 25%, accepted даёт +0.75, rejected — −0.25, если ничего не показывается – 0. Вот модель и решает, как ей лучше себя вести. Также в награде учитывается длина оффера, общее количество офферов и др.

2. On-policy data. То есть данные, на которых училась политика, собраны в реальной работе модели уже после её обновления. Получили новый чекпоинт -> задеплоили -> собрали данные (это занимает пару часов) -> учим дальше. Это чтобы не было distribution shift и градиент обновлялся правильно. Реализовать такое, конечно, мега запара.

Итог: в новой версии на 21% меньше предложений, но на 28% выше доля принятия.

Мало того, что это огромный скачок метрики, это еще и качественно другой результат: тут accept rate растет не за счет костыльной фильтрации шумных предсказаний, а за счет того, что сама модель стала более прагматичной и предлагает меньше ерунды.

Good job

cursor.com/blog/tab-rl
21👍1