AI LAB | Лаборатория ИИ
1.23K subscribers
392 photos
317 videos
22 files
694 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

Interesting materials and experiments with use machine learning and not only.

На связи 24/7
@unrealartur
Download Telegram
#unrealneural
Сходил в гости к коллегам из института AIRI
Немного поучаствовал в их мозгоштурме 😃
С нетерпением жду совместных активностей наших команд 🔥
Forwarded from Data Secrets
Apple даст разработчикам доступ к локальным ИИ-моделям компании

Об этом объявили на WWDC 2025. Apple запускают целый фреймворк Foundation Models, с помощью которого их модели можно будет встраивать в приложения.

При этом у пользователей при использовании приложений эти модели будут запускаться локально. Ну, например, вы создаете в FatSecret персональный план питания с помощью ИИ, но при этом ваши данные не улетают в облако, а остаются только на устройстве.

Говорят, что фреймворк достаточно интуитивный, с поддержкой Swift. Доступ к моделям или к tool calling можно будет получить всего в 3-5 строк кода.

www.apple.com/newsroom/2025/06/apple-supercharges-its-tools-and-technologies-for-developers/
#вкопилкуэрудита

Наглядное доказательство теоремы Байеса

*Теорема Байеса — одна из основных теорем элементарной теории вероятностей, которая позволяет определить вероятность события при условии, что произошло другое статистически взаимозависимое с ним событие.
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Morphology-adaptive

Проект, в котором контроллеры движения адаптируются к разным формам. На видео один и тот же контроллер работает с разными телами с помощью механизма внимания.
https://github.com/juniorrojas/morphology-adaptive
Media is too big
VIEW IN TELEGRAM
CAST — еще один метод, чтобы получить 3D-модель из одного изображения

1️⃣ Сегментирует 2D и выделяет из него все объекты.
2️⃣ Строит частичное 3D-представление сцены — облако точек с примерной глубиной и расположением объектов.
3️⃣ Используя диффузионные модели, генерирует для каждого объекта полноценную 3D-модель с детализацией, включая недостающие части.
4️⃣ Выравнивает и размещает объекты в 3D-пространстве так, чтобы соблюдались реальные физические связи — например, здания стоят на земле, а не парят, а объекты не пересекаются.

Результат — 3D-сцена с корректными геометрией и физикой, готовая для использования в CAD. CAST может значительно ускорить и упростить создание точных 3D-моделей для градостроительства. Сами же авторы пишут, что метод можно также применять в робототехнике.

Кода пока нет.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Китай.AI
🤖 Искусственный интеллект и будущее Китая: взгляд основателя Huawei

Основатель Huawei Жэнь Чжэнфэй в эксклюзивном интервью поделился мнением о развитии ИИ, проблемах полупроводниковой отрасли и роли фундаментальной науки.

🔹 О вызовах и инновациях
- В ответ на санкции США: "Не думаем о трудностях — просто работаем" 
- Признает отставание в одно поколение в производстве чипов, но отмечает компенсацию через:
  • Математические методы (восполнение физических ограничений)
  • Кластерные вычисления
  • Развитие альтернатив кремнию

Huawei инвестирует $25 млрд в R&D ежегодно, из них $8 млрд — в фундаментальные исследования без KPI.

🧠 Будущее ИИ по версии Huawei
• Главные условия развития: мощные энергосистемы и инфраструктура передачи данных 
• "Алгоритмы принадлежат не IT-специалистам, а экспертам в энергетике, медицине и т.д."
• Преимущества Китая:
  - Крупнейший в мире пул молодых талантов 
  - Передовые электросети и телекоммуникации 
  - Программа "Восточные данные — западные вычисления"

🌍 Социальный аспект
Подчеркивает важность государственной поддержки нерентабельных, но социально значимых проектов (как в случае с китайской сетью ВСМ), что возможно только при социалистической модели.

Вывод: Несмотря на технологические вызовы, Китай делает стратегические ставки на ИИ и фундаментальную науку, используя системные преимущества своей экономической модели.

Источник (People's Daily)

#КитайскийИИ #КитайAI #Huawei #Технологии
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
PartCrafter
Еще один инструмент 3D-генерации.
Из одного изображения он генерирует несколько структурированных, семантически значимых 3D-деталей — все за один проход.

https://arxiv.org/abs/2506.05573
#проархитектуру #пытаюсьпонять #ЛабораторияИИ
Про «архитектон» современного проектирования

Казимир Малевич создавал архитектоны как абстрактные модели будущей архитектуры. Это были не здания, а композиции, формы - попытка нащупать основу пространства, до наполнения функцией, до фасада, до планировок, до стройки.
Сегодня, спустя большие этапы развития технологий, подходов, появления такого количества проектов и форм зданий, архитектон уже не может быть как физический объём. Он скорее не физическая композиция, а логика архитектурного процесса, проектирования вне зависимости где это действие совершается (на компьютере или на бумаге).

В реальности ИИ-агентов и автоматизированных платформ становится ясно: архитектуру порождает не результат, а последовательность решений, принятых по пути. И если у Малевича архитектоны были телами, то сегодня — это единицы проектного действия, то, из чего рождается пространство, как мне кажется. Ведь построенный объект это не всегда единственно верное решение на данном куске пространство, даже если к нему пришла группа хороших архитекторов.

Такое большое разнообразие архпространства порождается комбинацией ограниченного множества действий. Особенно если это происходит в рамках API определенного софта 🧐
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Kyvo

В качестве запроса отправляем трехмерные фигуры в json формате и он выдает их изображение.
Учитывая 3D модели и их расположение, Kyvo прогнозирует изображение методом авторегрессии.

https://glab-caltech.github.io/kyvo/
Forwarded from Complete AI
⚡️⚡️⚡️На прошлой неделе мы зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning

Архитектура представляет собой мультимодальную LLM, которая на вход может принимать облака точек, изображения и текст, а на выходе генерировать код операций, восстанавливающих некоторый CAD объект (например, какую-то инженерную деталь). То есть мы одновременно решаем задачу понимания сложных модальностей и задачу синтеза последовательности операций, необходимых для её восстановления по фото и облаку точек.

В дополнение добавили несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволило значительно улучшить метрики и выбить SoTA на самых известных бенчмарках по восстановлению CAD моделей: DeepCAD, Fusion360 и CC3D💪

📍Статья — https://arxiv.org/abs/2505.22914
📍GitHub
📍
Hugging Face
📍
На Papers With Code уверенная SoTA на DeepCAD бенчмарке

Буду очень рад обратной связи и предложениям по развитию, тестированию и будущему внедрению!

P.S. На прошедшем 30 мая DataFest’е в Сбере я рассказал подробно про наши исследования в области генеративного проектирования и кратко о модели, что вызвало большой интерес у представителей промышленности. Поэтому если вы ещё не слышали про cadrille, то обязательно расскажите своему другу - инженеру, ему особенно понравится😉

@complete_ai
Forwarded from NN
Krea выпустили свою первую модель для генерации изображений Krea 1. Работает бесплатно для всех пользователей.

Умеет на ходу переключаться между разными стилями, от фотореализма до простого рисунка. Можно натренировать нейронку на собственных снимках.

Уже раздают бета-доступ. До полноценного релиза меньше недели.
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Text-to-LoRA

Гиперсеть, которая генерирует адаптеры LLM для конкретных задач (LoRA) на основе текстового описания задачи.

Биологические системы быстро адаптируются к сенсорным изменениям, например, зрение подстраивается под освещение. Современные LLM, несмотря на широкие возможности, плохо адаптируются к специфическим задачам без больших данных и дорогой тонкой настройки. Text-to-LoRA (T2L) решает это, обучая «гиперсеть», которая по текстовому описанию задачи генерирует LoRA-адаптер. T2L эффективно кодирует сотни адаптеров, сохраняя их производительность, и обобщает на новые задачи. Этот метод позволяет нетехническим пользователям адаптировать модели простым языком, снижая вычислительные и технические барьеры.

https://github.com/SakanaAI/Text-to-Lora
Forwarded from эйай ньюз
Авито показали технологическую внутрянку компании

На фестивале Data Fest Авито показали, как работают языковые и визуальные модели, обучаются агенты поддержки, функционируют бизнес-метрики внедрения. А еще — чем занимаются стажеры в компании.

Выяснилось, что собственный токенизатор модели требует на русском языке в среднем на 29% меньше токенов. Это делает модель до двух раз быстрее чем Qwen такого же размера. В итоге на фесте A-Vibe заняла первое место среди небольших моделей в бенчмарке MERA. Кстати, стажеры в компании тоже занимаются обучением A-Vibe. Для них нет тестовых проектов — ребята сразу попадают в гущу событий.

Визуальная модель не отстает от языковой: она умеет делать описание изображения, распознавать текст, считать объекты на фото и даже определять названия брендов. Быстрый токенизатор опять же помогает выполнять все эти задачи в ускоренном режиме.

А для автоматизации 80-95% рутинных задач Авито создал ML-платформу. Платформа объединяет хранилище готовых признаков, систему разметки с взаимным контролем качества между людьми и ИИ, а также open-source решение Aqueduct для оптимизации инференса, экономящее до 30% ресурсов. Конечная цель ー no-code интерфейс, позволяющий любому сотруднику запускать модели без написания кода.

@ai_newz