#unrealneural
Cadrille
Модель комбинирует мультимодальную LLM (на вход может принимать картинки или облака точек или всё сразу) и несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволяет выбить SoTA на самых известных бенчмарках по синтезу CAD моделей.
https://paperswithcode.com/sota/cad-reconstruction-on-deepcad
https://arxiv.org/abs/2505.22914
Cadrille
Модель комбинирует мультимодальную LLM (на вход может принимать картинки или облака точек или всё сразу) и несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволяет выбить SoTA на самых известных бенчмарках по синтезу CAD моделей.
https://paperswithcode.com/sota/cad-reconstruction-on-deepcad
https://arxiv.org/abs/2505.22914
Forwarded from Институт AIRI
Новый шаг в управлении роботами и оптимизации индустриальных процессов 🤖
Исследователи AIRI разработали Vintix — SOTA action-модель для роботов и индустриальных процессов, умеющую имитировать ход обучения с подкреплением. Благодаря этому Vintix самостоятельно корректирует и улучшает свои действия, получая минимальную обратную связь от пользователя.
Техническая реализация Vintix опирается на расширенный контекст трансформера. Благодаря сжатию данных — состояние-действие-награда в один токен — модель анализирует в 3 раза больше информации по сравнению с аналогами: JAT от HugginFace и GATO от Google DeepMind. При этом архитектура устойчива к шуму и частичной наблюдаемости среды — Vintix успешно справляется с задержками и неполными данными, что критически важно для промышленного применения.
Vintix может быть полезной в разных областях. Например, применяться для автоматизации задач на производственных линиях и оптимизации маршрутов складских роботов, а в сфере энергетики подобные системы способны управлять распределением нагрузки для более эффективного использования ресурсов. Научная статья будет представлена на конференции ICML в июле 2025 года.
Подробнее про исследование — в материале Forbes.
Научная статья | GitHub
Исследователи AIRI разработали Vintix — SOTA action-модель для роботов и индустриальных процессов, умеющую имитировать ход обучения с подкреплением. Благодаря этому Vintix самостоятельно корректирует и улучшает свои действия, получая минимальную обратную связь от пользователя.
Техническая реализация Vintix опирается на расширенный контекст трансформера. Благодаря сжатию данных — состояние-действие-награда в один токен — модель анализирует в 3 раза больше информации по сравнению с аналогами: JAT от HugginFace и GATO от Google DeepMind. При этом архитектура устойчива к шуму и частичной наблюдаемости среды — Vintix успешно справляется с задержками и неполными данными, что критически важно для промышленного применения.
Vintix может быть полезной в разных областях. Например, применяться для автоматизации задач на производственных линиях и оптимизации маршрутов складских роботов, а в сфере энергетики подобные системы способны управлять распределением нагрузки для более эффективного использования ресурсов. Научная статья будет представлена на конференции ICML в июле 2025 года.
Подробнее про исследование — в материале Forbes.
Научная статья | GitHub
#unrealneural
15 правил вайб-кодинга 🙃
1. Начни с шаблона: Начни свой проект, клонировав шаблон с GitHub или другого источника, чтобы получить надёжную основу. (В Cursor выбери "Start from Repo" и вставь эту ссылку для запуска nextjs-приложения с предустановленным ИИ, базой данных и авторизацией:
https://github.com/ansh/template-2)
2. Используй агент-режим: Работай в агент-режиме Cursor (не в обычном), чтобы создавать, редактировать и управлять файлами через команды на естественном языке.
3. Используй Perplexity: Ищи новые дизайны и API в интернете через Perplexity. Например: если ты создаёшь проект на nextjs и хочешь реализовать определённую фичу, попроси Perplexity дать инструкции и примеры кода.
4. Создавай новые чаты в Composer: Создавай отдельный чат в Composer для каждой задачи. Держи чаты короткими.
5. Запускай локально, тестируй часто: Используй встроенные серверы для локального запуска приложения и частого тестирования, чтобы сразу ловить ошибки.
6. Итерируй и дорабатывай: Прими быстрые итерации — не пытайся сразу сделать идеально, улучшай шаг за шагом.
7. Используй голосовой ввод: Применяй инструменты вроде Whispr Flow для быстрого ввода — и просто кайфуй.
8. Клонируй и используй разумно: Используй репозитории GitHub как шаблоны, чтобы ускорить разработку или вдохновиться, а потом адаптируй под свои нужды.
9. Копируй ошибки в агент Composer: Когда возникает ошибка — копируй сообщение из консоли в агент Composer. Иногда нужно вставить несколько раз. Лучше переобъясни, чем недообъясни.
10. Не забывай, что можно восстановить прошлые чаты в Composer: Сохраняй свою работу часто, чтобы в случае чего откатиться назад.
11. Храни секреты: Всегда сохраняй API-ключи и чувствительные данные в файлах окружения, а не жёстко в коде.
12. Коммить чаще: Загружай изменения в GitHub регулярно, чтобы не потерять прогресс. Cursor может сделать это за тебя — просто попроси агента.
13. Развёртывай пораньше: Используй платформы вроде Vercel для раннего деплоя — так ты узнаешь об ошибках заранее.
14. Веди записи удачных промптов; переиспользуй их: Документируй эффективные команды, чтобы в будущем легче было развивать проект и находить баги.
15. Наслаждайся процессом — просто вайб: Получай кайф от креативного пути вайб-кодинга, экспериментируй, учись и просто наслаждайся. Just vibe.
15 правил вайб-кодинга 🙃
1. Начни с шаблона: Начни свой проект, клонировав шаблон с GitHub или другого источника, чтобы получить надёжную основу. (В Cursor выбери "Start from Repo" и вставь эту ссылку для запуска nextjs-приложения с предустановленным ИИ, базой данных и авторизацией:
https://github.com/ansh/template-2)
2. Используй агент-режим: Работай в агент-режиме Cursor (не в обычном), чтобы создавать, редактировать и управлять файлами через команды на естественном языке.
3. Используй Perplexity: Ищи новые дизайны и API в интернете через Perplexity. Например: если ты создаёшь проект на nextjs и хочешь реализовать определённую фичу, попроси Perplexity дать инструкции и примеры кода.
4. Создавай новые чаты в Composer: Создавай отдельный чат в Composer для каждой задачи. Держи чаты короткими.
5. Запускай локально, тестируй часто: Используй встроенные серверы для локального запуска приложения и частого тестирования, чтобы сразу ловить ошибки.
6. Итерируй и дорабатывай: Прими быстрые итерации — не пытайся сразу сделать идеально, улучшай шаг за шагом.
7. Используй голосовой ввод: Применяй инструменты вроде Whispr Flow для быстрого ввода — и просто кайфуй.
8. Клонируй и используй разумно: Используй репозитории GitHub как шаблоны, чтобы ускорить разработку или вдохновиться, а потом адаптируй под свои нужды.
9. Копируй ошибки в агент Composer: Когда возникает ошибка — копируй сообщение из консоли в агент Composer. Иногда нужно вставить несколько раз. Лучше переобъясни, чем недообъясни.
10. Не забывай, что можно восстановить прошлые чаты в Composer: Сохраняй свою работу часто, чтобы в случае чего откатиться назад.
11. Храни секреты: Всегда сохраняй API-ключи и чувствительные данные в файлах окружения, а не жёстко в коде.
12. Коммить чаще: Загружай изменения в GitHub регулярно, чтобы не потерять прогресс. Cursor может сделать это за тебя — просто попроси агента.
13. Развёртывай пораньше: Используй платформы вроде Vercel для раннего деплоя — так ты узнаешь об ошибках заранее.
14. Веди записи удачных промптов; переиспользуй их: Документируй эффективные команды, чтобы в будущем легче было развивать проект и находить баги.
15. Наслаждайся процессом — просто вайб: Получай кайф от креативного пути вайб-кодинга, экспериментируй, учись и просто наслаждайся. Just vibe.
#пытаюсьпонять
Self-attention в LLM, представленный как направленный взвешенный граф
Self-attention в LLM, представленный как направленный взвешенный граф
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
EleutherAI выпустила The Common Pile v0.1 — 8-терабайтный набор данных для тренировки моделей, собранный при участии Hugging Face и академических институтов. В него вошли более 20-ти публичных источников, На базе датасета созданы Comma v0.1-1T и Comma v0.1-2T (по 7 млрд параметров), которые, по заявлению разработчиков, не уступают моделям, обученным на нелицензированном контенте.
Модели показывают сильные результаты в прораммировании и математике, опровергая мнение, что только "пиратский" контент обеспечивает качество. Релиз датасета - это попытка исправить ошибки прошлого: ранее EleutherAI критиковали за использование защищенного авторским правом контента в старом датасете The Pile.
huggingface.co
OpenAI получила судебный приказ о временном хранении данных пользователей ChatGPT и API, даже если они были удалены. Это связано с иском New York Times о нарушении авторских прав. NYT требует сохранить «всю переписку и контент» для использования в качестве доказательств.
Под приказ попадают данные пользователей бесплатных и платных версий ChatGPT (Plus, Pro, Team), а также API-клиенты без соглашения о нулевом хранении данных. Корпоративные клиенты и образовательные проекты в безопасности — их информация не попадает под приказ.
OpenAI назвала требование чрезмерным, подчеркнув, что обычно удаляет данные через 30 дней и подала апелляцию, но временно соблюдает решение.
openai.com
MIT CSAIL и Recursion разработали Boltz-2 — открытую модель для анализа биомолекулярных структур и связывания. Она сочетает рекордную скорость и точность, превосходя AlphaFold3 и других конкурентов.
Boltz-2 предсказывает, как молекулы взаимодействуют, с точностью, близкой к физическим методам FEP, но в 1000 раз быстрее. Разработчики надеются, что публикация модели облегчит поиск лекарств, ведь Boltz-2 может за час перебрать тысячи соединений вместо недель вычислений.
globenewswire.com
AMD объявил о покупке ключевых специалистов из стартапа Untether AI, разработавшего энергоэффективные чипы для ИИ-инференса. Сделка должна укрепить возможности компании в области компиляторов и проектирования чипов.
Untether AI, основанный в 2018 году, славился архитектурой «at-memory», повышающей производительность в дата-центрах и на EDGE-устройствах. Их плата speedAI240 Slim показала рекордную энергоэффективность: в 3–6 раз выше аналогов по тестам MLPerf.
Сделка стала частью стратегии AMD по конкурированию с Nvidia. Ранее, приобретя стартап Brium, компания усилила оптимизацию ИИ-нагрузок на GPU Instinct. Теперь фокус смещается на интеграцию новых технологий в продукты, ориентированные на растущий рынок ИИ.
crn.com
В Нью-Йорке прошел ежегодный фестиваль ИИ-фильмов от Runway. За 3 года проект вырос от 300 до 6000 заявок, а в этом году представил десятку короткометражек, созданных с помощью ИИ. Лучшей стала «Total Pixel Space» Джейкоба Алдера, исследующая математические границы digital-изображений.
По словам организаторов, технологии ускоряют процессы кинопроизводства и фестиваль делает акцент на том, как ИИ поддерживает, а не заменяет творцов.
apnews.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
LlamaBot: помощник по программированию
Агент ИИ на базе LangGraph, который создает веб-приложения через естественный чат. Включает генерацию кода в реальном времени с предварительным просмотром в реальном времени и специализированных агентов для различных задач разработки.
Opensource 🔥
https://github.com/KodyKendall/LlamaBot
LlamaBot: помощник по программированию
Агент ИИ на базе LangGraph, который создает веб-приложения через естественный чат. Включает генерацию кода в реальном времени с предварительным просмотром в реальном времени и специализированных агентов для различных задач разработки.
Opensource 🔥
https://github.com/KodyKendall/LlamaBot
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Не удержался и сделал нарезку работ студентов во время семинара студии STF.
Все они были смоделированы с использованием ИИ студентами с нулевыми знаниями в области программирования!
Все проекты:
-идея с помощью ИИ
-смоделировано с помощью ИИ
-спрограммировано с помощью ИИ
-анимировано с помощью ИИ
Будем учиться у коллег делать невероятные вещи👍👍👍
Не удержался и сделал нарезку работ студентов во время семинара студии STF.
Все они были смоделированы с использованием ИИ студентами с нулевыми знаниями в области программирования!
Все проекты:
-идея с помощью ИИ
-смоделировано с помощью ИИ
-спрограммировано с помощью ИИ
-анимировано с помощью ИИ
Будем учиться у коллег делать невероятные вещи👍👍👍
#проахитектуру #пытаюсьпонять #ЛабораторияИИ
Хочу попытаться понять, что именно вызывает у меня внутреннее сопротивление при взгляде на жилой комплекс «Бадаевский».
Формально он выглядит эффектно: «парящая» архитектура, чистые линии, отсылки к современным проектам вроде зданий Heatherwick Studio. Но именно это и настораживает — на стадии концепции он уже оглядывается на реализованные элитарные проекты, вместо того чтобы формировать собственную архитектурную идею. В его основе — иллюзия легкости, технологии и футуризма, но без попытки осмыслить, зачем здание должно парить и что оно этим говорит городу. А ведь ещё в 1923 году Эль Лисицкий в своей работе «Горизонтальный небоскрёб» (Wolkenbügel) предложил не просто поднятое здание, а новую структуру городской жизни — освобождённую от хаоса улиц, построенную на принципах открытого, коллективного пространства.
Мне кажется, чтобы проект зазвучал по-настоящему, ему не хватает идентичности — не стилистической, а культурной и смысловой. Таким элементом мог бы стать образ избушки на курьих ножках: архетип переходного, живого, уклоняющегося от норм жилища. Это бы превратило ЖК в организм, в архитектуру как существо — не просто парящее, а мифологически нагруженное. Тогда проект стал бы не только технологически сильным, но и концептуально цельным — высказыванием о культурной памяти, об архитектуре как диалоге между утопией и мифом.
Возможно, именно такой синтез и может стать языком новой архитектуры — ведь ещё Заха Хадид вдохновлялась конструктивистами и архитектонами Малевича, а их поиски пространства и формы стали философским фундаментом того, что позже назвали параметризмом.
ЖК "Горизонтальные небоскребы на курьих ножках" звучало бы веселее 😃 Ну и есть идея с которой можно поэкспериментировать с помощью нейросетей.
Хочу попытаться понять, что именно вызывает у меня внутреннее сопротивление при взгляде на жилой комплекс «Бадаевский».
Формально он выглядит эффектно: «парящая» архитектура, чистые линии, отсылки к современным проектам вроде зданий Heatherwick Studio. Но именно это и настораживает — на стадии концепции он уже оглядывается на реализованные элитарные проекты, вместо того чтобы формировать собственную архитектурную идею. В его основе — иллюзия легкости, технологии и футуризма, но без попытки осмыслить, зачем здание должно парить и что оно этим говорит городу. А ведь ещё в 1923 году Эль Лисицкий в своей работе «Горизонтальный небоскрёб» (Wolkenbügel) предложил не просто поднятое здание, а новую структуру городской жизни — освобождённую от хаоса улиц, построенную на принципах открытого, коллективного пространства.
Мне кажется, чтобы проект зазвучал по-настоящему, ему не хватает идентичности — не стилистической, а культурной и смысловой. Таким элементом мог бы стать образ избушки на курьих ножках: архетип переходного, живого, уклоняющегося от норм жилища. Это бы превратило ЖК в организм, в архитектуру как существо — не просто парящее, а мифологически нагруженное. Тогда проект стал бы не только технологически сильным, но и концептуально цельным — высказыванием о культурной памяти, об архитектуре как диалоге между утопией и мифом.
Возможно, именно такой синтез и может стать языком новой архитектуры — ведь ещё Заха Хадид вдохновлялась конструктивистами и архитектонами Малевича, а их поиски пространства и формы стали философским фундаментом того, что позже назвали параметризмом.
ЖК "Горизонтальные небоскребы на курьих ножках" звучало бы веселее 😃 Ну и есть идея с которой можно поэкспериментировать с помощью нейросетей.
Может сделать конкурс на лучшую генерацию на эту тему Избушки вместо ЖК Бадаевский?
Anonymous Poll
67%
да
10%
нет
24%
делай что хочешь 😎
#unrealneural
Log-linear attention - новый тип внимания, предложенный
Massachusetts Institute of Technology (MIT)
Он использует небольшое, но растущее число слотов памяти, которое логарифмически увеличивается с длиной последовательности.
https://arxiv.org/abs/2506.04761
https://github.com/HanGuo97/log-linear-attention
Log-linear attention - новый тип внимания, предложенный
Massachusetts Institute of Technology (MIT)
Он использует небольшое, но растущее число слотов памяти, которое логарифмически увеличивается с длиной последовательности.
https://arxiv.org/abs/2506.04761
https://github.com/HanGuo97/log-linear-attention
#unrealneural
Сходил в гости к коллегам из института AIRI
Немного поучаствовал в их мозгоштурме 😃
С нетерпением жду совместных активностей наших команд 🔥
Сходил в гости к коллегам из института AIRI
Немного поучаствовал в их мозгоштурме 😃
С нетерпением жду совместных активностей наших команд 🔥
Forwarded from Data Secrets
Apple даст разработчикам доступ к локальным ИИ-моделям компании
Об этом объявили на WWDC 2025. Apple запускают целый фреймворк Foundation Models, с помощью которого их модели можно будет встраивать в приложения.
При этом у пользователей при использовании приложений эти модели будут запускаться локально. Ну, например, вы создаете в FatSecret персональный план питания с помощью ИИ, но при этом ваши данные не улетают в облако, а остаются только на устройстве.
Говорят, что фреймворк достаточно интуитивный, с поддержкой Swift. Доступ к моделям или к tool calling можно будет получить всего в 3-5 строк кода.
www.apple.com/newsroom/2025/06/apple-supercharges-its-tools-and-technologies-for-developers/
Об этом объявили на WWDC 2025. Apple запускают целый фреймворк Foundation Models, с помощью которого их модели можно будет встраивать в приложения.
При этом у пользователей при использовании приложений эти модели будут запускаться локально. Ну, например, вы создаете в FatSecret персональный план питания с помощью ИИ, но при этом ваши данные не улетают в облако, а остаются только на устройстве.
Говорят, что фреймворк достаточно интуитивный, с поддержкой Swift. Доступ к моделям или к tool calling можно будет получить всего в 3-5 строк кода.
www.apple.com/newsroom/2025/06/apple-supercharges-its-tools-and-technologies-for-developers/
#вкопилкуэрудита
Наглядное доказательство теоремы Байеса
*Теорема Байеса — одна из основных теорем элементарной теории вероятностей, которая позволяет определить вероятность события при условии, что произошло другое статистически взаимозависимое с ним событие.
Наглядное доказательство теоремы Байеса
*Теорема Байеса — одна из основных теорем элементарной теории вероятностей, которая позволяет определить вероятность события при условии, что произошло другое статистически взаимозависимое с ним событие.
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Morphology-adaptive
Проект, в котором контроллеры движения адаптируются к разным формам. На видео один и тот же контроллер работает с разными телами с помощью механизма внимания.
https://github.com/juniorrojas/morphology-adaptive
Morphology-adaptive
Проект, в котором контроллеры движения адаптируются к разным формам. На видео один и тот же контроллер работает с разными телами с помощью механизма внимания.
https://github.com/juniorrojas/morphology-adaptive
Forwarded from ИИ и роботы в стройке
Media is too big
VIEW IN TELEGRAM
CAST — еще один метод, чтобы получить 3D-модель из одного изображения
1️⃣ Сегментирует 2D и выделяет из него все объекты.
2️⃣ Строит частичное 3D-представление сцены — облако точек с примерной глубиной и расположением объектов.
3️⃣ Используя диффузионные модели, генерирует для каждого объекта полноценную 3D-модель с детализацией, включая недостающие части.
4️⃣ Выравнивает и размещает объекты в 3D-пространстве так, чтобы соблюдались реальные физические связи — например, здания стоят на земле, а не парят, а объекты не пересекаются.
Результат — 3D-сцена с корректными геометрией и физикой, готовая для использования в CAD. CAST может значительно ускорить и упростить создание точных 3D-моделей для градостроительства. Сами же авторы пишут, что метод можно также применять в робототехнике.
Кода пока нет.
Результат — 3D-сцена с корректными геометрией и физикой, готовая для использования в CAD. CAST может значительно ускорить и упростить создание точных 3D-моделей для градостроительства. Сами же авторы пишут, что метод можно также применять в робототехнике.
Кода пока нет.
Please open Telegram to view this post
VIEW IN TELEGRAM