AI LAB | Лаборатория ИИ
1.67K subscribers
580 photos
423 videos
23 files
860 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca

Вопросы сотрудничества и соучастия
@j_fede
Download Telegram
#unrealneural
Cosmos-Reason1-7B

NVIDIA выпустила новую модель зрительного восприятия для робототехники.
Как я понимаю, помимо зрительного восприятия, появятся инструменты восприятия входных сигналов тактильного восприятия. Не знаю как это реализовано, возможно через зрительное восприятие.

Судя по всему это первая модель для робототехники, которая позволит им "мыслить" 🤯

https://integratormedia.com/2025/05/20/nvidia-open-sources-physical-common-sense-ai-phase-3-of-the-ai-story-starts-now/
🤯53
На Hugging Face запустили бесплатный курс по Model Context Protocol (MCP)

Курс подойдёт разработчикам и ML-инженерам, которые хотят создавать приложения на базе больших языковых моделей.

💚Про что: как работать на архитектуре MCP, с официальными SDK на Python и TypeScript, а также как создавать свои MCP-приложения с помощью Gradio и Hugging Face Spaces.

Для прохождения требуется базовый опыт с Python или TypeScript, понимание API и LLM. В ходе обучения обещают конкурсы и соревнования с другими слушателями курса. А в конце, выполнив все задания, можно получить сертификат HF.

Курс на Hugging Face
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73
Gemini Ultra пока не дождались, зато дождались
* Супербыструю текстовую диффузию в Gemini Diffusion (5x faster than 2.0 Flash Lite)
* Улучшенную Gemini 2.5 Pro Deep Think
* Будущее развитие в направлении World models и Universal AI assistant
👍42
Forwarded from эйай ньюз
😮 Google тестит дифуззионки для текста!

На Google I/O показали Diffusion версию Gemini. Она, при таком же уровне интеллекта, в пять раз быстрее Gemini Gemini 2.0 Flash Lite, самой быстрой модели гугла. Пока доступно только ограниченное превью для избранных, которым обещают докинуть более умную модель чуть позже.

Очень интересно наблюдать как авторегрессию юзают в генерации изображений и видео, а дифузию в генерации текста. Архитектуры становятся всё ближе и ближе к друг другу.

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Gemini diffusion

1000+ слов в секунду 🤯
🤯82
This media is not supported in your browser
VIEW IN TELEGRAM
#вкопилкуэрудита
Теорема Нётер и принцип эквивалентности

Теорема Нётер связывает симметрии в природе с законами сохранения. Если физические законы остаются неизменными при некоторых других изменениях, то есть величины, которые сохраняются:
- Симметрия во времени (законы одинаковы сегодня и завтра) даёт сохранение энергии
- Симметрия в пространстве (законы одинаковы в любой точке) приводит к сохранению импульса
- Симметрия вращения (законы не меняются при поворотах) отвечает за сохранение углового момента

Принцип эквивалентности Эйнштейна говорит, что гравитация — это не просто сила, а искривление пространства-времени. Ускорение (например, в лифте) и гравитация ощущаются одинаково, потому что пространство и время связаны, и гравитация влияет на их геометрию, изменяя движение объектов и течение времени.
4🤔43👍3
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Large Language Diffusion Models

Исследование, которое ставит под сомнение доминирующую роль авторегрессивных моделей в больших языковых моделях, показывая эффективность модели LLaDa (Latent Language Diffusion Architecture).

Пришло время изучать статью 🧐
https://arxiv.org/pdf/2502.09992
👍63🤔2
#unrealneural
Text2CadQuery

Это расширение подходов генерации CAD данных. Преобразование происходит через обработку естественного языка в 3 д модели с использованием CadQuery.

CadQuery — это библиотека для параметрического 3D-моделирования, которая позволяет создавать 3D-объекты с помощью скриптов, а не через графический интерфейс (как в Blender, Grasshopper для Rhino и т.д.).
https://arxiv.org/abs/2505.06507
👍64
Forwarded from NN
Создаем дизайн любого приложения за минуту: Google запустили ИИ-сервис Stitch для разработки интерфейсов.

Нейронка создаёт готовые файлы HTML и CSS — их можно экспортировать в Figma или любую IDE для доработки кода. Вместе с промтом можно загрузить свой набросок от руки.

Пробуем здесь.
👍743
Forwarded from Data Secrets
А еще сегодня, возможно, будет что-то новенькое от Anthropic

В 18:30 МСК они проведут стрим под названием «Code with Claude». По некоторым неподтвержденным утечкам, на нем покажут как раз те самые обновленные Opus и Sonnet с глубоким агентским ризонингом.

Смотрим здесь
🤔4👍32👎1🤯1
Forwarded from Machinelearning
⚡️ Anthropic представила Claude 4 Opus и Sonnet 4

На мероприятии Code /w Claude CEO Anthropic презентовал Claude 4 Opus и Claude Sonnet 4.

✔️ Opus 4 Anthropic называет лучшей моделью для кодинга, она справляется с многошаговыми задачами, работая часами без потери эффективности — например, сохраняет контекст игры в Pokémon, записывая ключевые данные в локальные файлы.

✔️Sonnet 4, доступная даже бесплатным пользователям, стал серьезным апгрейдом предыдущей версии: точнее выполняет инструкции и сократил ошибки в навигации по коду с 20% до нуля.

Обе модели поддерживают расширенное мышление: чередуют анализ и использование инструментов веб-поиска, а также выполняют задачи параллельно.

Для разработчиков появилась интеграция с VS Code, JetBrains и GitHub Actions — правки от Claude теперь отображаются прямо в редакторе. В бета-режиме можно подключать SDK для создания собственных агентов.

По словам партнеров: GitHub и Replit, Opus 4 понимает сложные кодбазы, а Sonnet 4 идеален для повседневных задач. Например, в GitHub Copilot его уже тестируют как основу для нового агента.

В тарифные планы Pro, Max, Team и Enterprise Claude включены обе модели и расширенное мышление, а Sonnet 4 также доступен для бесплатных пользователей.

Обе модели доступны в Anthropic API, Amazon Bedrock и Google Cloud's Vertex AI. Ценообразование остается неизменным по сравнению с предыдущими моделями Opus и Sonnet: Opus 4 - $15/$75 за миллион токенов (ввод/вывод), Sonnet 4 - $3/$15.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍32🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
MMaDA - Multimodal Large Diffusion Language Models

Первая диффузионная технология, которая объединяет текстовое обоснование, мультимодальное понимание и генерацию изображений с помощью смешанного Long-CoT и унифицированного RL — UniGRPO

https://arxiv.org/abs/2505.15809
42🤯2
#ИИ Сделали новый чат @bimaichat с Александром Поповым, техническим директором и автором SIGNAL, автором тг канала про BIM: @prostobim

Сегодня вход открыт для всех, кто интересуется ИИ, затем будем пускать по заявкам (чтобы защититься от спама).

Планируем обсуждать в чате тренды в ИИ, а также способы применения ИИ в проектировании и на стройке. Будем рады, если будете делиться своими кейсами в чате. Ну и обсуждать чужие.
👍72👌2
#unrealneural
CAD-Coder

VLM, обученный на наборе данных кода CadQuery Python, для прямой генерации САПР из изображений.

Похоже еще одна модель, генерирующая геометрию через CadQuery

https://arxiv.org/abs/2505.14646
👍64
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
LLaMA-Factory

Позволяет обучать и настраивать LLM и VLM с открытым исходным кодом без написания кода.

Поддерживает более 100 моделей, многомодальную тонкую настройку, PPO, DPO, отслеживание экспериментов и многое другое!

100% открытый исходный код с 50 тыс. звезд!
👍743
Forwarded from Complete AI
🔥 Внимание, AI-энтузиасты! 🔥

Ребята из нашей лаборатории FusionBrain запускают несколько топовых исследовательских проектов в рамках конкурса научных проектов МГУ! Если мечтаешь вкатиться в AI Research, прокачать свои навыки и поработать над крутыми задачами — это твой шанс!

📢 Темы исследований:
- Text-to-Image/Video Diffusion Models
- Large Language Models (LLM)
- Vision-Language Models (VLM)
- 3D perception/reconstruction


👩‍💻 Кто может участвовать?
Студенты и выпускники технических вузов, готовые погрузиться в мир передовых технологий и внести свой вклад в развитие науки.

📌 Как принять участие?

1. Заходи на сайт: ссылка
2. Выбирай проект, который тебе по душе
3. Заполняй анкету с сайта
4. Отправляй заявку на почту: a.mezentseva@intellect-foundation.ru


📅 Дедлайн: до 23:59 (МСК) 26 мая 2025 года.


Не упускай возможность — вливайся в мир AI, работай с крутыми задачами и прокачивайся вместе с нами! 🔥
👍74
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural

DTGBrepGen

Авторы предлагают новую структуру, разделяющую топологию и геометрию для генерации B-rep, которая явно учитывает оба аспекта. Сначала генерируются допустимые топологические структуры посредством двухэтапного процесса, который независимо моделирует отношения смежности ребро-грань и ребро-вершина. Затем авторы используют модели диффузии на основе Transformer для последовательной генерации геометрии, постепенно генерируя координаты вершин, за которыми следуют геометрии ребер и геометрии граней, которые представлены в виде B-сплайнов.

https://jinli99.github.io/DTGBrepGen/
🔥62👍2
😃😃😃
😁203