Forwarded from NN
Вышел новый инструмент для вайб-кодеров — Kiro. Это полноценная среда разработки со встроенным ИИ-агентом.
Бот может подготовить полный план создания сайта, приложения или целой игры. Он подбирает нужные технологии, пишет документацию и придумывает тесты.
Забираем здесь. На время бета-тестирования сервис полностью бесплатный.
Бот может подготовить полный план создания сайта, приложения или целой игры. Он подбирает нужные технологии, пишет документацию и придумывает тесты.
Забираем здесь. На время бета-тестирования сервис полностью бесплатный.
🔥6⚡3👍3
#unrealneural
Cadmium 🌊 — статья ANSYS о синтетической маркировке набора данных DeepCAD с использованием аннотаций, созданных с помощью GPT 4.1 на основе реальных данных и многоракурсных изображений, для обучения более качественной модели преобразования текста в CAD с помощью Qwen2.5-Coder. На самом деле, не превосходит ручную маркировку (Text2CAD), но близок к ней
https://arxiv.org/abs/2507.09792
Cadmium 🌊 — статья ANSYS о синтетической маркировке набора данных DeepCAD с использованием аннотаций, созданных с помощью GPT 4.1 на основе реальных данных и многоракурсных изображений, для обучения более качественной модели преобразования текста в CAD с помощью Qwen2.5-Coder. На самом деле, не превосходит ручную маркировку (Text2CAD), но близок к ней
https://arxiv.org/abs/2507.09792
❤3⚡2👍2
Forwarded from Нейросеть
Нашумевший ИИ-фотошоп Flux Kontext теперь можно запустить в чайнике — энтузиасты сделали расширение для облегчённого интерфейса Forge.
Всё, что нужно — установить Forge с GitHub, в поле Extension вставить эту ссылку:
Подгрузить модель и можно пользоваться ☕️
Всё, что нужно — установить Forge с GitHub, в поле Extension вставить эту ссылку:
https://github.com/DenOfEquity/forge2_flux_kontext
Подгрузить модель и можно пользоваться ☕️
⚡5❤2👍2🔥1
Forwarded from Институт AIRI
AIRI × SMILES
Мы выступаем научным партнёром летней школы Сколтеха — SMILES 2025, которая проходит в Харбинском технологическом институте в Китае. Делимся расписанием лекций исследователей AIRI:
⚫️ 19 июля
Олег Рогов — Differential Privacy and Explainable AI: Balancing Transparency and Safety
⚫️ 22 июля
Андрей Кузнецов — AI Principles for Construction and Industrial Generative Design
Александр Коротин — Diffusion Bridge Models for Domain Translation Problems
⚫️ 23 июля
Александр Коротин — Adversarial Bridge Models for Domain Translation Problems
⚫️ 24 июля
Денис Димитров — Text-to-Image and Text-to-Video: Current State and Challenges
📎 Записи и трансляции всех лекций — по ссылке.
Мы выступаем научным партнёром летней школы Сколтеха — SMILES 2025, которая проходит в Харбинском технологическом институте в Китае. Делимся расписанием лекций исследователей AIRI:
Олег Рогов — Differential Privacy and Explainable AI: Balancing Transparency and Safety
Андрей Кузнецов — AI Principles for Construction and Industrial Generative Design
Александр Коротин — Diffusion Bridge Models for Domain Translation Problems
Александр Коротин — Adversarial Bridge Models for Domain Translation Problems
Денис Димитров — Text-to-Image and Text-to-Video: Current State and Challenges
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3⚡1❤1
Forwarded from Нейросеть
Media is too big
VIEW IN TELEGRAM
В OpenAI анонсировали агента, который управляет ПК и работает в интернете. Он работает лучше «кожаных» офисных сотрудников в 50% случаев.
OpenAI выпустили ИИ-ассистента ChatGPT Agent. Доступный по подписке, он умеет лазить в вашем компьютере от лица пользователя и управлять им: смотреть календарь, писать письма, бронировать отели и заказывать продукты. Помимо браузера нейронка имеет доступ и к приложениям в компьютере — она может, например, достать данные из PDF-файла и заполнить эксель-таблицу. На видео ChatGPT Agent планирует путешествие и добавляет даты в календарь.
В процессе работы агента можно прервать, чтобы уточнить детали и он продолжит искать желаемый результат без потери прогресса. Кроме того сам чат может запрашивать дополнительные сведения, если это будет необходимо.
В основе агента два других инструмента от компании: Deep Research, анализирующий и резюмирующий информацию и ИИ-агент Operator, умеющий пользоваться интернетом и выполнять там действия. Их симбиоз и дал существование модели для ChatGPT Agent.
Нагоним немного страха: согласно внутреннему тестированию OpenAI, проведённому для оценки эффективности, результаты ChatGPT-агента оказались сопоставимы с работой человека — а порой и превосходили её — примерно в половине случаев.
Как дела в офисе, пацанИИ?
OpenAI выпустили ИИ-ассистента ChatGPT Agent. Доступный по подписке, он умеет лазить в вашем компьютере от лица пользователя и управлять им: смотреть календарь, писать письма, бронировать отели и заказывать продукты. Помимо браузера нейронка имеет доступ и к приложениям в компьютере — она может, например, достать данные из PDF-файла и заполнить эксель-таблицу. На видео ChatGPT Agent планирует путешествие и добавляет даты в календарь.
В процессе работы агента можно прервать, чтобы уточнить детали и он продолжит искать желаемый результат без потери прогресса. Кроме того сам чат может запрашивать дополнительные сведения, если это будет необходимо.
В основе агента два других инструмента от компании: Deep Research, анализирующий и резюмирующий информацию и ИИ-агент Operator, умеющий пользоваться интернетом и выполнять там действия. Их симбиоз и дал существование модели для ChatGPT Agent.
Нагоним немного страха: согласно внутреннему тестированию OpenAI, проведённому для оценки эффективности, результаты ChatGPT-агента оказались сопоставимы с работой человека — а порой и превосходили её — примерно в половине случаев.
❤3⚡2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Движок RAG для глубокого понимания документов!
RAGFlow позволяет создавать рабочие процессы RAG корпоративного уровня для сложных документов со ссылками.
Поддерживает понимание мультимодальных данных, веб-поиск, глубокие исследования и т. д.
100% локальный и с открытым исходным кодом, 60 тыс. звезд🔥🔥🔥
Движок RAG для глубокого понимания документов!
RAGFlow позволяет создавать рабочие процессы RAG корпоративного уровня для сложных документов со ссылками.
Поддерживает понимание мультимодальных данных, веб-поиск, глубокие исследования и т. д.
100% локальный и с открытым исходным кодом, 60 тыс. звезд🔥🔥🔥
🤔4🔥3⚡1
#unrealneural #пытаюсьпонять #вкопилкуэрудита
Optimizers Qualitatively Alter Solutions And We Should Leverage This
Статья объясняет, что глубокие нейронные сети сложно оптимизировать, так как они не всегда находят наилучшее решение с помощью обычных методов, вроде градиентного спуска. Однако большие сети всё равно хорошо работают на практике. Авторы говорят, что методы оптимизации влияют не только на скорость обучения, но и на то, какое решение получится, и предлагают создавать новые методы, чтобы получать нужные результаты.
https://arxiv.org/abs/2507.12224
Optimizers Qualitatively Alter Solutions And We Should Leverage This
Статья объясняет, что глубокие нейронные сети сложно оптимизировать, так как они не всегда находят наилучшее решение с помощью обычных методов, вроде градиентного спуска. Однако большие сети всё равно хорошо работают на практике. Авторы говорят, что методы оптимизации влияют не только на скорость обучения, но и на то, какое решение получится, и предлагают создавать новые методы, чтобы получать нужные результаты.
https://arxiv.org/abs/2507.12224
🤔4❤1👌1
#unrealneural
MathArena: Оценка LLM на соревнованиях по чистой математике
matharena.ai
arxiv.org/abs/2505.23281
MathArena: Оценка LLM на соревнованиях по чистой математике
matharena.ai
arxiv.org/abs/2505.23281
🔥2⚡1👍1
#unrealneural
«Искусственный интеллект развивается — и меняет наше понимание сознания»
Достижения в области искусственного интеллекта заставляют нас переосмыслить, что такое интеллект, и дают нам ключи к раскрытию полного потенциала ИИ.
https://www.noemamag.com/ai-is-evolving-and-changing-our-understanding-of-intelligence
«Искусственный интеллект развивается — и меняет наше понимание сознания»
Достижения в области искусственного интеллекта заставляют нас переосмыслить, что такое интеллект, и дают нам ключи к раскрытию полного потенциала ИИ.
https://www.noemamag.com/ai-is-evolving-and-changing-our-understanding-of-intelligence
🔥4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Можно создавать рабочие процессы для ИИ-агентов простым перетаскиванием, без написания кода.
Совместимо с моделями OpenAI, Anthropic, Google и локальными моделями Ollama.
Полностью с открытым исходным кодом.
https://github.com/simstudioai/sim
Можно создавать рабочие процессы для ИИ-агентов простым перетаскиванием, без написания кода.
Совместимо с моделями OpenAI, Anthropic, Google и локальными моделями Ollama.
Полностью с открытым исходным кодом.
https://github.com/simstudioai/sim
👍5❤2🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Дико интересная статья про пространство смыслов, которое не зависит от конкретного языка.
Самое захватывающее в том, что его нашли и у кожаных в мозгу и у LLM в "средних слоях".
Итак, исследование показывает, что, несмотря на различия в языках (звуки, алфавиты, синтаксис), их смысловые представления в мозге схожи и могут быть смоделированы нейросетевыми языковыми моделями (LLMs). И человеческий мозг, и LLMs создают сходное "пространство концепций", объединяющее разные языки.
Использовались данные fMRI людей, слушавших одну и ту же историю («Маленький принц») на английском, китайском и французском языках.
Применялись воксельные модели кодирования, связывающие эмбеддинги слов из BERT и Whisper с активностью мозга.
Сравнивались одноязычные модели (uBERT) и многоязычная модель (mBERT), а также мультимодальная модель (Whisper).
Результаты
Сходство представлений: Даже одноязычные модели BERT формируют сходные концептуальные пространства, особенно в средних слоях.
Мозговая активность в зонах, отвечающих за понимание, схожа у всех разно-язычных групп людей
Кросс-языковая генерализация: Модели, обученные предсказывать активность мозга для одного языка, могут предсказывать активность для других языков, если история одинакова по смыслу.
Речь и текст: Whisper выявляет общие фонетические и акустические паттерны между разными языками, которые также отражаются в активности мозга.
Итого:
Смысловое восприятие в мозге не зависит от формы языка.
Как мозг, так и LLMs кодируют концепции в высокоразмерном пространстве (область смыслов\концепций?), где смысловые структуры совпадают для разных языков, иначе говоря, нейронные репрезентации смысла, лежащие в основе разных языков, являются общими для носителей разных языков, и что языковые модели, обученные на разных языках, сходятся на этом общем значении
Общие концептуальные представления формируются благодаря взаимодействию людей с окружающим миром, а не только особенностям языка.
Тут интересно поразмышлять, в каком пространстве мы мыслим - ближе к языку или к вот этим вот скрытым смыслам?
https://paperswithcode.com/paper/brains-and-language-models-converge-on-a
@cgevent
Самое захватывающее в том, что его нашли и у кожаных в мозгу и у LLM в "средних слоях".
Итак, исследование показывает, что, несмотря на различия в языках (звуки, алфавиты, синтаксис), их смысловые представления в мозге схожи и могут быть смоделированы нейросетевыми языковыми моделями (LLMs). И человеческий мозг, и LLMs создают сходное "пространство концепций", объединяющее разные языки.
Использовались данные fMRI людей, слушавших одну и ту же историю («Маленький принц») на английском, китайском и французском языках.
Применялись воксельные модели кодирования, связывающие эмбеддинги слов из BERT и Whisper с активностью мозга.
Сравнивались одноязычные модели (uBERT) и многоязычная модель (mBERT), а также мультимодальная модель (Whisper).
Результаты
Сходство представлений: Даже одноязычные модели BERT формируют сходные концептуальные пространства, особенно в средних слоях.
Мозговая активность в зонах, отвечающих за понимание, схожа у всех разно-язычных групп людей
Кросс-языковая генерализация: Модели, обученные предсказывать активность мозга для одного языка, могут предсказывать активность для других языков, если история одинакова по смыслу.
Речь и текст: Whisper выявляет общие фонетические и акустические паттерны между разными языками, которые также отражаются в активности мозга.
Итого:
Смысловое восприятие в мозге не зависит от формы языка.
Как мозг, так и LLMs кодируют концепции в высокоразмерном пространстве (область смыслов\концепций?), где смысловые структуры совпадают для разных языков, иначе говоря, нейронные репрезентации смысла, лежащие в основе разных языков, являются общими для носителей разных языков, и что языковые модели, обученные на разных языках, сходятся на этом общем значении
Общие концептуальные представления формируются благодаря взаимодействию людей с окружающим миром, а не только особенностям языка.
Тут интересно поразмышлять, в каком пространстве мы мыслим - ближе к языку или к вот этим вот скрытым смыслам?
https://paperswithcode.com/paper/brains-and-language-models-converge-on-a
@cgevent
👍4⚡2❤2🤡1
#ЛабораторияИИ #Эксперименты
Продолжаем разработку генераторов архитектурного Массинга. Вот какие формы удается получить с помощью модели Grok 4
Продолжаем разработку генераторов архитектурного Массинга. Вот какие формы удается получить с помощью модели Grok 4
🔥10❤5⚡2
Forwarded from Альянс Цифровых Лидеров в стройке
This media is not supported in your browser
VIEW IN TELEGRAM
Что наша жизнь? Игра Граф😁
В целом: удобно же, если ChatGPT не просто будет хранить нашу историю где-то между своими алгоритмами, но и — показывать нам в таком виде. Как думаете?
В целом: удобно же, если ChatGPT не просто будет хранить нашу историю где-то между своими алгоритмами, но и — показывать нам в таком виде. Как думаете?
🔥5⚡4❤2👍2👎1
AI LAB | Лаборатория ИИ
OmniSVG Еще один чрезвычайно интересный генератор svg геометрии на архитектуре трансформеров. Как он работает? Построен на предварительно обученной визуальной языковой модели Qwen-VL (мультимодальный трансформер, умеющий работать с изображениями и текстом…
OmniSVG появился в свободном доступе
Demo: https://huggingface.co/spaces/OmniSVG/OmniSVG-3B
Code: https://github.com/OmniSVG/OmniSVG
Model: https://huggingface.co/OmniSVG/OmniSVG
Demo: https://huggingface.co/spaces/OmniSVG/OmniSVG-3B
Code: https://github.com/OmniSVG/OmniSVG
Model: https://huggingface.co/OmniSVG/OmniSVG
huggingface.co
OmniSVG 3B - a Hugging Face Space by OmniSVG
This application allows users to generate SVG code by either uploading an image or entering a text description. Users will receive SVG code and a preview image as the result.
🔥3⚡1👍1
Приношу извинение, что не указал автора этого видео во время презентации🥲 Это действительно видео взято с его канала для демонстрации
❤7👍3⚡2
Forwarded from BIM Координатор
This media is not supported in your browser
VIEW IN TELEGRAM
Когда твоё видео показывает крупнейший застройщик страны… и «забывает» тебя упомянуть 😅
🎤 Сегодня наткнулся на интересную презентацию от компании ПИК на мероприятии BIM Просвет, посвящённом «искусственному интеллекту в проектировании и девелопменте» которую посетил сегодня.
На слайде - моё видео с YouTube, где я показываю работу ИИ-ассистента для Revit (MCP), автоматизирующего рутинные задачи проектировщика.
🔗 Вот ссылка: https://youtu.be/Qm_vRncHHGU?si=HCSBJlfBN5gV7XRe
📽 Приятно, что разработка оказалась полезной и попала в презентацию одного из крупнейших девелоперов страны.
Но ребята… зачем вырезать мое лицо?)
Можно было просто упомянуть автора - я бы только порадовался! 😉
В любом случае, приятно видеть, как наши наработки начинают жить своей жизнью и помогают BIM-сообществу двигаться вперёд. Работаем дальше 💪
🎤 Сегодня наткнулся на интересную презентацию от компании ПИК на мероприятии BIM Просвет, посвящённом «искусственному интеллекту в проектировании и девелопменте» которую посетил сегодня.
На слайде - моё видео с YouTube, где я показываю работу ИИ-ассистента для Revit (MCP), автоматизирующего рутинные задачи проектировщика.
🔗 Вот ссылка: https://youtu.be/Qm_vRncHHGU?si=HCSBJlfBN5gV7XRe
📽 Приятно, что разработка оказалась полезной и попала в презентацию одного из крупнейших девелоперов страны.
Но ребята… зачем вырезать мое лицо?)
Можно было просто упомянуть автора - я бы только порадовался! 😉
В любом случае, приятно видеть, как наши наработки начинают жить своей жизнью и помогают BIM-сообществу двигаться вперёд. Работаем дальше 💪
1🔥12❤5😁5🤝3
#unrealneural
OpenGVLab выпустила Mono-InternVL-1.5 — новый мультимодальный ИИ. Он работает быстрее, стоит дешевле и показывает отличные результаты, при этом снижая затраты на обучение и время отклика.
https://huggingface.co/papers/2507.12566
OpenGVLab выпустила Mono-InternVL-1.5 — новый мультимодальный ИИ. Он работает быстрее, стоит дешевле и показывает отличные результаты, при этом снижая затраты на обучение и время отклика.
https://huggingface.co/papers/2507.12566
🔥2⚡1👍1