AI LAB | Лаборатория ИИ
1.67K subscribers
583 photos
423 videos
23 files
863 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca

Вопросы сотрудничества и соучастия
@j_fede
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
#пытаюсьпонять
Замечательное видео с иллюстрацией того, как LLM модели ориентируются в латентном пространстве при определении цвета.

Люди воспринимаем цвета через длину волны, в то время как LLM полагаются на семантические отношения между словами.

Чтобы увидеть это, автор представляет проекцию латентного пространства на 2-мерную плоскость, выбирая разные "смысловые"(если их так корректно называть) размерности.

Что это значит?
При проекции на некоторые оси многомерного пространства, слова, связанные с определенными цветами, ближе друг к другу. Например, слова обозначающие оранжевый цвет и желтый, тоже в некоторых измерениях близки.

Как можно осмыслить некоторые размерности, связанные с цветом:
- ось теплый-холодный
- ось яркий-тусклый
и так далее

Ну важно понимать, что цвет (как и многие другие физически определяемые явления) для LLM - это всего лишь языковая конструкция.
🔥7👍4
Forwarded from Data Secrets
Понедельник! Сейчас в ИИ-гонке затишье, но неделя обещает быть насыщенной. Чего ждем:

1. Gemini Ultra и проект Astra с ИИ-очками от Google. На этой неделе у них крупнейшая анонс-конференция в году, Google I/O. В прошлом году именно на этом мероприятии показали Gemini 1.5 Pro с контекстом в 1млн токенов и Gemini 1.5 Flash.

2. o3-pro или GPT-5. Почти наверняка OpenAI что-то припасли чтобы перетянуть на себя внимание от Google. Вчера некоторые пользователи даже заметили, что Альтман твитнул строку «4+1», но сейчас твит удален.

3. Grok-3.5, который Илон Маск обещает уже вторую неделю.
4👍32
#unrealneural
CubeDiff

Новый метод создания 3д панорам из текстовых подсказок или изображений на основе диффузии.
https://cubediff.github.io/
3👍32
Forwarded from Нейросеть
Сингапурские прогеры дропнули i10X — коллекция всех лучших нейросетей и LLM в одном месте

Через сервис можно напрямую общаться со моделями уровня 4o, o3, Gemini, Grok, Claude и DeepSeek. Кроме этого сайт кишит ИИ-агентами, заточенными под конкретные задачи: это может быть помощник в написании резюме, которое пройдет все HR-фильтры или партнер по дебатам, через которого можно переспорить кого угодно в сети.

В скором времени i10X внедрит возможность построения собственных агентов, а пока что вы можете бесплатно юзать все вышеперечисленные функции здесь.
5👍42
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Микрософт анонсировала MCP for Windows.

Ну то есть теперь можно голосом сказать, Клод, отформатируй все жёсткие диски.

Слово - не воробей...

Шутки шутками, но на очереди MCP для офиса. И вот уже операционка превращается в LMOS, о которой говорил Андрей Карпатый.

@cgevent
4👍4🤯4
#unrealneural
SQLite-Vec

Маленькая, портативная векторная база данных, созданная на SQLite. Подходит для RAG решений.

https://github.com/asg017/sqlite-vec
6👍2
#unrealneural
Cosmos-Reason1-7B

NVIDIA выпустила новую модель зрительного восприятия для робототехники.
Как я понимаю, помимо зрительного восприятия, появятся инструменты восприятия входных сигналов тактильного восприятия. Не знаю как это реализовано, возможно через зрительное восприятие.

Судя по всему это первая модель для робототехники, которая позволит им "мыслить" 🤯

https://integratormedia.com/2025/05/20/nvidia-open-sources-physical-common-sense-ai-phase-3-of-the-ai-story-starts-now/
🤯53
На Hugging Face запустили бесплатный курс по Model Context Protocol (MCP)

Курс подойдёт разработчикам и ML-инженерам, которые хотят создавать приложения на базе больших языковых моделей.

💚Про что: как работать на архитектуре MCP, с официальными SDK на Python и TypeScript, а также как создавать свои MCP-приложения с помощью Gradio и Hugging Face Spaces.

Для прохождения требуется базовый опыт с Python или TypeScript, понимание API и LLM. В ходе обучения обещают конкурсы и соревнования с другими слушателями курса. А в конце, выполнив все задания, можно получить сертификат HF.

Курс на Hugging Face
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73
Gemini Ultra пока не дождались, зато дождались
* Супербыструю текстовую диффузию в Gemini Diffusion (5x faster than 2.0 Flash Lite)
* Улучшенную Gemini 2.5 Pro Deep Think
* Будущее развитие в направлении World models и Universal AI assistant
👍42
Forwarded from эйай ньюз
😮 Google тестит дифуззионки для текста!

На Google I/O показали Diffusion версию Gemini. Она, при таком же уровне интеллекта, в пять раз быстрее Gemini Gemini 2.0 Flash Lite, самой быстрой модели гугла. Пока доступно только ограниченное превью для избранных, которым обещают докинуть более умную модель чуть позже.

Очень интересно наблюдать как авторегрессию юзают в генерации изображений и видео, а дифузию в генерации текста. Архитектуры становятся всё ближе и ближе к друг другу.

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Gemini diffusion

1000+ слов в секунду 🤯
🤯82
This media is not supported in your browser
VIEW IN TELEGRAM
#вкопилкуэрудита
Теорема Нётер и принцип эквивалентности

Теорема Нётер связывает симметрии в природе с законами сохранения. Если физические законы остаются неизменными при некоторых других изменениях, то есть величины, которые сохраняются:
- Симметрия во времени (законы одинаковы сегодня и завтра) даёт сохранение энергии
- Симметрия в пространстве (законы одинаковы в любой точке) приводит к сохранению импульса
- Симметрия вращения (законы не меняются при поворотах) отвечает за сохранение углового момента

Принцип эквивалентности Эйнштейна говорит, что гравитация — это не просто сила, а искривление пространства-времени. Ускорение (например, в лифте) и гравитация ощущаются одинаково, потому что пространство и время связаны, и гравитация влияет на их геометрию, изменяя движение объектов и течение времени.
4🤔43👍3
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Large Language Diffusion Models

Исследование, которое ставит под сомнение доминирующую роль авторегрессивных моделей в больших языковых моделях, показывая эффективность модели LLaDa (Latent Language Diffusion Architecture).

Пришло время изучать статью 🧐
https://arxiv.org/pdf/2502.09992
👍63🤔2
#unrealneural
Text2CadQuery

Это расширение подходов генерации CAD данных. Преобразование происходит через обработку естественного языка в 3 д модели с использованием CadQuery.

CadQuery — это библиотека для параметрического 3D-моделирования, которая позволяет создавать 3D-объекты с помощью скриптов, а не через графический интерфейс (как в Blender, Grasshopper для Rhino и т.д.).
https://arxiv.org/abs/2505.06507
👍64
Forwarded from NN
Создаем дизайн любого приложения за минуту: Google запустили ИИ-сервис Stitch для разработки интерфейсов.

Нейронка создаёт готовые файлы HTML и CSS — их можно экспортировать в Figma или любую IDE для доработки кода. Вместе с промтом можно загрузить свой набросок от руки.

Пробуем здесь.
👍743
Forwarded from Data Secrets
А еще сегодня, возможно, будет что-то новенькое от Anthropic

В 18:30 МСК они проведут стрим под названием «Code with Claude». По некоторым неподтвержденным утечкам, на нем покажут как раз те самые обновленные Opus и Sonnet с глубоким агентским ризонингом.

Смотрим здесь
🤔4👍32👎1🤯1
Forwarded from Machinelearning
⚡️ Anthropic представила Claude 4 Opus и Sonnet 4

На мероприятии Code /w Claude CEO Anthropic презентовал Claude 4 Opus и Claude Sonnet 4.

✔️ Opus 4 Anthropic называет лучшей моделью для кодинга, она справляется с многошаговыми задачами, работая часами без потери эффективности — например, сохраняет контекст игры в Pokémon, записывая ключевые данные в локальные файлы.

✔️Sonnet 4, доступная даже бесплатным пользователям, стал серьезным апгрейдом предыдущей версии: точнее выполняет инструкции и сократил ошибки в навигации по коду с 20% до нуля.

Обе модели поддерживают расширенное мышление: чередуют анализ и использование инструментов веб-поиска, а также выполняют задачи параллельно.

Для разработчиков появилась интеграция с VS Code, JetBrains и GitHub Actions — правки от Claude теперь отображаются прямо в редакторе. В бета-режиме можно подключать SDK для создания собственных агентов.

По словам партнеров: GitHub и Replit, Opus 4 понимает сложные кодбазы, а Sonnet 4 идеален для повседневных задач. Например, в GitHub Copilot его уже тестируют как основу для нового агента.

В тарифные планы Pro, Max, Team и Enterprise Claude включены обе модели и расширенное мышление, а Sonnet 4 также доступен для бесплатных пользователей.

Обе модели доступны в Anthropic API, Amazon Bedrock и Google Cloud's Vertex AI. Ценообразование остается неизменным по сравнению с предыдущими моделями Opus и Sonnet: Opus 4 - $15/$75 за миллион токенов (ввод/вывод), Sonnet 4 - $3/$15.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍32🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
MMaDA - Multimodal Large Diffusion Language Models

Первая диффузионная технология, которая объединяет текстовое обоснование, мультимодальное понимание и генерацию изображений с помощью смешанного Long-CoT и унифицированного RL — UniGRPO

https://arxiv.org/abs/2505.15809
42🤯2