This media is not supported in your browser
VIEW IN TELEGRAM
#пытаюсьпонять
Замечательное видео с иллюстрацией того, как LLM модели ориентируются в латентном пространстве при определении цвета.
Люди воспринимаем цвета через длину волны, в то время как LLM полагаются на семантические отношения между словами.
Чтобы увидеть это, автор представляет проекцию латентного пространства на 2-мерную плоскость, выбирая разные "смысловые"(если их так корректно называть) размерности.
Что это значит?
При проекции на некоторые оси многомерного пространства, слова, связанные с определенными цветами, ближе друг к другу. Например, слова обозначающие оранжевый цвет и желтый, тоже в некоторых измерениях близки.
Как можно осмыслить некоторые размерности, связанные с цветом:
- ось теплый-холодный
- ось яркий-тусклый
и так далее
Ну важно понимать, что цвет (как и многие другие физически определяемые явления) для LLM - это всего лишь языковая конструкция.
Замечательное видео с иллюстрацией того, как LLM модели ориентируются в латентном пространстве при определении цвета.
Люди воспринимаем цвета через длину волны, в то время как LLM полагаются на семантические отношения между словами.
Чтобы увидеть это, автор представляет проекцию латентного пространства на 2-мерную плоскость, выбирая разные "смысловые"(если их так корректно называть) размерности.
Что это значит?
При проекции на некоторые оси многомерного пространства, слова, связанные с определенными цветами, ближе друг к другу. Например, слова обозначающие оранжевый цвет и желтый, тоже в некоторых измерениях близки.
Как можно осмыслить некоторые размерности, связанные с цветом:
- ось теплый-холодный
- ось яркий-тусклый
и так далее
Ну важно понимать, что цвет (как и многие другие физически определяемые явления) для LLM - это всего лишь языковая конструкция.
🔥7👍4
Forwarded from Data Secrets
Понедельник! Сейчас в ИИ-гонке затишье, но неделя обещает быть насыщенной. Чего ждем:
1. Gemini Ultra и проект Astra с ИИ-очками от Google. На этой неделе у них крупнейшая анонс-конференция в году, Google I/O. В прошлом году именно на этом мероприятии показали Gemini 1.5 Pro с контекстом в 1млн токенов и Gemini 1.5 Flash.
2. o3-pro или GPT-5. Почти наверняка OpenAI что-то припасли чтобы перетянуть на себя внимание от Google. Вчера некоторые пользователи даже заметили, что Альтман твитнул строку «4+1», но сейчас твит удален.
3. Grok-3.5, который Илон Маск обещает уже вторую неделю.
1. Gemini Ultra и проект Astra с ИИ-очками от Google. На этой неделе у них крупнейшая анонс-конференция в году, Google I/O. В прошлом году именно на этом мероприятии показали Gemini 1.5 Pro с контекстом в 1млн токенов и Gemini 1.5 Flash.
2. o3-pro или GPT-5. Почти наверняка OpenAI что-то припасли чтобы перетянуть на себя внимание от Google. Вчера некоторые пользователи даже заметили, что Альтман твитнул строку «4+1», но сейчас твит удален.
3. Grok-3.5, который Илон Маск обещает уже вторую неделю.
⚡4👍3❤2
#unrealneural
CubeDiff
Новый метод создания 3д панорам из текстовых подсказок или изображений на основе диффузии.
https://cubediff.github.io/
CubeDiff
Новый метод создания 3д панорам из текстовых подсказок или изображений на основе диффузии.
https://cubediff.github.io/
⚡3👍3❤2
Forwarded from Нейросеть
Сингапурские прогеры дропнули i10X — коллекция всех лучших нейросетей и LLM в одном месте
Через сервис можно напрямую общаться со моделями уровня 4o, o3, Gemini, Grok, Claude и DeepSeek. Кроме этого сайт кишит ИИ-агентами, заточенными под конкретные задачи: это может быть помощник в написании резюме, которое пройдет все HR-фильтры или партнер по дебатам, через которого можно переспорить кого угодно в сети.
В скором времени i10X внедрит возможность построения собственных агентов, а пока что вы можете бесплатно юзать все вышеперечисленные функции здесь.
Через сервис можно напрямую общаться со моделями уровня 4o, o3, Gemini, Grok, Claude и DeepSeek. Кроме этого сайт кишит ИИ-агентами, заточенными под конкретные задачи: это может быть помощник в написании резюме, которое пройдет все HR-фильтры или партнер по дебатам, через которого можно переспорить кого угодно в сети.
В скором времени i10X внедрит возможность построения собственных агентов, а пока что вы можете бесплатно юзать все вышеперечисленные функции здесь.
⚡5👍4❤2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Микрософт анонсировала MCP for Windows.
Ну то есть теперь можно голосом сказать, Клод, отформатируй все жёсткие диски.
Слово - не воробей...
Шутки шутками, но на очереди MCP для офиса. И вот уже операционка превращается в LMOS, о которой говорил Андрей Карпатый.
@cgevent
Ну то есть теперь можно голосом сказать, Клод, отформатируй все жёсткие диски.
Слово - не воробей...
Шутки шутками, но на очереди MCP для офиса. И вот уже операционка превращается в LMOS, о которой говорил Андрей Карпатый.
@cgevent
⚡4👍4🤯4
#unrealneural
SQLite-Vec
Маленькая, портативная векторная база данных, созданная на SQLite. Подходит для RAG решений.
https://github.com/asg017/sqlite-vec
SQLite-Vec
Маленькая, портативная векторная база данных, созданная на SQLite. Подходит для RAG решений.
https://github.com/asg017/sqlite-vec
⚡6👍2
#unrealneural
Cosmos-Reason1-7B
NVIDIA выпустила новую модель зрительного восприятия для робототехники.
Как я понимаю, помимо зрительного восприятия, появятся инструменты восприятия входных сигналов тактильного восприятия. Не знаю как это реализовано, возможно через зрительное восприятие.
Судя по всему это первая модель для робототехники, которая позволит им "мыслить" 🤯
https://integratormedia.com/2025/05/20/nvidia-open-sources-physical-common-sense-ai-phase-3-of-the-ai-story-starts-now/
Cosmos-Reason1-7B
NVIDIA выпустила новую модель зрительного восприятия для робототехники.
Как я понимаю, помимо зрительного восприятия, появятся инструменты восприятия входных сигналов тактильного восприятия. Не знаю как это реализовано, возможно через зрительное восприятие.
Судя по всему это первая модель для робототехники, которая позволит им "мыслить" 🤯
https://integratormedia.com/2025/05/20/nvidia-open-sources-physical-common-sense-ai-phase-3-of-the-ai-story-starts-now/
🤯5⚡3
Forwarded from ИИ и роботы в стройке
На Hugging Face запустили бесплатный курс по Model Context Protocol (MCP)
Курс подойдёт разработчикам и ML-инженерам, которые хотят создавать приложения на базе больших языковых моделей.
💚 Про что: как работать на архитектуре MCP, с официальными SDK на Python и TypeScript, а также как создавать свои MCP-приложения с помощью Gradio и Hugging Face Spaces.
Для прохождения требуется базовый опыт с Python или TypeScript, понимание API и LLM. В ходе обучения обещают конкурсы и соревнования с другими слушателями курса. А в конце, выполнив все задания, можно получить сертификат HF.
Курс на Hugging Face
Курс подойдёт разработчикам и ML-инженерам, которые хотят создавать приложения на базе больших языковых моделей.
Для прохождения требуется базовый опыт с Python или TypeScript, понимание API и LLM. В ходе обучения обещают конкурсы и соревнования с другими слушателями курса. А в конце, выполнив все задания, можно получить сертификат HF.
Курс на Hugging Face
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7⚡3
Forwarded from gonzo-обзоры ML статей
Gemini Ultra пока не дождались, зато дождались
* Супербыструю текстовую диффузию в Gemini Diffusion (5x faster than 2.0 Flash Lite)
* Улучшенную Gemini 2.5 Pro Deep Think
* Будущее развитие в направлении World models и Universal AI assistant
* Супербыструю текстовую диффузию в Gemini Diffusion (5x faster than 2.0 Flash Lite)
* Улучшенную Gemini 2.5 Pro Deep Think
* Будущее развитие в направлении World models и Universal AI assistant
👍4⚡2
Forwarded from эйай ньюз
На Google I/O показали Diffusion версию Gemini. Она, при таком же уровне интеллекта, в пять раз быстрее Gemini Gemini 2.0 Flash Lite, самой быстрой модели гугла. Пока доступно только ограниченное превью для избранных, которым обещают докинуть более умную модель чуть позже.
Очень интересно наблюдать как авторегрессию юзают в генерации изображений и видео, а дифузию в генерации текста. Архитектуры становятся всё ближе и ближе к друг другу.
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡3👍3🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
#вкопилкуэрудита
Теорема Нётер и принцип эквивалентности
Теорема Нётер связывает симметрии в природе с законами сохранения. Если физические законы остаются неизменными при некоторых других изменениях, то есть величины, которые сохраняются:
- Симметрия во времени (законы одинаковы сегодня и завтра) даёт сохранение энергии
- Симметрия в пространстве (законы одинаковы в любой точке) приводит к сохранению импульса
- Симметрия вращения (законы не меняются при поворотах) отвечает за сохранение углового момента
Принцип эквивалентности Эйнштейна говорит, что гравитация — это не просто сила, а искривление пространства-времени. Ускорение (например, в лифте) и гравитация ощущаются одинаково, потому что пространство и время связаны, и гравитация влияет на их геометрию, изменяя движение объектов и течение времени.
Теорема Нётер и принцип эквивалентности
Теорема Нётер связывает симметрии в природе с законами сохранения. Если физические законы остаются неизменными при некоторых других изменениях, то есть величины, которые сохраняются:
- Симметрия во времени (законы одинаковы сегодня и завтра) даёт сохранение энергии
- Симметрия в пространстве (законы одинаковы в любой точке) приводит к сохранению импульса
- Симметрия вращения (законы не меняются при поворотах) отвечает за сохранение углового момента
Принцип эквивалентности Эйнштейна говорит, что гравитация — это не просто сила, а искривление пространства-времени. Ускорение (например, в лифте) и гравитация ощущаются одинаково, потому что пространство и время связаны, и гравитация влияет на их геометрию, изменяя движение объектов и течение времени.
⚡4🤔4❤3👍3
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Large Language Diffusion Models
Исследование, которое ставит под сомнение доминирующую роль авторегрессивных моделей в больших языковых моделях, показывая эффективность модели LLaDa (Latent Language Diffusion Architecture).
Пришло время изучать статью 🧐
https://arxiv.org/pdf/2502.09992
Large Language Diffusion Models
Исследование, которое ставит под сомнение доминирующую роль авторегрессивных моделей в больших языковых моделях, показывая эффективность модели LLaDa (Latent Language Diffusion Architecture).
Пришло время изучать статью 🧐
https://arxiv.org/pdf/2502.09992
👍6⚡3🤔2
#unrealneural
Text2CadQuery
Это расширение подходов генерации CAD данных. Преобразование происходит через обработку естественного языка в 3 д модели с использованием CadQuery.
CadQuery — это библиотека для параметрического 3D-моделирования, которая позволяет создавать 3D-объекты с помощью скриптов, а не через графический интерфейс (как в Blender, Grasshopper для Rhino и т.д.).
https://arxiv.org/abs/2505.06507
Text2CadQuery
Это расширение подходов генерации CAD данных. Преобразование происходит через обработку естественного языка в 3 д модели с использованием CadQuery.
CadQuery — это библиотека для параметрического 3D-моделирования, которая позволяет создавать 3D-объекты с помощью скриптов, а не через графический интерфейс (как в Blender, Grasshopper для Rhino и т.д.).
https://arxiv.org/abs/2505.06507
👍6⚡4
Forwarded from NN
Создаем дизайн любого приложения за минуту: Google запустили ИИ-сервис Stitch для разработки интерфейсов.
Нейронка создаёт готовые файлы HTML и CSS — их можно экспортировать в Figma или любую IDE для доработки кода. Вместе с промтом можно загрузить свой набросок от руки.
Пробуем здесь.
Нейронка создаёт готовые файлы HTML и CSS — их можно экспортировать в Figma или любую IDE для доработки кода. Вместе с промтом можно загрузить свой набросок от руки.
Пробуем здесь.
👍7❤4⚡3
Forwarded from Data Secrets
А еще сегодня, возможно, будет что-то новенькое от Anthropic
В 18:30 МСК они проведут стрим под названием «Code with Claude». По некоторым неподтвержденным утечкам, на нем покажут как раз те самые обновленные Opus и Sonnet с глубоким агентским ризонингом.
Смотрим здесь
В 18:30 МСК они проведут стрим под названием «Code with Claude». По некоторым неподтвержденным утечкам, на нем покажут как раз те самые обновленные Opus и Sonnet с глубоким агентским ризонингом.
Смотрим здесь
🤔4👍3⚡2👎1🤯1
Forwarded from Machinelearning
На мероприятии Code /w Claude CEO Anthropic презентовал Claude 4 Opus и Claude Sonnet 4.
Обе модели поддерживают расширенное мышление: чередуют анализ и использование инструментов веб-поиска, а также выполняют задачи параллельно.
Для разработчиков появилась интеграция с VS Code, JetBrains и GitHub Actions — правки от Claude теперь отображаются прямо в редакторе. В бета-режиме можно подключать SDK для создания собственных агентов.
По словам партнеров: GitHub и Replit, Opus 4 понимает сложные кодбазы, а Sonnet 4 идеален для повседневных задач. Например, в GitHub Copilot его уже тестируют как основу для нового агента.
В тарифные планы Pro, Max, Team и Enterprise Claude включены обе модели и расширенное мышление, а Sonnet 4 также доступен для бесплатных пользователей.
Обе модели доступны в Anthropic API, Amazon Bedrock и Google Cloud's Vertex AI. Ценообразование остается неизменным по сравнению с предыдущими моделями Opus и Sonnet: Opus 4 - $15/$75 за миллион токенов (ввод/вывод), Sonnet 4 - $3/$15.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1⚡5👍3❤2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
MMaDA - Multimodal Large Diffusion Language Models
Первая диффузионная технология, которая объединяет текстовое обоснование, мультимодальное понимание и генерацию изображений с помощью смешанного Long-CoT и унифицированного RL — UniGRPO
https://arxiv.org/abs/2505.15809
MMaDA - Multimodal Large Diffusion Language Models
Первая диффузионная технология, которая объединяет текстовое обоснование, мультимодальное понимание и генерацию изображений с помощью смешанного Long-CoT и унифицированного RL — UniGRPO
https://arxiv.org/abs/2505.15809
⚡4❤2🤯2