🎨 X-Omni от Tencent: прорыв в text-to-image генерации. Новая модель X-Omni демонстрирует, как reinforcement learning может вывести авторегрессионные text-to-image системы на новый уровень. В основе — гибридная архитектура: SigLIP-VQ токенизирует изображения, Qwen2.5-7B обрабатывает мультимодальные данные, а диффузионный декодер FLUX.1-dev завершает рендеринг.
Интерес вызывает комплексная reward-система, оценивающая результат по эстетике, семантике и читаемости текста. На тестах модель превзошла GPT-4o в рендеринге надписей, особенно для китайского языка. При этом X-Omni стабильно работает без CFG, что выделяет её среди аналогов.
🔗 Ссылка - *клик*
Интерес вызывает комплексная reward-система, оценивающая результат по эстетике, семантике и читаемости текста. На тестах модель превзошла GPT-4o в рендеринге надписей, особенно для китайского языка. При этом X-Omni стабильно работает без CFG, что выделяет её среди аналогов.
🔗 Ссылка - *клик*
👍14🔥7❤4🥱1
🍏 Apple выпустила мощный open-source инструмент для визуализации эмбеддингов — Embedding Atlas.
Идеально подходит для работы с большими наборами текста и метаданных.
Что он умеет:
✅ Мгновенный поиск
✅ Отрисовка миллионов точек в реальном времени
✅ Автоматическая кластеризация с подписями
✅ UMAP-проекции
✅ Фасетный поиск по метаданным (например, "страна vs. цена")
✅ Подсказки и ховеры по точкам
✅ Интерактивные фильтры, гистограммы, оверлеи кластеров
✅ Связанные scatterplot + таблицы
Под капотом:
• WebGPU (с WebGL-фолбэком) для быстрой отрисовки
• Поиск по смысловому сходству в эмбеддингах
• Kernel density contours для поиска кластеров и выбросов
Пример Apple: визуализация ~200K отзывов о вине с метаданными (цена, страна, заметки о вкусе) — всё летает прямо в браузере, без допкода.
Загружаешь
Это как Tableau для LLM-разработчиков: оптимизировано под текст, чат и современные датасеты.
Отлично подойдёт для RAG-оценок, тюнинга поиска, объяснения кластеров и аудита данных.
📌 Github
Идеально подходит для работы с большими наборами текста и метаданных.
Что он умеет:
✅ Мгновенный поиск
✅ Отрисовка миллионов точек в реальном времени
✅ Автоматическая кластеризация с подписями
✅ UMAP-проекции
✅ Фасетный поиск по метаданным (например, "страна vs. цена")
✅ Подсказки и ховеры по точкам
✅ Интерактивные фильтры, гистограммы, оверлеи кластеров
✅ Связанные scatterplot + таблицы
Под капотом:
• WebGPU (с WebGL-фолбэком) для быстрой отрисовки
• Поиск по смысловому сходству в эмбеддингах
• Kernel density contours для поиска кластеров и выбросов
Пример Apple: визуализация ~200K отзывов о вине с метаданными (цена, страна, заметки о вкусе) — всё летает прямо в браузере, без допкода.
Загружаешь
.jsonl
или .csv
с текстом, векторами и метаданными — инструмент сам делает кластеризацию, разметку и строит UI.Это как Tableau для LLM-разработчиков: оптимизировано под текст, чат и современные датасеты.
Отлично подойдёт для RAG-оценок, тюнинга поиска, объяснения кластеров и аудита данных.
📌 Github
🔥13❤5🥰3