В сети появился системный промпт Claude Fable 5.
Пробежимся по главному:
Репозиторий CL4R1T4S от Pliny the Liberator. Сейчас у него 41 тысяча звёзд на GitHub. Именно через этот репозиторий ранее публиковались системные промпты ChatGPT, Gemini, Grok, Cursor, Lovable, Replit и Perplexity.
Что делать с ним дальше, решайте сами. Кто-то уже пересобирает свой Fable 5🙉
Пробежимся по главному:
Fable 5 и Mythos 5 - это одна и таже модель. У Fable просто включены дополнительные фильтры безопасности. У Mythos их нет, но доступ к нему ограничен. По сути, это одна модель с разными ограничителями.
Knowledge cutoff указан как конец января 2026 года. Многие считали, что знания модели более свежие.
Claude пярмо инструктируют избегать маркированных списков и буллетов, если пользователь не просит их явно. Тот самый необычный стиль изложения оказался не особенностью модели, а инструкцией в системном промпте.
Ограничения по авторскому праву прописаны очень жёстко. Цитата длиной более 15 слов из любого источника помечается как серьёзное нарушение. Допускается только одна цитата на источник. После этого источник считается закрытым для Claude в рамках текущего диалога.
Внутри обнаружен новый API для постоянного хранения данных. Artifacts теперь могут сохранять и извлекать пользовательские данные между сессиями через хранилище вида «ключ-значение». Большинство пользователей даже не знает о существовании этой возможности.
Коннекторы MCP встроены прямо в системный промпт. Claude может находить и предлагать сторонние интеграции прямо во время диалога.
В промпте есть отдельные инструкции для Claude Cowork, Claude в Chrome, Claude в Excel и Claude в PowerPoint. Это уже не просто интеграции, а инструменты, с которыми Claude умеет работать.
Этот системный промпт относится только к юзер версии на Claude.ai. Пользователи API его не получают. У Claude Code используется совершенно другой набор внутренних инструкций.
Репозиторий CL4R1T4S от Pliny the Liberator. Сейчас у него 41 тысяча звёзд на GitHub. Именно через этот репозиторий ранее публиковались системные промпты ChatGPT, Gemini, Grok, Cursor, Lovable, Replit и Perplexity.
Что делать с ним дальше, решайте сами. Кто-то уже пересобирает свой Fable 5
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Автоматизация кода уже есть. Теперь автоматизируем и ту часть, где нужно хоть немного заботиться о себе. 💀
Сделали плагин для Claude Code, который отказывается работать, пока ты не сделаешь отжимания или приседания.
Называется Workout Gate, и это настолько же безумно, насколько звучит. Когда срабатывает хук, он блокирует твой промпт, включает веб-камеру и заставляет тебя заниматься, прежде чем разрешить продолжить кодить.
> считает повторения через веб-камеру в реальном времени с помощью MediaPipe — схалтурить не получится
> разблокирует промпт только после того, как ты действительно выполнишь нужное количество повторений
> если сдался на полпути, оставшиеся повторения сохраняются как «долг» на следующую сессию
> есть режимы Chill, Demo и Hardcore, а также триггеры по промптам, времени или случайным событиям
> ведёт статистику, серии тренировок и личные рекорды прямо в статусной строке Claude Code
исходники
Сделали плагин для Claude Code, который отказывается работать, пока ты не сделаешь отжимания или приседания.
Называется Workout Gate, и это настолько же безумно, насколько звучит. Когда срабатывает хук, он блокирует твой промпт, включает веб-камеру и заставляет тебя заниматься, прежде чем разрешить продолжить кодить.
> считает повторения через веб-камеру в реальном времени с помощью MediaPipe — схалтурить не получится
> разблокирует промпт только после того, как ты действительно выполнишь нужное количество повторений
> если сдался на полпути, оставшиеся повторения сохраняются как «долг» на следующую сессию
> есть режимы Chill, Demo и Hardcore, а также триггеры по промптам, времени или случайным событиям
> ведёт статистику, серии тренировок и личные рекорды прямо в статусной строке Claude Code
исходники
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Forwarded from IT Portal
SpaceX официально купили Cursor за $60 млрд. А Cursor тем временем запускает свой "GitHub эпохи ИИ-агентов" – Cursor Origin.
Это будет платформа для хранения и управления кодом, но изначально спроектированная не только под людей, а под армии ИИ-агентов, которые постоянно клонируют репозитории, читают код и пушат изменения.
Подробностей пока мало: массовый запуск обещают осенью. Cursor говорит, что Origin должен решить главные боли агентной разработки – координацию, проверку и безопасный мерж AI-generated кода в большом масштабе.
☕️
@IT_Portal
Это будет платформа для хранения и управления кодом, но изначально спроектированная не только под людей, а под армии ИИ-агентов, которые постоянно клонируют репозитории, читают код и пушат изменения.
Подробностей пока мало: массовый запуск обещают осенью. Cursor говорит, что Origin должен решить главные боли агентной разработки – координацию, проверку и безопасный мерж AI-generated кода в большом масштабе.
@IT_Portal
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Вайб-кодинг
Кто-то скрестил ChatGPT и Codex через MCP. GPT-5.5 Pro сейчас один из лучших вариантов для ресерча, планирования и декомпозиции задач, но внутри Codex его нет. У самого Codex с исполнением всё отлично, а вот в плане планирования он пока заметно слабее. …
This media is not supported in your browser
VIEW IN TELEGRAM
Ну что, вот и ссылка на неофициальный «промокод на 2x лимиты Codex». 😎
Знакомьтесь: DevSpace - MCP-коннектор, который превращает ChatGPT в Codex.
После установки пробросьте MCP-сервер через интернет и пользуйтесь двойными лимитами.
Можно использовать GPT-5.5 Pro, xHigh или High для планирования и декомпозиции задач, а затем передавать выполнение в локальный экземпляр Codex, pi, opencode, Cursor или Claude Code.
Либо использовать это просто для ревью кода, написанного другими локальными ИИ-агентами для программирования.
Пожалуйста, используйте это умеренно и только когда действительно упираетесь в лимиты. Не злоупотребляйте. В конце концов, у OpenAI есть кнопка, которая может это остановить🙂
исходники
Знакомьтесь: DevSpace - MCP-коннектор, который превращает ChatGPT в Codex.
npm install -g @waishnav/devspace
После установки пробросьте MCP-сервер через интернет и пользуйтесь двойными лимитами.
Можно использовать GPT-5.5 Pro, xHigh или High для планирования и декомпозиции задач, а затем передавать выполнение в локальный экземпляр Codex, pi, opencode, Cursor или Claude Code.
Либо использовать это просто для ревью кода, написанного другими локальными ИИ-агентами для программирования.
Пожалуйста, используйте это умеренно и только когда действительно упираетесь в лимиты. Не злоупотребляйте. В конце концов, у OpenAI есть кнопка, которая может это остановить
исходники
Please open Telegram to view this post
VIEW IN TELEGRAM
Claude Design получил обновление:
• Теперь можно подтянуть дизайн-систему прямо из репозитория, дизайн-файлов или кодовой базы. Claude использует реальные компоненты проекта и дополнительно проверяет результат на соответствие дизайн-системе перед выдачей.
• Обновили редактор. Новые инструменты управления макетом позволяют перетаскивать, изменять размер и выравнивать элементы прямо на холсте.
• Claude Design и Claude Code теперь работают в обе стороны. Можно передать макет в разработку или начать с кода и синхронизировать дизайн-проект прямо из терминала.
• Добавили экспорт в PDF и PowerPoint, а также интеграции с дополнительными инструментами.
Claude Design доступен в бета-версии на всех платных тарифах для веба и десктопа.🏋️♂️
• Теперь можно подтянуть дизайн-систему прямо из репозитория, дизайн-файлов или кодовой базы. Claude использует реальные компоненты проекта и дополнительно проверяет результат на соответствие дизайн-системе перед выдачей.
• Обновили редактор. Новые инструменты управления макетом позволяют перетаскивать, изменять размер и выравнивать элементы прямо на холсте.
• Claude Design и Claude Code теперь работают в обе стороны. Можно передать макет в разработку или начать с кода и синхронизировать дизайн-проект прямо из терминала.
• Добавили экспорт в PDF и PowerPoint, а также интеграции с дополнительными инструментами.
Claude Design доступен в бета-версии на всех платных тарифах для веба и десктопа.
Please open Telegram to view this post
VIEW IN TELEGRAM
Вышла GLM 5.2 🫤
Главная особенность релиза - контекстное окно размером до 1 миллиона токенов, для чего пришлось внести изменения в архитектуру.
Модель уже успела занять 10-е место в Agent Arena и стала лучшей открытой моделью в рейтинге. В Code Arena: Frontend она также лидирует среди open-weight моделей и показывает сильные результаты в задачах по React, HTML и генерации интерфейсов.
Один из пользователей попросил GLM 5.2 (слева) и Opus 4.8 (справа) сделать лендинг. По результату даже сложно понять, где какая модель.
При этом запуск GLM обошёлся в $0.06, а Opus — в $0.49. Более чем в 6 раз дешевле, быстрее и с меньшим расходом токенов.
Цена осталась прежней: $1.4/$4.4 за миллион токенов. И да, лицензия MIT тоже на месте.
Веса: https://huggingface.co/zai-org/GLM-5.2
Главная особенность релиза - контекстное окно размером до 1 миллиона токенов, для чего пришлось внести изменения в архитектуру.
Модель уже успела занять 10-е место в Agent Arena и стала лучшей открытой моделью в рейтинге. В Code Arena: Frontend она также лидирует среди open-weight моделей и показывает сильные результаты в задачах по React, HTML и генерации интерфейсов.
Один из пользователей попросил GLM 5.2 (слева) и Opus 4.8 (справа) сделать лендинг. По результату даже сложно понять, где какая модель.
При этом запуск GLM обошёлся в $0.06, а Opus — в $0.49. Более чем в 6 раз дешевле, быстрее и с меньшим расходом токенов.
Цена осталась прежней: $1.4/$4.4 за миллион токенов. И да, лицензия MIT тоже на месте.
Веса: https://huggingface.co/zai-org/GLM-5.2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI убрала один из самых бесячих этапов разработки под iOS. Больше никакого цикла copy-paste → build → screenshot. Теперь агент видит результат своей работы сразу после изменений.
Новый плагин Codex Build iOS Apps умеет:
→ запускать приложение прямо внутри Codex
→ открывать SwiftUI Preview
→ применять изменения через hot reload
Без переключений между IDE, симулятором и чатиком.
Новый плагин Codex Build iOS Apps умеет:
→ запускать приложение прямо внутри Codex
→ открывать SwiftUI Preview
→ применять изменения через hot reload
Без переключений между IDE, симулятором и чатиком.
4
Media is too big
VIEW IN TELEGRAM
В Claude Code появились Artifacts.
Теперь рабочую сессию можно превратить в интерактивную страницу для команды: дашборд проекта, обзор PR или наглядное представление того, что сейчас разрабатывается. Страница публикуется по приватной ссылке и автоматически обновляется по мере продолжения работы сессии.
Функция уже доступна в бета-версии на тарифах Team и Enterprise.🏁
Теперь рабочую сессию можно превратить в интерактивную страницу для команды: дашборд проекта, обзор PR или наглядное представление того, что сейчас разрабатывается. Страница публикуется по приватной ссылке и автоматически обновляется по мере продолжения работы сессии.
Функция уже доступна в бета-версии на тарифах Team и Enterprise.
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Один полезный приём перед написанием кода.
Не просите агента сразу что-то реализовывать. Сначала проверьте, как он понял задачу.
Вставьте промпт:
Этот подход особенно полезен, когда требования сформулированы не до конца, контекста много или вы сами ещё не до конца продумали решение.
Сначала пусть модель перескажет задачу своими словами, покажет спорные места и разложит работу по шагам. И только потом приступает к реализации. Обычно это даёт гораздо более предсказуемый результат.
По сути, вы просто переносите ревью на более ранний этап😶
Не просите агента сразу что-то реализовывать. Сначала проверьте, как он понял задачу.
Вставьте промпт:
Пока не изменяй код. Проверь, насколько полно ты понимаешь задачу:
Какую реальную проблему я пытаюсь решить?
Какие требования уже понятны?
Где могут быть неоднозначности?
Что ты, скорее всего, можешь неправильно понять, если сразу начнёшь писать код?
После этого предложи план выполнения.
Этот подход особенно полезен, когда требования сформулированы не до конца, контекста много или вы сами ещё не до конца продумали решение.
Сначала пусть модель перескажет задачу своими словами, покажет спорные места и разложит работу по шагам. И только потом приступает к реализации. Обычно это даёт гораздо более предсказуемый результат.
По сути, вы просто переносите ревью на более ранний этап
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Media is too big
VIEW IN TELEGRAM
Новая фича в Codex: Record & Replay
Она позволяет продемонстрировать Codex повторяющийся процесс, например один раз показываешь Codex, как выполняешь задачу, а он сохраняет этот процесс и превращает его в переиспользуемый скилл.
Например, каждый день скачиваешь счета с одного и того же сайта. Один раз проходишь весь процесс вручную — дальше Codex может повторять его сам.
Или постоянно выгружаешь отчёт из админки, переименовываешь файл и складываешь его в нужную папку. Показываешь последовательность действий один раз, после чего её можно запускать снова без ручной работы.
Смысл в том, что теперь не обязательно каждый раз подробно объяснять задачу через промпты. Можно просто показать процесс, а затем превратить его в автоматизацию.🙉
https://developers.openai.com/codex/changelog#codex-2026-06-18-app
Она позволяет продемонстрировать Codex повторяющийся процесс, например один раз показываешь Codex, как выполняешь задачу, а он сохраняет этот процесс и превращает его в переиспользуемый скилл.
Например, каждый день скачиваешь счета с одного и того же сайта. Один раз проходишь весь процесс вручную — дальше Codex может повторять его сам.
Или постоянно выгружаешь отчёт из админки, переименовываешь файл и складываешь его в нужную папку. Показываешь последовательность действий один раз, после чего её можно запускать снова без ручной работы.
Смысл в том, что теперь не обязательно каждый раз подробно объяснять задачу через промпты. Можно просто показать процесс, а затем превратить его в автоматизацию.
https://developers.openai.com/codex/changelog#codex-2026-06-18-app
Please open Telegram to view this post
VIEW IN TELEGRAM
Находка: лёгкий локальный векторный поиск, с которым можно быстро собрать собственную базу знаний.
Опенсорс проект zvec от Alibaba уже набрал 10,3 тыс. звёзд на GitHub и активно используется внутри Alibaba в крупных продакшен-сценариях.
Обычно для векторного поиска приходится поднимать отдельный сервис: Pinecone, Weaviate, Qdrant или что-то ещё. Плюсом идут - настройка, инфраструктура и деплой. Для небольших проектов это часто оказывается слишком хардкорно
С zvec всё проще. Он встраивает всю векторную базу данных прямо в ваш процесс - примерно так же, как SQLite работает с реляционными базами данных. Установили через pip, создали коллекцию несколькими строками кода, загрузили данные - и можно выполнять поиск по сходству. Никаких серверов, конфигурационных файлов и доп.инфраструктуры, всё хранится в одном локальном файле.
zvec умеет искать среди сотен миллионов векторов за миллисекунды и поддерживает гибридный поиск: векторный + полнотекстовый. Работает на ноутбуках, серверах и даже на edge-устройствах.
Обновление v0.5.0 от 12 июня заметно расширило возможности проекта:
↳ Нативный полнотекстовый поиск без внешних поисковых движков
↳ Гибридный поиск, объединяющий векторы, ключевые слова и фильтры в одном запросе
↳ Новый дисковый индекс, существенно снижающий потребление памяти на больших объёмах данных
↳ Zvec Studio — визуальный инструмент для просмотра данных и отладки без написания кода
100% опенсорс😁
Опенсорс проект zvec от Alibaba уже набрал 10,3 тыс. звёзд на GitHub и активно используется внутри Alibaba в крупных продакшен-сценариях.
Обычно для векторного поиска приходится поднимать отдельный сервис: Pinecone, Weaviate, Qdrant или что-то ещё. Плюсом идут - настройка, инфраструктура и деплой. Для небольших проектов это часто оказывается слишком хардкорно
С zvec всё проще. Он встраивает всю векторную базу данных прямо в ваш процесс - примерно так же, как SQLite работает с реляционными базами данных. Установили через pip, создали коллекцию несколькими строками кода, загрузили данные - и можно выполнять поиск по сходству. Никаких серверов, конфигурационных файлов и доп.инфраструктуры, всё хранится в одном локальном файле.
zvec умеет искать среди сотен миллионов векторов за миллисекунды и поддерживает гибридный поиск: векторный + полнотекстовый. Работает на ноутбуках, серверах и даже на edge-устройствах.
Обновление v0.5.0 от 12 июня заметно расширило возможности проекта:
↳ Нативный полнотекстовый поиск без внешних поисковых движков
↳ Гибридный поиск, объединяющий векторы, ключевые слова и фильтры в одном запросе
↳ Новый дисковый индекс, существенно снижающий потребление памяти на больших объёмах данных
↳ Zvec Studio — визуальный инструмент для просмотра данных и отладки без написания кода
100% опенсорс
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - alibaba/zvec: A lightweight, lightning-fast, in-process vector database
A lightweight, lightning-fast, in-process vector database - alibaba/zvec
This media is not supported in your browser
VIEW IN TELEGRAM
Datalab открыла исходный код Lift — 9B-модели для извлечения структурированных данных из документов.
По заявлению разработчиков, модель показывает 90,2% точности на их бенчмарке против 91,3% у Gemini 3.5 Flash и заметно опережает специализированные опенсорс решения вроде NuExtract3 (81,5%).
Lift умеет извлекать данные по JSON Schema, а медианное время обработки составляет 9,5 секунды.
Для запуска достаточно: pip install lift-pdf
Модель и код доступны в открытом доступе.👍
По заявлению разработчиков, модель показывает 90,2% точности на их бенчмарке против 91,3% у Gemini 3.5 Flash и заметно опережает специализированные опенсорс решения вроде NuExtract3 (81,5%).
Lift умеет извлекать данные по JSON Schema, а медианное время обработки составляет 9,5 секунды.
Для запуска достаточно: pip install lift-pdf
Модель и код доступны в открытом доступе.
Please open Telegram to view this post
VIEW IN TELEGRAM
Если вы часто используете потоковый режим Codex или автоматизированные задачи, стоит учитывать один неприятный момент: это может заметно ускорять износ SSD.
Сейчас Codex автоматически пишет большое количество логов уровня
По сообщениям пользователей, скорость записи может достигать примерно 5 МБ/с.
OpenAI пока не исправили эту проблему.
Обсуждения:
GitHub Issue #17320
GitHub Issue #28224
Временный обходной путь:
Эта команда создаёт триггер SQLite, который блокирует новые записи в таблицу логов.
Также в качестве временной меры можно запускать Codex с флагом
Это отключает TRACE-логирование и может заметно сократить объём записываемых логов.
Если у вас есть долгоживущие автоматизированные задачи, имеет смысл вынести логи сессий на RAM-диск. В этом случае они будут храниться в оперативной памяти и автоматически удаляться после перезагрузки, что дополнительно снизит нагрузку на SSD.
P.S. Один из пользователей сообщил, что постоянно работал через😐
Сейчас Codex автоматически пишет большое количество логов уровня
TRACE в файл: ~/.codex/logs_2.sqliteПо сообщениям пользователей, скорость записи может достигать примерно 5 МБ/с.
OpenAI пока не исправили эту проблему.
Обсуждения:
GitHub Issue #17320
GitHub Issue #28224
Временный обходной путь:
sqlite3 ~/.codex/logs_2.sqlite "CREATE TRIGGER IF NOT EXISTS block_log_inserts BEFORE INSERT ON logs BEGIN SELECT RAISE(IGNORE); END;"
Эта команда создаёт триггер SQLite, который блокирует новые записи в таблицу логов.
Также в качестве временной меры можно запускать Codex с флагом
--no-trace или задать переменную окружения:CODEX_LOG_LEVEL=ERROR
Это отключает TRACE-логирование и может заметно сократить объём записываемых логов.
Если у вас есть долгоживущие автоматизированные задачи, имеет смысл вынести логи сессий на RAM-диск. В этом случае они будут храниться в оперативной памяти и автоматически удаляться после перезагрузки, что дополнительно снизит нагрузку на SSD.
P.S. Один из пользователей сообщил, что постоянно работал через
/resume в одной и той же сессии, после чего Codex начал заметно тормозить. Размер файла логов к тому моменту вырос примерно до 1.2 ГБ. Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from IT Portal
This media is not supported in your browser
VIEW IN TELEGRAM
Теория мёртвого интернета на практике: энтузиаст с Reddit поднял приватный сервер World of Warcraft на AzerothCore, заселил его 1800 ботами и прикрутил DeepSeek API для общения в чате
Боты сами качаются, закрывают квесты, собираются в группы и общаются друг с другом так, будто это обычный вечер на живом сервере
Сегодня забрали работу. Завтра заберут слот в рейде🫡 👁🗨
@IT_Portal
Боты сами качаются, закрывают квесты, собираются в группы и общаются друг с другом так, будто это обычный вечер на живом сервере
Сегодня забрали работу. Завтра заберут слот в рейде
@IT_Portal
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Codex умеет передавать сессии между локальными и удалёнными хостами.
Начал работу на ноутбуке, перед закрытием крышки отправил её на удалённый сервер, а позже вернул обратно и продолжил с того же места.
Самое интересное - вместе с сессией передаются не только сообщения, но и состояние проекта: код и Git-состояние. По словам OpenAI, Codex может сам координировать весь процесс передачи.
Для фронтенд-разработки это особенно удобно: можно работать локально, запускать dev-сборки и тестировать изменения, а тяжёлые задачи или долгие агентные сессии переносить на удалённую машину без потери контекста.😮💨
Начал работу на ноутбуке, перед закрытием крышки отправил её на удалённый сервер, а позже вернул обратно и продолжил с того же места.
Самое интересное - вместе с сессией передаются не только сообщения, но и состояние проекта: код и Git-состояние. По словам OpenAI, Codex может сам координировать весь процесс передачи.
Для фронтенд-разработки это особенно удобно: можно работать локально, запускать dev-сборки и тестировать изменения, а тяжёлые задачи или долгие агентные сессии переносить на удалённую машину без потери контекста.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Веб-скрейпинг уже не будет прежним. 💀
Вышел PixelRAG - опенсорс ретривер-фреймворк, который использует изображения страниц вместо традиционного HTML-парсинга
По словам разработчиков, традиционные HTML-to-text пайплайны могут терять более 40% содержимого страницы, включая таблицы, графики и элементы разметки. PixelRAG работает с документом в том виде, в котором его видит пользователь после рендеринга.
Как работает пайплайн:
- Рендерит каждый документ (веб-страницы, PDF, изображения) в набор тайлов.
- Строит эмеддинги с помощью Qwen3-VL-Embedding, дообученной через LoRA на скриншотах.
- Создаёт индекс FAISS и предоставляет API для поиска.
Если заменить модель-чтец на более сильную, точность вырастет без переиндексации, поскольку индекс хранит только пиксели.
Для экспериментов команда проекта создала визуальный индекс всей Википедии - более 30 миллионов скриншотов. В итоге, даже в таком формате система превосходит лучший текстовый RAG-бейзлайн на 18,1% в задачах question answering только по тексту.
Также представлен плагин для Claude Code, позволяющий анализировать отрендерированные страницы через скриншоты без работы с DOM.
Весь проект опубликован в открытом доступе под лицензией Apache-2.0, а в статье есть подробные разборы ошибок, абляционные исследования и сравнение более чем с 25 VLM-моделями.
Вышел PixelRAG - опенсорс ретривер-фреймворк, который использует изображения страниц вместо традиционного HTML-парсинга
По словам разработчиков, традиционные HTML-to-text пайплайны могут терять более 40% содержимого страницы, включая таблицы, графики и элементы разметки. PixelRAG работает с документом в том виде, в котором его видит пользователь после рендеринга.
Как работает пайплайн:
- Рендерит каждый документ (веб-страницы, PDF, изображения) в набор тайлов.
- Строит эмеддинги с помощью Qwen3-VL-Embedding, дообученной через LoRA на скриншотах.
- Создаёт индекс FAISS и предоставляет API для поиска.
Если заменить модель-чтец на более сильную, точность вырастет без переиндексации, поскольку индекс хранит только пиксели.
Для экспериментов команда проекта создала визуальный индекс всей Википедии - более 30 миллионов скриншотов. В итоге, даже в таком формате система превосходит лучший текстовый RAG-бейзлайн на 18,1% в задачах question answering только по тексту.
Также представлен плагин для Claude Code, позволяющий анализировать отрендерированные страницы через скриншоты без работы с DOM.
Весь проект опубликован в открытом доступе под лицензией Apache-2.0, а в статье есть подробные разборы ошибок, абляционные исследования и сравнение более чем с 25 VLM-моделями.
Please open Telegram to view this post
VIEW IN TELEGRAM
5
This media is not supported in your browser
VIEW IN TELEGRAM
WTF: Как я сам не додумался до такого юзкейса? 🤯
Теперь для правок изображений можно не жечь кредиты генерации в GPT. Это можно прогонять через Codex бесплатно.
Достаточно открыть Excalidraw, разметить изображение стрелками, подписями и заметками, а затем отправить результат cкриншотом в Codex.
В итоге Excalidraw становится холстом для аннотаций, Codex — исполнителем, а генерацию изображений ты вообще не трогаешь.
Всё работает нативно, без дополнительных плагинов
Теперь для правок изображений можно не жечь кредиты генерации в GPT. Это можно прогонять через Codex бесплатно.
Достаточно открыть Excalidraw, разметить изображение стрелками, подписями и заметками, а затем отправить результат cкриншотом в Codex.
В итоге Excalidraw становится холстом для аннотаций, Codex — исполнителем, а генерацию изображений ты вообще не трогаешь.
Всё работает нативно, без дополнительных плагинов
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Figma + Claude Code + Open Source = OpenPencil
Появился OpenPencil — опенсорсный ИИ-редактор для дизайна.
Что умеет:
• Открывает файлы
• Работает локально на компьютере
• Имеет встроенные ИИ-функции
• Экспортирует макеты в Tailwind и JSX
• Интегрируется с Claude Code и Cursor
☕️ ☕️ ☕️
Появился OpenPencil — опенсорсный ИИ-редактор для дизайна.
Что умеет:
• Открывает файлы
.fig• Работает локально на компьютере
• Имеет встроенные ИИ-функции
• Экспортирует макеты в Tailwind и JSX
• Интегрируется с Claude Code и Cursor
Please open Telegram to view this post
VIEW IN TELEGRAM