This media is not supported in your browser
VIEW IN TELEGRAM
Для Chrome вышло расширение Caveman, которое помогает сокращать количество токенов при работе с ИИ-моделями.
Расширение поддерживает ChatGPT, Claude, Gemini и другие сервисы. Оно автоматически переписывает промпты и ответы, убирая лишние слова без потери основного смысла.
По словам первопроходцев, это позволяет сократить расход выходных токенов до 75%, а ответы сделать более краткими и содержательными.😥
Расширение поддерживает ChatGPT, Claude, Gemini и другие сервисы. Оно автоматически переписывает промпты и ответы, убирая лишние слова без потери основного смысла.
По словам первопроходцев, это позволяет сократить расход выходных токенов до 75%, а ответы сделать более краткими и содержательными.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
В PaddlePaddle представили новую OCR-модель Unlimited-OCR, рассчитанную на обработку больших документов.
По словам разработчиков, модель способна обрабатывать сотни страниц за один проход без заметной потери скорости. Это стало возможным благодаря механизму R-SWA (Reference Sliding Window Attention), который поддерживает постоянный размер KV-кэша во время декодирования.
В бенчмарке OmniDocBench модель набрала 93%, а также показала результат на 6% выше, чем DeepSeek-OCR.
https://huggingface.co/baidu/Unlimited-OCR🤨
По словам разработчиков, модель способна обрабатывать сотни страниц за один проход без заметной потери скорости. Это стало возможным благодаря механизму R-SWA (Reference Sliding Window Attention), который поддерживает постоянный размер KV-кэша во время декодирования.
В бенчмарке OmniDocBench модель набрала 93%, а также показала результат на 6% выше, чем DeepSeek-OCR.
https://huggingface.co/baidu/Unlimited-OCR
Please open Telegram to view this post
VIEW IN TELEGRAM
Вышла Qwythos-9B-Claude-Mythos-5 с контекстным окном до 1 млн токенов. 🤔
Команда Empero представила свою reasoning-модель Qwythos-9B, построенную на базе глубоко разцензуренной версии Qwen3.5-9B. Модель получила полный fine-tune всех параметров и была дополнительно обучена более чем на 500 млн токенов данных Claude Mythos и Claude Fable.
Для обучения использовались синтетические Chain of Thought (CoT), сгенерированные на основе логов сессий Fable-5 и Mythos-5.
Модель уже доступна на Hugging Face:
https://huggingface.co/empero-ai/Qwythos-9B-Claude-Mythos-5-1M
Команда Empero представила свою reasoning-модель Qwythos-9B, построенную на базе глубоко разцензуренной версии Qwen3.5-9B. Модель получила полный fine-tune всех параметров и была дополнительно обучена более чем на 500 млн токенов данных Claude Mythos и Claude Fable.
Для обучения использовались синтетические Chain of Thought (CoT), сгенерированные на основе логов сессий Fable-5 и Mythos-5.
Модель уже доступна на Hugging Face:
https://huggingface.co/empero-ai/Qwythos-9B-Claude-Mythos-5-1M
Please open Telegram to view this post
VIEW IN TELEGRAM
Victor Mustar, Head of Product в Hugging Face, порекомендовал это подробное руководство по оптимизации локального запуска LLM через llama.cpp.
В статье разбираются выбор железа, настройка ОС, квантизация моделей, работа с памятью и способы повышения скорости инференса на потребительских ПК.😁
В статье разбираются выбор железа, настройка ОС, квантизация моделей, работа с памятью и способы повышения скорости инференса на потребительских ПК.
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Скилл make-interfaces-feel-better от разработчика Jakub Krehel преодолел отметку в 30 тысяч установок.
Проект представляет собой набор практических рекомендаций по улучшению пользовательских интерфейсов. В него входят советы по UI-дизайну, анимациям, производительности, визуальным деталям и другим аспектам, которые влияют на восприятие продукта пользователями.🤩
Устанвока :
Проект представляет собой набор практических рекомендаций по улучшению пользовательских интерфейсов. В него входят советы по UI-дизайну, анимациям, производительности, визуальным деталям и другим аспектам, которые влияют на восприятие продукта пользователями.
Устанвока :
npx skills add jakubkrehel/make-interfaces-feel-betterPlease open Telegram to view this post
VIEW IN TELEGRAM
Держите неплохой лайфхак по запуску локалок 😆
Скормите Codex CLI эту статью от Ахмеда и попросите:
- определи подходящий inference engine под моё железо
- настрой проект через uv + venv
- подбери нужные kernels
- подкрути flags, batching, KVCache и другие параметры
- оптимизируй запуск под мою модель и железо
Легко.
Скормите Codex CLI эту статью от Ахмеда и попросите:
- определи подходящий inference engine под моё железо
- настрой проект через uv + venv
- подбери нужные kernels
- подкрути flags, batching, KVCache и другие параметры
- оптимизируй запуск под мою модель и железо
Легко.
Please open Telegram to view this post
VIEW IN TELEGRAM
3
This media is not supported in your browser
VIEW IN TELEGRAM
Знакомьтесь: Clips. Бесплатная открытая замена Loom, заточенная под агентов. 😋
В отличие от Loom, агент понимает Clips просто по ссылке. Каждый клип содержит API и метаданные, благодаря которым агент может изучить его содержимое. Агенты видят и слышат не только транскрипт, а вообще всё, что происходит на видео в любой момент времени.
Делишься баг-репортом, фидбеком, анализом — и передаёшь это агенту, чтобы он улучшал продукт или отчёт.
Ещё один плюс: софт твой. Никто не поднимет цену в один день, как это сделал Loom.
Clips создан для кастомизации. Встроенный агент умеет править собственный код, просто адаптируешь приложение под себя.
Ещё можно импортировать Loom по ссылке и загружать видео.
Есть бесплатная хостовая версия. Можно форкнуть и хостить самому.
В отличие от Loom, агент понимает Clips просто по ссылке. Каждый клип содержит API и метаданные, благодаря которым агент может изучить его содержимое. Агенты видят и слышат не только транскрипт, а вообще всё, что происходит на видео в любой момент времени.
Делишься баг-репортом, фидбеком, анализом — и передаёшь это агенту, чтобы он улучшал продукт или отчёт.
Ещё один плюс: софт твой. Никто не поднимет цену в один день, как это сделал Loom.
Clips создан для кастомизации. Встроенный агент умеет править собственный код, просто адаптируешь приложение под себя.
Ещё можно импортировать Loom по ссылке и загружать видео.
Есть бесплатная хостовая версия. Можно форкнуть и хостить самому.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
На GitHub появился проект reverse-skill, посвящённый автоматизации задач реверс-инжиниринга и анализа безопасности с помощью ИИ.
В проект добавляется файл
Внутри больше 20 направлений: APK-реверс, статический анализ IDA, реверс JS-фронтенда, безопасность прошивок, обход EDR, эксплуатация уязвимостей. В общем, все типичные сценарии защиты и нападения.
исходники🤩
В проект добавляется файл
routing.md, в нём расписано, по какому пути идти агенту для разных задач безопасности. Агент получает его и сам решает, какие инструменты и методы использовать.Внутри больше 20 направлений: APK-реверс, статический анализ IDA, реверс JS-фронтенда, безопасность прошивок, обход EDR, эксплуатация уязвимостей. В общем, все типичные сценарии защиты и нападения.
исходники
Please open Telegram to view this post
VIEW IN TELEGRAM
На днях вышел Mistral OCR 4
Он распознаёт документы на 170 языках.
Тестеры сравнили OCR 4 с другими решениями в лоб. Независимые аннотаторы вслепую ранжировали 600+ реальных документов на 12+ языках. OCR 4 победил каждую систему. Средний винрейт 72%.
На бенчмарках картина похожая. OlmOCRBench - 85.20. Особенно заметен разрыв на редких языках
Из интересного - OCR 4 смог превратить рукописный экзамен по математическому анализу в чистый LaTeX.
Модели дали фото страницы с рукописным экзаменом. Она прочитала почерк и восстановила каждую формулу в структурированный цифровой текст.
Результат: 5.1 секунды обработки при стоимости всего $0.09.
Формулы были распознаны корректно. График модель не перерисовала, но это как раз показательно. Большинство OCR-систем просто извлекают текст и теряют подобные элементы. OCR 4 распознал график, выделил его отдельным блоком и пометил как chart. Он не появился в виде новой отрисовки, но был учтён в структуре документа.😨
https://mistral.ai/news/ocr-4/
Он распознаёт документы на 170 языках.
Тестеры сравнили OCR 4 с другими решениями в лоб. Независимые аннотаторы вслепую ранжировали 600+ реальных документов на 12+ языках. OCR 4 победил каждую систему. Средний винрейт 72%.
На бенчмарках картина похожая. OlmOCRBench - 85.20. Особенно заметен разрыв на редких языках
Из интересного - OCR 4 смог превратить рукописный экзамен по математическому анализу в чистый LaTeX.
Модели дали фото страницы с рукописным экзаменом. Она прочитала почерк и восстановила каждую формулу в структурированный цифровой текст.
Результат: 5.1 секунды обработки при стоимости всего $0.09.
Формулы были распознаны корректно. График модель не перерисовала, но это как раз показательно. Большинство OCR-систем просто извлекают текст и теряют подобные элементы. OCR 4 распознал график, выделил его отдельным блоком и пометил как chart. Он не появился в виде новой отрисовки, но был учтён в структуре документа.
https://mistral.ai/news/ocr-4/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В Figma появятся генеративные плагины, которые можно создавать вместе с агентом.
Достаточно описать в чате нужную функцию, и помощник соберет и интегрирует готовый плагин с удобным интерфейсом
Таким же образом можно генерировать шейдеры для эффектов элементов.
Также завезли Figma Motion. Похоже на LottieLab, только без прыжков между тулзами и с коллабой в реальном времени. Если дальше подтянут экспорт и перфоманс, половина таких отдельных анимационных сервисов просто перестанет иметь смысл.
🐸 🐸 🐸
Достаточно описать в чате нужную функцию, и помощник соберет и интегрирует готовый плагин с удобным интерфейсом
Таким же образом можно генерировать шейдеры для эффектов элементов.
Также завезли Figma Motion. Похоже на LottieLab, только без прыжков между тулзами и с коллабой в реальном времени. Если дальше подтянут экспорт и перфоманс, половина таких отдельных анимационных сервисов просто перестанет иметь смысл.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Вау, вот это скорость разработки! 🚀
На GitVerse появилось зеркало PyPI — теперь Python‑пакеты доступны, даже если upstream PyPI упадёт или станет недоступен.
Ставьте зеркало как основной источник или держите как резерв. Рассказали, как это сделать, здесь!
На GitVerse появилось зеркало PyPI — теперь Python‑пакеты доступны, даже если upstream PyPI упадёт или станет недоступен.
Ставьте зеркало как основной источник или держите как резерв. Рассказали, как это сделать, здесь!
Как улучшить свой /goal, спроектировав цикл до его запуска
Плохо спроектированный цикл быстро сжигает токены и выдаёт мусор. поэтому важно потратить время на проектирование loop harness
Вместо того чтобы просто написать /goal и надеяться, что он сработает, ты сначала прогоняешь его через LOOPER skill, и он:
- критикует твой цикл и приводит его к лучшим практикам из библиотеки
- собирает верификационный рубрикатор, чтобы цикл понимал, что значит «готово»
- даёт возможность подключить LLM в роли судьи, включая Codex и модели кроме Claude
- настраивает ограничения и бюджет токенов — жёсткий или свободный, чтобы процесс не разъехался
- экспортирует всё как переносимый артефакт, который можно повторять и править
- даёт визуальную диаграмму цикла
Это слой проектирования, который помогает собрать цикл, выдающий качественный результат, а потом передаёт его в Claude Code или другие модели🐸 🐸
Плохо спроектированный цикл быстро сжигает токены и выдаёт мусор. поэтому важно потратить время на проектирование loop harness
Вместо того чтобы просто написать /goal и надеяться, что он сработает, ты сначала прогоняешь его через LOOPER skill, и он:
- критикует твой цикл и приводит его к лучшим практикам из библиотеки
- собирает верификационный рубрикатор, чтобы цикл понимал, что значит «готово»
- даёт возможность подключить LLM в роли судьи, включая Codex и модели кроме Claude
- настраивает ограничения и бюджет токенов — жёсткий или свободный, чтобы процесс не разъехался
- экспортирует всё как переносимый артефакт, который можно повторять и править
- даёт визуальную диаграмму цикла
Это слой проектирования, который помогает собрать цикл, выдающий качественный результат, а потом передаёт его в Claude Code или другие модели
Please open Telegram to view this post
VIEW IN TELEGRAM