minimind-o
Обучение полноценной мультимодальной модели на 0.1B параметров с нуля: одна общая модель обрабатывает текст, речь и изображения, а на выходе генерирует текст и потоковую речь.
MiniMind-O — мультимодальная модель всего на 0.1B параметров с двухконтурной архитектурой Thinker-Talker. Поддерживает текстовые, голосовые и визуальные входные данные, а в качестве вывода умеет генерировать текст и потоковую речь.
В проекте полностью открыты:
- исходный код;
- веса модели;
- тренировочные датасеты;
- технические отчёты.
Базовые алгоритмы реализованы с нуля на PyTorch, а обучение на мини-датасете можно завершить примерно за два часа даже на одной RTX 3090.
📁 Language: #Python 71%
⭐️ Stars: 755
➡️ Cсылка на GitHub
📱 @git_developer
Обучение полноценной мультимодальной модели на 0.1B параметров с нуля: одна общая модель обрабатывает текст, речь и изображения, а на выходе генерирует текст и потоковую речь.
MiniMind-O — мультимодальная модель всего на 0.1B параметров с двухконтурной архитектурой Thinker-Talker. Поддерживает текстовые, голосовые и визуальные входные данные, а в качестве вывода умеет генерировать текст и потоковую речь.
В проекте полностью открыты:
- исходный код;
- веса модели;
- тренировочные датасеты;
- технические отчёты.
Базовые алгоритмы реализованы с нуля на PyTorch, а обучение на мини-датасете можно завершить примерно за два часа даже на одной RTX 3090.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥3❤1
cronalytics
Преврати стоимость запланированных задач Hermes Agent из «чёрного ящика» в визуальную панель аналитики.
Cronalytics добавляет панель мониторинга стоимости к запланированным задачам Hermes Agent. После каждого выполнения cron-задачи плагин автоматически записывает стоимость, токены, модель, длительность и результат, сохраняя всё в локальной базе SQLite.
Панель включает сводную статистику, рейтинги, сравнение стоимости между моделями, сортируемый список задач и детальные записи каждого запуска при клике на конкретную задачу.
📁 Language: #Python 52.7%
⭐️ Stars: 65
➡️ Cсылка на GitHub
📱 @git_developer
Преврати стоимость запланированных задач Hermes Agent из «чёрного ящика» в визуальную панель аналитики.
Cronalytics добавляет панель мониторинга стоимости к запланированным задачам Hermes Agent. После каждого выполнения cron-задачи плагин автоматически записывает стоимость, токены, модель, длительность и результат, сохраняя всё в локальной базе SQLite.
Панель включает сводную статистику, рейтинги, сравнение стоимости между моделями, сортируемый список задач и детальные записи каждого запуска при клике на конкретную задачу.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2💊1
Academic Research Skills for Codex
Перенесли набор инструментов для академических исследований с Claude Code на Codex, чтобы исследователи могли запускать процессы вроде обзоров литературы, написания статей и peer review напрямую внутри Codex.
Это версия Academic Research Skills для Codex, изначально созданная для Claude Code. Проект объединяет пять исследовательских воркфлоу в один скилл:
→ deep research
→ подготовка научных статей
→ peer review
→ полный исследовательский пайплайн
→ планирование экспериментов
После установки всё вызывается через:
📁 Language: #Python 71.6%
⭐️ Stars: 448
➡️ Cсылка на GitHub
📱 @git_developer
Перенесли набор инструментов для академических исследований с Claude Code на Codex, чтобы исследователи могли запускать процессы вроде обзоров литературы, написания статей и peer review напрямую внутри Codex.
Это версия Academic Research Skills для Codex, изначально созданная для Claude Code. Проект объединяет пять исследовательских воркфлоу в один скилл:
→ deep research
→ подготовка научных статей
→ peer review
→ полный исследовательский пайплайн
→ планирование экспериментов
После установки всё вызывается через:
$academic-research-suite
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍2
MagesticAI
Управление AI-задачами разработки через браузер с использованием мультиагентного взаимодействия, которое закрывает полный цикл: от планирования до написания кода и QA-ревью.
MagesticAI — браузерная платформа управления AI-задачами и оркестрации агентов, использующая режим SDD (разработка, управляемая спецификацией). Платформа предоставляет Kanban-доски задач, интерактивный терминал и редактор кода на базе Monaco, а backend реализован через кооперацию трёх агентов: Planner, Coder и QA.
📁 Language: #Python 69.2%
⭐️ Stars: 27
➡️ Cсылка на GitHub
📱 @git_developer
Управление AI-задачами разработки через браузер с использованием мультиагентного взаимодействия, которое закрывает полный цикл: от планирования до написания кода и QA-ревью.
MagesticAI — браузерная платформа управления AI-задачами и оркестрации агентов, использующая режим SDD (разработка, управляемая спецификацией). Платформа предоставляет Kanban-доски задач, интерактивный терминал и редактор кода на базе Monaco, а backend реализован через кооперацию трёх агентов: Planner, Coder и QA.
Please open Telegram to view this post
VIEW IN TELEGRAM
claude-bughunter
Оснасти Claude Code набором skills для bug bounty и red team-пентеста: 51 skill, 574+ шаблона отчётов, 24 категории уязвимостей — установи это, и он мгновенно превратится в опытного исследователя безопасности.
📁 Language: #Python 74.8%
⭐️ Stars: 429
➡️ Cсылка на GitHub
📱 @git_developer
Оснасти Claude Code набором skills для bug bounty и red team-пентеста: 51 skill, 574+ шаблона отчётов, 24 категории уязвимостей — установи это, и он мгновенно превратится в опытного исследователя безопасности.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10
Remove-AI-Watermarks
Недавно наткнулся на open-source инструмент, который позволяет в один клик удалять различные водяные знаки и метки с AI-изображений — Remove-AI-Watermarks.
Он поддерживает изображения, сгенерированные такими платформами, как Gemini и Midjourney, и способен работать как с видимыми, так и со скрытыми водяными знаками, включая Google SynthID.
Инструмент также умеет удалять метаданные, из-за которых платформы помечают изображения как «сгенерированные ИИ». Для скрытых водяных знаков он восстанавливает пиксели с помощью диффузионной модели, тем самым устраняя встроенные метки.
Кроме того, в нём есть встроенная функция защиты лиц: она автоматически обнаруживает лица на изображении и сохраняет их детали в процессе обработки, чтобы избежать искажений.
Если вы часто генерируете изображения с помощью ИИ, но не хотите, чтобы платформы автоматически помечали их как AI-generated, этот инструмент стоит добавить в закладки и попробовать.
📁 Language: #Python 99.9%
⭐️ Stars: 2.4k
➡️ Cсылка на GitHub
📱 @git_developer
Недавно наткнулся на open-source инструмент, который позволяет в один клик удалять различные водяные знаки и метки с AI-изображений — Remove-AI-Watermarks.
Он поддерживает изображения, сгенерированные такими платформами, как Gemini и Midjourney, и способен работать как с видимыми, так и со скрытыми водяными знаками, включая Google SynthID.
Инструмент также умеет удалять метаданные, из-за которых платформы помечают изображения как «сгенерированные ИИ». Для скрытых водяных знаков он восстанавливает пиксели с помощью диффузионной модели, тем самым устраняя встроенные метки.
Кроме того, в нём есть встроенная функция защиты лиц: она автоматически обнаруживает лица на изображении и сохраняет их детали в процессе обработки, чтобы избежать искажений.
Если вы часто генерируете изображения с помощью ИИ, но не хотите, чтобы платформы автоматически помечали их как AI-generated, этот инструмент стоит добавить в закладки и попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
Horizon
Я каждый день скроллю Hacker News, Reddit и Twitter в поисках полезной информации — и каждый раз оказывается, что 80% этого просто шум.
Пока я не наткнулся на этот open-source проект:
- Автоматически агрегирует Hacker News / Twitter / Reddit / GitHub
-AI автоматически выставляет оценку и сразу отфильтровывает низкокачественный контент
-Извлекает ценные инсайты из комментариев
-Автоматически добавляет бэкграунд по незнакомым компаниям и технологиям
-Дедуплицирует одни и те же новости по всему вебу
-Поддерживает двуязычные брифинги на китайском и английском
-Может отправлять дайджесты в Feishu / email / WeChat
В одном предложении: он превращает «поиск информации через бесконечный скролл» в «получение уже отфильтрованной информации».
📁 Language: #Python 99.6%
⭐️ Stars: 5к
➡️ Cсылка на GitHub
📱 @git_developer
Я каждый день скроллю Hacker News, Reddit и Twitter в поисках полезной информации — и каждый раз оказывается, что 80% этого просто шум.
Пока я не наткнулся на этот open-source проект:
- Автоматически агрегирует Hacker News / Twitter / Reddit / GitHub
-AI автоматически выставляет оценку и сразу отфильтровывает низкокачественный контент
-Извлекает ценные инсайты из комментариев
-Автоматически добавляет бэкграунд по незнакомым компаниям и технологиям
-Дедуплицирует одни и те же новости по всему вебу
-Поддерживает двуязычные брифинги на китайском и английском
-Может отправлять дайджесты в Feishu / email / WeChat
В одном предложении: он превращает «поиск информации через бесконечный скролл» в «получение уже отфильтрованной информации».
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
This media is not supported in your browser
VIEW IN TELEGRAM
LongCat-Avatar
Китайская лаборатория только что поставила в неудобное положение половину индустрии видеопроизводства.
Вы загружаете фотографию и аудиозапись, а на выходе получаете аватар, который синхронно говорит с аудио. Проект с открытым исходным кодом.
То, для чего раньше требовались агентство, камера и монтаж, теперь больше похоже на Git-репозиторий.
Называется это LongCat-Avatar.
📁 Language: #Python 100.0%
⭐️ Stars: 3.5k
➡️ Cсылка на GitHub
📱 @git_developer
Китайская лаборатория только что поставила в неудобное положение половину индустрии видеопроизводства.
Вы загружаете фотографию и аудиозапись, а на выходе получаете аватар, который синхронно говорит с аудио. Проект с открытым исходным кодом.
То, для чего раньше требовались агентство, камера и монтаж, теперь больше похоже на Git-репозиторий.
Называется это LongCat-Avatar.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13😁2🔥1
14days-build-claude-code-cli
Используй 14-дневный туториал, чтобы с нуля собрать на Python code-agent CLI в стиле Claude Code и разобраться в базовых механизмах Agent Harness.
Это учебный проект, где с нуля на Python реализуется agent-code CLI в стиле Claude Code. Туториал разбит на 14 дней: каждый день разбирается одна возможность harness-слоя: CLI runtime, Agent Loop, tool calling, permissions, file editing, command execution, session memory, hooks, skills, subagents, worktree, MCP.
📁 Language: #MDX 41.2% #Python 38.0%
⭐️ Stars: 174
➡️ Cсылка на GitHub
📱 @git_developer
Используй 14-дневный туториал, чтобы с нуля собрать на Python code-agent CLI в стиле Claude Code и разобраться в базовых механизмах Agent Harness.
Это учебный проект, где с нуля на Python реализуется agent-code CLI в стиле Claude Code. Туториал разбит на 14 дней: каждый день разбирается одна возможность harness-слоя: CLI runtime, Agent Loop, tool calling, permissions, file editing, command execution, session memory, hooks, skills, subagents, worktree, MCP.
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - bozhouDev/14days-build-claude-code-cli: 网页版教程,看起来会舒服一点
网页版教程,看起来会舒服一点. Contribute to bozhouDev/14days-build-claude-code-cli development by creating an account on GitHub.
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
claude-tap
claude-tap — это локальный прокси и просмотрщик трассировок, который перехватывает и отображает весь API-трафик AI-агентов для программирования, чтобы упростить отладку и анализ.
- Просмотр системных промптов, истории диалога, схем инструментов и потоковых ответов
- Сравнение структурированных diff'ов между соседними запросами для точного понимания, что изменилось
- Экспорт трассировок в автономный HTML-просмотрщик для обмена или архивирования
- Работает с Claude Code, Codex CLI, Gemini CLI, Kimi CLI и другими инструментами подобного класса
📁 Language: #Python 78.8%
⭐️ Stars: 1.3к
➡️ Cсылка на GitHub
📱 @git_developer
claude-tap — это локальный прокси и просмотрщик трассировок, который перехватывает и отображает весь API-трафик AI-агентов для программирования, чтобы упростить отладку и анализ.
- Просмотр системных промптов, истории диалога, схем инструментов и потоковых ответов
- Сравнение структурированных diff'ов между соседними запросами для точного понимания, что изменилось
- Экспорт трассировок в автономный HTML-просмотрщик для обмена или архивирования
- Работает с Claude Code, Codex CLI, Gemini CLI, Kimi CLI и другими инструментами подобного класса
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
defending-code-reference-harness
Референсная реализация для автоматизированного поиска уязвимостей и их исправления с помощью Claude, охватывающая весь процесс: от моделирования угроз до автоматического применения патчей в рамках единого конвейера.
Open-source реализация от Anthropic для автоматизации задач безопасности, объединяющая интерактивные навыки Claude Code и автономные пайплайны.
Пайплайн состоит из семи этапов:
• сборка (build)
• разведка (reconnaissance)
• поиск уязвимостей (discovery)
• верификация (verification)
• дедупликация (deduplication)
• формирование отчётов (reporting)
• применение патчей (patching)
Для поиска уязвимостей, связанных с памятью в C/C++, используются Docker и ASAN (AddressSanitizer).
📁 Language: #Python 92.7%
⭐️ Stars: 2.2к
➡️ Cсылка на GitHub
📱 @git_developer
Референсная реализация для автоматизированного поиска уязвимостей и их исправления с помощью Claude, охватывающая весь процесс: от моделирования угроз до автоматического применения патчей в рамках единого конвейера.
Open-source реализация от Anthropic для автоматизации задач безопасности, объединяющая интерактивные навыки Claude Code и автономные пайплайны.
Пайплайн состоит из семи этапов:
• сборка (build)
• разведка (reconnaissance)
• поиск уязвимостей (discovery)
• верификация (verification)
• дедупликация (deduplication)
• формирование отчётов (reporting)
• применение патчей (patching)
Для поиска уязвимостей, связанных с памятью в C/C++, используются Docker и ASAN (AddressSanitizer).
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - anthropics/defending-code-reference-harness: Skills for threat modeling, scanning, triage, patching, plus an autonomous…
Skills for threat modeling, scanning, triage, patching, plus an autonomous scanning harness you can /customize - anthropics/defending-code-reference-harness
❤4
Surya
Surya — open-source OCR-модель на 650 млн параметров, которая показывает 83.3% на olmOCR-bench и обрабатывает до 5 страниц в секунду на RTX 5090.
Что умеет:
• 83.3% на olmOCR-bench — лучший результат среди моделей меньше 3 млрд параметров
• до 5 страниц в секунду на RTX 5090
• 87.2% на мультиязычном бенчмарке для 91 языка
• встроенный анализ структуры документа
• определение порядка чтения текста
• распознавание таблиц без дополнительных моделей
Подходит для извлечения текста из PDF, сканов, книг, отчётов и других документов, где важна не только OCR-часть, но и понимание структуры страницы.
📁 Language: #Python 94.4%
⭐️ Stars: 20к
➡️ Cсылка на GitHub
📱 @git_developer
Surya — open-source OCR-модель на 650 млн параметров, которая показывает 83.3% на olmOCR-bench и обрабатывает до 5 страниц в секунду на RTX 5090.
Что умеет:
• 83.3% на olmOCR-bench — лучший результат среди моделей меньше 3 млрд параметров
• до 5 страниц в секунду на RTX 5090
• 87.2% на мультиязычном бенчмарке для 91 языка
• встроенный анализ структуры документа
• определение порядка чтения текста
• распознавание таблиц без дополнительных моделей
Подходит для извлечения текста из PDF, сканов, книг, отчётов и других документов, где важна не только OCR-часть, но и понимание структуры страницы.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
ChatTTS-ui
Нужен локальный аналог облачных TTS-сервисов?
ChatTTS-ui оборачивает модель ChatTTS в удобный веб-интерфейс и API, которые можно запускать полностью локально.
Что умеет:
• синтезирует речь из текста с поддержкой китайского, английского языка и чисел в одном запросе;
• есть готовая сборка для Windows, можно запустить без настройки исходников;
• поддерживает запуск через Docker на Linux как с GPU, так и на CPU;
• помимо веб-интерфейса предоставляет API для интеграции в свои проекты.
Удобный вариант, если нужен локальный TTS без зависимости от облачных сервисов.
📁 Language: #Python 90.7%
⭐️ Stars: 7.6к
➡️ Cсылка на GitHub
📱 @git_developer
Нужен локальный аналог облачных TTS-сервисов?
ChatTTS-ui оборачивает модель ChatTTS в удобный веб-интерфейс и API, которые можно запускать полностью локально.
Что умеет:
• синтезирует речь из текста с поддержкой китайского, английского языка и чисел в одном запросе;
• есть готовая сборка для Windows, можно запустить без настройки исходников;
• поддерживает запуск через Docker на Linux как с GPU, так и на CPU;
• помимо веб-интерфейса предоставляет API для интеграции в свои проекты.
Удобный вариант, если нужен локальный TTS без зависимости от облачных сервисов.
Please open Telegram to view this post
VIEW IN TELEGRAM
agentic-stack
Claude Code, OpenClaw и Hermes Agent теперь могут использовать общий слой памяти и навыков.
Одна папка
Меняете инструмент, а накопленная память, навыки и весь опыт остаются на месте.
По сути, один переносимый слой памяти для разных кодовых агентов. Никакой привязки к конкретному инструменту и никакой потери накопленных знаний при миграции. Open source.
📁 Language: #Python 96.7%
⭐️ Stars: 2.1к
➡️ Cсылка на GitHub
📱 @git_developer
Claude Code, OpenClaw и Hermes Agent теперь могут использовать общий слой памяти и навыков.
Одна папка
.agent/ работает сразу в 8 разных агентных harness'ах для программирования.Меняете инструмент, а накопленная память, навыки и весь опыт остаются на месте.
По сути, один переносимый слой памяти для разных кодовых агентов. Никакой привязки к конкретному инструменту и никакой потери накопленных знаний при миграции. Open source.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4