Clippy — Культовый «Скрепыш» теперь ваш ИИ-помощник
Это приложение для запуска крупных языковых моделей искусственного интеллекта на локальном компьютере с интерфейсом в стиле 1990-х.
Оно предлагает установку популярных моделей от таких компаний, как Google, Mistral, Microsoft и многих других с одного клика и работает оффлайн и бесплатно.
Приложение вдохновлено Clippy, помощником из Microsoft Office 1997, но не связано с Microsoft.
Хотите, чтобы игрушки и фигурки могли говорить и выражать эмоции? Существующие решения либо слишком дорогие и сложные, либо требуют постоянного подключения к смартфону, что крайне неудобно.
Чтобы решить эти проблемы, на GitHub опубликован открытый проект ElatoAI, разработанный на базе микроконтроллера ESP32 и OpenAI Realtime API.
Он позволяет превратить вашу игрушку в настоящего AI-компаньона, поддерживает более 10 минут непрерывного естественного диалога, а распознавание речи и отклик работают очень плавно.
🔸Реальное голос-в-голос взаимодействие: основано на OpenAI Realtime API, обеспечивает исключительно естественное и плавное общение
🔸Настраиваемый AI-персонаж: возможность задавать различные характеры и голосовые профили
🔸Простая аппаратная реализация: требуется только одна отладочная плата ESP32-S3
🔸Безопасная передача данных: используется зашифрованный WebSocket
🔸Низкая задержка по всему миру: реализовано с помощью Deno Edge Functions, обеспечивая задержку менее 1 секунды по всему миру
Код фронтенда, сервера и прошивки проекта открыт — разработчики, интересующиеся продуктами вроде AI-игрушек или AI-компаньонов, могут ознакомиться.
На GitHub появилась инновационная open-source AI-утилита автоматизации — Terminator
В отличие от привычных инструментов, использующих OCR для распознавания содержимого экрана, Terminator “понимает” интерфейсы приложений напрямую — как будто парсит HTML-страницу, быстро и точно управляя различными программами на компьютере.
В сравнении с традиционными OCR-инструментами автоматизации:
🔸Значительно выше скорость — в разы быстрее классических методов; 🔸Можно взаимодействовать с окнами, даже если они свернуты или перекрыты; 🔸Более устойчивая работа — не ломается при изменении интерфейса.
На данный момент основной фокус — Windows, на macOS реализована лишь часть функций.
Если интересуешься автоматизацией задач на ПК — стоит изучить, как устроен этот проект
При работе с AI-инструментами для фронтенд-разработки, такими как Cursor или Windsurf, иногда бывает неудобно менять стили UI-интерфейса — необходимо вручную указывать AI точные сведения о расположении элементов.
Рекомендуем попробовать Stagewise — это open-source инструмент, который предоставляет браузерное расширение, позволяющее напрямую выбирать элементы на веб-странице и добавлять к ним комментарии.
Инструмент помогает делать скриншоты элементов, извлекать DOM-структуру и другую важную информацию, которую затем можно отправить в Cursor и другие AI-ассистенты для дальнейшей обработки.
Ключевые возможности:
🟡Выбор любых UI-элементов прямо в браузере и отправка их AI-ассистенту; 🟡Автоматическая интеграция с расширением VS Code без дополнительной настройки; 🟡Поддержка популярных фронтенд-фреймворков: React, Vue, Next.js, SvelteKit и др.; 🟡Расширяемость через систему пользовательских плагинов; 🟡Передача DOM-элементов, скриншотов и метаданных AI-агентам; 🟡Не влияет на финальный размер сборки, работает только в режиме разработки.
Если вы фронтенд-разработчик и используете AI-инструменты вроде Cursor — стоит попробовать этот инструмент в связке
Обнаружен мощный open-source аналог, объединяющий ключевые возможности NotebookLM и Perplexity — SurfSense.
Он поддерживает загрузку файлов 27 форматов в личную базу знаний и позволяет вести естественные диалоги с этими данными, предоставляя ответы с источниками.
Также SurfSense интегрируется с внешними платформами — поиск, Slack, Notion, GitHub — и способен всего за 20 секунд генерировать 3-минутный подкаст высокого качества.
Основные возможности:
🟡Поддержка 27 форматов файлов для загрузки в приватную базу; 🟡Ответы на естественном языке с цитированием источников; 🟡Быстрая генерация подкастов; 🟡Интеграция с поиском, Slack, Notion, GitHub и др.; 🟡RAG-механизм для точного поиска по базе; 🟡Расширение для браузера — сохранение любых страниц, включая требующие авторизацию; 🟡Полностью open-source, возможен self-hosting.
Лёгкий деплой через Docker или вручную — инструкции есть для Windows, macOS и Linux
На GitHub появилась расширенная версия браузерного плагина MCP под названием MCP-SuperAssistant.
Плагин разблокирует вызовы MCP-инструментов прямо на страницах ChatGPT, Gemini и Grok, автоматически обнаруживает и подключает внешние данные и утилиты в диалоговом окне, а затем бесшовно вставляет результаты обратно в чат.
Поддерживает режим автоматического выполнения без ручных кликов — инструменты MCP запускаются одной кнопкой. Внутри плагина также встроено множество полезных утилит.
Уже доступен в Chrome Web Store и поддерживает подключение к локальному прокси-серверу
Представляем Agentic Company Researcher — open-source проект, который автоматически генерирует подробные отчёты о компаниях в один клик.
Он использует несколько AI-агентов, которые собирают данные с сайта компании, новостей, финансовых отчётов и других источников, а затем с помощью Gemini и ChatGPT отбирают и структурируют информацию в качественный отчёт.
Возможности:
🟡Автоматический сбор данных из разных источников: сайты, новости, отчёты 🟡AI-фильтрация контента на базе Tavily — только релевантная инфа 🟡Прогресс в реальном времени — потоковое отображение результатов 🟡Двойная модель: Gemini обрабатывает массив данных, GPT-4.1 красиво форматирует 🟡Современный интерфейс на React с поддержкой live-обновлений и скачивания 🟡Модульная архитектура агентов — легко расширяется и кастомизируется
Достаточно клонировать репозиторий и прописать API-ключ — и можно пользоваться.
Открытое настольное приложение с виртуальным питомцем — BongoCat.
На экране появляется милый котёнок, который реагирует на нажатия клавиш и движения мыши, взаимодействуя с вами в реальном времени. Отличный способ немного расслабиться во время работы или учёбы.
Доступны установочные пакеты для Windows, macOS и Linux — всё работает из коробки
Для повседневной передачи крупных файлов обычно выбирают облачные хранилища или внешние диски, но такие способы часто сопровождаются низкой скоростью, ограниченным объёмом хранения и проблемами с безопасностью.
На GitHub есть open-source инструмент, который решает эти проблемы — FilePizza.
Полностью бесплатный, не требует регистрации, установки или предварительной загрузки — передача файлов происходит напрямую между браузерами по P2P-соединению, быстро и безопасно, без хранения на сторонних серверах.
Особенности:
🟡Нет ограничений по размеру файлов 🟡Поддержка пакетной отправки нескольких файлов 🟡Возможность установить пароль для защиты передачи 🟡После загрузки файла генерируется QR-код или короткая ссылка для удобного распространения 🟡В реальном времени отображается прогресс передачи
Полезный инструмент, который стоит сохранить — может пригодиться в нужный момент.
Открытый инструмент для автоматизации веб-страниц с помощью ИИ — Nanobrowser.
Это open-source альтернатива OpenAI Operator, работает локально в браузере и поддерживает мультиагентные системы.
Полностью бесплатный, с упором на конфиденциальность, гибкими настройками LLM и полностью открытым исходным кодом — делает автоматизацию веба умной и эффективной.
Скачайте zip с GitHub и просто установите его в Chrome
Готовый к использованию инструмент для управления Android-устройствами
Графический интерфейс, оборачивающий множество функций ADB, включая трансляцию экрана, управление файлами, управление приложениями и другие возможности — без необходимости использовать сложные команды в терминале.
Основные функции:
🟡Трансляция экрана — просмотр изображения с устройства в реальном времени 🟡Файловый менеджер — удобное управление файлами на устройстве 🟡Менеджер приложений — простая установка и удаление приложений 🟡Мониторинг процессов — отображение текущего состояния системы 🟡Инспектор макета — отладка пользовательских интерфейсов 🟡Мониторинг производительности: CPU, память и FPS 🟡Просмотр логов и интерактивный терминал
Поддерживаются Windows, macOS и Linux — достаточно скачать установщик и запустить
Когда вы хотите, чтобы ваш API-сервис быстро начал работать с Claude и другими AI-ассистентами по протоколу MCP, стоит обратить внимание на MCP Gateway — это open-source инструмент, позволяющий интегрировать существующий API без изменения кода.
Основные возможности:
🟡Преобразование текущего API в MCP-сервис без единой строчки изменений в коде; 🟡Простая настройка через YAML-файл; 🟡Поддержка любых сред — bare metal, виртуалки, Kubernetes — без необходимости менять инфраструктуру; 🟡Встроенный web-интерфейс для управления — легко начать использовать; 🟡Поддержка MCP SSE и HTTP стриминга для более плавного взаимодействия; 🟡Лёгкая и производительная архитектура с акцентом на высокую доступность.
Можно развернуть за считанные минуты с помощью Docker — удобное решение для разработчиков, которым нужно быстро адаптироваться под протокол MCP.
На GitHub появилась мощная MCP-серверная реализация для браузерного краулера — Browserbase MCP Server.
С его помощью Claude может напрямую управлять веб-браузером: не только извлекать контент со страниц, но и выполнять навигацию, делать скриншоты, кликать по элементам и заполнять формы.
Основные возможности:
🔸Создание и управление сессиями облачного браузера
🔸Навигация по страницам и извлечение данных
🔸Скриншоты всей страницы или отдельных элементов
🔸Клики по элементам и заполнение форм
🔸Выполнение JavaScript-кода
🔸Поддержка параллельных сессий браузера
Достаточно клонировать репозиторий и установить зависимости. Поддерживаются MCP-клиенты, такие как Windsurf, Claude и Cursor. После настройки — готово к использованию.
Ранее уже делились множеством инструментов для извлечения текста из PDF с помощью OCR, но у них часто бывают проблемы — сложная настройка, низкая точность и т.д.
Сегодня — AI-инструмент для обработки документов без OCR: No OCR.
Просто загрузите PDF — и можно искать или задавать вопросы по содержимому сразу нескольких документов, без использования традиционного OCR. Это значительно повышает эффективность анализа документов.
Ключевые возможности:
🔸Создание и управление PDF/документами, организованными по "кейсам" 🔸Автоматическая генерация датасета в формате Hugging Face 🔸Поиск по страницам PDF и изображениям с помощью векторного поиска (на базе LanceDB) 🔸Визуальный вопрос-ответ по изображениям и графикам с помощью Qwen2-VL 🔸Поддержка гибридного поиска: текст + визуальные данные
Поддерживается быстрая установка через Docker, есть подробная инструкция по развёртыванию и разработке.
Это весьма полезный MCP-сервер, который позволяет нашим AI-ассистентам получать профессиональные возможности визуализации данных.
С помощью MCP можно прямо в ходе AI-диалога генерировать более 15 видов высококачественных графиков: столбчатые диаграммы, линейные графики, круговые диаграммы и другие. Для визуализации используется фреймворк AntV.
Поддерживается такими MCP-клиентами, как Claude, Cursor, Cherry Studio. При необходимости можно подключить и настроить.