GitHub Разработчика
17.1K subscribers
659 photos
365 videos
2 files
1.01K links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Можно управлять телефоном через обычный текст: пусть AI сам смотрит на экран, нажимает кнопки и выполняет задачи. Но текущие инструменты автоматизации либо требуют писать скрипты, либо умеют только жёстко заданные сценарии.

Один разработчик выложил в open source проект PhoneDriver. Он работает на визуальной модели Qwen3-VL, умеет понимать, что на экране телефона, и имитировать действия человека.

Достаточно просто описать задачу, например: "Открой настройки и включи Wi-Fi". Модель сама анализирует элементы интерфейса и через команды ADB выполняет клики, свайпы или ввод текста.

Есть визуальный веб-интерфейс: можно в реальном времени смотреть скриншоты с телефона и логи выполнения.

Также поддерживается автоопределение разрешения экрана, плюс можно настраивать параметры модели, задержку действий, число ретраев и т.д.

Для деплоя в основном нужны Python и окружение ADB. Ещё нужна видеокарта с достаточным объёмом VRAM, чтобы тянуть 4B или 8B визуальную модель, а на телефоне должен быть включён USB Debugging.

Если хочется пощупать, как AI-агент реально рулит физическим устройством, или есть задачи по автотестам, проект точно стоит попробовать.

📁 Language: #Python100.0%

⭐️ Stars: 840

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
6💊1
This media is not supported in your browser
VIEW IN TELEGRAM
watchtower

Хочешь быстро понимать, что происходит в мире или на рынках, но в браузере слишком много инфы и непонятно, что читать, а профессиональные развед-инструменты слишком сложные.

Недавно нашел Watchtower: максимально минималистичный терминальный "инфо-дашборд", который сжимает мировые новости прямо в командную строку.

Он агрегирует глобальные RSS-источники, показывает данные по крипте и акциям в реальном времени, и даже умеет выводить локальную погоду.

Еще он может дергать AI и делать дневной дайджест новостей, поддерживает несколько моделей: Groq (бесплатно), OpenAI, Deepseek, Gemini и другие.

Источники данных в основном на бесплатных публичных API. API Key нужен только для AI-сводок, конфиг хранится локально и никуда не отправляется.

Можно быстро поднять через Docker. Хорошая штука для тех, кто не хочет вылезать из терминала, но хочет держать руку на пульсе внешнего мира.

📁 Language: #Go 96.4%

⭐️ Stars: 62

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31💊1
transcribee

Когда натыкаюсь на полезные видео на YouTube или TikTok и хочу разобрать контент в текстовые заметки, чтобы потом гонять это через AI, вручную конспектировать слишком выматывает. А существующие инструменты обычно требуют по одному экспортировать и раскладывать все руками, что жутко неудобно.

Можно попробовать вот это: transcribee, open-source тулза, которая одной командой превращает видео или аудио в текст и автоматически раскладывает все по базе знаний.

Поддерживает ссылки на YouTube, Instagram и TikTok, а также умеет обрабатывать локальные аудио- и видеофайлы. После транскриба она автоматически определяет разных спикеров и использует Claude, чтобы проанализировать темы и разнести материалы по соответствующим папкам.

Например, если прогнать пачку видео про AI-исследования, интервью со стартапами и health-образование, инструмент сам создаст под Documents категории вроде AI-Research, Startups и Health, а для каждого видео сделает отдельную директорию, где будут храниться текст транскриба и метаданные.

Сгенерированный текст уже размечен по спикерам, так что его можно сразу копипастить в ChatGPT или Claude и задавать вопросы.

Если ты часто смотришь обучающие видео или собираешь материалы и хочешь превращать это в поисковую базу знаний с Q&A, эту тулзу точно стоит попробовать.

📁 Language: #TypeScript 96.8%

⭐️ Stars: 160

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62💊1
claude-usage-bar

Это инструмент для отображения текущего использования лимитов Claude в строке состояния.

Он показывает количество использованных токенов, оставшийся бюджет, скорость расхода и время до истощения ресурсов в реальном времени.

Интегрируется с tmux и zsh, позволяя отображать информацию непосредственно в статусной строке или командной строке.

Обновления происходят автоматически, обеспечивая актуальность данных без необходимости ручного вмешательства.

📁 Language: #Svelte 34.4%, #Rust 32.1%

⭐️ Stars: 79

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3
map-to-poster

Один приятель с нестандартным мышлением запилил опенсорсное приложение, которое полностью работает в браузере: в нем можно генерить постеры-карты в разных стилях для любой точки мира:

Приложение предлагает различные темы и макеты, а также предоставляет опции экспорта для удобного сохранения созданных постеров.

Работая полностью на стороне клиента, MapToPoster обеспечивает быструю и безопасную обработку данных без необходимости передачи информации на сервер.

📁 Language: #JavaScript 65.2%

⭐️ Stars: 622

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
7
CPA-Dashboard

Руки чешутся: накупил кучу аккаунтов Gemini, Claude или Antigravity, повесил их на CLIProxyAPI и гоняю сервис.

Самое больное: непонятно, какой аккаунт уже отвалился, и сколько у кого осталось квоты. Каждый раз лезть в логи и выискивать это вручную, дико неэффективно.

Случайно наткнулся на проект CPA-Dashboard. Это визуальная панель управления, заточенная специально под CLIProxyAPI: вместо холодного CLI получаешь понятный веб-интерфейс.

Что умеет:

- В вебе прямо включать/выключать сервисы
- В реальном времени смотреть runtime-логи
- Самое полезное: пачкой обновлять квоты аккаунтов, автоматически детектить и помечать протухшие аккаунты, которым нужен повторный логин
- Есть интеграция OAuth-флоу: чтобы добавить новый аккаунт, не надо в терминале набивать сложные команды, пару кликов и готово

Есть one-click скрипты запуска для Windows, macOS и Linux: они сами поднимут Python-окружение, поставят зависимости и подхватят существующий конфиг, так что можно сразу стартовать.

Если ты на CLIProxyAPI строишь свой AI API-сервис, эта панель реально экономит кучу времени на поддержке, стоит задеплоить.

📁 Language: #HTML 51.3%, #Python 42.5%

⭐️ Stars: 212

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM