Дрессировщик Нейросетей
8.25K subscribers
94 photos
3 videos
1 file
83 links
Внедряю цифровой разум в реальные задачи.
YouTube: https://www.youtube.com/@Handler_AI
Автор: @Flytoo
Download Telegram
5 НЕДООЦЕНЁННЫХ ИНСТРУМЕНТОВ ДЛЯ AI-АГЕНТОВ

Составил подборку инструментов для Claude Code и не только. Большинство работают с любым AI-агентом. На мой взгляд - очень недооценённые.

1. Autoresearch
Андрей Карпати сделал штуку для автономных экспериментов. Агент меняет код, гоняет тесты, оставляет то что работает лучше, откатывает что хуже. И так по кругу. 70K звёзд на GitHub.

2. Codex
Плагин OpenAI внутри Claude Code. Отлично экономит токены и хорош в аудите кода - модель не будет ругать собственный код, а вот другая модель ещё как будет.

3. Agent Browser
Автоматизация браузера для AI-агентов. Позволяет автоматизировать браузер и тратит меньше драгоценных токенов по сравнению с другими решениями.

4. NotebookLM CLI
У NotebookLM нет API - и это боль. CLI решает проблему: закинул источники, получил структурированный ответ, всё из терминала. Анализ документов и видео ложится на серверы Google, а не на ваши токены.

5. Google Workspace CLI
Для тех кто работает с сервисами Google - мастхэв. Разработчики Google сделали CLI для Gmail, Calendar, Drive, Docs. В комплекте не только сами инструменты, но и готовые скиллы под каждый сервис.

Все пять объединяет одно - они экономят токены и делают рутину за вас. Экосистема вокруг AI-агентов растёт быстрее чем успеваешь следить, но именно эти инструменты реально заходят в ежедневную работу.

Кто чем пользуется из расширений? Может я что-то упустил?
👍37🔥158👎1
ANTHROPIC СЛОМАЛИ CLAUDE CODE. ИЛИ НЕТ?

Последние недели мне всё чаще пишут: "Клод кончается за час работы, что происходит?"

Попытался разобраться. Картина интересная.

Пользователи Max x5 ($100/мес) массово жалуются: лимит улетает за 1.5 часа при умеренной работе. Anthropic признали - "люди исчерпывают квоту намного быстрее, чем ожидалось, это приоритет №1 для команды". (The Register)

Официального объяснения так и нет. Зато сообщество само взялось за расследование - реверс-инжиниринг бинарника, перехват трафика, диагностические скрипты. Нашли несколько причин: баги в кешировании, целенаправленное замедление в часы пик (Anthropic подтвердили), и самое дикое - у одного пользователя система намолотила 650 000 токенов без единого его запроса. Просто так, фоном. (GitHub)

Параллельно 6 марта тихо срезали TTL кеша с 1 часа до 5 минут. Без анонса. Простым языком: раньше Claude "помнил" контекст вашего разговора час - и не тратил на это квоту. Теперь память сбрасывается каждые 5 минут, и всё пересчитывается заново. За ваш счёт. (GitHub)

Борис Черны - создатель Claude Code - ответил лично. Коротко: "работаем, чтобы выжать из квоты больше". Без признания конкретных проблем.

Моё мнение: у Anthropic банально не хватает серверов. Claude Code взорвался по популярности - это реально лучший AI-инструмент прямо сейчас, и пользователей прибавляется каждый день. Параллельно они тестируют Claude Mythos - новую модель, настолько мощную, что публично её вообще не выпустили (только для 40 компаний вроде Apple, Amazon, Microsoft). (TechCrunch) Спрос растёт, Mythos жрёт ресурсы - на всех просто не хватает.

Скорее всего впереди подорожание. Либо новый план дороже $200, либо что-то еще придумают.

Вы сейчас используете Claude Code? Замечали что лимиты стали улетать быстрее?
32👍19🔥8👎2
КОГДА ИИ УЧИТ ТЕБЯ СЛЫШАТЬ МИР

Вышел утром с собакой. Семь утра, природа давно проснулась - птицы начинают петь с первыми лучами, задолго до будильника. Вокруг заливаются голоса, и я знаю каждого из них по имени.

Уже полгода пользуюсь Merlin - бесплатное приложение от Корнеллского университета. Нажимаешь одну кнопку, и оно в реальном времени определяет птиц вокруг тебя по голосу. ИИ-модель обучена на миллионах записей птичьих голосов со всего мира.

Сегодня за 15 минут прогулки - 8 видов. Чёрный дрозд, зарянка, зяблик, коноплянка, поползень, овсянка, певчий дрозд, полевой жаворонок.

И вот что зацепило: в приложении показывает, что более 13 тысяч человек слушают птиц одновременно с тобой. По всей планете.

Работает офлайн, ничего не стоит. Друзья., рекомендую - попробуйте на ближайшей прогулке. Это тот случай, когда ИИ не заменяет реальный мир, а возвращает тебе внимание к нему!

А вы знаете, кто поёт у вас за окном прямо сейчас?

Merlin Bird ID
🔥71👍3919🕊31
🔥 Новое видео на канале!

Помните ролик про экспорт Telegram в NotebookLM? Тот, что собрал 150K+ просмотров. В комментах все спрашивали одно и то же: «А закрытые каналы? Там же нет кнопки экспорта».

Ну вот, разобрался.

В новом видео показываю, как заставить Claude Code выкачать все сообщения из закрытого Telegram-канала и собрать из них самообновляемую базу знаний по методу Андрея Карпати. Без кода. Вообще.

▶️ https://youtu.be/DzBdeHauw6c?is=XWls6kQO2lCJj4on

Что внутри:
— Telegram MCP на Telethon + Claude Code
— как безопасно настроить (виртуальный номер, отдельный аккаунт)
— Wiki Base skill — LLM сам строит вики с бэклинками
— готовый workflow, который можно повторить за вечер

Инструменты из видео:
📦 Telegram MCP (Telethon)
📦 Karpathy LLM Wiki
📦 Claude Code
📦 my.telegram.org

📎 Мой Wiki Base skill прикреплю первым комментарием к этому посту — забирайте и пробуйте.

Спасибо, что смотрите и делитесь пользой 🙏
9🔥90👍3019👏4
НОВОСТИ СЫПЯТСЯ КАК ИЗ ВЕДРА

За один день индустрия выдала столько, что голова кругом.

Anthropic выкатили Claude Opus 4.7 - новую флагманскую модель. У меня 4.7 гораздо лучше слушается инструкций и почему-то у меня ест меньше лимитов чем 4.6, хотя у модели новый токенизатор. Распознавание картинок теперь в высоком разрешении - должно подтянуть качество. Ещё у меня модель начала отвечать в женском роде - наверно побочный эффект для русского языка.

Anthropic серьёзно обновили десктопное приложение Claude Code - боковая панель с сессиями, встроенный терминал, редактор файлов с диффами, drag-and-drop. Появились Routines - автоматизации по расписанию или по событиям из GitHub. Если кто-то раньше боялся командной строки - самое время попробовать. Сейчас это уже полноценная IDE, а не просто терминал. Тут, конечно, видно что подсматривают у Codex - но конкуренция только на пользу.

OpenAI тем временем превратили Codex в суперприложение. Объединили ChatGPT, Codex и браузер в одну оболочку, добавили 90+ плагинов, генерацию картинок, Computer Use. Открыли доступ на всех тарифах, включая бесплатный - явно борются за каждого пользователя и хотят откусить побольше у Anthropic.

Гонка идёт нешуточная. Anthropic выпускают модель и обновляют десктоп - OpenAI тут же отвечают суперприложением. Темп такой, что если на день отвлёкся - уже отстал.

Признавайтесь, у кого тоже FOMO от скорости обновлений?
2🔥61👏12👍9💯9🤯2
OPENAI ТИХО ВЫЛОЖИЛИ ШТУКУ, КОТОРУЮ МНОГИЕ ПРОСПАЛИ

Вчера OpenAI выпустили GPT-5.5 - всё внимание туда. Но за день до этого они опубликовали кое-что, что касается каждого, кто хоть раз вставлял рабочий документ в ChatGPT.

Privacy Filter - открытая модель, которая находит и маскирует персональные данные в тексте. Имена, адреса, телефоны, email, номера карт, API-ключи - вычищает до того, как текст уйдёт в облако.

Зачем это обычному человеку? Вспомните, сколько раз вы копировали в ChatGPT рабочую переписку с именами коллег. Скидывали договор с паспортными данными. Вставляли таблицу с телефонами клиентов. Просили разобрать выписку из банка. Все эти данные улетели на серверы.

Privacy Filter работает на вашем компьютере. Данные никуда не уходят. Модель проходит по тексту, заменяет "Иван Петров" на PRIVATE_PERSON, номер карты на ACCOUNT_NUMBER - и дальше отправляете уже чистый текст в любую нейросеть. Спокойно.

Хотите попробовать без установки? На Hugging Face есть демо - можно вставить текст прямо в браузере и посмотреть как работает.

Модель специально спроектирована маленькой: 1.5 миллиарда параметров, но активных только 50 миллионов. Внутри 128 экспертов, из которых на каждый токен работают только 4. Документ на 300 страниц проходит за один прогон. На MacBook с чипом M4 работает быстро - средний документ за 1-2 секунды.

Точность - 96% F1 на бенчмарках (precision 94%, recall 98%). Важный нюанс: модель заточена под английский. На кириллице и не-латинских скриптах качество падает. OpenAI это честно пишут в документации. Но модель можно дообучить под свой язык и домен - инфраструктура для файнтюна идёт в комплекте. Лицензия Apache 2.0 - бесплатно, можно коммерчески.

Честно, от OpenAI я ожидал чего угодно, но не open source инструмент для защиты приватности. Видимо, устали от критики, что люди сливают свои данные в ChatGPT. И ответили: вот вам фильтр, ставьте локально, чистите перед отправкой.

А вы задумывались, сколько личных данных уже скормили нейросетям?

Источник
👍56🔥228👎1
РАСШИФРОВАТЬ СВОЙ ГЕНОМ НА КУХОННОМ СТОЛЕ

Чувак расшифровал свой геном дома. Буквально на кухонном столе. У него в семье аутоиммунное заболевание, и он захотел разобраться в генетике, не сдавая ДНК сторонним компаниям типа 23andMe.

Как это выглядит:
- Берёшь мазок со щеки
- Извлекаешь ДНК с помощью набора реагентов
- Загружаешь в секвенатор MinION - коробочка размером с флешку, которая протягивает нить ДНК через нанопору и по изменению электрического тока считывает буквы генома
- Нейросеть переводит сигнал в последовательность A, C, G, T
- Софт сравнивает твой геном с эталонным и находит отличия

72 часа от мазка до результата. Руками работаешь около 4 часов. Остальное машина считает.

Из железа: секвенатор Oxford Nanopore MinION ($3,200, многоразовый), расходники ~$1,100 за запуск (flow cell $900 + реагенты) и Mac с чипом M3 или выше.

А теперь самое интересное - роль AI.
Автор использовал Claude, чтобы составить список генов для прицельного анализа. Описал семейный анамнез, попросил сгенерировать файл с координатами нужных генов на хромосомах. 5 минут диалога вместо часов ковыряния в геномных базах данных. Сам называет это "one of the best uses of an LLM".

И это только начало. В комментариях на Hacker News основатель Stripe Патрик Коллисон рассказал, как с помощью AI-агентов исследовал мутации в своём геноме и подобрал прицельные медицинские тесты. Раньше для этого нужен был биоинформатик с учёной степенью. Сейчас - диалог с моделью, которая знает геномику, фармакогенетику и умеет читать клинические базы.

AI тут меняет правила игры: железо для секвенирования уже доступно, данные открыты, но без специалиста разобраться в 3.2 миллиардах букв генома было нереально. Теперь специалист не нужен. Claude, GPT, Gemini - они становятся персональным генетическим консультантом для тех, кто готов копнуть глубже.

Справедливости ради: заказать полное секвенирование через сервис стоит $379-399. В 11 раз дешевле. Но автору было принципиально, чтобы его ДНК не покидала дом, а сам процесс был под полным контролем.

Для контекста: проект "Геном человека" завершился в 2003 году. 13 лет работы, $3 миллиарда. Сейчас то же самое - на кухне, за 72 часа. А AI делает результат понятным без учёной степени.

Как думаете, через сколько лет домашнее секвенирование станет таким же обычным как тест на давление?
👍4017🔥16👎1🤯1
КАК РАБОТАТЬ КОГДА ТЕБЯ ЗАБАНИЛ КЛОД

28 апреля Anthropic снова прокатилась волной банов. Под раздачу попали преимущественно пользователи из России. Официальная причина - "suspicious patterns / нарушение TOS", конкретики ноль.

Делюсь тем, что реально работает как замена.

ChatGPT / Codex
По наблюдениям комьюнити, $20 подписка по лимитам кодинга примерно равна Claude Code за $100. А 9 апреля OpenAI выкатили новый план за $100 - там 5x лимиты от базового и до 31 мая 10x по Codex. Плюс у них сейчас очень интересная десктопная версия приложения.

Честно скажу - это только моё мнение: GPT-5.5 чуть меньше доверяю чем Opus 4.7. Сам использую её в основном для ревью кода и альтернативного взгляда на задачу. Но как замена на ежедневную работу, когда Claude недоступен - вполне годится.
codex.openai.com

Kimi K2.6
Вышла 20 апреля. Комьюнити в целом довольно - сравнивают с уровнем Claude Code версий 4.5-4.6, то есть уже серьёзно. Тарифы с Kimi Code CLI: $19/мес (базовый) и $39/мес - там 150 agent tasks, 50 Agent Swarm и 5x кредитов на код. По отзывам в лимиты упереться сложно даже при активной работе.

Есть интересный вариант: использовать Kimi как backend прямо внутри привычного Claude Code. Интерфейс остаётся тот же, модель под капотом уже Kimi. Как настроить - разбирали в чате.

Кто уже переехал с Claude - куда ушли и как впечатления?
👍286🤡1
КАК ПРАВИЛЬНО СТАВИТЬ ЗАДАЧИ НЕЙРОСЕТИ

Большинство людей всё ещё общаются с AI как со строкой поиска. Пишут короткие фразы, получают мусор, злятся.

Я пользуюсь рамкой КЗФО. Работает с Claude, Codex - с любым агентом.

К - контекст. Кто ты, что за проект, какие вводные. Модель не знает ничего кроме того что ты написал.

З - задача. Что конкретно нужно сделать. Один глагол, один результат.

Ф - формат ответа. Список, таблица, код, абзац. Если не сказать - сам решит.

О - ограничения. Что нельзя, какой объём, какой стиль, какие исключения.

И в конце добавляю одну фразу: «Уточни, правильно ли ты меня понял, и если необходимо задай дополнительные вопросы». Это не вежливость - это проверка. Если модель пересказывает не то - исправляю до того как она начала делать.

OpenAI недавно выпустили гайд по промптингу GPT-5.5 - и там прямо пишут: старые инструкции на 500 строк работают хуже. Новые модели умнее, им нужен результат, а не маршрут. Anthropic в своём официальном руководстве говорят то же самое: контекст и пример лучше длинного технического описания.

С агентами (Claude Code, Codex) это важнее вдвойне. Агент принимает решения сам. Если ты прописал каждый шаг - ты не агенту задачу даёшь, ты пишешь скрипт с лишними шагами.

Попробуй добавить КЗФО к своему следующему запросу. Разница будет сразу.

А как вы обычно формулируете задачи для AI - коротко и надеетесь на лучшее, или пишете детальный промпт?
1🔥47👍2014🤔1
АНТРОПИК ВКЛЮЧИЛ ЗАДНИЙ ХОД

Последние месяцы - сплошные жалобы: лимиты Claude Code, баны за «слишком активную работу», задушенные запросы в пиковые часы. Люди переходили к ChatGPT, Kimi, Qwen. Что угодно, лишь бы работало.

Сегодня Anthropic объявил:
• 2x скорость Claude Code для тарифов Pro, Max, Team и Enterprise
• Убраны ограничения в пиковые часы - теперь утром и ночью одинаково
• Причина: новая сделка со SpaceX на вычислительные мощности

Давно пора. Думаю, конкуренция помогла принять решение чуть быстрее.

Забавный момент: мощности дал SpaceX. Не Google, не AWS. Маск вечно воюет с Альтманом и OpenAI в судах, но с Anthropic - другая история.

Вы уже заметили разницу в работе Claude, или пока без изменений?
👍2715🐳6💩2
КАЖДЫЙ ПЛАН КАЖЕТСЯ ОТЛИЧНЫМ. ДО МОМЕНТА КОГДА ОН ЛОМАЕТСЯ

Ты садишься, думаешь, расписываешь. Всё учтено. Запускаешь. И через три месяца смотришь: вот тут было очевидно, вот тут надо было остановиться, вот тут дыра лежала на поверхности.

Проблема не в том что ты плохо думаешь. Когда смотришь на план вперёд - мозг оптимистичен: достраивает недостающее, смягчает риски, находит причины почему сработает. AI-агент усугубляет: спросишь «это хороший план?» - он ищет причины сказать да. Он не говорит вот конкретно почему это сломается, пока ты не создашь правильный контекст.

Такой контекст называется premortem.

Что это

Метод разработал Гэри Кляйн - американский психолог, специалист по принятию решений в условиях неопределённости. Описал в Harvard Business Review в 2007-м. Даниэль Канеман - нобелевский лауреат по экономике, автор «Думай медленно, решай быстро» - назвал его своим единственным ценным инструментом принятия решений. Используют Google, Goldman Sachs, P\&G.

Принцип: не «оцени план», а «план уже провалился - расскажи как именно».

Один сдвиг в формулировке - и всё меняется. Исследование Mitchell, Russo, Pennington (1989): думать о событии как о уже случившемся повышает точность определения причин на 30%. Мозг переключается из режима «найди причины сказать да» в режим нарратива - выдаёт конкретные, честные ответы вместо хеджирования.

Как работает скил

Я упаковал метод в скил для Claude Code. 10-15 минут.

Скил читает файлы проекта, задаёт пару уточняющих вопросов - и запускает три AI-помощника параллельно. Каждый смотрит на план с другого угла: как клиент, как тот кто будет исполнять, как конкурент. Плюс обязательный вопрос - чьего взгляда нет в комнате вообще.

Получаешь 5-8 конкретных дыр. По каждой - не «вот риск, разбирайся», а решение с первым шагом и исполнителем. В конце - рекомендация: продолжать, снизить ставку, отложить или остановить. Если рекомендация осторожная - обратный запрос: «а если не сделаем, окажется что зря?» Чтобы не уйти в паранойю.

Сессия сохраняется. Через месяц перезапускаешь - видишь какие дыры закрылись, какие нет.

Для чего подходит

Запуск продукта или фичи. Изменение цены или модели. Анализ плана проекта до старта. Переговоры и партнёрства. Выход в новую нишу. Перед созвоном с инвестором. Перед подписанием договора.

По сути - перед любым моментом когда важно не пропустить то, что сам не видишь.

Репозиторий на GitHub

Бывало запускаешь что-то - и потом понимаешь что «вот же оно лежало на поверхности»? Что чаще всего пропускаешь?
👍50🔥128