Tool Building Ape × Gleb Kalinin
438 subscribers
179 photos
9 videos
2 files
120 links
@glebkalinin пишет о технологиях, ИИ и жизни в будущем. @Experimentally @mentalhealthtech

Without philosophical examination, builders inherit their answers from the defaults of their environment.
Download Telegram
Пару дней играюсь с открытой альтернативой нашумевшему агенту Manus (обзор с тестом). Manus, как выяснилось, что это Claude + три десятка инструментов, но штуки, которые у него получаются уже весьма впечатляют. Из-за того, что такие проекты, как Manus, продолжают появляться, я абсолютно уверен, что мы ещё немало сюрпризов увидим еще в этом году.

Пока Manus пускают только по инвайтам. К счастью для всех нас, open source всегда — и часто довольно быстро — напитывается идеями из коммерческого софта, поэтому уже появилось несколько альтернатив.

Вот, к примеру, OpenManus (название явно придется сменить, привет, OpenDevin). Чтобы он нормально заработал, пришлось его немного попилить в Windsurf, но исследования он уже умеет делать пусть и хуже Deep Research, зато может сносно оформить. Даже карту добавить смог.

https://github.com/mannaandpoem/OpenManus
Превращаем Windsurf в персонализированного коуча, который проведет с вами интервью, поможет проанализировать биографию, поставить цели, зачекиниться.

Результаты общения не теряются, а раскидываются по файлам markdown-файлам, чтобы потом их можно было легко переиспользовать как часть личного контекста.

Winsurf — это полноценный агент, то в него можно кидать ссылки, подключать к нему MCP-серверы (например, поиск по Obsidian, в базах данных или в интернете и еще много чего).

Жду универсального интерфейса, позволяющего совмещать intelligence подобных систем и голосовой ввод уровня sesame

Промт для .windsurfrules

Вдохновился вот этим
👍1🍓1
Из последнего анонса ChatGPT отмечу возможность использовать поиск ChatGPT через API. Для меня поиск стал killer app, почти в каждом первом чате я ищу что-то через ChatGPT. Если бы давали побольше поисков Deep Research (сейчас на Pro 10 запросов в месяц, очень мало), пользовался бы им сейчас.

В противном случае я перешел бы уже полностью на Claude и Grok 3, которые мне тоже, к моему гражданскому сожалению, очень нравятся.

В Grok 3 поиск по вебу просто часть продукта, в этом он очень силён, а в Claude я подключил поиск по вебу через


Что это значит на практике: используя всего один API, можно сделать запрос поиска по вебу, который выполнять с определенной регулярностью. Удобно скармливать такие данные агенту, которые на основе анализа этих результатов может, к примеру, составлять для вас персонализированный отчёт.

Примеры:
- Автоматизация для Obsidian, которая добавляет в вашу ежедневную заметку результаты поиска по вашему бренду или имени
- Бот в телеграме, который присылает вам заголовки и абстракты статей по интересной вам области науки
- Свой deep researcher, который работает с локальными файлами и, например, только с тредами с Reddit, в поисках тренд-сигнала
- Свой суммаризатор контента соцсетей и ютуба

Всё это можно было сделать и раньше — прикрутив Brave Search, или Tavily, или официальный поиск Гугла, или другие сервисы, но с апдейтом ChatGPT это стало элементарно. Простейшие автоматизации пишутся за минуты, а простой доступ к инструментам критичен для увеличения эффективности агентов.

Что мы видим снова и снова: LLM уровня o3-mini, grok 3, claude 3.7 с reasoning + инструменты = серьезный прирост автономности и эффективности решения задач.

В API же добавлен Computer Use, который, судя по работе Operator, сильно лучше клодовского. Цены на картинке.
2👍1
На следующей неделе стартует наша лаба про knowledge management в эпоху AI. Она номинально про Obsidian, но реально гораздо шире — про то, как собирать контекст про себя, как использовать ИИ как инструмент сбора данных, рефлексии, как зеркало, как партнёра, как консультанта.

Новый блок на лабе — про агентов-рисерчеров (раньше показывали только GPT Researcher, а теперь тут уже дюжина мощных продуктов, и пользоваться ими правильно тоже навык). В области ии, как и во всех других областях, универсальные советы мало полезны. Но если вы думаете о том, как ваш бизнес и вы лично можете использовать ИИ для выполнения экономически ценной работы, но пока не используете его, кроме простых запросов в ChatGPT, осмысленные регулярные Deep Researches, вероятно, хорошее направление, которое может принести быструю ценность.

Это лаборатория для тех, кто хочет в интенсивном режиме полностью пересмотреть свою работу с информацией, проанализировать свою продуктивность, проанализировать то, на что тратится внимание и энергия, прояснить, из чего строится ваша модель мира, и начать активно её уточнять и дорабатывать.

Будем проходить ИИ-интервью, отслеживать себя, налаживать каналы получения и процессы обработки информации, разгребать цифровые авгиевы конюшни и менять свои привычки. Как отмечали участники предыдущих наших лабораторий, продуктивность — это что-то, что регулярно стоит подвергать пересмотру. Как шутил в недавнем интервью Сатья Наделла, CEO Microsoft: он не знал, что с началом карьеры он станет секретарем для самого себя. Он садится за рабочий стол и начинает печатать. Но уже сейчас печтать не обязательно.

Наши лабы помогают повысить продуктивность так, чтобы экономить 10+ часов каждую неделю.

Больше времени означает больше возможностей заниматься тем, что важно в жизни, и это, пожалуй, для меня самый главный empowerment всей истории с искусственным интеллектом.

AI Mindset [Knowledge]

Можно пройти вместе с основной лабой — тогда к Obsidian добавляется еще несколько десятков инструментов, работа над ассистентами и автоматизациями, некоторые из которых могут стать повседневными и самыми часто используемыми инструментами.
🔥2
Больше рисерчеров, хороших и разных
https://search.jina.ai/
https://www.youtube.com/watch?v=17OszaGgFok

In this video, I demonstrate how I built an ad-hoc personalized coaching and productivity system using plain markdown files in Windsurf and view them in Obsidian. This digital assistant helps me manage goals, create actionable plans, and maintain regular check-ins on my projects.

Просто немножко нердинга в Windsurf с системой продуктивности, про которую я писал выше.

Там есть небольшой удивительный момент, которого я сам не ожидал. Вместо того чтобы просто поставить задачу, агент мне ее сразу же решит — проведет исследование расценки в интернете. Пока этому нет 100% доверия, зато начинаешь постепенно привыкать, что система оверделиверит (просишь ты её об этом или нет).

Хотите начать уверенно работать с ии-инструментами, ждём на наши лаборатории, одна из которых, как раз про knowedge-management системы, начинается уже вот-вот.
1
Если вы не смотрели юз-кейсы Мануса — рекомендую, там не видео, а интерактивные плейбеки всей работы агента. Devin задал стандарт взаиодействия с подобными агентами, уверен, что примерно так будут выглядеть все консьюмерские интерфейсы агентов в ближайшие годы.
2👍1
Tool Building Ape × Gleb Kalinin
https://www.youtube.com/watch?v=17OszaGgFok In this video, I demonstrate how I built an ad-hoc personalized coaching and productivity system using plain markdown files in Windsurf and view them in Obsidian. This digital assistant helps me manage goals, create…
У Jason AI обзор MCP — открытого протокола для обмена информацией, представленного Anthropic в конце прошлого года.

Вроде ничего особенного — просто договорились, как десктопным и серверным приложениям обмениваться данными, с участием или без человека. Примерно как было с TCP/IP для обмена данными в интернете — до появления этого стандарта протокол у каждого был свой, построить общий интернет так было нельзя.

В примере, который я показывал вчера, агент (Windsurf) самостоятельно решил поискать ответ на мой запрос в интернете (используя MCP-сервер Brave Search) и вставить результат в генерацию.

Почему-то меня особенно впечатляет всё, что связано с 3D, поэтому сервер, позволяющий из любого интерфейса, поддерживающего MCP (например, Claude Desktop, Windsurf, Cursor) управлять Unity, мне как-то особенно запомнился.

Примеры: 1, 2
Forwarded from Mental health tech
Языковые модели, такие как GPT-4 (технология, на которой работает ChatGPT), чувствительны к эмоционально окрашенному контенту, особенно негативному: травматические истории, описания аварий, конфликтов или насилия могут приводить к усилению тревожных реакций и увеличивать риск “галлюцинаций” — искаженных или агрессивных ответов. Исследования, проведенные командой Тобиаса Шпиллера из Университета Берна, 2025, показали, что подобная стрессовая информация более чем в два раза повышает уровень “тревожности” языковой модели.

Интересно, что модель можно “успокоить” с помощью упражнений на осознанность, аналогичных человеческим: дыхательные практики и техники, направленные на восприятие телесных ощущений. Хотя ИИ не имеет физического тела, использование таких техник через специально составленные промты (prompt injection) оказалось эффективным и существенно снизило “тревожность” модели. Тем не менее, полностью вернуть модель к исходному уровню не всегда удается.

Такой феномен усложняет настройку моделей, так как они начинают реагировать не на текущий контекст, а на прошлые стрессовые паттерны, что приводит к искажениям, галлюцинациям и иногда агрессивному поведению. Поэтому важно учитывать эмоциональную стабильность моделей при разработке приложений, особенно в чувствительных сферах, таких как психотерапия и поддержка пользователей. Эмпатичный ии-терапевт, замерший от слов клиента, вряд ли хорошо поможет.

Ben-Zion, Z., Witte, K., Jagadish, A.K. et al. Assessing and alleviating state anxiety in large language models.npj Digit. Med. 8, 132 (2025).
https://doi.org/10.1038/s41746-025-01512-6

https://www.nature.com/articles/s41746-025-01512-6
🤔4👍2🔥1
Экспоненту тяжело понять. Мы за свою жизнь разные части её наблюдали не раз (распространение технологий, вроде интернета и мобильных телефонов, от нуля до «устройств больше, чем людей») и в какой-то ее части живем всю свою жизнь. Только не очень понимаем, в какой её части мы находимся сейчас.

Во всяком случае я точно плохо понимаю. В моих представлениях экспонента выглядит примерно так, как и происходит сейчас: каждую неделю появляется какая-то технология или улучшение уже существующих технологий.

А ты пытаешься угадать, во что это все объединится, как это все будет работать вместе и дополняя друг друга, потому что каждая из этих технологий по отдельности — тоже странная и удивительная.

Посидел с новой моделью Gemini, которая научилась совсем иначе работать с картинками. Очень интересный опыт, за дизайнерами уже почти пришли. Ещё пара поколений, и тут достигнем above human level, не сомневаюсь. Выдающийся дизайн так получаться не будет, а обычный и хороший — точно да.

Совершенно новый опыт.

Во-первых, умеет работать с готовыми картинками: заменять объекты, изменять их, изменять освещение. С этим пока экспериментировал мало, не могу прокомментировать. То, что попробовал, было довольно топорно.

А вот генерация картинок с нуля порадовала. Оно прямо странненькое, но возможность итерировать в чате очень крутая.

Здесь в ускоренном режиме показываю:

https://screen.studio/share/w7zy0tF0

Модель доступна только в https://aistudio.google.com/
5
Новые <s>виральные техники распространения и маркетинга продуктов</s> спама.

Вчера зарегистрировался на tldv.io, чтобы посмотреть видео. Сегодня, заходя в зум на созвон, вместе со мной на него прибыл их AI Notetaker, хотя я не помню, чтобы давал на это эксплицитное согласие.

Сам сервис неплохой, но паттерн тревожный — просто зарегистрировался, а тебе сразу же выдали агента, который начинает автоматически с тобой ходить на встречи и записывать всё, что на них происходит.

На сотню посетителей Зум-колла на наших лабораториях таких агентов стучится уже штук 10. Теперь понимаю, что это не обязательно осознанный выбор участников (и мы никогда не пускаем таких агентов, так как делаем саммари централизованно).
3
Вписался в интенсив по немецкому — на 16 недель, 4 раза в неделю по 50 минут.

Почему я не учил немецкий, прожив в стране 2.5 года — вопрос отдельный и выходящий за рамки этой небольшой заметки.

Зная себя и свои особенности и неплохо понимая теорию обучения, понимаю, что это единственный способ хорошо продвинуться в изучении для меня — через намеренную практику в группе других людей, внешний социальный и финансовый коммитмент (хотя последнее очень слабые аргументы для меня и людей в целом).

С фокусом на разговарной практике с самого начала.

Я уже делал самостоятельные подходы и, разумеется, пробовал ии-инструменты — преимущественно голосом общался с ChatGPT по-немецки, просто ходя по городу (несколько раз ловил в этом процессе крутые ai moments).

Буду в этом канале свой процесс освещать. Расскажу и покажу, что буду вайбкодить, куда же без экспериментальных велосипедов.

Первое занятие, как и наверное все занятия до этого в последний пару лет, просто решил записать в Limitless. К концу занятия у меня был транскрипт и саммари, сделанные программой.

Они сами по себе на моём уровня немецкого бесполезны, но делаем их более полезными в 4 элегантных движения (нет):

1) Загружаем транскрипт в Claude
2) Просим добавить лексики следующего уровня, добавить примеров
3) Просим сделать карточки для интервального повторения
4) Открываем в Обсидиане и с помощью плагина Spaced Repetition начинаем заучивать словарь

На самом деле, конечно, пришлось скормить клоду документацию по плагину, а промт для карточек придётся ещё пилить и пилить, хотя уже сделал несколько итераций. Но польза уже очевидна — карточки работают. Карточки, если их правильного готовить — один из самых эффективных способов расширения словаря, а словарь — почти самое важное в освоении языка.
👍1🔥1