Tool Building Ape × Gleb Kalinin
438 subscribers
179 photos
9 videos
2 files
120 links
@glebkalinin пишет о технологиях, ИИ и жизни в будущем. @Experimentally @mentalhealthtech

Without philosophical examination, builders inherit their answers from the defaults of their environment.
Download Telegram
Как хочется, чтобы работало.

Скинул транскрипт — получил карточки. Время затраченное: 30 секунд.
(Ну или ничего не скидываешь, конечно — просто закончилось занятие, карточки готовы)

Как на самом деле работает?

Скинул Клоду транскрипт, написал промт — получил карточки в формате, который не имеет отношения к тому, который тебе нужен.

Идешь пробовать, потом искать документацию. Начинаешь копировать кусочки документации. Оказывается, что их недостаточно, или это какие-то не те кусочки. Находишь нужные.

Работаешь над промтом, чтобы карточек было не слишком много, но при этом они были действительно полезные.

Удаляешь карточки руками и еще раз дорабатываешь промт. В результате все работает и достаточно качественно, но тебе нужно эту технологию «приготовить» — к счастью, только 1 раз. После, если ты не ленив, можно сделать проект с промтом и каждый раз получать карточки в нужном формате и с нужным набором примеров. Но вот с этим первым этапом многие не справляются, а AGI пока не наступил, и технологией, которой можно было бы пользоваться каждый день, пока пользоваться не получается совсем.

Но в новостях пишут об ускорении освоения этих инструментов большой аудиторией.

Возможно, уже к концу этого года мы увидим первый миллиард пользователей ии-продуктов (или уже? сложно посчитать), и уровень знаний людей об этих инструментах может значительно увеличиться.
Jack Dorsey (ex-Twitter) делает своего открытого агента-ассистента Goose.

Форбс вот пишет, что он становится важной частью ии-инфраструктуры (но мы не верим журналистам на слово, конечно).

Goose может генерить код, на Маке есть десктопное приложение, которое умеет пользоваться инструментами (доступ к файлам, скриншоты и так далее)

Пожалуй, больше всего напомнило OpenInterpreter, Aider, Claude Code, только с графическим интерфейсом (пусть и примитивным).

Это не Devin и не Manus, и пока он подтупливает — но выглядит любопытно. На последней картинки я попросил Goose сделать мне саммари обсуждения его самого — в первый раз он сгаллюцинировал, а во второй получилось неплохо.

Подключается Клод, ChatGPT, Groq.
1
Мои первые котики. Написал по поводу начала лаборатории скрипт, который ходит в апишку новой Gemini gemini-2.0-flash-exp-image-generation и генерит картинки.

Теперь можно генерировать через дешевый АПИ Gemini картинки по любому поводу. Люди уже конструируют на этом API замену фотошопу.

Это очень серьезный прорыв — говорю это как хардкорный пользователь Midjourney.
👍31
Включаю ChatGPT параллельно работе с Windsurf. Это одно из немногих приложений, которое умеет делиться экраном с ChatGPT (в Windsurf для этого нужно поставить расширение, как и в Cursor с VSCode).

И вот я расшариваю ему просто текстовый файл с описанием проекта — вернее двумя абзацами сырых идей, и прошу его задавать вопросы, добавлять идеи улучшение и фич и помогать с описанием сценариев. ChatGPT скорее помогает, если отговорить его делать комплименты и повторять твои мысли, постоянно подтверждая, как они гениальны, а наоборот, быть более критичным.

ChatGPT как ассистент, вечно глядящий в твой редактор код, может быть очень полезен. Например, как фоновый исследователь, который всегда в курсе того, на что вы смотрите. Благодаря нему я вспомнил о существовании progressive web apps (PWA), и подумал, что сейчас это снова актуальная платформа. Одну идею я, возможно, воплощу, используя эту технологию, а мини-исследование по результатам из веба я провёл прямо из Windsurf, и получил в пару промтов на выходе симпатичную стравнительную таблицу.

(Наверняка данные нужно проверять, я бы прогнал поверх этого отчёта пару Deep Research’ей-фактчеков) и попросил бы помощи в выборе у мыслящей модели с максимально свежим датасетом.
👍1
Дали доступ в нашумевший Manus — китайскому агенту, котор. Попробую применять его к действительно полезным и важным задачам — квартиру поищу в Берлине, например.


Про перфоманс говорить рано. Пока порадовало то, насколько это техничный иструмент — можно все файлы, которые он создает, посмотреть в облачном VSCode
🤝3👍2
Если я что-то понял про жизнь и психологию, «личное развитие», то это то, что нет единого способа чего-то достичь, и не может быть. Никакой подход не имеет права претендовать на уникальность и единственность, каким бы доказательным сейчас не считался.

К более «просветленному» состоянию можно прийти совершенно разными путями. Те или иные аспекты осознанности, внимательности в тех или иных пропорциях развиваются и в терапии, и в коучинге, в письменных практиках, в мистических практиках, или же в творчестве. Когда я занимался в театральной студии, я был приятно удивлен тем, какое количество практик на развитие актерского мастерства можно было бы назвать формальными практиками осознанности. Твоя способность полно проживать свою жизнь, свой опыт влияет на то, как ты играешь на сцене. Или как пишешь музыку, тексты, картины.

Один из важных навыков художника — замечать, видеть нюансы, детали и паттерны, которые ускользают от внимания других. Зрение и восприятие вообще — процесс активный. Это навык, который можно развить.

Абсолютно уверен, что все все от рождения креативны и способны к свободному созиданию, хотя большинство из нас и теряет эту способность с возрастом — и наше образование очень способствует этому.

Большая проблема, с которой сталкиваются те, кто пытаются перепридумать себя, свою профессию, своё дело, своё творчество, найти себе место в будущем, освоить новые технологии, искусственный интеллект, — это невозможность фантазировать и воображать. Люди видят десятки и сотни крутейших технологий, но не могут придумать, как они могут быть применимы в их жизни, как получить пользу, экономию времени и новые возможности. Даже имея доступ к самым продвинутым агентам, они не могут придумать им никакого применения.

У многих из нас отсутствует привычка воображать, как может выглядеть будущее.

Возможно, мы осознанно от нее отказываемся, потому что фантазировать про будущее страшно. Но очень сложно идти куда-то, где ты даже капельку, даже чуть-чуть не можешь представить (для меня это, например, попадание в точку сингулярности). Не буду врать. Мне тоже страшно. Я очень много лет своей жизни жил с картиной безопасного мира, и уже несколько лет как она разрушена. Однако, по эгоистическим причинам, не могу жить с пессимистической картиной мира. Чтобы что-то делать, мне нужно иметь позитивную мотивацию, веру в то, что мои действия имеют смысл и могут принести пользу достаточно широкому количеству людей.

Поэтому важная задача для меня сейчас — представлять позитивное будущее. Я вижу, что технологии, которые появляются сейчас, дают огромное количество возможностей для того, чтобы мы с вами жили лучше в самых разных областях жизни. Мы находимся в первой минуте, первого часа, первого дня новой эпохи в истории человечества. Сейчас мне кажется, что многие из самых громких, ярких предсказаний будут сбываться и даже быстрее, чем мы могли себе представить.

Кажется, мы теряем способность воображать, потому что живем в мире готовых образов. Мы потребляем их тысячами, и для создания своих не остаётся места.

На нашей ближайшей лабораторией мы с Юлей Катан (почитайте, как она пишет про вещи в прикрепленном посте и посмотрите её канал) делаем трек про воображение. Будет развивать воображение и креативность через практику. Чтобы научиться представлять светлое будущее.
Про значимость вещей

Нарисовала маркерами картинку в духе иллюстраций из старых атласов и энциклопедий. Разворот с перечислением вещей домашнего обитания. Обычно такие мелочи не подвергаются анализу, но я смотрю на них как на объекты своего творческого исследования.

Что, материально и символически, делает твой дом твоим домом?
Здесь всегда есть вещицы, которых больше нигде нет, по крайней мере в таком же сочетании.
Единственная в своем роде комбинация предметов, поверхностей, света, запахов, звуков формирует что-то вроде эмоционально-сенсорных капсул. Все места, в которых я жила или проводила много времени, стали запечатанными капсулами, они раскиданы по разным этапам моей жизни.

У значимости есть градации интенсивности, тонкий момент. Конечно я не говорю о таких исторических штуках как бабушкин сундук или чашка с которой вы неразлучны.
Вещи простые, иногда утилитарные, иногда принесенные с улицы какие-то ветки. Они уже некоторое время живут у вас, заняли свое место и вы к ним привыкли. Привычка делает обстановку невидимой.
Я люблю искоса наблюдать за вниманием: на что смотрю когда просыпаюсь или захожу на кухню? Вещи как будто немного подсвечены, от взгляда на них появляется едва уловимое удовольствие и успокоение. Поэтому изо дня в день просмотр повторяется, связь крепнет. Бывает, что символическое значение прет наружу сразу, а бывает только через много дней спустя.

Гнездо, например, символ заботы и уязвимости. Его построили голуби, которые жили на березе. Мы с Глебом долгое время наблюдали за ними из окна кухни. Было трепетно видеть, они там шебуршали и хоботились, а мы за них радовались, что голуби вообще оказались способны мастерить жилище как другие птицы. А потом однажды случился ураган с градом, березу качало так мощно, мы думали ее сломает. Гнездо хоть и не упало, но повисло на ветке. После урагана оно долго еще там качалось, покинутое. Было больновато. И упало наконец. Глеб его подобрал, принес домой, в голубином клее с перьями. Счастье. Оно валялось под стулом в коридоре и грело мне сердце: приютили гнездо в нашем гнезде. Все тут ясно сразу.

С кухонной лампой - не сразу. Это единственный источник света на обеденном столе каждый вечер. Лампа дешевая, может даже рукотворная, на месте склейки шашечка не сходится и морщится, пластиковые ножки расползаются. Но свет теплый, стабильно в уголке.
Нужно было много-много хороших кухонных вечеров, чтобы в один плохой я, зажигая ее, почувствовала утешение именно от шашечки и оттенка желтого.
👍31
Небольшое исследование про точность работы и поисковиков, и ресерчеры типа Perplexity и Grok.

Overall, the chatbots often failed to retrieve the correct articles. Collectively, they provided incorrect answers to more than 60 percent of queries. Across different platforms, the level of inaccuracy varied, with Perplexity answering 37 percent of the queries incorrectly, while Grok 3 had a much higher error rate, answering 94 percent of the queries incorrectly.

— Чат-боты в целом плохо справлялись с отказом отвечать на вопросы, на которые не могли дать точный ответ, вместо этого предлагая неверные или спекулятивные ответы.
— Платные чат-боты чаще выдавали уверенно неверные ответы по сравнению с бесплатными аналогами.
— Несколько чат-ботов, по-видимому, игнорировали настройки протокола исключения роботов (Robot Exclusion Protocol).
— Генеративные инструменты поиска создавали несуществующие ссылки и цитировали синдицированные или скопированные версии статей.
— Наличие лицензионных соглашений с новостными источниками не гарантировало точность цитирования в ответах чат-ботов.

https://www.cjr.org/tow_center/we-compared-eight-ai-search-engines-theyre-all-bad-at-citing-news.php
1
Forwarded from AI Mindset (Gleb Kalinin)
Субъективный хит-парад ИИ-инструментов и сервисов, выпуск 01

В новой рубрике коротким списком делимся инструментами, которыми пользуемся каждый или почти каждый день. Добавляйте ваши варианты в комментариях.

Whispr Flow. Голосовой ввод done right. Умеет качественно расшифровывать аудио на нескольких языках, сам пополняет словарь, умеет выполнять ии-команды над выбранным текстом. Простая штука, но пользуюсь есть сотни раз в день. Есть версии для Windows и Mac, iOS дают тестировать платным пользователям.

Sesame conversational voice. Голосовой интерфейс будущего. Диалоги, которые хочется продолжить сразу же, как он закончится. Увы, пока что не продукт, а технологическое демо. Их отрытая модель

ChatGPT4.5. Интересные изменения произошли в работе с языком. Скармливаю ему несколько своих текстов, текст на английском, прошу перевести, и получаю результат, в котором впервые за всю нашу историю не хочется исправить почти ничего. Если текст не художественный — оптимально.

Grok. Я вынужден признать, что ЛЛМ Маска сейчас on par или лучше и OpenAI, из «коробки» умеет быстро искать в интернете, дает щедрые лимиты на deep research — благодаря нему, для меня deep research стал почти таким же привычным, как простой поиск. Когда это быстро и бесплатно, начинаешь пользоваться. Важное уточнение: свежее исследование показывает, что ни один deep research не может заменить ручной поиск — принимать решение на основании таких не стоит, во всяком не из одного рисерча).

Manus. Взорвавший интернет китайский ии-агент, который автономно решает задачи по поиску и обработке информации, написанию кода, создания презентаций, конвертации данных и даже тренировке простеньких нейросетей, как когда-то Devin. У агента есть изолированная виртуальная машина с ОС Ubuntu и правами на запуск написанного софта. Внутри агента, как выяснилось, Claude 3.7 с доступом к 29 инструментам, и работает он совсем не так безукоризненно, как хотелось бы (например, зависает, вероятно, из-за высокой нагрузки, или галлюцинирует), но всё это не важно. Совершенно очевидно, что манусоподобные агенты станут еще более способными (например, простое сочетание агента + MCP открывает почти бесконечные возможности для этих самых агентов). Пока что тормозить прогресс будут цены. Постоянно работающий агент — это не просто футуристично, но и требует энергии и серверных мощностей, но соприкоснуться.

Goose. Джек Дорси, основатель Твиттера, делает новый продукт с открытым кодом — локального ии-агента. Он тоже умеет пользоваться инструментами (например, на Маке может делать скриншоты или управлять календарем), писать и выполнять код, интегрироваться с MCP-серверами. Похож на OpenInterpreter и Aider.

Генерация картинок с Gemini 2.0. Cовершенно новый опыт. Новая мультимодальная нейросеть Гугла умеет то, что раньше было невозможно. Отмечу работу с текстом — прогресс и по сравнению с Flux, можно добавлять длинные тексты. Кажется, не так далеко до качественного генеративного дизайна. Доступно через AI Studio.

Windsurf. ИИ-редактор кода, ставший для меня вторым домом после Obsidian. Подключил к нему MCP, и теперь, например, я ставлю задачу на исследование, а MCP-сервер сам её решает, и закрывает по завершении. Когда в первый раз понял, что софт тебе не только помогает задачки декомпозировать, а реально их решить и сразу же закрыть — осознал, насколько это будет частью нашей реальности уже в ближайшие годы. Самовыполняющаяся работа? Будем еще от этого отбиваться. Windsurf рекомендую, больше чем Cursor, хотя и оба хороши. Для работы со знаниями и кодом — в этой среде особенно легко к нему переходить. За мои несколько месяцев с Windsurf, он стал значительно автономнее, и чаще без моего вмешательства справляется с ошибками.

Claude 3.7. Новая версия по-прежнему любимой по стилю и эстетике коммуникации модель. Вместе с MCP Claude из чат-бота превращается в мощного агента — легко и быстро можно загружать контент из внешних источников, управлять файловой системой и внешним софтом вроде blender, искать в интернете и по локальным файлам.

🤖 Глеб | AI Tools
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍1