Tool Building Ape × Gleb Kalinin
436 subscribers
176 photos
9 videos
2 files
119 links
@glebkalinin пишет о технологиях, ИИ и жизни в будущем. @Experimentally @mentalhealthtech

Without philosophical examination, builders inherit their answers from the defaults of their environment.
Download Telegram
Если вы готовы делиться своими данными с OpenAI (помня, конечно, про это), то API можно пользоваться бесплатно

→ Up to 1 million tokens per day across gpt-4.5-preview, gpt-4.1, gpt-4o, o1 and o3

→ Up to 10 million tokens per day across gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, and codex-mini-latest

Настраивается здесь https://platform.openai.com/settings/organization/data-controls/sharing, опция называется Share inputs and outputs with OpenAI (можно выбрать отдельные проекты).

Повайбкодить самое то
10
Попробовал Codex, кодинг-агент OpenAI. Работает через веб или приложение ChatGPT с вашим кодом на Github.


Очень любопытный опыт — то, что это удаленный агент, имеет свои преимущества.

Комп дома.

Дал Codex доступ к Гитхаб-репозиторию с моим ADHD GTD тулом. Codex сам поискал ошибку, нашёл пару штук и исправил.

Дальше я создал для Codex новую задачу — описал через приложение ChatGPT, что хочу сделать. Минут 10 он поработал (план предварительно не показав и не задав вопросы), и корректно, пусть и не очень красиво, с первой попытки реализовал новую фичу.

Отправил PR на гитхаб, там его принял и смёржил, и вуаля — инструмент обновился, фича работает.

Я сделал это полностью с мобильного телефона и, при желании, мог бы только голосом. Почему-то вот это сочетание — автономности и мобильности, меня всё ещё восхищает (ну и пугает).

Я работал в командах, где ровно то, что cделал Codex, выполнял человек — и часто не лучше.
6👍3🔥1👏1
20250710-chatgpt-workflow-summary-en.pdf
33.9 KB
Упоминал, что использую Claude code для управления знаниями: собираю и обрабатываю источники, транскрипты встреч, генерирую и обрабатываю множество связанных файлов, которые в основном просматриваю Obsidian.

А при необходимости экспортирую прямо из Claude Code пдфки. Code запускает pandoc для текстов или marp для презентаций.

По умолчанию текстовые PDF страшные. Как сделать их более красивыми?

Шаги:

1. Идём в o3, просим сделать подборку шаблонов по нашим критериями. В моём случае — фокус на типографику, чтобы подходило для генерации научных статей (картинка 1). (Этот шаг claude code может выполнить сам, но мне нравится вручную.)

2. Проходимся по ссылкам, смотрим, что нравится. Я остановился на этих шаблонах, но также супер-интересно выглядит Typst (а ещё автора в Берлине)! Эстетические выборы всегда должен делать человек!

3. Идём в Claude code и говорим ему использовать понравившийся шаблон

for pdf conversion use templates from https://github.com/enhuiz/eisvogel

Всё! Теперь можно просто просить claude code сгенерировать pdf, и получать симпатичные и сложно свёрстанные pdf.

Вот, например, PDF по мотивам встречи про ChatGPT (ссылки внутри кликабельны). Для чего-то, сделанного за несколько минут, по-моему хорошо
9🔥4🫡2
Observable Framework — генератор статичных сайтов с поддержкой самых разных визуализаций данных.

Собрал себе на нём дэшборд с визуализациями данных из Apple Health.

Сам сервис Observable тоже интересный — визуальная работа с данными на бесконечной доске в духе Miro, ну или Figma + Jupyter + D3
9
Еще не успел толком попробовать новую модель Kimi 2, но отчёты очень впечатляющие. Открытая модель, которая на 80% дешевле ближайшего конкурента, намекает нам, что это теперь — нижний порог открытых моделей, то есть хуже уже точно не будет, будет только лучше. (А ещё что это модель уже навсегда всех rogue actors в мире.)

И её можно подключить в claude code! Очень интересно будет попробовать её на задачах по работе с документами — язык всё-таки не то же самое, что код, и Kimi пока что не ризонинг-модель.

Как обычно, Jason AI показывает, как этим пользоваться:

https://www.youtube.com/watch?v=Y4VEAI04W_U

В видео Джейсон делает сложный рабочий интерфейс IDE и простенькую версию Марио, а здесь Wes Roth ван-шотит 3д-модель Земли очень хорошего качества — до генеративных игр уже чуть-чуть.
7
Удивляет не то, что у каждого из нас теперь есть армия маленьких проджектов Маккинзи, дотошных факт-чекеров, систематизаторов и декораторов, а то, насколько мало кому это оказывается интересно. Мы все еще early adopters. Запись эфира о том, как я пользуюсь ChatGPT (и немного plaud и superwhisper)
11
Forwarded from Show me your GPT
Даже думскроллинг может стать топливом для творчества, если подойти к нему осознанно и призвать на помощь AI инструменты. В недавнем эфире Глеб Калинин показал, как превращать пойманные идеи в материал для исследования и формировать из них живые статьи, посты или документы.

Главное, чему мы научились:

→ превращать пассивное потребление контента в активное
→ эффективно организовывать рабочие пространства и базы знаний
→ пользоваться продвинутой персонализацией
→ внедрять мультимодальность
→ управлять здоровьем как проектом

📹 Это и многое другое — в записи эфира.

Cледующий анонс — совсем скоро!

———
🤖 Show me your GPT
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥52👍2
цифровой бардак и мотивация

Есть несколько мыслей на стыке того, о чём я пишу в основном канале — про психологическое и технологическое.

Рассматриваю свою творческую жизнь с момента, как я занялся фотографией в конце 2017. Думаю, насколько важную негативную роль сыграли отношения с технологиями и даже простая цифровая гигиена.

Я довольно быстро начал снимать на среднеформатную сначала 50-мегапиксельную, а потом и 100-мегапиксельную камеру. После того, как поснимаешь на такую технику, снимать ни на что меньшее не хочется. Цвета, динамический диапазон, киношная картинка…

Но есть проблема — каждая фотография в несжатом виде весит 200 мегабайт, а чтобы получать все преимущество такой камеры, нужно снимать в несжатом. За съемку лекго отснять 20-30 гигабайт. Если активно и много снимать, терабайтный диск забивается за недели.

Чтобы снимать, твой инструмент всегда должен быть в минимальном жизнеспособном состоянии. Это значит, что на карте памяти должно быть всегда достаточно места. А еще батареи должны быть заряжены, все нужные провода лежать наготове.

Иначе техника встаёт на пути творчества. (У Пинхасова услышал такую формулировку.)

Из-за того, что я не доводил банальную организацию хранения файлов, каждая обработка съемки начиналась с чистки жестких дисков в поисках свободного места. Очень важное творческое занятие становилось технической тягомотиной. Докупка дисков решает проблему только частично, а долгосрочно ещё и усугубляет её — теперь нужно организовывать еще и диски.

Ненастроенные процессы бьют по мотивации. Мы формируем ассоциацию «творчество» = «тяжело, нудно, больно». А наша нервная система стремится избавиться от всего, что воспринимается как боль.

Уверен, людям творческим и производящим любые цифровые артефакты (тексты, публикации, видео, подкасты, презентации) — да всем нам — важно учиться упрощать техническую часть создания этих артефактов. Чтобы больше заниматься исключительно человеческим.
13🔥1
Напоминаю, о3 — не LLM, а уже серьезный агент. Иногда под капотом он поднимает себе тихо сервер, устанавливает библиотеки, пишет и запускает код
6
https://fellou.ai/ — пока ждём браузер от OpenAI (и экономим деньги на Perplexity) — очередной китайский стартап, на этот раз браузер-агент. Я подал заявку на waitlist и сразу же получил приглашение.

Агент работает в фоне (и разгоняет фен моего мака), ходит по десяткам сайтов, заполняет таблички и в теории делает что угодно, что можно делать в браузере.

update
Пока AGI в очередной раз отменяется. Попросил Fellou провести небольшое исследование it-продуктов — по сайтам он походил бодро, разогрев мой свежий Макбук про градусов до сорока, а вот когда я попросил его сделать из исследования Гугл-презентацию, возился минут 40 и сделал полную халтуру. Съев на всё-про всё 2200 кредитов из 5000, которые были доступны.

А ещё из предсказуемого — Гугл меня за скоростной поиск в процессе забанил за подозрительный трафик — в этом смысле подобные локальные браузеры работать будут плохо всегда.
👍42😁1
Наблюдать за тем, как агент пытается пользоваться человеческими инструментами прямо больно. Кажется, это-таки какая-то тупиковая ветка развития, просто чудовищно медленно (зато посмотрите, как он сам себя нахваливает в чате! за каждую введенную букву)

Попросил его просто скопировать результаты в csv, он пошёл заново делать
😁8
Очень сложно жить, не имея хотя бы среднесрочного плана

Год-другой так пожить можно, и даже, наверное, пять.

Но жить дольше в режиме постоянного тушения пожаров, хаоса и непредсказуемости утомительно. Нервная система для такого не создана. Уму хочется создать хоть какое-то подобие плана.

Но как планировать? Ведь мы получаем громкие сигналы о том, что социально-экономические изменения, вызванные целым каскадом причин, и технологии тут играют всё больше роли, неизбежны?

Не знаю, как вам, а мне точно нужна хоть какая-то картинка будущего. Ведь совершенно разные решения будет иррационально принять, если мы исходим из того, что до апокалипсиса или, наоборот, рая сингулярного остались считанные месяцы. И наоборот, если считаем, что прогресс будет постепенным, будет много времени для перестройки, и возможностей, которые эта перестройка несет, будет больше, чем рисков.

Мы рациональные люди и понимаем, что попытка по waterfall спланировать даже на полгодна — безумие, обереченное на провал даже в более стабильные времена. Значит, первое, что нам нужно прокачивать, — это способность быть в порядке при непредсказуемостью. Дружить с изменчивостью. Как говорил Майк Тайсон: «У каждого есть план, пока ему не врежут по лицу».

Мне очень сложно смотреть на жизнь через пессимистическую линзу. Такая оптика затемняет и не даёт увидеть всю сложность мира, и через неё тяжелее уведеть мотивацию действовать.

Поэтому я выбираю умеренно-оптимистическую позицию.

Это именно выбор — я сознательно его сделал, как прагматически более полезный (меньше вероятности свалиться в депрессию, лучше здоровье), и намеренно практиковал, приучая ум не бегать по проторенным дорожкам пессимизма, а строить новые нейронные тропы более оптимистичных сценариев. Это навык, который пришлось тренировать, зато теперь он автоматический, ну и к счастью жизни не один раз сбывались и оптимистичные прогнозы.

Я выбираю верить, что технологии хотя бы в отдельных частях мира принесут очень много пользы, продлят жизнь, освободят нам время, помогут с governance, а общество сможет под это гибко перестроиться.

Я понимаю, что это займет время, и считаю, что разгоняться будет достаточно медленно, чтобы мы успели подготовиться и перепридумать важные для устойчивости системы. Я верю, что на земле достаточно всего для всех, что мы можем обратить часть урона, нанесенного экологии и найти способы жить в гармонии с этой планетой.

Это моя базовое убеждение, похожее на религиозное.

Про будущее я думаю, что оно будет так же и более сложно и неоднообразно, как настоящее. В разных областях жизни мы увидим и удивительный прогресс, и совершенно непредсказуемые и глобальные проблемы.

Думаю, это важно знать, например, если ты новое партнерство начинаешь. Я не хочу партнёрства с тем, кто ждёт зомби-апокалипсис, разные картины ведут к разным ценностям и реальным выборам, реальному поведению.
19🤩1
Про время — очень нравится идея «длинного сейчас»

Постепенно прицеливаюсь к масштабу nowadays, мыслить в масштабе Long Now пока очень сложно

Посмотрите The Long Now Foundation, я был большим фанатом их лекций

https://longnow.org/
5
технология в масштабе длинного сейчас

Если смотреть на то, что происходит в технологиях хотя бы со второго масштаба в 30 лет, то даже без глубокого анализа становится понятно, что сейчас мы на самой-самой ранней стадии этого технологического витка.

Мы на стадии 64-битных компьютеров, попукивающих при подключении диалапа US Robotics Sportster, пятидюймовых дискет и BBS (эстетика которых уже вернулась). Нужно ещё несколько волн хайпа и залива денег, чтобы по-настоящему полезные приложения появились и стали привычными, чтобы эффект если не замены чего-то там ИИ, а банальной автоматизации, которую с помощью ИИ можно сделать, стал заметным.

То, как будет выглядеть наше технологическое будущее, ещё только придумывают — и вы тоже можете придумывать.

Моя простая максималисткая гипотеза: Если сервис или приложение использует экраны как единственный интерфейс — это software 2.0.

Для меня настоящее Software 3.0 — это такое, которое возникает и встраивается в мою жизнь с адекватным понимаем контекста, и которое доступно в любых удобных мне формах (голос, видео, жесты, вибрация и тактильность, биомаркеры и тд).
13👍1👏1
Великолепный обзор того, что произошло в мире LLM за первые полгода 2025.

Во-первых, Саймон прекрасный нерд, который умеет рассказывать.

Во-вторых, тестировать LLM рисованием пеликана на велосипеде замечательно.

В-третьих, скорость прогресса удивительная: фактически все важные модели вышли с начала года.

Выводы:
- пора снова посмотреть на локальные открытые модели (mistral small 3 24b), общий тренд — все более маленькие модели

- amazon nova micro — самая дешевая llm (сайт-сравнение цен — https://www.llm-prices.com/ )

- gpt4.1 отличная модель для работы с большим контекстом (1m), gpt-4.1nano самая дешевая их модель ever


- основной прогресс сейчас — ризонинг плюс использование инструментов. o3 крута, потому что это лучшее сочетание tool using (поиска) и ризонинга

- gemini рисует лучших пеликанов на велосипеде

Жаль в выступление kimi k2 не попала

https://youtu.be/YpY83-kA7Bo?si=OgQeucn6-gLkCbjl

Текстовое описание
👍3🕊1👀1
В ChatGPT на Plus-тарифе (за 20 баксов) появилась запись длинных встреч с удобной расшифровкой. После обработки записи сразу же создаёт canvas с саммари (подробность можно регулировать, как и у любых текстов в canvas), с привязкой ко времени. Естественно, можно сразу же задавать вопросы к тексту в чате

Расшифровка и диаризаций на уровне, причин запускать Fathom или Гранолу или Limitless никаких
👍75