Tool Building Ape × Gleb Kalinin
438 subscribers
179 photos
9 videos
2 files
120 links
@glebkalinin пишет о технологиях, ИИ и жизни в будущем. @Experimentally @mentalhealthtech

Without philosophical examination, builders inherit their answers from the defaults of their environment.
Download Telegram
Forwarded from Show me your GPT
Даже думскроллинг может стать топливом для творчества, если подойти к нему осознанно и призвать на помощь AI инструменты. В недавнем эфире Глеб Калинин показал, как превращать пойманные идеи в материал для исследования и формировать из них живые статьи, посты или документы.

Главное, чему мы научились:

→ превращать пассивное потребление контента в активное
→ эффективно организовывать рабочие пространства и базы знаний
→ пользоваться продвинутой персонализацией
→ внедрять мультимодальность
→ управлять здоровьем как проектом

📹 Это и многое другое — в записи эфира.

Cледующий анонс — совсем скоро!

———
🤖 Show me your GPT
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥52👍2
цифровой бардак и мотивация

Есть несколько мыслей на стыке того, о чём я пишу в основном канале — про психологическое и технологическое.

Рассматриваю свою творческую жизнь с момента, как я занялся фотографией в конце 2017. Думаю, насколько важную негативную роль сыграли отношения с технологиями и даже простая цифровая гигиена.

Я довольно быстро начал снимать на среднеформатную сначала 50-мегапиксельную, а потом и 100-мегапиксельную камеру. После того, как поснимаешь на такую технику, снимать ни на что меньшее не хочется. Цвета, динамический диапазон, киношная картинка…

Но есть проблема — каждая фотография в несжатом виде весит 200 мегабайт, а чтобы получать все преимущество такой камеры, нужно снимать в несжатом. За съемку лекго отснять 20-30 гигабайт. Если активно и много снимать, терабайтный диск забивается за недели.

Чтобы снимать, твой инструмент всегда должен быть в минимальном жизнеспособном состоянии. Это значит, что на карте памяти должно быть всегда достаточно места. А еще батареи должны быть заряжены, все нужные провода лежать наготове.

Иначе техника встаёт на пути творчества. (У Пинхасова услышал такую формулировку.)

Из-за того, что я не доводил банальную организацию хранения файлов, каждая обработка съемки начиналась с чистки жестких дисков в поисках свободного места. Очень важное творческое занятие становилось технической тягомотиной. Докупка дисков решает проблему только частично, а долгосрочно ещё и усугубляет её — теперь нужно организовывать еще и диски.

Ненастроенные процессы бьют по мотивации. Мы формируем ассоциацию «творчество» = «тяжело, нудно, больно». А наша нервная система стремится избавиться от всего, что воспринимается как боль.

Уверен, людям творческим и производящим любые цифровые артефакты (тексты, публикации, видео, подкасты, презентации) — да всем нам — важно учиться упрощать техническую часть создания этих артефактов. Чтобы больше заниматься исключительно человеческим.
13🔥1
Напоминаю, о3 — не LLM, а уже серьезный агент. Иногда под капотом он поднимает себе тихо сервер, устанавливает библиотеки, пишет и запускает код
6
https://fellou.ai/ — пока ждём браузер от OpenAI (и экономим деньги на Perplexity) — очередной китайский стартап, на этот раз браузер-агент. Я подал заявку на waitlist и сразу же получил приглашение.

Агент работает в фоне (и разгоняет фен моего мака), ходит по десяткам сайтов, заполняет таблички и в теории делает что угодно, что можно делать в браузере.

update
Пока AGI в очередной раз отменяется. Попросил Fellou провести небольшое исследование it-продуктов — по сайтам он походил бодро, разогрев мой свежий Макбук про градусов до сорока, а вот когда я попросил его сделать из исследования Гугл-презентацию, возился минут 40 и сделал полную халтуру. Съев на всё-про всё 2200 кредитов из 5000, которые были доступны.

А ещё из предсказуемого — Гугл меня за скоростной поиск в процессе забанил за подозрительный трафик — в этом смысле подобные локальные браузеры работать будут плохо всегда.
👍42😁1
Наблюдать за тем, как агент пытается пользоваться человеческими инструментами прямо больно. Кажется, это-таки какая-то тупиковая ветка развития, просто чудовищно медленно (зато посмотрите, как он сам себя нахваливает в чате! за каждую введенную букву)

Попросил его просто скопировать результаты в csv, он пошёл заново делать
😁8
Очень сложно жить, не имея хотя бы среднесрочного плана

Год-другой так пожить можно, и даже, наверное, пять.

Но жить дольше в режиме постоянного тушения пожаров, хаоса и непредсказуемости утомительно. Нервная система для такого не создана. Уму хочется создать хоть какое-то подобие плана.

Но как планировать? Ведь мы получаем громкие сигналы о том, что социально-экономические изменения, вызванные целым каскадом причин, и технологии тут играют всё больше роли, неизбежны?

Не знаю, как вам, а мне точно нужна хоть какая-то картинка будущего. Ведь совершенно разные решения будет иррационально принять, если мы исходим из того, что до апокалипсиса или, наоборот, рая сингулярного остались считанные месяцы. И наоборот, если считаем, что прогресс будет постепенным, будет много времени для перестройки, и возможностей, которые эта перестройка несет, будет больше, чем рисков.

Мы рациональные люди и понимаем, что попытка по waterfall спланировать даже на полгодна — безумие, обереченное на провал даже в более стабильные времена. Значит, первое, что нам нужно прокачивать, — это способность быть в порядке при непредсказуемостью. Дружить с изменчивостью. Как говорил Майк Тайсон: «У каждого есть план, пока ему не врежут по лицу».

Мне очень сложно смотреть на жизнь через пессимистическую линзу. Такая оптика затемняет и не даёт увидеть всю сложность мира, и через неё тяжелее уведеть мотивацию действовать.

Поэтому я выбираю умеренно-оптимистическую позицию.

Это именно выбор — я сознательно его сделал, как прагматически более полезный (меньше вероятности свалиться в депрессию, лучше здоровье), и намеренно практиковал, приучая ум не бегать по проторенным дорожкам пессимизма, а строить новые нейронные тропы более оптимистичных сценариев. Это навык, который пришлось тренировать, зато теперь он автоматический, ну и к счастью жизни не один раз сбывались и оптимистичные прогнозы.

Я выбираю верить, что технологии хотя бы в отдельных частях мира принесут очень много пользы, продлят жизнь, освободят нам время, помогут с governance, а общество сможет под это гибко перестроиться.

Я понимаю, что это займет время, и считаю, что разгоняться будет достаточно медленно, чтобы мы успели подготовиться и перепридумать важные для устойчивости системы. Я верю, что на земле достаточно всего для всех, что мы можем обратить часть урона, нанесенного экологии и найти способы жить в гармонии с этой планетой.

Это моя базовое убеждение, похожее на религиозное.

Про будущее я думаю, что оно будет так же и более сложно и неоднообразно, как настоящее. В разных областях жизни мы увидим и удивительный прогресс, и совершенно непредсказуемые и глобальные проблемы.

Думаю, это важно знать, например, если ты новое партнерство начинаешь. Я не хочу партнёрства с тем, кто ждёт зомби-апокалипсис, разные картины ведут к разным ценностям и реальным выборам, реальному поведению.
19🤩1
Про время — очень нравится идея «длинного сейчас»

Постепенно прицеливаюсь к масштабу nowadays, мыслить в масштабе Long Now пока очень сложно

Посмотрите The Long Now Foundation, я был большим фанатом их лекций

https://longnow.org/
5
технология в масштабе длинного сейчас

Если смотреть на то, что происходит в технологиях хотя бы со второго масштаба в 30 лет, то даже без глубокого анализа становится понятно, что сейчас мы на самой-самой ранней стадии этого технологического витка.

Мы на стадии 64-битных компьютеров, попукивающих при подключении диалапа US Robotics Sportster, пятидюймовых дискет и BBS (эстетика которых уже вернулась). Нужно ещё несколько волн хайпа и залива денег, чтобы по-настоящему полезные приложения появились и стали привычными, чтобы эффект если не замены чего-то там ИИ, а банальной автоматизации, которую с помощью ИИ можно сделать, стал заметным.

То, как будет выглядеть наше технологическое будущее, ещё только придумывают — и вы тоже можете придумывать.

Моя простая максималисткая гипотеза: Если сервис или приложение использует экраны как единственный интерфейс — это software 2.0.

Для меня настоящее Software 3.0 — это такое, которое возникает и встраивается в мою жизнь с адекватным понимаем контекста, и которое доступно в любых удобных мне формах (голос, видео, жесты, вибрация и тактильность, биомаркеры и тд).
13👍1👏1
Великолепный обзор того, что произошло в мире LLM за первые полгода 2025.

Во-первых, Саймон прекрасный нерд, который умеет рассказывать.

Во-вторых, тестировать LLM рисованием пеликана на велосипеде замечательно.

В-третьих, скорость прогресса удивительная: фактически все важные модели вышли с начала года.

Выводы:
- пора снова посмотреть на локальные открытые модели (mistral small 3 24b), общий тренд — все более маленькие модели

- amazon nova micro — самая дешевая llm (сайт-сравнение цен — https://www.llm-prices.com/ )

- gpt4.1 отличная модель для работы с большим контекстом (1m), gpt-4.1nano самая дешевая их модель ever


- основной прогресс сейчас — ризонинг плюс использование инструментов. o3 крута, потому что это лучшее сочетание tool using (поиска) и ризонинга

- gemini рисует лучших пеликанов на велосипеде

Жаль в выступление kimi k2 не попала

https://youtu.be/YpY83-kA7Bo?si=OgQeucn6-gLkCbjl

Текстовое описание
👍3🕊1👀1
В ChatGPT на Plus-тарифе (за 20 баксов) появилась запись длинных встреч с удобной расшифровкой. После обработки записи сразу же создаёт canvas с саммари (подробность можно регулировать, как и у любых текстов в canvas), с привязкой ко времени. Естественно, можно сразу же задавать вопросы к тексту в чате

Расшифровка и диаризаций на уровне, причин запускать Fathom или Гранолу или Limitless никаких
👍75
…Сегодня нас окружают толпы рьяных Тевтов, одноглазых пророков, видящих лишь то, что новые технологии способны сотворить, и не умеющих вообразить, что они способны разрушить. Таких людей можно назвать технофилами. Они взирают на технологию так же, как влюблённый на предмет своей страсти — не замечая изъянов и не испытывая ни малейшей тревоги за будущее.

Нил Постман. Технополия


...we are currently surrounded by throngs of zealous Theuths, one-eyed prophets who see only what new technologies can do and are incapable of imagining what they will undo. We might call such people Technophiles. They gaze on technology as a lover does on his beloved, seeing it as without blemish and entertaining no apprehension for the future.

Neil Postman. Technopoly
2
Пост-знакомство

Поскольку этот канал потихоньку растёт и уже чуть больше моей технической записной книжки, пора представиться.

Глеб Калинин

У меня 2 основных бэкграунда:
→ IT (20 лет в ролях от фронта до CPO)
→ Работа с людьми (коучинг по стандартам ICF, психология, майндфулнесс и еще огромное количество практик).

Оба из них оказываются сейчас нужны и важны, потому что ИИ — штука очень сложная и для многих эмоциональная. Мне с этой эмоциональность окей.

Последние пару лет я обучал людей на лабораториях AI Mindset (ушёл из проекта), а пока я готовлю новые программы, у меня есть время для личной работы.

Как я могу помочь:

→ Выработать личную стратегию и освоить критичные навыки работы с ИИ. Как коуч и ментор, я помогу вам выработать цели, составить программу, помогу подобрать инструменты и оптимальные паттерны их использования.

→ Сформулировать и упаковать идею вашего проекта или продукта, провести исследование и даже сделать прототип. Я активно слежу, тестирую и пишу про современные технологии, умею проводить исследования и могу помочь подобрать оптимальный стек, а также найти команду, которая поможет реализовать продукт.

С кем я обычно работаю:
→ Предприниматели, руководители и специалисты (продакты, разработчики, аналитики), но несколько раз я работал — и мне понравилось — с подростками про их AI-based продукты

Я не теоретик: активно пользуюсь современными моделям и агентами, разрабатываю свои AI-based приложения, пишу про всё это в своём канале.
Ссылки о себя положу в комментариях.

Если вам актуально — предлагаю бесплатный получасовой звонок.

Написать мне

Базируюсь в Берлине и с радостью работаю с компаниями по всему миру.

Мои другие каналы:
Mental health tech
Опытным путём
18👍3🥰3
https://www.youtube.com/watch?v=yIlnyoIxNPI

UltraZoom — система, создающая гигапиксельные изображения из обычных снимков, сделанных на смартфон. На вход — общий кадр и один-два крупноплановых фото, автоматически совмещает крупные планы с общим изображением, оценивает масштаб и строит пары «низкое → высокое» разрешение. Далее предобученная генеративная модель дообучается на этих парах. Результат — плавный пан-и-зум по всему объекту с фотореалистичной детализацией при минимальном исходном материале.

https://ultra-zoom.github.io/
Следить за вакансиями OpenAI и ко всегда интересно — на деле отражает убеждения компании относительно будущего профессий.

К примеру, ищут фронтенд-инженера:

https://openai.com/careers/front-end-software-engineer-marketing/

$255K – $405K + Offers Equity


А вот вакансии Антропиков — https://www.anthropic.com/jobs — тоже любопытно посмотреть в контексте громких заявлений Амадея.

Ни одной вакансии для агентов, все — для людей
👍3
Я не большой фанат распространения промтов, но вот этот мне дал удивительно любопытные результаты в ChatGPT:

What advice have you been trying to give me that i havent been able to hear?

Можно добавить Respond in Russian. 4o и o3, русская и английская версии вернули немного разные результаты.

Один совет ChatGPT по ощущениям был очень похож на один из мощных моментов в моей работе с психотерапевтом. На больших объемах и с постепенно улучшающейся памятью LLM смогут давать нам уникальную перспективу на наши когнитивные и эмоциональные процессы.
14
Сейчас много пишут (я в том числе в канале Mental health tech) про риски взаимодействия с ChatGPT, но такие истории тоже важно подсвечивать.

Людей, для которых ии-инструменты могут стать искусным средством для движения к стоящей жизни наверняка больше, а не меньше, чем тех, кто столкнется со сложностями.
8
Птицы, рыбы, насекомые и другие животные объединяются в большме группы, чтобы эффективнее добывать пищу, обеспечивать себе защиту и решать сложные задачи.

Роевой интеллект (swarm intelligence) — таким термином описывают коллективное поведение, увеличивающее интеллект больших децентрализованных групп. Вспоминаем муравьев, обошедших в решении задачи группу людей (впрочем, один человек всё равно оказывается умнее).

Могут ли люди проявлять роевой интеллект? Безусловно, да — от скоординированного движения толпы, адаптирующейся под изменения среды, до масштабных децентрализованных проектов с открытым кодом.

Создатели платформы Thinkscape задались вопросом — возможно ли повысить коллективный интеллект человека?

Мы знаем, что эффективное обдумывание в формате беседы (conversational deliberation) — когда группе нужно что-то спланировать или принять решение — наиболее комфортно проходит в группе от 4 до 7 человек. В таком формате каждый получает возможность внести свой вклад в разговор.

Thinkscape предлагает разбивать большие группы людей (сейчас до 400 человек, но в перспективе — безлимитно) на группы по 4-7 человек, наподобие breakout rooms в Зуме. Каждая группа ведёт отдельное обсуждение на заданную тему. Разговоры всех групп в реальном времени мониторит и анализирует ИИ-агент, обнаруживая в разговоре консенсусы, несогласие и инсайты. Эти данные передаются всем агентам, которые делятся ими с участниками других групп.

Например, если группа обсуждает планирование большого пикник, агент может периодически указывать на нюансы, упомянутые в других группах, но упущенные в этой, например, что делать в случае плохой погоды.

Как рассказывают в интервью один из создателей, доктор Луис Розенберг, одним из самых сложных аспектов, помимо разработки, была калибровка того, когда и что именно говорит агент. Агент вмешивается слишком часто? Это воспринимается навязчиво. Люди, со слов Розенберга, воспринимают агентов как полноценных участников разговора, и доверие здесь — ключевой фактор.

В небольшом исследовании группы в 75 человек, участники отметили, что такой формат был эффективней, чем простые чаты, был более продуктивным, чем сессии мозгового штурма, способствовал появлению идей более высокого качества, более сильное чувство причастности к итоговым решениям, ощущение, что их голоса были лучше услышаны.

Пока Thinkscape работает в закрытом режиме, но можно записаться на участие в тестовых разговорах.
🔥6🤔2
Я (как, не сомневаюсь, и вы) регистрируюсь в десятках сервисов в месяц. Иногда вспоминаю про них, когда они присылают письмо о том, что закрываются. Так я вспомнил про nette.io — A Research OS for the Web, который закроется 15 августа.

Попробовал — очень классный интерфейс с миро-подобной доской и генеративными фичами, в духе are.na и подобных минималистичных сервисов.