Tool Building Ape × Gleb Kalinin
373 subscribers
129 photos
8 videos
2 files
106 links
@glebkalinin пишет о технологиях, ИИ и жизни в будущем. @Experimentally @mentalhealthtech
Download Telegram
Еще не успел толком попробовать новую модель Kimi 2, но отчёты очень впечатляющие. Открытая модель, которая на 80% дешевле ближайшего конкурента, намекает нам, что это теперь — нижний порог открытых моделей, то есть хуже уже точно не будет, будет только лучше. (А ещё что это модель уже навсегда всех rogue actors в мире.)

И её можно подключить в claude code! Очень интересно будет попробовать её на задачах по работе с документами — язык всё-таки не то же самое, что код, и Kimi пока что не ризонинг-модель.

Как обычно, Jason AI показывает, как этим пользоваться:

https://www.youtube.com/watch?v=Y4VEAI04W_U

В видео Джейсон делает сложный рабочий интерфейс IDE и простенькую версию Марио, а здесь Wes Roth ван-шотит 3д-модель Земли очень хорошего качества — до генеративных игр уже чуть-чуть.
7
Удивляет не то, что у каждого из нас теперь есть армия маленьких проджектов Маккинзи, дотошных факт-чекеров, систематизаторов и декораторов, а то, насколько мало кому это оказывается интересно. Мы все еще early adopters. Запись эфира о том, как я пользуюсь ChatGPT (и немного plaud и superwhisper)
9
Forwarded from Show me your GPT
Даже думскроллинг может стать топливом для творчества, если подойти к нему осознанно и призвать на помощь AI инструменты. В недавнем эфире Глеб Калинин показал, как превращать пойманные идеи в материал для исследования и формировать из них живые статьи, посты или документы.

Главное, чему мы научились:

→ превращать пассивное потребление контента в активное
→ эффективно организовывать рабочие пространства и базы знаний
→ пользоваться продвинутой персонализацией
→ внедрять мультимодальность
→ управлять здоровьем как проектом

📹 Это и многое другое — в записи эфира.

Cледующий анонс — совсем скоро!

———
🤖 Show me your GPT
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥42👍2
цифровой бардак и мотивация

Есть несколько мыслей на стыке того, о чём я пишу в основном канале — про психологическое и технологическое.

Рассматриваю свою творческую жизнь с момента, как я занялся фотографией в конце 2017. Думаю, насколько важную негативную роль сыграли отношения с технологиями и даже простая цифровая гигиена.

Я довольно быстро начал снимать на среднеформатную сначала 50-мегапиксельную, а потом и 100-мегапиксельную камеру. После того, как поснимаешь на такую технику, снимать ни на что меньшее не хочется. Цвета, динамический диапазон, киношная картинка…

Но есть проблема — каждая фотография в несжатом виде весит 200 мегабайт, а чтобы получать все преимущество такой камеры, нужно снимать в несжатом. За съемку лекго отснять 20-30 гигабайт. Если активно и много снимать, терабайтный диск забивается за недели.

Чтобы снимать, твой инструмент всегда должен быть в минимальном жизнеспособном состоянии. Это значит, что на карте памяти должно быть всегда достаточно места. А еще батареи должны быть заряжены, все нужные провода лежать наготове.

Иначе техника встаёт на пути творчества. (У Пинхасова услышал такую формулировку.)

Из-за того, что я не доводил банальную организацию хранения файлов, каждая обработка съемки начиналась с чистки жестких дисков в поисках свободного места. Очень важное творческое занятие становилось технической тягомотиной. Докупка дисков решает проблему только частично, а долгосрочно ещё и усугубляет её — теперь нужно организовывать еще и диски.

Ненастроенные процессы бьют по мотивации. Мы формируем ассоциацию «творчество» = «тяжело, нудно, больно». А наша нервная система стремится избавиться от всего, что воспринимается как боль.

Уверен, людям творческим и производящим любые цифровые артефакты (тексты, публикации, видео, подкасты, презентации) — да всем нам — важно учиться упрощать техническую часть создания этих артефактов. Чтобы больше заниматься исключительно человеческим.
13🔥1
Напоминаю, о3 — не LLM, а уже серьезный агент. Иногда под капотом он поднимает себе тихо сервер, устанавливает библиотеки, пишет и запускает код
6
https://fellou.ai/ — пока ждём браузер от OpenAI (и экономим деньги на Perplexity) — очередной китайский стартап, на этот раз браузер-агент. Я подал заявку на waitlist и сразу же получил приглашение.

Агент работает в фоне (и разгоняет фен моего мака), ходит по десяткам сайтов, заполняет таблички и в теории делает что угодно, что можно делать в браузере.

update
Пока AGI в очередной раз отменяется. Попросил Fellou провести небольшое исследование it-продуктов — по сайтам он походил бодро, разогрев мой свежий Макбук про градусов до сорока, а вот когда я попросил его сделать из исследования Гугл-презентацию, возился минут 40 и сделал полную халтуру. Съев на всё-про всё 2200 кредитов из 5000, которые были доступны.

А ещё из предсказуемого — Гугл меня за скоростной поиск в процессе забанил за подозрительный трафик — в этом смысле подобные локальные браузеры работать будут плохо всегда.
👍41
Наблюдать за тем, как агент пытается пользоваться человеческими инструментами прямо больно. Кажется, это-таки какая-то тупиковая ветка развития, просто чудовищно медленно (зато посмотрите, как он сам себя нахваливает в чате! за каждую введенную букву)

Попросил его просто скопировать результаты в csv, он пошёл заново делать
😁7
Очень сложно жить, не имея хотя бы среднесрочного плана

Год-другой так пожить можно, и даже, наверное, пять.

Но жить дольше в режиме постоянного тушения пожаров, хаоса и непредсказуемости утомительно. Нервная система для такого не создана. Уму хочется создать хоть какое-то подобие плана.

Но как планировать? Ведь мы получаем громкие сигналы о том, что социально-экономические изменения, вызванные целым каскадом причин, и технологии тут играют всё больше роли, неизбежны?

Не знаю, как вам, а мне точно нужна хоть какая-то картинка будущего. Ведь совершенно разные решения будет иррационально принять, если мы исходим из того, что до апокалипсиса или, наоборот, рая сингулярного остались считанные месяцы. И наоборот, если считаем, что прогресс будет постепенным, будет много времени для перестройки, и возможностей, которые эта перестройка несет, будет больше, чем рисков.

Мы рациональные люди и понимаем, что попытка по waterfall спланировать даже на полгодна — безумие, обереченное на провал даже в более стабильные времена. Значит, первое, что нам нужно прокачивать, — это способность быть в порядке при непредсказуемостью. Дружить с изменчивостью. Как говорил Майк Тайсон: «У каждого есть план, пока ему не врежут по лицу».

Мне очень сложно смотреть на жизнь через пессимистическую линзу. Такая оптика затемняет и не даёт увидеть всю сложность мира, и через неё тяжелее уведеть мотивацию действовать.

Поэтому я выбираю умеренно-оптимистическую позицию.

Это именно выбор — я сознательно его сделал, как прагматически более полезный (меньше вероятности свалиться в депрессию, лучше здоровье), и намеренно практиковал, приучая ум не бегать по проторенным дорожкам пессимизма, а строить новые нейронные тропы более оптимистичных сценариев. Это навык, который пришлось тренировать, зато теперь он автоматический, ну и к счастью жизни не один раз сбывались и оптимистичные прогнозы.

Я выбираю верить, что технологии хотя бы в отдельных частях мира принесут очень много пользы, продлят жизнь, освободят нам время, помогут с governance, а общество сможет под это гибко перестроиться.

Я понимаю, что это займет время, и считаю, что разгоняться будет достаточно медленно, чтобы мы успели подготовиться и перепридумать важные для устойчивости системы. Я верю, что на земле достаточно всего для всех, что мы можем обратить часть урона, нанесенного экологии и найти способы жить в гармонии с этой планетой.

Это моя базовое убеждение, похожее на религиозное.

Про будущее я думаю, что оно будет так же и более сложно и неоднообразно, как настоящее. В разных областях жизни мы увидим и удивительный прогресс, и совершенно непредсказуемые и глобальные проблемы.

Думаю, это важно знать, например, если ты новое партнерство начинаешь. Я не хочу партнёрства с тем, кто ждёт зомби-апокалипсис, разные картины ведут к разным ценностям и реальным выборам, реальному поведению.
19🤩1
Про время — очень нравится идея «длинного сейчас»

Постепенно прицеливаюсь к масштабу nowadays, мыслить в масштабе Long Now пока очень сложно

Посмотрите The Long Now Foundation, я был большим фанатом их лекций

https://longnow.org/
5
технология в масштабе длинного сейчас

Если смотреть на то, что происходит в технологиях хотя бы со второго масштаба в 30 лет, то даже без глубокого анализа становится понятно, что сейчас мы на самой-самой ранней стадии этого технологического витка.

Мы на стадии 64-битных компьютеров, попукивающих при подключении диалапа US Robotics Sportster, пятидюймовых дискет и BBS (эстетика которых уже вернулась). Нужно ещё несколько волн хайпа и залива денег, чтобы по-настоящему полезные приложения появились и стали привычными, чтобы эффект если не замены чего-то там ИИ, а банальной автоматизации, которую с помощью ИИ можно сделать, стал заметным.

То, как будет выглядеть наше технологическое будущее, ещё только придумывают — и вы тоже можете придумывать.

Моя простая максималисткая гипотеза: Если сервис или приложение использует экраны как единственный интерфейс — это software 2.0.

Для меня настоящее Software 3.0 — это такое, которое возникает и встраивается в мою жизнь с адекватным понимаем контекста, и которое доступно в любых удобных мне формах (голос, видео, жесты, вибрация и тактильность, биомаркеры и тд).
11👍1
Великолепный обзор того, что произошло в мире LLM за первые полгода 2025.

Во-первых, Саймон прекрасный нерд, который умеет рассказывать.

Во-вторых, тестировать LLM рисованием пеликана на велосипеде замечательно.

В-третьих, скорость прогресса удивительная: фактически все важные модели вышли с начала года.

Выводы:
- пора снова посмотреть на локальные открытые модели (mistral small 3 24b), общий тренд — все более маленькие модели

- amazon nova micro — самая дешевая llm (сайт-сравнение цен — https://www.llm-prices.com/ )

- gpt4.1 отличная модель для работы с большим контекстом (1m), gpt-4.1nano самая дешевая их модель ever


- основной прогресс сейчас — ризонинг плюс использование инструментов. o3 крута, потому что это лучшее сочетание tool using (поиска) и ризонинга

- gemini рисует лучших пеликанов на велосипеде

Жаль в выступление kimi k2 не попала

https://youtu.be/YpY83-kA7Bo?si=OgQeucn6-gLkCbjl

Текстовое описание
👍2
В ChatGPT на Plus-тарифе (за 20 баксов) появилась запись длинных встреч с удобной расшифровкой. После обработки записи сразу же создаёт canvas с саммари (подробность можно регулировать, как и у любых текстов в canvas), с привязкой ко времени. Естественно, можно сразу же задавать вопросы к тексту в чате

Расшифровка и диаризаций на уровне, причин запускать Fathom или Гранолу или Limitless никаких
5👍5
…Сегодня нас окружают толпы рьяных Тевтов, одноглазых пророков, видящих лишь то, что новые технологии способны сотворить, и не умеющих вообразить, что они способны разрушить. Таких людей можно назвать технофилами. Они взирают на технологию так же, как влюблённый на предмет своей страсти — не замечая изъянов и не испытывая ни малейшей тревоги за будущее.

Нил Постман. Технополия


...we are currently surrounded by throngs of zealous Theuths, one-eyed prophets who see only what new technologies can do and are incapable of imagining what they will undo. We might call such people Technophiles. They gaze on technology as a lover does on his beloved, seeing it as without blemish and entertaining no apprehension for the future.

Neil Postman. Technopoly
1
Пост-знакомство

Поскольку этот канал потихоньку растёт и уже чуть больше моей технической записной книжки, пора представиться.

Глеб Калинин

У меня 2 основных бэкграунда:
→ IT (20 лет в ролях от фронта до CPO)
→ Работа с людьми (коучинг по стандартам ICF, психология, майндфулнесс и еще огромное количество практик).

Оба из них оказываются сейчас нужны и важны, потому что ИИ — штука очень сложная и для многих эмоциональная. Мне с этой эмоциональность окей.

Последние пару лет я обучал людей на лабораториях AI Mindset (ушёл из проекта), а пока я готовлю новые программы, у меня есть время для личной работы.

Как я могу помочь:

→ Выработать личную стратегию и освоить критичные навыки работы с ИИ. Как коуч и ментор, я помогу вам выработать цели, составить программу, помогу подобрать инструменты и оптимальные паттерны их использования.

→ Сформулировать и упаковать идею вашего проекта или продукта, провести исследование и даже сделать прототип. Я активно слежу, тестирую и пишу про современные технологии, умею проводить исследования и могу помочь подобрать оптимальный стек, а также найти команду, которая поможет реализовать продукт.

С кем я обычно работаю:
→ Предприниматели, руководители и специалисты (продакты, разработчики, аналитики), но несколько раз я работал — и мне понравилось — с подростками про их AI-based продукты

Я не теоретик: активно пользуюсь современными моделям и агентами, разрабатываю свои AI-based приложения, пишу про всё это в своём канале.
Ссылки о себя положу в комментариях.

Если вам актуально — предлагаю бесплатный получасовой звонок.

Написать мне

Базируюсь в Берлине и с радостью работаю с компаниями по всему миру.

Мои другие каналы:
Mental health tech
Опытным путём
16👍1🥰1
https://www.youtube.com/watch?v=yIlnyoIxNPI

UltraZoom — система, создающая гигапиксельные изображения из обычных снимков, сделанных на смартфон. На вход — общий кадр и один-два крупноплановых фото, автоматически совмещает крупные планы с общим изображением, оценивает масштаб и строит пары «низкое → высокое» разрешение. Далее предобученная генеративная модель дообучается на этих парах. Результат — плавный пан-и-зум по всему объекту с фотореалистичной детализацией при минимальном исходном материале.

https://ultra-zoom.github.io/
Следить за вакансиями OpenAI и ко всегда интересно — на деле отражает убеждения компании относительно будущего профессий.

К примеру, ищут фронтенд-инженера:

https://openai.com/careers/front-end-software-engineer-marketing/

$255K – $405K + Offers Equity


А вот вакансии Антропиков — https://www.anthropic.com/jobs — тоже любопытно посмотреть в контексте громких заявлений Амадея.

Ни одной вакансии для агентов, все — для людей
👍2
Я не большой фанат распространения промтов, но вот этот мне дал удивительно любопытные результаты в ChatGPT:

What advice have you been trying to give me that i havent been able to hear?

Можно добавить Respond in Russian. 4o и o3, русская и английская версии вернули немного разные результаты.

Один совет ChatGPT по ощущениям был очень похож на один из мощных моментов в моей работе с психотерапевтом. На больших объемах и с постепенно улучшающейся памятью LLM смогут давать нам уникальную перспективу на наши когнитивные и эмоциональные процессы.
12
Сейчас много пишут (я в том числе в канале Mental health tech) про риски взаимодействия с ChatGPT, но такие истории тоже важно подсвечивать.

Людей, для которых ии-инструменты могут стать искусным средством для движения к стоящей жизни наверняка больше, а не меньше, чем тех, кто столкнется со сложностями.
3