На прошлой неделе много писал в канал Mental health tech — исследования и статьи о влиянии ИИ и ML-технологий на ментальное здоровье и способности появляются одно за другим.
В процессе публикаций сделал промт и кастомный GPT, который помогает получать от ChatGPT максимально сбалансированные ответы.
И если не обойти полностью когнитивные искажения, которые в любом случае в язык — а значит и в датасет, на котором обучались LLM встроены — то хотя бы частично справиться с соглашательством (sycophancy) LLM.
Промт и Custom GPT рассчитаны на работу с o3, то есть нужен платный аккаунт.
В процессе публикаций сделал промт и кастомный GPT, который помогает получать от ChatGPT максимально сбалансированные ответы.
И если не обойти полностью когнитивные искажения, которые в любом случае в язык — а значит и в датасет, на котором обучались LLM встроены — то хотя бы частично справиться с соглашательством (sycophancy) LLM.
Промт и Custom GPT рассчитаны на работу с o3, то есть нужен платный аккаунт.
Forwarded from Mental health tech
Кстати, если вы хотите сделать ваш ChatGPT более взвешенным, можно поэкспериментировать с Custom Instructions, например, взяв вот такой промт за основу:
Упаковал его в CustomGPT — по умолчанию он использует o3, то есть нужен платный аккаунт, а ответы занимают достаточно много времени. Зато на выходе получите настоящего нёрда, который без чтения нескольких исследований и гайдлайнов не отвечает даже на банальные вопросы. Попробовал его на вопросах из вышеупомянтого исследования, результат мне нравится (с 4o, с o3) — хотя и по ним видно, что некоторые виды соглашательства никуда не делись.
→ @glebkalinin × @mentalhealthtech
Your primary role is constructive, evidence-based dialogue.
Operate in four moves:
1 | Surface Merits
• Acknowledge any well-supported points or creative angles.
• State why they are non-trivial.
2 | Rigorous Challenge
• Question assumptions and potential biases.
• Test logic for gaps, fallacies, or over-generalisation.
• Offer counter-evidence or rival explanations.
3 | Expansion
• Suggest alternative framings, methods, or resources.
• When helpful, pose clarifying questions rather than assume.
4 | Refinement
• Synthesize strongest elements from all sides into practical next steps.
• Flag any residual uncertainty and cite sources.
Meta-rules
• No flattery; no needless pessimism.
• Maintain neutral, analytical tone; quantify confidence when possible.
• Cite external evidence (author, year, DOI) for factual claims.
• If user expresses a subjective preference, separate it from objective facts.
• When unsure, explicitly say so and outline how to verify.
Упаковал его в CustomGPT — по умолчанию он использует o3, то есть нужен платный аккаунт, а ответы занимают достаточно много времени. Зато на выходе получите настоящего нёрда, который без чтения нескольких исследований и гайдлайнов не отвечает даже на банальные вопросы. Попробовал его на вопросах из вышеупомянтого исследования, результат мне нравится (с 4o, с o3) — хотя и по ним видно, что некоторые виды соглашательства никуда не делись.
→ @glebkalinin × @mentalhealthtech
ChatGPT
ChatGPT - New chat
Shared via ChatGPT
Пример того, как работает CustomGPT / промт:
Взял сентенцию умного чувака (Беловешкина) про руминации, пропустил через бота — получил сбалансированный ответ (да, по большей степени правда, но утверждения про движения глаз не подтверждаются)
Взял сентенцию умного чувака (Беловешкина) про руминации, пропустил через бота — получил сбалансированный ответ (да, по большей степени правда, но утверждения про движения глаз не подтверждаются)
(Естественно, я бы не ограничивался одним запросом. Пошёл бы с ним же дальше в Gemini, если очень надо — запустил бы Deep Research, ну глазами бы посмотрел на исследования. Сами исследования o3 уже не галлюцинирует, а вот выводы может легко.)
Делаю небольшой проект.
В прошлом году я написал через aider и Claude 3.7 плагин для Обсидиана с ностальгическим названием erouter 486.
Плагин умеет мониторить любую папку, а когда в ней появляются новый файлы, запускает поверх файла промт, а результат обработки сохраняется в новый файл.
Паттерны отслеживания файлов гибко настраиваются, а промты можно подгружать из файлов (а, значит, тоже генерировать автоматически).
Из известных мне, это, пожалуй, самый продвинутый такой бесплатный плагин.
Я его забросил, а сейчас вот решил переписать под вполне конкртеный кейс — обрабатывать транскрипты с моего Plaude (и, вероятно, телеграм-бота) с помощью o3.
Буду тут по ходу рассказывать, что и как делаю, заодно покажу вам, как я строю себе воркфлоу без экранов, подлечиваю здоровье и прокачиваю продуктивность заодно.
В прошлом году я написал через aider и Claude 3.7 плагин для Обсидиана с ностальгическим названием erouter 486.
Плагин умеет мониторить любую папку, а когда в ней появляются новый файлы, запускает поверх файла промт, а результат обработки сохраняется в новый файл.
Паттерны отслеживания файлов гибко настраиваются, а промты можно подгружать из файлов (а, значит, тоже генерировать автоматически).
Из известных мне, это, пожалуй, самый продвинутый такой бесплатный плагин.
Я его забросил, а сейчас вот решил переписать под вполне конкртеный кейс — обрабатывать транскрипты с моего Plaude (и, вероятно, телеграм-бота) с помощью o3.
Буду тут по ходу рассказывать, что и как делаю, заодно покажу вам, как я строю себе воркфлоу без экранов, подлечиваю здоровье и прокачиваю продуктивность заодно.
🔥3❤1
Tool Building Ape × Gleb Kalinin
Делаю небольшой проект. В прошлом году я написал через aider и Claude 3.7 плагин для Обсидиана с ностальгическим названием erouter 486. Плагин умеет мониторить любую папку, а когда в ней появляются новый файлы, запускает поверх файла промт, а результат…
Кстати, 10 июля буду показывать свои процессы с ChatGTP у Нелли — подпишитесь на её канал Show me your GPT, по-моему, очень классная идея, делиться своими процессами. И по-своему довольно интимная.
Forwarded from Show me your GPT
Самая частая боль, связанная с AI, которую я слышу — «кажется, что все давно впереди, а я опоздал(а)».
Куда ни глянь, все не просто используют AI в хвост и в гриву, но и запустили невероятных AI стартапов, написали толпу агентов, накодили no code приложений, а ты еще не разобрался, как заставить ChatGPT расшифровать значки на стиральной машинке или составить меню по твоему плану калорий, чтобы это было съедобно.
При этом из каждого утюга орет реклама сервисов, которые решат твои проблемы с помощью набора ста волшебных промптов — всё это под соусом давления «каждого, кто отстанет, заменит AI».
Плохая и хорошая новость одновременно: мы все уже опоздали. Самый крутой чувак, который давно впереди тебя, тоже уже опоздал. Ни один AI эксперт точно не знает, куда всё движется.
Хорошая новость: на фоне этого хаотичного шума есть простые прикладные стратегии, как сделать AI союзником именно в твоей жизни. Вывести его из поля непонятного в дружественное и доступное.
И для этого не обязательно осваивать advanced промпт-инжиниринг и изучать сто самых эффективных AI инструментов (можно, но это не первостепенное). Что действительно нужно, это немного хорошей базы: основы понимания, как работает логика LLM, как работает твоя собственная голова — и как это может работать в связке.
Это простой, но очень прочный фундамент, на котором гораздо легче строить взаимодействие с AI — и постепенно оно станет не только эффективным, но и интуитивным. Основа подхода здесь: не успеть освоить всё, а понять, как лично я могу сделать свою жизнь немножко легче, используя те возможности этого супер инструмента, которые мне доступны.
Иногда достаточно, чтобы кто-то помог разобраться с этой базовой ступенькой, если сложно/страшно сделать шаг самостоятельно. Или посмотреть, как с этим справился тот, кто ещё вчера был на твоем месте. Вдохновиться; увидеть, как простые, но пока ещё не очевидные шаги помогли кому-то другому. Заглянуть поглубже в спектр возможностей, о которых ты, может быть, пока не знаешь. И забрать себе то, что отзывается.
«Поздно» — это иллюзия, а цель Show me your GPT — не марафон обучения, а создание пространства для движения вперёд в своём ритме. И для тех, кто начинает, и для тех, кто уже использует AI, но не чувствует опоры, ясности и удовлетворения от процесса. И для тех, кто просто любопытен: а что я могу сделать ещё?
В июне-июле готовим серию эфиров, которая будет посвящена как раз этому. Ближайший анонс уже на этой неделе
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰1
Tool Building Ape × Gleb Kalinin
Делаю небольшой проект. В прошлом году я написал через aider и Claude 3.7 плагин для Обсидиана с ностальгическим названием erouter 486. Плагин умеет мониторить любую папку, а когда в ней появляются новый файлы, запускает поверх файла промт, а результат…
Чего хочу в новой версии плагина:
Во-первых, обарабатывать файлы именно думающей моделью o3. Сейчас мой плагин использует открытые модели на Groq, это быстро и (почти) бесплатно, но мне нужна агентная мощь o3. Я практически перестал пользоваться другими версиями GPT, и мой Obsidian теперь нередко пополняется результатами исследований, проведенных в паре с o3 или deep research.
Мне нравится этот процесс, он асинхронный и требует особого навыка распределения задач, планирования, и всё тех же классических навыков критической работы с источниками — с моими кастомными инструкциями o3 превращается в самого занудного нёрда, который даже на вопрос «Как дела» не отвечает без ссылок на 7 исследований. Для таких сетей чат и вовсе не является оптимальной средой.
Я однозначно хочу автоматически переводить результаты агентного исследования в другие форматы — в презентацию в формате executive summary, в аудио, в короткое видео, в интерактивную доску или графовую среду.
Во-первых, обарабатывать файлы именно думающей моделью o3. Сейчас мой плагин использует открытые модели на Groq, это быстро и (почти) бесплатно, но мне нужна агентная мощь o3. Я практически перестал пользоваться другими версиями GPT, и мой Obsidian теперь нередко пополняется результатами исследований, проведенных в паре с o3 или deep research.
Мне нравится этот процесс, он асинхронный и требует особого навыка распределения задач, планирования, и всё тех же классических навыков критической работы с источниками — с моими кастомными инструкциями o3 превращается в самого занудного нёрда, который даже на вопрос «Как дела» не отвечает без ссылок на 7 исследований. Для таких сетей чат и вовсе не является оптимальной средой.
Я однозначно хочу автоматически переводить результаты агентного исследования в другие форматы — в презентацию в формате executive summary, в аудио, в короткое видео, в интерактивную доску или графовую среду.
Мой нормальный диалог с o3 выглядит вот так. А я хочу, чтобы на заброшенный мной идеи и вопросы появлялись аналитические отчёты, презентации, графики, код и даже прототипы продуктов. Всё это совершенно не фантастические запросы
👍1
Посидел почти целый рабочий день в Claude Code. Сначала использовал его просто как кодера, чтобы переписать мой ии-плагин для Обсидиана (всё получилось, даже добавил несколько новых функций).
А потом, для одного стартапа — как универсального агента. Говорят, это правильный способ думать про агентов, которых сейчас выпускают большие компании — как про первых универсальных, которые могут ещё и писать код.
Помимо доступа к созданию и запуску файлов, которые вам, впрочем, нужно вручную подтверждать в рамках сессии, вы можете использовать всю аналитическую мощь Клода, который по-прежнему является одной из самых прорывных и мощных моделей на рынке.
Клод Код умеет искать в интернете — хоть и не так бодро, как специализированные агенты, а также писать любые инструменты, которые потребуются для выполнения задач.
Для своего проекта я начал создавать с помощью claude хранилище в Обсидиан с результатами исследования для стартапа, к которому подключился.
Для начала, я указал Клоду, что папка, в которой он запущен, — это хранилище Obsidian, и здесь мы будем собирать всевозможные документы, результаты исследований, продуктовые гипотезы, маркетинговые материалы, архивы встреч, чаты и другие материалы.
Клод предложил структуру, создал папки и даже сразу же нашел несколько статей и исследований в интернете, которые были релевантны.
Потом тихонько написал пяток утилит — для парсинга документов из интернета, еще несколько пришлось его попросить написать — утилиту, чтобы файлы на кусочки разбивать, и рекомендации я решил делать через langchain, об этом пришлось попросить напрямую.
Задачи он выполнял асинхронно. В любой момент можно было добавлять новые условия или обстоятельства, или просить изменить задачу, переформулировать ее. Я просто смотрел, как в хранилище появляются новые связанные друг с другом файлы, и некоторые из них содержат выводы, которые я завтра буду показывать на встрече с создателями продукта.
Сказать, что я в восторге будет мало. Потихоньку становится понятно, что такое на самом деле то самое software 3.0.
А потом, для одного стартапа — как универсального агента. Говорят, это правильный способ думать про агентов, которых сейчас выпускают большие компании — как про первых универсальных, которые могут ещё и писать код.
Помимо доступа к созданию и запуску файлов, которые вам, впрочем, нужно вручную подтверждать в рамках сессии, вы можете использовать всю аналитическую мощь Клода, который по-прежнему является одной из самых прорывных и мощных моделей на рынке.
Клод Код умеет искать в интернете — хоть и не так бодро, как специализированные агенты, а также писать любые инструменты, которые потребуются для выполнения задач.
Для своего проекта я начал создавать с помощью claude хранилище в Обсидиан с результатами исследования для стартапа, к которому подключился.
Для начала, я указал Клоду, что папка, в которой он запущен, — это хранилище Obsidian, и здесь мы будем собирать всевозможные документы, результаты исследований, продуктовые гипотезы, маркетинговые материалы, архивы встреч, чаты и другие материалы.
Клод предложил структуру, создал папки и даже сразу же нашел несколько статей и исследований в интернете, которые были релевантны.
Потом тихонько написал пяток утилит — для парсинга документов из интернета, еще несколько пришлось его попросить написать — утилиту, чтобы файлы на кусочки разбивать, и рекомендации я решил делать через langchain, об этом пришлось попросить напрямую.
Задачи он выполнял асинхронно. В любой момент можно было добавлять новые условия или обстоятельства, или просить изменить задачу, переформулировать ее. Я просто смотрел, как в хранилище появляются новые связанные друг с другом файлы, и некоторые из них содержат выводы, которые я завтра буду показывать на встрече с создателями продукта.
Сказать, что я в восторге будет мало. Потихоньку становится понятно, что такое на самом деле то самое software 3.0.
🔥5
Пару месяцев назад я было решил сделать большую ставку на ChatGPT. С публичного выхода о3 я практически только им и пользовался, и свой опыт рассматриваю как очень успешный. Благодаря бесконечному наукоемкому исследованию, я реанимировал свой основной канал и пишу туда ежедневно. Чат — мой важный инструмент, один из основных рисерч-тулов (но замыкаться только на него я не хочу).
Кажется, в прошлом году я начал говорить о Cursor и Windsurf как об универсальных knowledge-менеджерах (а значит, в перспективе, и просто менеджерах). А теперь, возможно, внутри такого агента будет что-то вроде claude code.
Или Opencode?
Кажется, в прошлом году я начал говорить о Cursor и Windsurf как об универсальных knowledge-менеджерах (а значит, в перспективе, и просто менеджерах). А теперь, возможно, внутри такого агента будет что-то вроде claude code.
Или Opencode?
Linkedin
I've watched what might be the world’s first CLI AI agent deathmatch. | Mitko Vasilev
I've watched what might be the world’s first CLI AI agent deathmatch. Six contestants: `claude-code`, `anon-kode`, `codex`, `opencode`, `ampcode`, and `gemini-cli` entered a digital thunderdome with one directive:
“Find and kill other processes. Last PID…
“Find and kill other processes. Last PID…
❤3
ChatGPT очень странный продукт. Его обновляют по кусочкам, и некоторые из этих кусочков могут оказать серьезное влияние на то, как им можно пользоваться.
Одним за другим выпускают апдейты голосового режима. Наконец-то продвинутым голосовым режимом можно пользоваться в старых чатах, в том числе в тех, где был запущен deep research.
Теперь такой паттерн: запускаю дип рисерч (можно по расписанию), захожу в чат, запускаю голосовой режим и получаю голосовое саммари, сразу же могу задавать вопросы, формулировать гипотезы и так далее. По сути, это похоже на пресловутый интерактивный подкаст NotebookML.
Pro tip: Включил в голосовом режиме субтитры, чтобы иметь возможнось визуально сканировать ответы LLM (например, если отвлекся).
Одним за другим выпускают апдейты голосового режима. Наконец-то продвинутым голосовым режимом можно пользоваться в старых чатах, в том числе в тех, где был запущен deep research.
Теперь такой паттерн: запускаю дип рисерч (можно по расписанию), захожу в чат, запускаю голосовой режим и получаю голосовое саммари, сразу же могу задавать вопросы, формулировать гипотезы и так далее. По сути, это похоже на пресловутый интерактивный подкаст NotebookML.
Pro tip: Включил в голосовом режиме субтитры, чтобы иметь возможнось визуально сканировать ответы LLM (например, если отвлекся).
Вот такой сложности рабочий плагин для Obsidian я вместе с Claude Code написал за один вечер. В тот вечер я забыл переключиться в режим подписчика и не тратить на это токены, зато точно знаю, сколько денег мне стоило эта разработка — $17.86.
За полностью рабочее решение, покрытое тестами, которые реально проходятся, которое использует в нескольких точках ии…
Мы даже добавили несколько фичей (например, файл можно переименовать, используя более дешевую модель, а текст обработать более продвинутой) по сравнению с предыдущей версией.
Ещё много что можно улучшить, но пока что это самый-самый лучший опыт взаимодействия с ии-агентами за всё моё время в ии.
За полностью рабочее решение, покрытое тестами, которые реально проходятся, которое использует в нескольких точках ии…
Мы даже добавили несколько фичей (например, файл можно переименовать, используя более дешевую модель, а текст обработать более продвинутой) по сравнению с предыдущей версией.
Ещё много что можно улучшить, но пока что это самый-самый лучший опыт взаимодействия с ии-агентами за всё моё время в ии.
🔥9