Записки C3PO
5.1K subscribers
75 photos
5 videos
227 links
Product Director @ T-Bank AI, ex. YouDo

Пишу о Product & People Management, AI, своих наблюдениях и прочих бесполезных вещах.
Download Telegram
Пишут, что «Джеймс Уэбб», обнаружил в атмосфере экзопланеты химические вещества, которые на Земле обычно связаны с деятельностью живых организмов: диметилсульфид и диметилдисульфид, которые преимущественно вырабатываются морским фитопланктоном и другими микробами💆‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
20🔥10
Оказывается, если брать годовую подписку на блог Лени, получаешь еще годовую подписку на следующие продукты:

- Bolt
- Cursor (похоже распродан)
- Lovable
- Replit
- v0
- Granola
- Notion
- Linear
- Superhuman
- Perplexity

Общая стоимость всех продуктов превышает 15k 🤯💳
Как ему удалось собрать такой бандл, мое почтение, конечно.

Напомню, что у Лени все еще лучший блог и подкаст для продактов.

UPD: разобрали 😭
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20
Сделать простой классификатор на входе для распознования благодарности — нет.
Рассказывать в твиттере о миллионах на ответы на благодарность — да.

https://x.com/sama/status/1912646035979239430?s=46
😁28👍14
Записки C3PO
Хороший пример того, до чего доводит гештальт терапия https://t.me/strategic_move/1184
Дополнение к предыдущему посту и плавный переход к достаточно важной проблеме:
- Проблемы "проработок" и бесконечного хождения по кругу — это типичная проблема гештальт-терапии, которой почти полностью нет в КПТ.
- В комментах правильно заметили, что одна из причин, почему LLM плохо справляются в роли терапевта, — это их жесткий confirmation bias.

На самом деле, Confirmation Bias моделей и их легкая адаптивность к почти любой дичи, которую вы им говорите, — одна из самых больших и ключевых проблем, на мой взгляд, которая мешает LLM генерировать больше пользы и внедряться в бизнес. Причин много: начиная от датасетов, методов обучения и заканчивая тем, что часто это тупой абьюз какого-нибудь RL.

Модельки OpenAI, кстати, судя по всему, учат для того, чтобы не поддаваться "провокациям" пользователя и стоять на своем. Видимо, что очевидно для передовых исследователей, они тоже считают это крупной проблемой. Но такие методы обучения, похоже, имеют достаточно болезненные сайд-эффекты: когда модель ошиблась, она начинает упорно стоять на своем и не отходить от неверного пути, который изначально выбрала. Когда я впервые потрогал O1 Pro, это была одна из самых раздражающих в ней вещей.
20👍7
Записки C3PO
У меня есть одна любимая задача для проверки LLM в скиле написания документов, так как это почти самая частая моя задача. Даю недоделанный док со стратегией "одного маркетплейса", к которому прилагается шаблон этого документа и артефакты с юзер/маркет ресерчем…
Нашел кейс, где новые модельки Open AI o3/o4 расцветают. Это кейсы, где нужен стохастический tool calling для решения задач. Тобишь агенты.

Пример, мне нужно построить сложную модель в эксельке с учетом всяких диффузий по Бассу и прочего. У меня есть базовая, есть цифры, которые нужно найти в интернете, есть методология, которую надо улучшить. Даешь задание o3 в интерфейсе Chat GPT, он улучшает твою методологию, ищет нужные цифры в интернете, пишет код, запускает, строит таблички, делает графики. Кажется, еще один пласт моей работы будет до предела автоматизирован.
👍31
Ещё одна причина, по которой я люблю Perplexity и Anthropic, - их визуальный стиль и язык. Кайфово пользоваться продуктом, который приносит не только пользу, но и эстетическое наслаждение, и не выглядит так, будто его сделали студенты за одну ночь во время хакатона.
👍387💯7
Я много ругал Deep Research от Perplexity, но осознал сегодня, что стал пользоваться им чаще, чем от Open AI. А все почему?

Во-первых, они его сильно улучшили.
Во-вторых, если отприоритизировать все мои потребности по частоте возникновения, то получится так:
1. Самый частый кейс с частотой несколько раз в час и больше - получить ответ на вопрос, который меня волнует, здесь и сейчас. Тут решает точность ответа и скорость.
2. Второй по популярности с частотой где-то раз в 2-3 часа - получить развернутый и более глубокий ответ, но окно ожидания может быть увеличено до 5-10 минут. Дольше ждать слишком долго.
3. Ну и последний кейс частотой 1-3 раза в день - требуется глубокое и развернутое исследование и отчет по нему, чтобы с одной максимум 2-х попыток получить исчерпывающий ответ на волнующую меня тему. Лимиты по времени тут уже до нескольких часов увеличиваются изи.

Первый кейс отлично закрывает классический Search Mode в Perplexity Pro. Третья ниша это тот самый Deep Research от Open AI, но второй кейс он решает плохо, ибо время ожидания не вписывается в критерии. И тут как раз после последних обновлений Research Mode от Perplexity решает: он дает достаточно развернутый и качественный ответ, но дает его весьма быстро, вписываясь во временные ограничения. Они его даже переименовали из DeepResearch в просто Research.

Недавний Lightweight режим Deep Research в ChatGPT занимает нишу между Perplexity Research и классическим Deep Research, но ближе к последнему.

В результате все можно отразить в виде триады value/price/speed. Для каждого кейса свои критерии и вот получается, что Research Mode в Perplexity отлично вписался в свою нишу.
16👍9🔥6
Новость, от которой я 🤯: Хинтон оказался леваком.

Да не просто леваком, а из семьи отбитых маоистов.

С другой стороны, чему я удивляюсь? Когда академики не были леваками?
Please open Telegram to view this post
VIEW IN TELEGRAM
5💔3🤔1
😎 флекс нового поколения
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1410💯1
Forwarded from Время Валеры
Недавно на одной встрече, очень большой начальник заметил: с учётом того, что мы теперь много нанимаем по всему миру и в разных часовых зонах, умение писать становится критически важным.

Спорить с этим сложно, и переоценить важность тоже. К сожалению, многие люди катастрофически не умеют формулировать свои мысли — отсюда все эти «давай быстро созвонимся», «пересечёмся раз на раз» или голосовые сообщения. Не всегда, но очень часто это происходит не потому, что встреча действительно нужна, а потому что человек просто не в состоянии организовать свой словесный салат во что-то внятное. В итоге он выливает свои мысленные помои на собеседника в надежде, что тот переработает это во что-то осмысленное — вместо того чтобы самому потратить время и внимание.

Черчилль как-то написал: «Прости, времени было мало, поэтому письмо длинное». И почти все это понимают на подсознательном уровне — отсюда все мемы и приколы про голосовые сообщения. Сложно переоценить важность хорошей культуры письма: она не только экономит кучу времени и сил, позволяет работать асинхронно, но со временем ещё и учит человека мыслить собранно и чётко.

Возможно, не стоит доходить до пределов ребят из провинции Лакония с их «если», но пример с них брать точно стоит. В здоровом письме — здоровый дух. А лучшая встреча - это короткая встреча
34👍12💯10👏1
Время Валеры
Недавно на одной встрече, очень большой начальник заметил: с учётом того, что мы теперь много нанимаем по всему миру и в разных часовых зонах, умение писать становится критически важным. Спорить с этим сложно, и переоценить важность тоже. К сожалению, многие…
В комментариях к посту Валеры и его репосту в Сиолошной многие отстаивают мысль, что голосовое обсуждение проще и быстрее текстовой коммуникации. Парадоксально, но этот аргумент лишь подтверждает исходный тезис. Когда человеку легче пробиться через плотный календарь и организовать встречу, чем четко сформулировать мысль на письме, это красноречиво свидетельствует о его затруднениях с письменной коммуникацией.

При этом догматизмом страдать тоже не нужно. Текст не является панацеей и есть ситуации, когда устное или визуальное общение действительно предпочтительнее, но таких ситуаций диспропорционально меньше.

Письменная коммуникация имеет свои ограничения, главное из которых — субъективность восприятия. Каждый читатель привносит собственную эмоциональную окраску в прочитанное. Поэтому встречи, где критически важен эмоциональный контакт — первые знакомства, развернутая обратная связь, разрешение конфликтов или 1-1 с подчиненными — трудно перевести в текстовый формат. Однако способность грамотно и экологично изложить фидбек на письме зачастую отражает умение деликатно донести его и при личном общении.

Качественно составленный 6-pager всегда превосходит презентацию, где выступающий полагается лишь на жестикуляцию на фоне слайдов с несколькими картинками. Но принятие решений в письменном формате осложняется асинхронностью коммуникации. Для обсуждения стратегических ставок и принятия важных решений о запусках предпочтительнее живое общение, поскольку оно способствует достижению консенсуса и вовлеченности всех участников.

Стоит ли, однако, тратить драгоценное время на встречу, организованную человеком, который присылает приглашение с лаконичным названием "Синк", без описания, адженды, целей и ожидаемых результатов, но при этом приглашает 25 сотрудников, суммарная почасовая ставка которых сопоставима с его месячным окладом?

В конечном счете, письмо, голос, визуал и другие средства — это инструменты коммуникации в нашем арсенале. Мастерство заключается не в слепой приверженности одному из них, а в умении выбрать наиболее подходящий инструмент для конкретной ситуации. Способность гибко переключаться между различными форматами коммуникации в зависимости от контекста и целей — вот что действительно отличает настоящего профессионала.
💯54👍7🔥64
Похоже, в моем AI арсенале поселится еще одна апка - Granola.

Это апка для ведения заметок, которая умеет транскрибировать диалоги и превращать их в красивые и хорошо структурированные заметки. Звучит стандартно, да?

Ключевые отличия от обычных подобных сервисов:
- Апка (Mac или iOS) умеет слушать системный in/out звук, поэтому не привязана к интеграциям всяких ботов в Zoom и прочее, а, по сути, может работать всегда и везде. Очень удобно положить на оффлайн митинге телефон, который фоном все просто запишет и превратит это в клевую заметку.
- Можно делать заметки по ходу митинга и они будут учитываться при финализации с помощью AI. Я часто на митингах закидываю какие то тезисы и прочие мысли, чтобы не потерялись, а теперь они еще привязаны к обсуждению и AI сможет это понять и расширить это.
- Если на работе юзаете Google календарь (я нет), по идее, апка может привязывать заметки к митингу вычленять участников, их контакты и добавлять контекст к заметке
- С каждой заметкой можно "початиться" и попросить что-то сделать: Q&A, Action Items, Follow Up Email после митинга и тд.

Модель - фримиум с ограничением на количество митингов. С подпиской их нет.
По идее, несложно написать свой подобный враппер, но кому не лень?
1👍292🔥1
Записки C3PO
Срезонировал пост Карпатого про evaluation-кризис LLM'ок. TLDR: - Cтарые метрики устарели, а новые ненадёжны. - Модели переобучаются под существующие бенчмарки, снижая их объективность. - В настоящее время невозможно точно определить реальное качество современных…
Заменил Superwhisper на Wispr Flow.

Wispr Flow лучше понимает контекст и чётко выполняет голосовые команды при работе с текстом.

К примеру, команду: «Напиши письмо на английском, в котором ты спрашиваешь Лебовски где мои деньги», он сразу поймет, в отличие от Superwhisper, который это делает по настроению. То есть не просто транляция речи в текст.

Еще жирный плюс Wispr Flow это оч маленькое всплывающее окно (скорее иконка) при распозновании речи, которое появляется внизу экрана над доком, а не огромная штука на переднем фоне.
🔥21👍5
Пример того, как по-разному работают модели Anthropic и их конкуренты: если Клоду сказать, выделив текст в документе, в котором он указал какую-то цифру, что для цифры нужен источник этих данных, он признает необходимость источника и изменит утверждение на более общее, не требующее подтверждения ссылками. А если моделям OpenAI или DeepSeek дать аналогичное указание, то они придумывают несуществующие источники, статьи и исследования для подтверждения информации. Но, справедливости ради, модели OpenAI с большей вероятностью назовут существующий источник.
👍315
Forwarded from CX: Стратегическая логика (Михаил Руденко)
– Этот фреймворк не работет!
– А как ты понял?
– Ну я попробовал, у меня не получилось.

Забавная зарисовка из жизни. Но вообще-то ведь именно так и происходит. Почти нигде в современных компаниях методологии не применяются так, как их задумывали авторы. Почему?

Можно, конечно, искать проблемы в самих методологиях. И они там действительно есть. Я знаю крайне мало фреймворков, которые бы обладали внутренними механизмами их проверки на корректность. Особенно, если это условно "гуманитарные" фреймворки.

Ты можешь заполнить бизнес-модель Остервальдера любой чушью, и она никак тебя не огородит от этой чуши. Та же история с JTBD, та же с CJM. Все они построены по единой схеме: там есть "вместилище", но нет критериев проверки правильности содержания этого "вместилища". Это всегда остается ответственностью заполняющего. И это огромная проблема.

Но эта проблема не самая главная. В конце концов, если вы командой заполняете какой-то фреймворк с размытыми рамками, кто вам мешает договориться о них для себя?

И вот тут мы приходим к ключевой, как мне кажется, беде. Почти никто в современных компаниях не любит думать о правильности того, что он делает вообще. В целом. Не любит рефлексировать о методах, о логике своих действий. Все предпочитают как можно скорее "показать результат". И нет никакого стремления этот результат самопроверить и самоулучшить. Я помню, как будучи еще преподом в ВШЭ наблюдал, как люди приносили на защиты (!) дипломные презентации, содержащие грамматические ошибки, недописанные предложения и даже черновые слайды! Взрослые люди, сотрудники корпораций. Они просто поленились финально вычитать свою же презентацию.

Мало задавать себе вопрос "а не х.ню ли я делаю?" Это модный, но бесполезный речекряк. Если ты не можешь по честноку и без дураков проанализировать свою работу, тебе всегда будет казаться, что нет, не х.ню – вот же, доска миро вся в стикерах, табличка полностью заполнена, что еще нужно? А если в итоге ничего не получилось – ну так это эксперимент, мы живём в быстроменяющемся мире и всё такое.

Такое некритичное отношение к себе и своему труду видится мне частным следствием общей культуры "этичной обратной связи", когда ни в коем случае нельзя говорить человеку, что он сделал что-то плохо, нужно обязательно показывать как лучше и в конце похвалить по голове, потому что сам-то он, конечно, молодец, просто вот тут надо исправить. А поскольку внутренних механизмов проверки нет (см. абзац выше), то проще принять работу – и так сойдет. Впрочем, даже если критерии и есть, "проверяющий" зачастую сам настолько не погружен в вопрос, что ему всё равно бы ничего не помогло.

Вот и выходит, что фреймворки не работают в основном потому что пользователи даже не попробовали представить себе его правильную работу. Ибо работать с фреймворком – это значит мыслить им, а не заполнять им стикеры. А вопрос "правильно ли я мыслю" обычно очень и очень не нравится людям.

Ибо там почти всегда бездна и страшное.
🔥2213😁2💯2
CX: Стратегическая логика
– Этот фреймворк не работет! – А как ты понял? – Ну я попробовал, у меня не получилось. Забавная зарисовка из жизни. Но вообще-то ведь именно так и происходит. Почти нигде в современных компаниях методологии не применяются так, как их задумывали авторы. Почему?…
Очередной пост Миши Руденко прям по живому. Потому что корявая имплементация фреймворков в индустрии это одна из главных моих болей. Столько людей вокруг с ПТСР от аджайла, скрама или OKR, который вызван по факту абсолютно непрофессиональным исполнением.

Я бы еще добавил, что одна из главных причин этого то, что каждый думает, что он самый умный и начинает менять на старте готовую методологию, даже не попробовав запустить, как есть. А потом бегают и рассказывают, какие хреновые и неработающие системы.

Один мой знакомый как-то сказал: «никто не спорит, что если в ракете поменять какую-то цифру в формуле или букву в коде, то она не взлетит или взорвется в воздухе, а когда дело доходит до каких нибудь фреймворков на работе, то каждый резко начинает считать, что он самый умный и может поменять все и оно будет работать»
💯23👍42👏1