Research Insights Made Simple #18 Review of "AI in SDLC report" by IT One & Skolkovo (Рубрика #AI)
Обсудили исследования от IT One и Сколково вместе с Дмитрием Немовым, директором по развитию и продуктам IT ONE. Дима - один из авторов этого исследования, что позволило копнуть в цели исследования, методологию, результаты. В общем, мне было очень интересно общаться с Димой и я надеюсь, что вам тоже понравиться выпуск. И если он вам зайдет, то поучаствуйте в исследовании про влияние AI на SDLC от Т-Банка
Кстати, сами результаты исследования от IT One и Сколково доступны здесь, плюс есть мой разбор в двух постах: 1 и 2. А в этом выпуске мы обсудили следующие темы
- Введение и тема выпуска
- Предпосылки: зачем это исследование
- Структура и методология исследования
- Мировая практика и этапы SDLC
- Сквозные инструменты и внутренняя платформа
- Автоматизация задач и роль доменных специалистов
- Как мерить продуктивность: опросы vs метрики активности
- Ассистенты и автодополнение - норма в 2025 году
- Платформенные решения: ИИ как ядро стратегии
- 2024→2025: адаптация и ожидания vs реальность
- Российские тренды: централизованный ModelOps и пилоты
- Агентные и мультиагентные подходы
- Изменение ролей в командах и доверие к коду
- Платформа для измерения эффектов (утилизация, impact, cost‑benefit analysis)
- Переход от пилотов к продукту и выбор кейсов
Выпуск подкаста доступен в Youtube, VK Video, Podster.fm, Ya Music.
#AI #Engineering #Architecture #ML #Software #Economics #Software
Обсудили исследования от IT One и Сколково вместе с Дмитрием Немовым, директором по развитию и продуктам IT ONE. Дима - один из авторов этого исследования, что позволило копнуть в цели исследования, методологию, результаты. В общем, мне было очень интересно общаться с Димой и я надеюсь, что вам тоже понравиться выпуск. И если он вам зайдет, то поучаствуйте в исследовании про влияние AI на SDLC от Т-Банка
Кстати, сами результаты исследования от IT One и Сколково доступны здесь, плюс есть мой разбор в двух постах: 1 и 2. А в этом выпуске мы обсудили следующие темы
- Введение и тема выпуска
- Предпосылки: зачем это исследование
- Структура и методология исследования
- Мировая практика и этапы SDLC
- Сквозные инструменты и внутренняя платформа
- Автоматизация задач и роль доменных специалистов
- Как мерить продуктивность: опросы vs метрики активности
- Ассистенты и автодополнение - норма в 2025 году
- Платформенные решения: ИИ как ядро стратегии
- 2024→2025: адаптация и ожидания vs реальность
- Российские тренды: централизованный ModelOps и пилоты
- Агентные и мультиагентные подходы
- Изменение ролей в командах и доверие к коду
- Платформа для измерения эффектов (утилизация, impact, cost‑benefit analysis)
- Переход от пилотов к продукту и выбор кейсов
Выпуск подкаста доступен в Youtube, VK Video, Podster.fm, Ya Music.
#AI #Engineering #Architecture #ML #Software #Economics #Software
YouTube
Research Insights Made Simple #18 Review of "AI in SDLC report" by IT One & Skolkovo
Обсудили исследования от IT One и Сколково вместе с Дмитрием Немовым, директором по развитию и продуктам IT ONE (https://www.it-one.ru/). Дима - один из авторов этого исследования, что позволило копнуть в цели исследования, методологию, результаты. В общем…
❤6🔥4👍2
Маленький принц
Недавно коллеги подарили мне фигурку Маленького Принца и его Розы, а также очень красивую книгу про эту историю. Сегодня я собрал Принца и Розу и теперь он оберегает мой рабочий стол вместе с Космонавтом, который раньше делал это в одиночку:)
Недавно коллеги подарили мне фигурку Маленького Принца и его Розы, а также очень красивую книгу про эту историю. Сегодня я собрал Принца и Розу и теперь он оберегает мой рабочий стол вместе с Космонавтом, который раньше делал это в одиночку:)
1❤15🔥7👍1
Техношоу «Дропнуто»: выпуск 1 (Рубрика #SRE)
Посмотрел вчера интересный выпуск нового шоу "Дропнуто" от моих коллег из Т-Банка. В этом шоу ребята говорят об инцидентах на дата‑платформах, с честным разбором причин и выводов. Интересно, что шоу идет в прямом эфире, что должно вселять надежду в минимум редактуры и зап...ния. Формат выдержан в духе blameless postmortems, где мы подходим к постмортемам без обвиненений и даже с прицелом на обучение - чель поговорить про то, а почему отказы случаются, как их предотвратить и что изменить в процессах/архитектуре для повышения надежности (кстати, про надежность в Т-Банке хорошо рассказывал Леша Мерсон в статье, о которой я писал раньше).
В первом выпуске подкаста гостем был Александр Крашенинников из Т‑Банка, практик в области платформ данных/ETL/DWH, а также просто человек с хорошим чувством юмора и навыками импровизации, что можно увидеть из его рассказа о двухнедельном инциденте в датаплатформе, о котором он рассказывает в этом эпизоде. Цепочка инцидента выглядит кратко примерно так: удаление/потеря метаданных → падение чтения в Trino → нет бэкапа/медленное CDC‑восстановление → критичный инцидент → разворот на новую Kafka‑архитектуру + контракты → унификация схем, параллельные загрузки → валидация и исправление расхождений → восстановление сервиса с возможной частичной потерей → восстановление сервиса из бекапов и дозагрузка исторических данных.
Инженерам может понравитсья этот «боевой» разбор инцидента
- Эксплуатация CDC (change data capture): где Debezium удобен, его архитектурные варианты, типовые грабли
- Паттерны целостности: outbox‑подход для надёжного обмена событиями между сервисами и границы применимости.
- Наблюдаемость пайплайнов: какие SLI поднимать для «скорости данных» (freshness/latency), целостности (дупликаты/пропуски), устойчивости коннекторов.
Руководителям эпизод полезен для управленческой оптики:
- Единый язык риска: связать цвет/серьёзность инцидента с бюджетам ошибок и фризом релизов
- Культура обучения на сбоях: blameless‑постмортемы как системный инструмент качества и коммуникации между командами данных/продукта/SRE.
- Управление SLO: перевод пользовательских метрик (например, «данные в витрине свежи ≤ X минут 99,9% времени») в алерты и план/факт по риску.
#SRE #SystemDesign #Software #Architecture #Metrics #SoftwareArchitecture #Engineering #Databases #Data
Посмотрел вчера интересный выпуск нового шоу "Дропнуто" от моих коллег из Т-Банка. В этом шоу ребята говорят об инцидентах на дата‑платформах, с честным разбором причин и выводов. Интересно, что шоу идет в прямом эфире, что должно вселять надежду в минимум редактуры и зап...ния. Формат выдержан в духе blameless postmortems, где мы подходим к постмортемам без обвиненений и даже с прицелом на обучение - чель поговорить про то, а почему отказы случаются, как их предотвратить и что изменить в процессах/архитектуре для повышения надежности (кстати, про надежность в Т-Банке хорошо рассказывал Леша Мерсон в статье, о которой я писал раньше).
В первом выпуске подкаста гостем был Александр Крашенинников из Т‑Банка, практик в области платформ данных/ETL/DWH, а также просто человек с хорошим чувством юмора и навыками импровизации, что можно увидеть из его рассказа о двухнедельном инциденте в датаплатформе, о котором он рассказывает в этом эпизоде. Цепочка инцидента выглядит кратко примерно так: удаление/потеря метаданных → падение чтения в Trino → нет бэкапа/медленное CDC‑восстановление → критичный инцидент → разворот на новую Kafka‑архитектуру + контракты → унификация схем, параллельные загрузки → валидация и исправление расхождений → восстановление сервиса с возможной частичной потерей → восстановление сервиса из бекапов и дозагрузка исторических данных.
Инженерам может понравитсья этот «боевой» разбор инцидента
- Эксплуатация CDC (change data capture): где Debezium удобен, его архитектурные варианты, типовые грабли
- Паттерны целостности: outbox‑подход для надёжного обмена событиями между сервисами и границы применимости.
- Наблюдаемость пайплайнов: какие SLI поднимать для «скорости данных» (freshness/latency), целостности (дупликаты/пропуски), устойчивости коннекторов.
Руководителям эпизод полезен для управленческой оптики:
- Единый язык риска: связать цвет/серьёзность инцидента с бюджетам ошибок и фризом релизов
- Культура обучения на сбоях: blameless‑постмортемы как системный инструмент качества и коммуникации между командами данных/продукта/SRE.
- Управление SLO: перевод пользовательских метрик (например, «данные в витрине свежи ≤ X минут 99,9% времени») в алерты и план/факт по риску.
#SRE #SystemDesign #Software #Architecture #Metrics #SoftwareArchitecture #Engineering #Databases #Data
YouTube
Техношоу «Дропнуто»: выпуск 1
«Дропнуто» — техношоу, где инженеры из крупнейших ИТ-команд делятся самыми болезненными фейлами на дата-платформах. В выпуске — Александр Крашенинников из Т-Банка, который однажды остался один на один с Iceberg, Kafka, Debezium и шквалом продовых багов. Что…
❤9🔥7👍3✍1🤔1
[1/3] How States Think: The Rationality of Foreign Policy (Как мыслят государства: рациональность внешней политики) (Рубрика #Politics)
С большим интересом прочитал книгу Джона Дж. Миршаймера и Себастьяна Розато, в которой авторы спорят с модной идеей, что государства часто ведут себя «нерационально». Они предлагают прикладное определение рациональности, ближе к инженерному мышлению:
- Решения опираются на достоверную теорию причин‑следствий, и
- Решения принимаются через содержательную, несиловую дискуссию (deliberation).
В мире внешней политики не хватает данных и вероятностей (это не «риск», а неопределённость), поэтому «максимизация ожидаемой полезности» и многие выводы поведенческой экономики дают сбой. По их критериям большинство решений государств - рациональны, даже если исход оказался неудачным.
Подробнее про книгу поговорим в следующий раз.
#Economics #Leadership #Management #Data
С большим интересом прочитал книгу Джона Дж. Миршаймера и Себастьяна Розато, в которой авторы спорят с модной идеей, что государства часто ведут себя «нерационально». Они предлагают прикладное определение рациональности, ближе к инженерному мышлению:
- Решения опираются на достоверную теорию причин‑следствий, и
- Решения принимаются через содержательную, несиловую дискуссию (deliberation).
В мире внешней политики не хватает данных и вероятностей (это не «риск», а неопределённость), поэтому «максимизация ожидаемой полезности» и многие выводы поведенческой экономики дают сбой. По их критериям большинство решений государств - рациональны, даже если исход оказался неудачным.
Подробнее про книгу поговорим в следующий раз.
#Economics #Leadership #Management #Data
❤10🔥8👍4
[2/3] How States Think: The Rationality of Foreign Policy (Как мыслят государства: рациональность внешней политики) (Рубрика #Politics)
Продолжая рассказ о книге, надо отметить, что модель рациональности авторов содержат два слоя
1. Рациональность целей (goal rationality). Почти всегда на первом месте - выживание государства; остальные цели подчинены этому.
2. Рациональность стратегий (strategic rationality). В итоге, стратегические решений
- Опирается на достоверную теорию (реалистичные допущения, непротиворечивая каузальная логика, поддержка в данных/истории), и
- Появилось из открытой и «неподавляющей» процедуры обсуждения (без умолчаний, давления, искажения информации). Оценивать нужно процесс, а не только результат.
Ключом к их школе мыслей является разница между риском и неопределенностью. В международной политике чаще нет надёжных частот/базовых вероятностей, поэтому чистые расчёты EV/Expected Utility неприменимы - здесь имеет смысл построения надежных теорий + сценарный анализ и «проверка на худший случай».
Вот как выглядит критика стандартных подходов от авторов книги
1. Против expected utility. Модели, где рациональность = расчёт ожидаемой полезности, предполагают измеримые вероятности и стабильные предпочтения, а во внешней политике это редкость. Поэтому требовать от государств «считать EU в голове» - неправильно; разумнее оценивать качество применённой теории и качество процесса.
2. Против «все вокруг в bias’ах». Политпсихология/поведенческая экономика часто объявляет отклонения от expected utility «нерациональностью» (bias), упирая в аналогии, эвристики, «групповое мышление». Авторы отвечают:
- Эвристики ≠ нерациональность, если они встроены в внятную теорию и
- Групповые процедуры в госаппарате нередко сглаживают индивидуальные искажения. И главное - эти подходы почти не объясняют, как индивидуальные мнения агрегируются в государственные решения.
Если говорить про инженерную интерпретацию, то авторы предлагают сменить метрику оценки рациональности с «считал ли агент правильный expected value» на «была ли у агента валидная модель мира + нормальный review‑процесс принятия решения».
Свою модель авторы подтверждают разбором ситуаций, которые по мнению авторов были несправедливо названы нерациональными
- Начинается все с СВО в 2022 году - в предисловии книги разбирается как кейс, где на Западе быстро повесили ярлык «безумия», но авторы считают решение теоретически мотивированным (баланс сил, НАТО) и обсуждённым на уровне элиты.
- Германия, вступление в Первую мировую (1914) - превентивная логика против растущей мощи соперников и окна уязвимости.
- Япония, удар по Пёрл‑Харбору (1941) - попытка вывести из игры Тихоокеанский флот США и обеспечить ресурсы; рискованная стратегия, но не «иррациональный порыв».
- Германия, «Барбаросса» (1941) - авторы показывают, что ключевые лица рассуждали в терминах жёсткого силового реализма (разделение ресурсов СССР/Великобритании и т. п.). Спорно, но в их метрике это рациональная теория + процесс.
- Расширение НАТО после Холодной войны - при том что сам Миршаймер критиковал расширение, в книге это - рациональное решение, опирающееся на легитимные либеральные теории (демократический мир, институционализм, интердепенденция).
- и так далее
Также есть примеры действительно нерациональных решений (где связка «теория + процесс» нарушены)
- «Стратегия риска» Германии до Первой мировой - организационные и когнитивные искажения, пробелы/закрытие ключевой информации, не обеспечена качественная проверка теории.
- Вторжение на Кубу ака Залив Свиней, США (1961) - малый «клуб» перехватил процесс, критические сигналы игнорировались → нет нормального обсуждения.
- Ирак, вторжение США (2003) - подавление альтернатив, слабая эмпирическая база теории (WMD/демократизация через силу), искажения в процессе.
А что из этого можно почерпнуть для работы, мы обсудим в следующий раз.
#Economics #Leadership #Management #Data
Продолжая рассказ о книге, надо отметить, что модель рациональности авторов содержат два слоя
1. Рациональность целей (goal rationality). Почти всегда на первом месте - выживание государства; остальные цели подчинены этому.
2. Рациональность стратегий (strategic rationality). В итоге, стратегические решений
- Опирается на достоверную теорию (реалистичные допущения, непротиворечивая каузальная логика, поддержка в данных/истории), и
- Появилось из открытой и «неподавляющей» процедуры обсуждения (без умолчаний, давления, искажения информации). Оценивать нужно процесс, а не только результат.
Ключом к их школе мыслей является разница между риском и неопределенностью. В международной политике чаще нет надёжных частот/базовых вероятностей, поэтому чистые расчёты EV/Expected Utility неприменимы - здесь имеет смысл построения надежных теорий + сценарный анализ и «проверка на худший случай».
Вот как выглядит критика стандартных подходов от авторов книги
1. Против expected utility. Модели, где рациональность = расчёт ожидаемой полезности, предполагают измеримые вероятности и стабильные предпочтения, а во внешней политике это редкость. Поэтому требовать от государств «считать EU в голове» - неправильно; разумнее оценивать качество применённой теории и качество процесса.
2. Против «все вокруг в bias’ах». Политпсихология/поведенческая экономика часто объявляет отклонения от expected utility «нерациональностью» (bias), упирая в аналогии, эвристики, «групповое мышление». Авторы отвечают:
- Эвристики ≠ нерациональность, если они встроены в внятную теорию и
- Групповые процедуры в госаппарате нередко сглаживают индивидуальные искажения. И главное - эти подходы почти не объясняют, как индивидуальные мнения агрегируются в государственные решения.
Если говорить про инженерную интерпретацию, то авторы предлагают сменить метрику оценки рациональности с «считал ли агент правильный expected value» на «была ли у агента валидная модель мира + нормальный review‑процесс принятия решения».
Свою модель авторы подтверждают разбором ситуаций, которые по мнению авторов были несправедливо названы нерациональными
- Начинается все с СВО в 2022 году - в предисловии книги разбирается как кейс, где на Западе быстро повесили ярлык «безумия», но авторы считают решение теоретически мотивированным (баланс сил, НАТО) и обсуждённым на уровне элиты.
- Германия, вступление в Первую мировую (1914) - превентивная логика против растущей мощи соперников и окна уязвимости.
- Япония, удар по Пёрл‑Харбору (1941) - попытка вывести из игры Тихоокеанский флот США и обеспечить ресурсы; рискованная стратегия, но не «иррациональный порыв».
- Германия, «Барбаросса» (1941) - авторы показывают, что ключевые лица рассуждали в терминах жёсткого силового реализма (разделение ресурсов СССР/Великобритании и т. п.). Спорно, но в их метрике это рациональная теория + процесс.
- Расширение НАТО после Холодной войны - при том что сам Миршаймер критиковал расширение, в книге это - рациональное решение, опирающееся на легитимные либеральные теории (демократический мир, институционализм, интердепенденция).
- и так далее
Также есть примеры действительно нерациональных решений (где связка «теория + процесс» нарушены)
- «Стратегия риска» Германии до Первой мировой - организационные и когнитивные искажения, пробелы/закрытие ключевой информации, не обеспечена качественная проверка теории.
- Вторжение на Кубу ака Залив Свиней, США (1961) - малый «клуб» перехватил процесс, критические сигналы игнорировались → нет нормального обсуждения.
- Ирак, вторжение США (2003) - подавление альтернатив, слабая эмпирическая база теории (WMD/демократизация через силу), искажения в процессе.
А что из этого можно почерпнуть для работы, мы обсудим в следующий раз.
#Economics #Leadership #Management #Data
Telegram
Книжный куб
[1/3] How States Think: The Rationality of Foreign Policy (Как мыслят государства: рациональность внешней политики) (Рубрика #Politics)
С большим интересом прочитал книгу Джона Дж. Миршаймера и Себастьяна Розато, в которой авторы спорят с модной идеей, что…
С большим интересом прочитал книгу Джона Дж. Миршаймера и Себастьяна Розато, в которой авторы спорят с модной идеей, что…
🔥7❤6👍3
[3/3] How States Think: The Rationality of Foreign Policy (Как мыслят государства: рациональность внешней политики) (Рубрика #Politics)
В последней части обзора книги (1 и 2) мы поговорим про применимость подходов авторов на земле, а точнее в работе обычного технического директора
1. Требуйте «достоверную теорию» перед крупным решением. В терминах архитектуры: чёткие допущения, причинно-следственная логика, ссылки на эмпирические данные/историю эксплуатации. Это не «максимизация KPI» по красивой формуле, а валидность модели.
2. Не путайте риск и неопределённость. Если у вас нет качественных базовых частот (например, для редких инцидентов SRE или влияния геополитики на поставки), ожидаемая ценность - ловушка уверенности. Лучше сценарии, стресс‑тесты, pre‑mortem, «что если всё пойдёт по худшему пути».
3. Открытое обсуждение как стандарт. Обязательные дизайн‑ревью, red team, «критик без санкций», протокол, где запрещено скрывать плохие новости. Формально фиксируйте, какая теория «под капотом» у решения.
4. Оценивайте процесс, а не только результат. Провал ≠ глупость, если теория была качественной, а обсуждение - честным. И наоборот: успех ≠ оправдание, если процесс был испорчен.
Если суммировать все, то рациональность государств - это не «всегда выигрывать» и не «всегда считать EV». Это про то, чтобы опираться на валидную модель мира и не ломать процесс обсуждения. В ИТ‑командах это означает: модель‑прежде‑чем‑метрика и ревью‑прежде‑чем‑решение
P.S.
Отдельно надо отметить, что это все про дорогие one-way door decision, когда фарш обратно не провернуть:) А вот two-way door decision хорошо бы научиться принимать без долгих размышлений и эскалаций. По этому поводу можно почитать письмо Джеффа Безоса акционерам, где он еще в 1997 году описывал этот фреймворк для принятия решений.
#Economics #Leadership #Management #Data
В последней части обзора книги (1 и 2) мы поговорим про применимость подходов авторов на земле, а точнее в работе обычного технического директора
1. Требуйте «достоверную теорию» перед крупным решением. В терминах архитектуры: чёткие допущения, причинно-следственная логика, ссылки на эмпирические данные/историю эксплуатации. Это не «максимизация KPI» по красивой формуле, а валидность модели.
2. Не путайте риск и неопределённость. Если у вас нет качественных базовых частот (например, для редких инцидентов SRE или влияния геополитики на поставки), ожидаемая ценность - ловушка уверенности. Лучше сценарии, стресс‑тесты, pre‑mortem, «что если всё пойдёт по худшему пути».
3. Открытое обсуждение как стандарт. Обязательные дизайн‑ревью, red team, «критик без санкций», протокол, где запрещено скрывать плохие новости. Формально фиксируйте, какая теория «под капотом» у решения.
4. Оценивайте процесс, а не только результат. Провал ≠ глупость, если теория была качественной, а обсуждение - честным. И наоборот: успех ≠ оправдание, если процесс был испорчен.
Если суммировать все, то рациональность государств - это не «всегда выигрывать» и не «всегда считать EV». Это про то, чтобы опираться на валидную модель мира и не ломать процесс обсуждения. В ИТ‑командах это означает: модель‑прежде‑чем‑метрика и ревью‑прежде‑чем‑решение
P.S.
Отдельно надо отметить, что это все про дорогие one-way door decision, когда фарш обратно не провернуть:) А вот two-way door decision хорошо бы научиться принимать без долгих размышлений и эскалаций. По этому поводу можно почитать письмо Джеффа Безоса акционерам, где он еще в 1997 году описывал этот фреймворк для принятия решений.
#Economics #Leadership #Management #Data
Telegram
Книжный куб
❤5🔥5👍3
Why Growth Playbooks Are Crumbling - and What’s Next (Рубрика #ProductManagement)
С интересом посмотрел выступление с ProductCon SF 2025 от Elena Verna, Head of Growth в Lovable. Ранее Елена руководила/консультировала ростом в SurveyMonkey, Miro, Amplitude, Dropbox. Тезисно она рассказывала о следующих темах
1. Классический рост ломается. SEO, перформанс‑реклама и линейные воронки теряют эффективность. Новая точка входа - answer engines (LLM‑поисковики, ассистенты), где пользователи получают ответ сразу, без клика.
2. AEO вместо только SEO. Нужны стратегии Answer Engine Optimization: как подготовить данные и контент, чтобы ассистенты “знали” о вас и цитировали. Подробнее про это можно посмотреть в серии подкаста Лении "Why ChatGPT will be the next big growth channel" (см. мой разбор)
3. Защита через growth‑петли, а не воронки. Нам надо связать продукт, контент и сигналы пользователей, чтобы запускать самоподдерживающийся рост.
4. Партнёрства с AI‑платформами. Надо работать с провайдерами моделей и экосистемами, чтобы закрепить присутствие бренда/продукта в выдаче ответ‑движков.
Важно, что это не просто про маркетинг, а про инженерную дистрибуцию продукта, которую можно улучшить через следующие шаги
- Структурирование знаний: схемы, разметка, machine‑readable справка/доки, вики/репозитории знаний - чтобы модели могли извлекать и цитировать.
- Интеграции с LLM/поиском: фиды, API, RAG‑коннекторы и разрешения на повторное использование контента.
- Наблюдаемость и метрики AEO: отслеживание доли упоминаний/цитаций в ответах ассистентов, качество извлечения и “замыкание петли” в продукте.
- Эксперименты поверх контента/схем: быстрые итерации как по продукту, так и по документации и семантике.
#AI #Data #Software #Marketing #Economics
С интересом посмотрел выступление с ProductCon SF 2025 от Elena Verna, Head of Growth в Lovable. Ранее Елена руководила/консультировала ростом в SurveyMonkey, Miro, Amplitude, Dropbox. Тезисно она рассказывала о следующих темах
1. Классический рост ломается. SEO, перформанс‑реклама и линейные воронки теряют эффективность. Новая точка входа - answer engines (LLM‑поисковики, ассистенты), где пользователи получают ответ сразу, без клика.
2. AEO вместо только SEO. Нужны стратегии Answer Engine Optimization: как подготовить данные и контент, чтобы ассистенты “знали” о вас и цитировали. Подробнее про это можно посмотреть в серии подкаста Лении "Why ChatGPT will be the next big growth channel" (см. мой разбор)
3. Защита через growth‑петли, а не воронки. Нам надо связать продукт, контент и сигналы пользователей, чтобы запускать самоподдерживающийся рост.
4. Партнёрства с AI‑платформами. Надо работать с провайдерами моделей и экосистемами, чтобы закрепить присутствие бренда/продукта в выдаче ответ‑движков.
Важно, что это не просто про маркетинг, а про инженерную дистрибуцию продукта, которую можно улучшить через следующие шаги
- Структурирование знаний: схемы, разметка, machine‑readable справка/доки, вики/репозитории знаний - чтобы модели могли извлекать и цитировать.
- Интеграции с LLM/поиском: фиды, API, RAG‑коннекторы и разрешения на повторное использование контента.
- Наблюдаемость и метрики AEO: отслеживание доли упоминаний/цитаций в ответах ассистентов, качество извлечения и “замыкание петли” в продукте.
- Эксперименты поверх контента/схем: быстрые итерации как по продукту, так и по документации и семантике.
#AI #Data #Software #Marketing #Economics
YouTube
Head of Growth at Lovable | Why Growth Playbooks Are Crumbling—and What’s Next
Traditional SEO-driven moats are collapsing as AI-powered answer engines reshape discovery. Elena Verna, Head of Growth at Lovable, explains how product leaders can adapt by building Answer Engine Optimization (AEO) strategies that secure visibility in the…
❤4👍3🔥3
Охота на электроовец: большая книга искусственного интеллекта (Рубрика #AI)
За квартал я справился с первым томом этой книги Сергея Маркова, в которой он решил описать откуда взялись нейросети, как они устроены и куда всё идёт:) Отмечу, что многие истории из книги я уже знал, но в более сокращенном варианте (из-за чего часто история воспринималась более плоско и в черно-белом стиле). Интересно, что за время моего чтения по вечерам этой книги ей присудили Беляевскую премию 2025 года в номинации «за лучшую оригинальную научно‑популярную/научно‑художественную книгу на русском языке». Если попробовать фрагментарно описать за что ее стоит прочитать, то за
- За глубокое погружение в анналы истории: от античных механизмов и первых вычислительных устройств до компьютерных шахмат, AlexNet и «революции глубокого обучения».
- За рассказ о людях, что стояли за нейросетями: от Мак‑Каллока и Питтса и перцептрона Розенблатта до бэкпропа, Хинтона и современного DL
- За отличные иллюстрации и дизайн книги - в цветном издании это все смотрится превосходно
- За изложение математических основ понятно и без зубодробительных формул
- За историю «думающих машин», где игры выступали как двигатель ИИ (шахматы/го)
Книга есть в электронном виде бесплатно на сайте автора, а также можно купить бумажное издание от ДМК Пресс.
#PopularScience #AI #DS #Data #Math #History #Economics
За квартал я справился с первым томом этой книги Сергея Маркова, в которой он решил описать откуда взялись нейросети, как они устроены и куда всё идёт:) Отмечу, что многие истории из книги я уже знал, но в более сокращенном варианте (из-за чего часто история воспринималась более плоско и в черно-белом стиле). Интересно, что за время моего чтения по вечерам этой книги ей присудили Беляевскую премию 2025 года в номинации «за лучшую оригинальную научно‑популярную/научно‑художественную книгу на русском языке». Если попробовать фрагментарно описать за что ее стоит прочитать, то за
- За глубокое погружение в анналы истории: от античных механизмов и первых вычислительных устройств до компьютерных шахмат, AlexNet и «революции глубокого обучения».
- За рассказ о людях, что стояли за нейросетями: от Мак‑Каллока и Питтса и перцептрона Розенблатта до бэкпропа, Хинтона и современного DL
- За отличные иллюстрации и дизайн книги - в цветном издании это все смотрится превосходно
- За изложение математических основ понятно и без зубодробительных формул
- За историю «думающих машин», где игры выступали как двигатель ИИ (шахматы/го)
Книга есть в электронном виде бесплатно на сайте автора, а также можно купить бумажное издание от ДМК Пресс.
#PopularScience #AI #DS #Data #Math #History #Economics
1❤12👍7🔥4
Как мы искали экосистемные эффекты: метод проб и ошибок (Рубрика #Metrics)
Посмотрел интересный доклад от Владимира Абазова, директора по аналитике нефинансовых сервисов Т‑Банка. В это докладе Владимир рассказал о том, как ребята из нефинансовых сервисов Т-Банка проверяли, а дают ли нефинансовые сервисы (в частности, шопинг‑сервисы) заметный вклад в классические банковские продукты и поведение клиентов. Вова делится тем, как они формулировали гипотезы, чем и как измеряли «экосистемные эффекты», что работало, а что нет. В общем, доклад прямо очень интересен и практичен, но основные идеи можно сформулировать так
1. Экосистемные эффекты ≠ вера: их надо мерить и подтверждать, а не подгонять под красивую историю.
2. Гипотезы → метрики → эксперименты: без общего слоя событий/идентификаторов и корректной атрибуции эффекты «теряются».
3. Не всё - честные A/B тесты: когда «чистый» эксперимент невозможен, важны дизайн эксперимента, контроль сезонности/каннибализации и здравый скепсис к корреляциям.
4. Ошибки - часть метода: команда системно пересобирала метрики и дизайн, пока сигналы не стали устойчивыми (отсюда и «метод проб и ошибок»).
Доклад может бы полезен
1. Инженерам, чтобы понять какие данные и события действительно нужны для кросс‑сервисной атрибуции; зачем унифицировать user‑ID/схему событий; где «узкие места» экспериментальных тогглов и трекинга событий.
2. Аналитикам/ML, чтобы получить практический взгляд на измеримость экосистемных гипотез, работу с шумом/смещениями, выбор устойчивых бизнес‑метрик.
3. Руководителям, чтобы понять как договориться о владении метриками между продуктами в экосистеме, как строить приоритизацию и не тратить месяцы на «эффекты», которых нет.
В общем, это хороший доклад, чтобы синхронизировать продукт, аналитику и платформу и начать говорить на одном языке.
#Data #Metrics #Software #Engineering #DS
Посмотрел интересный доклад от Владимира Абазова, директора по аналитике нефинансовых сервисов Т‑Банка. В это докладе Владимир рассказал о том, как ребята из нефинансовых сервисов Т-Банка проверяли, а дают ли нефинансовые сервисы (в частности, шопинг‑сервисы) заметный вклад в классические банковские продукты и поведение клиентов. Вова делится тем, как они формулировали гипотезы, чем и как измеряли «экосистемные эффекты», что работало, а что нет. В общем, доклад прямо очень интересен и практичен, но основные идеи можно сформулировать так
1. Экосистемные эффекты ≠ вера: их надо мерить и подтверждать, а не подгонять под красивую историю.
2. Гипотезы → метрики → эксперименты: без общего слоя событий/идентификаторов и корректной атрибуции эффекты «теряются».
3. Не всё - честные A/B тесты: когда «чистый» эксперимент невозможен, важны дизайн эксперимента, контроль сезонности/каннибализации и здравый скепсис к корреляциям.
4. Ошибки - часть метода: команда системно пересобирала метрики и дизайн, пока сигналы не стали устойчивыми (отсюда и «метод проб и ошибок»).
Доклад может бы полезен
1. Инженерам, чтобы понять какие данные и события действительно нужны для кросс‑сервисной атрибуции; зачем унифицировать user‑ID/схему событий; где «узкие места» экспериментальных тогглов и трекинга событий.
2. Аналитикам/ML, чтобы получить практический взгляд на измеримость экосистемных гипотез, работу с шумом/смещениями, выбор устойчивых бизнес‑метрик.
3. Руководителям, чтобы понять как договориться о владении метриками между продуктами в экосистеме, как строить приоритизацию и не тратить месяцы на «эффекты», которых нет.
В общем, это хороший доклад, чтобы синхронизировать продукт, аналитику и платформу и начать говорить на одном языке.
#Data #Metrics #Software #Engineering #DS
YouTube
Владимир Абазов — «Как мы искали экосистемные эффекты: метод проб и ошибок»
У сервисов шопинга — своя продуктовая ценность. Но есть вопрос: оказывают ли они влияние на классические банковские продукты и поведение клиентов?
Задача нетривиальная: поиск причинно-следственных связей и работа с неоднозначными данными — именно с этими…
Задача нетривиальная: поиск причинно-следственных связей и работа с неоднозначными данными — именно с этими…
🔥9❤5👍4
[1/2] The Effective Software Engineer (Рубрика #Staff)
Я наткнулся на эту книгу, когда меня спросил достойна ли она перевода. Для этого мне пришлось внимательно изучить оглавление, а дальше прочитать по диагонали все 200+ страниц. Если сокращать, то это книга для эффективных инженеров, которые стремятся приносить больше ценности: делать правильные вещи правильно, а не просто быстрее писать код. Книгу написал Addy Osmani из команды Google Chrome (лид направления DevEx), а сама книга уже доступна как early release на O’Reilly. Она несет пользу для индивидуальных разработчиков (IC) всех уровней - от джуна до Staff/Principal. И главная идея в том, чтобы отличать понятия efficiency и effectiveness:
- Efficiency - это про то, как делать вещи правильно
- Effectiveness - это про то, делать правильные вещи
У effective software engineers акцент на outcomes, а не outputs, то есть они причиняют пользу и дают ценный результат для пользователей и бизнеса.
Ключевой подход, который продвигает автор в том, чтобы
- Системно развивать фундамент: хорошая архитектура, качественный код, тесты, отладка, документация, коммуникации
- Учиться влиять без должности руководителя: кросс‑функционально работать с продуктом/дизайном, "управлять вверх".
- Использовать ИИ как рычаг и приоритизировать работу с максимальным эффектом (это прямо в подзаголовке книги).
- Осознанно применять паттерны и избегать антипаттернов — от «героизма» и постройки силосов до овер‑инжиниринга, NIH, перфекционизма и «залипания» на созвонах.
Стоит прочитать книгу, так как она
- Помогает перевести карьеру с "делаю много" на "делаю важное", подкрепляя это понятными метриками и решениями
- Показывает, как масштабировать вклад без менеджерского титула и выращивать влияние через сотрудничество
- Дает трезвый взгляд на будущее IC‑карьеры: "длинная дистанция" плюс усиление за счет ИИ и непрерывного обучения
P.S.
Книга похожа по содержанию на "The Software Engineer's Guidebook".
#Engineering #Leadership #Software #Career #Architecture
Я наткнулся на эту книгу, когда меня спросил достойна ли она перевода. Для этого мне пришлось внимательно изучить оглавление, а дальше прочитать по диагонали все 200+ страниц. Если сокращать, то это книга для эффективных инженеров, которые стремятся приносить больше ценности: делать правильные вещи правильно, а не просто быстрее писать код. Книгу написал Addy Osmani из команды Google Chrome (лид направления DevEx), а сама книга уже доступна как early release на O’Reilly. Она несет пользу для индивидуальных разработчиков (IC) всех уровней - от джуна до Staff/Principal. И главная идея в том, чтобы отличать понятия efficiency и effectiveness:
- Efficiency - это про то, как делать вещи правильно
- Effectiveness - это про то, делать правильные вещи
У effective software engineers акцент на outcomes, а не outputs, то есть они причиняют пользу и дают ценный результат для пользователей и бизнеса.
Ключевой подход, который продвигает автор в том, чтобы
- Системно развивать фундамент: хорошая архитектура, качественный код, тесты, отладка, документация, коммуникации
- Учиться влиять без должности руководителя: кросс‑функционально работать с продуктом/дизайном, "управлять вверх".
- Использовать ИИ как рычаг и приоритизировать работу с максимальным эффектом (это прямо в подзаголовке книги).
- Осознанно применять паттерны и избегать антипаттернов — от «героизма» и постройки силосов до овер‑инжиниринга, NIH, перфекционизма и «залипания» на созвонах.
Стоит прочитать книгу, так как она
- Помогает перевести карьеру с "делаю много" на "делаю важное", подкрепляя это понятными метриками и решениями
- Показывает, как масштабировать вклад без менеджерского титула и выращивать влияние через сотрудничество
- Дает трезвый взгляд на будущее IC‑карьеры: "длинная дистанция" плюс усиление за счет ИИ и непрерывного обучения
P.S.
Книга похожа по содержанию на "The Software Engineer's Guidebook".
#Engineering #Leadership #Software #Career #Architecture
👍21❤6🔥5❤🔥1
[2/2] The Effective Software Engineer (Рубрика #Staff)
Продолжая рассказ о книге, стоит отметить, что в ней 13 глав, где автор идет поступательно от базовых принципов к тому, а что ждет IC в будущем, учитывая стремительное развитие AI. Ниже кратко о каждой главе
1. Foundations of Effectiveness - переход от «сколько сделали» к «какой эффект получили»: outcomes vs outputs, мыслить бизнес‑контекстом, измерять влияние, собирать обратную связь.
2. Understanding the Fundamentals (L3–L4) - поддерживаемый код, тесты, дисциплина отладки, Git, «писать, чтобы другим было понятно» - все это фундамент, на котором строится рост.
3. Technical Depth vs Breadth (L5+) - модель T‑shape: глубокая экспертиза + рабочая широта. Как проектировать на масштабе, оценивать компромиссы и управлять техдолгом, не теряя фокус продукта.
4. Collaboration & Cross‑Functional Influence - работа с PM/дизайном, как влиять без полномочий и "управлять вверх": проактивная коммуникация, согласование целей, приходить к менеджеру не с проблемами, а с решениями.
5. Anti‑Patterns That Limit IC Effectiveness - каталог антипаттернов: силосы знаний, «герой‑комплекс», овер‑инжиниринг vs YAGNI, несостоятельность делегирования, «невидимая работа», паралич анализа, NIH, перфекционизм, переключение контекстов, scope‑creep, отрицание техдолга, перегруз митингами, сопротивление фидбеку, «охота за тулзами», синдром самозванца.
6. Career Growth & Leveling Up - про системный рост и переход на следующий уровень — от понимания ожиданий до того, а как сделать вклад в результат видимым окружающим
7. Leadership as an IC - лидерство без должности руководителия: как вести инициативы, менторить, умножать эффект команды. Связанные принципы подробно раскрыты в главах про сотрудничество и влияние
8. Strategic Thinking for Engineers - как сместить фокус с «как реализовать» на «что и почему реализовывать»: приоритизация high‑impact работы, баланс долгосрочных улучшений и быстрых результатов, опора на данные.
9. Avoiding Burnout & Sustaining Long‑Term Success - границы, энерго‑менеджмент, "сказать нет", культура, где выгорание не героизируется. Консистентность > спурты. Кейсы и конкретные практики.
10. Individual Effectiveness Anti‑Patterns - "героизм" в последний момент, «накопительство кода», бесконечный рефакторинг и распухание скоупа, self‑merge и "вечные PR". Тут не только описание антипаттернов, но и способы того, как их распознать и заменить на зрелые практики.
11. Team‑Level Effectiveness Anti‑Patterns - тут уже не персональные проблемы, а про системную динамику: силосы, проблемы на ревью, перекосы приоритизации и пр. Автор рассказывает о том, как это чинить процессами и культурой.
12. Thriving in Modern Work Environments - как быть эффективным в распределенных командах: «перекоммуницировать правильно», явная видимость работы, режимы, договариваться про каналы/часы, качать письменную речь и публичные выступления.
13. The Future of Individual Contributors - глава о будущем: как ИИ усиливает IC, про то, что ценность фундаментальных навыков растет, а также о том, что карьера IC жизнеспособна на долгой дистанции.
По итогу, это актуальная книга для инженеров, которые осознанно подходят к развитию своей карьеры.
#Engineering #Leadership #Software #Career #Architecture
Продолжая рассказ о книге, стоит отметить, что в ней 13 глав, где автор идет поступательно от базовых принципов к тому, а что ждет IC в будущем, учитывая стремительное развитие AI. Ниже кратко о каждой главе
1. Foundations of Effectiveness - переход от «сколько сделали» к «какой эффект получили»: outcomes vs outputs, мыслить бизнес‑контекстом, измерять влияние, собирать обратную связь.
2. Understanding the Fundamentals (L3–L4) - поддерживаемый код, тесты, дисциплина отладки, Git, «писать, чтобы другим было понятно» - все это фундамент, на котором строится рост.
3. Technical Depth vs Breadth (L5+) - модель T‑shape: глубокая экспертиза + рабочая широта. Как проектировать на масштабе, оценивать компромиссы и управлять техдолгом, не теряя фокус продукта.
4. Collaboration & Cross‑Functional Influence - работа с PM/дизайном, как влиять без полномочий и "управлять вверх": проактивная коммуникация, согласование целей, приходить к менеджеру не с проблемами, а с решениями.
5. Anti‑Patterns That Limit IC Effectiveness - каталог антипаттернов: силосы знаний, «герой‑комплекс», овер‑инжиниринг vs YAGNI, несостоятельность делегирования, «невидимая работа», паралич анализа, NIH, перфекционизм, переключение контекстов, scope‑creep, отрицание техдолга, перегруз митингами, сопротивление фидбеку, «охота за тулзами», синдром самозванца.
6. Career Growth & Leveling Up - про системный рост и переход на следующий уровень — от понимания ожиданий до того, а как сделать вклад в результат видимым окружающим
7. Leadership as an IC - лидерство без должности руководителия: как вести инициативы, менторить, умножать эффект команды. Связанные принципы подробно раскрыты в главах про сотрудничество и влияние
8. Strategic Thinking for Engineers - как сместить фокус с «как реализовать» на «что и почему реализовывать»: приоритизация high‑impact работы, баланс долгосрочных улучшений и быстрых результатов, опора на данные.
9. Avoiding Burnout & Sustaining Long‑Term Success - границы, энерго‑менеджмент, "сказать нет", культура, где выгорание не героизируется. Консистентность > спурты. Кейсы и конкретные практики.
10. Individual Effectiveness Anti‑Patterns - "героизм" в последний момент, «накопительство кода», бесконечный рефакторинг и распухание скоупа, self‑merge и "вечные PR". Тут не только описание антипаттернов, но и способы того, как их распознать и заменить на зрелые практики.
11. Team‑Level Effectiveness Anti‑Patterns - тут уже не персональные проблемы, а про системную динамику: силосы, проблемы на ревью, перекосы приоритизации и пр. Автор рассказывает о том, как это чинить процессами и культурой.
12. Thriving in Modern Work Environments - как быть эффективным в распределенных командах: «перекоммуницировать правильно», явная видимость работы, режимы, договариваться про каналы/часы, качать письменную речь и публичные выступления.
13. The Future of Individual Contributors - глава о будущем: как ИИ усиливает IC, про то, что ценность фундаментальных навыков растет, а также о том, что карьера IC жизнеспособна на долгой дистанции.
По итогу, это актуальная книга для инженеров, которые осознанно подходят к развитию своей карьеры.
#Engineering #Leadership #Software #Career #Architecture
Telegram
Книжный куб
[1/2] The Effective Software Engineer (Рубрика #Staff)
Я наткнулся на эту книгу, когда меня спросил достойна ли она перевода. Для этого мне пришлось внимательно изучить оглавление, а дальше прочитать по диагонали все 200+ страниц. Если сокращать, то это…
Я наткнулся на эту книгу, когда меня спросил достойна ли она перевода. Для этого мне пришлось внимательно изучить оглавление, а дальше прочитать по диагонали все 200+ страниц. Если сокращать, то это…
❤🔥7❤5👍3🔥2
[1/2] Hands-On Large Language Models (Рубрика #AI)
В свой отпуск я захватил с собой этот визуальный путеводитель по большим языковым моделям или просто LLM:) Так как я воспринимаю информацию визуально на порядок лучше, чем на слух, а также сам строю схемы для визуализации сложных тем, то эта книга мне показалась просто блестящей - она не просто объясняет сложные темы, она показывает их через визуализации и код.
Книгу написали два эксперта в ML/AI:
- Джей Аламмар - engineering fellow в Cohere, автор культовых визуальных гайдов по ML и NLP. Его диаграммы разбирают в документации NumPy, pandas и на курсах deeplearning.ai. У него есть свой топовый блог
- Маартен Гротендорст - дата-сайентист, автор open-source библиотек (BERTopic, KeyBERT), специалист в теме тематического моделирования и эмбеддингов. У него есть свой топовый блог
Они придерживаются философии обучения когда сначала развивается интуиция (через качественное понимание концепций), а уже затем подкрепляют его формальным описанием и примерами. Для этого используется формат визуального повествования: книга содержит почти 300 оригинальных иллюстраций и диаграмм, созданных специально для этого издания. Посредством наглядных схем, графиков и рисунков сложные механизмы LLM (например, механизм self-attention в трансформерах, работа токенизаторов, многомерные пространства эмбеддингов и т.д.) разъясняются постепенно и доступно. Помимо визуализации, авторы делают акцент на практической стороне применения языковых моделей (об этом говорит hands-on в названии книги). Они приводят много примеров кода, сценариев и практических кейсов (код доступен на GitHub).
Книга отлично подойдет для всех
- Начинающих и продвинутых специалистов в ML/NLP
- Разработчиков и аналитиков, внедряющих LLM в проекты
- Всех, кто хочет уверенно ориентироваться в современных моделях вроде ChatGPT, Mistral или Claude
В продолжении немного про содержимое всех трех частей книги.
#Architecture #Software #AI #Engineering #ML #Data #SystemDesign #DistributedSystems
В свой отпуск я захватил с собой этот визуальный путеводитель по большим языковым моделям или просто LLM:) Так как я воспринимаю информацию визуально на порядок лучше, чем на слух, а также сам строю схемы для визуализации сложных тем, то эта книга мне показалась просто блестящей - она не просто объясняет сложные темы, она показывает их через визуализации и код.
Книгу написали два эксперта в ML/AI:
- Джей Аламмар - engineering fellow в Cohere, автор культовых визуальных гайдов по ML и NLP. Его диаграммы разбирают в документации NumPy, pandas и на курсах deeplearning.ai. У него есть свой топовый блог
- Маартен Гротендорст - дата-сайентист, автор open-source библиотек (BERTopic, KeyBERT), специалист в теме тематического моделирования и эмбеддингов. У него есть свой топовый блог
Они придерживаются философии обучения когда сначала развивается интуиция (через качественное понимание концепций), а уже затем подкрепляют его формальным описанием и примерами. Для этого используется формат визуального повествования: книга содержит почти 300 оригинальных иллюстраций и диаграмм, созданных специально для этого издания. Посредством наглядных схем, графиков и рисунков сложные механизмы LLM (например, механизм self-attention в трансформерах, работа токенизаторов, многомерные пространства эмбеддингов и т.д.) разъясняются постепенно и доступно. Помимо визуализации, авторы делают акцент на практической стороне применения языковых моделей (об этом говорит hands-on в названии книги). Они приводят много примеров кода, сценариев и практических кейсов (код доступен на GitHub).
Книга отлично подойдет для всех
- Начинающих и продвинутых специалистов в ML/NLP
- Разработчиков и аналитиков, внедряющих LLM в проекты
- Всех, кто хочет уверенно ориентироваться в современных моделях вроде ChatGPT, Mistral или Claude
В продолжении немного про содержимое всех трех частей книги.
#Architecture #Software #AI #Engineering #ML #Data #SystemDesign #DistributedSystems
1👍11❤8🔥3
[2/2] Hands-On Large Language Models (Рубрика #AI)
Продолжая рассказ про эту книгу, скажу о том, что она состоит из трех частей и 12 глав (я пока прочитал четыре с половиной главы, поэтому про них расскажу подробнее). Но если кратко, то книга начинается с основ LLM, дальше авторы переходят к их использованию для решения задач, а заканчивают методами обучения моделей.
Часть I: Понимание языковых моделей
Первая часть закладывает фундамент, объясняя, что такое языковые модели и как они устроены.
Глава 1. Здесь приведен обзор развития обработки языка - от "bags of words и классических представлений текста до появления методов вроде word embeddings и архитектуры трансформеров. Читатель узнает, что собой представляют большие языковые модели, и чем они отличаются от предыдущих подходов. В главе также обсуждается, почему LLM стали настолько полезными.
Глава 2. Авторы погружаются в тему токенизации и эмбеддингов - ключевых понятий для представления текста в численной форме. Авторы подробно описывают, как работает токенизатор LLM (преобразуя текст в токены), сравнивают разные виды токенов (слова, подслова, символы, байты) и демонстрируют свойства обученных токенизаторов. Далее рассматривается, как модель превращает токены в векторные представления (эмбеддинги) и как эти эмбеддинги могут использоваться для представления слов, предложений и документов. Приводятся примеры, как с помощью эмбеддингов измерять семантическую близость текстов. В этой же главе объясняются традиционные алгоритмы построения эмбеддингов (например, word2vec) и более современные подходы, вплоть до того, как LLM сами формируют эмбеддинги во время работы. Завершает главу практический пример: обучение модели эмбеддингов для рекомендательной системы (например, рекомендация песен по схожести эмбеддингов).
Глава 3. Авторы показывают внутренности трансформера, объясняя что происходит под капотом. Они рассказывают про forward-pass модели: как обрабатываются входные токены, как вычисляется матрица внимания (attention) и как на её основе модель выбирает следующий токен. Важная часть главы - интуитивное объяснение механизма Self-Attention (внимания), благодаря которому модель учитывает контекст слов при генерации. Также обсуждаются оптимизации: как модели обрабатывают несколько токенов параллельно, какой максимальный размер контекста поддерживается, и как кеширование ключей и значений ускоряет генерацию текста.
Часть II: Использование предварительно обученных моделей
Вторая часть посвящена практическим способам применения готовых языковых моделей и эмбеддингов в разных задачах обработки текста. Здесь авторы переходят от устройства моделей к их использованию "из коробки" для решения прикладных задач.
Глава 4. Классификация текста
Глава 5. Кластеризация и тематическое моделирование (BERTopic)
Глава 6. Инженерия промтов (Chain of Thought, ReAct, Tree of Thought)
Глава 7. Продвинутые техники генерации текстов и инструменты (LangChain и агенты, Memory, Tools)
Глава 8. Семантический поиск и Retrieval-Augmented Generation (RAG)
Глава 9. Мультимодальные модели (текст + картинки, CLIP, BLIP-2)
Часть III: "Обучение и тонкая настройка моделей"
Последняя часть книги посвящена тому, как создавать свои модели и адаптировать существующие LLM под конкретные задачи. Здесь материал становится более продвинутым
Глава 10. Создание моделей эмбеддингов для текста
Глава 11. Fine-tuning representation models для классификаций
Глава 12. Fine-tuning генеративных моделей
В заключительной части (Afterword) авторы подводят итоги проделанному пути и заглядывают в будущее развития больших языковых моделей. Они отмечают, какой колоссальный и широкомасштабный эффект LLM уже оказали на мир и что понимание принципов их работы открывает перед специалистами новые возможности.
#Architecture #Software #AI #Engineering #ML #Data #SystemDesign #DistributedSystems
Продолжая рассказ про эту книгу, скажу о том, что она состоит из трех частей и 12 глав (я пока прочитал четыре с половиной главы, поэтому про них расскажу подробнее). Но если кратко, то книга начинается с основ LLM, дальше авторы переходят к их использованию для решения задач, а заканчивают методами обучения моделей.
Часть I: Понимание языковых моделей
Первая часть закладывает фундамент, объясняя, что такое языковые модели и как они устроены.
Глава 1. Здесь приведен обзор развития обработки языка - от "bags of words и классических представлений текста до появления методов вроде word embeddings и архитектуры трансформеров. Читатель узнает, что собой представляют большие языковые модели, и чем они отличаются от предыдущих подходов. В главе также обсуждается, почему LLM стали настолько полезными.
Глава 2. Авторы погружаются в тему токенизации и эмбеддингов - ключевых понятий для представления текста в численной форме. Авторы подробно описывают, как работает токенизатор LLM (преобразуя текст в токены), сравнивают разные виды токенов (слова, подслова, символы, байты) и демонстрируют свойства обученных токенизаторов. Далее рассматривается, как модель превращает токены в векторные представления (эмбеддинги) и как эти эмбеддинги могут использоваться для представления слов, предложений и документов. Приводятся примеры, как с помощью эмбеддингов измерять семантическую близость текстов. В этой же главе объясняются традиционные алгоритмы построения эмбеддингов (например, word2vec) и более современные подходы, вплоть до того, как LLM сами формируют эмбеддинги во время работы. Завершает главу практический пример: обучение модели эмбеддингов для рекомендательной системы (например, рекомендация песен по схожести эмбеддингов).
Глава 3. Авторы показывают внутренности трансформера, объясняя что происходит под капотом. Они рассказывают про forward-pass модели: как обрабатываются входные токены, как вычисляется матрица внимания (attention) и как на её основе модель выбирает следующий токен. Важная часть главы - интуитивное объяснение механизма Self-Attention (внимания), благодаря которому модель учитывает контекст слов при генерации. Также обсуждаются оптимизации: как модели обрабатывают несколько токенов параллельно, какой максимальный размер контекста поддерживается, и как кеширование ключей и значений ускоряет генерацию текста.
Часть II: Использование предварительно обученных моделей
Вторая часть посвящена практическим способам применения готовых языковых моделей и эмбеддингов в разных задачах обработки текста. Здесь авторы переходят от устройства моделей к их использованию "из коробки" для решения прикладных задач.
Глава 4. Классификация текста
Глава 5. Кластеризация и тематическое моделирование (BERTopic)
Глава 6. Инженерия промтов (Chain of Thought, ReAct, Tree of Thought)
Глава 7. Продвинутые техники генерации текстов и инструменты (LangChain и агенты, Memory, Tools)
Глава 8. Семантический поиск и Retrieval-Augmented Generation (RAG)
Глава 9. Мультимодальные модели (текст + картинки, CLIP, BLIP-2)
Часть III: "Обучение и тонкая настройка моделей"
Последняя часть книги посвящена тому, как создавать свои модели и адаптировать существующие LLM под конкретные задачи. Здесь материал становится более продвинутым
Глава 10. Создание моделей эмбеддингов для текста
Глава 11. Fine-tuning representation models для классификаций
Глава 12. Fine-tuning генеративных моделей
В заключительной части (Afterword) авторы подводят итоги проделанному пути и заглядывают в будущее развития больших языковых моделей. Они отмечают, какой колоссальный и широкомасштабный эффект LLM уже оказали на мир и что понимание принципов их работы открывает перед специалистами новые возможности.
#Architecture #Software #AI #Engineering #ML #Data #SystemDesign #DistributedSystems
Telegram
Книжный куб
[1/2] Hands-On Large Language Models (Рубрика #AI)
В свой отпуск я захватил с собой этот визуальный путеводитель по большим языковым моделям или просто LLM:) Так как я воспринимаю информацию визуально на порядок лучше, чем на слух, а также сам строю схемы…
В свой отпуск я захватил с собой этот визуальный путеводитель по большим языковым моделям или просто LLM:) Так как я воспринимаю информацию визуально на порядок лучше, чем на слух, а также сам строю схемы…
👍8❤6🔥3
Good News For Startups: Enterprise Is Bad At AI (Рубрика #AI)
В этой серии подкаста ребята из Y Combinator обсуждали исследование "The GenAI Divide: State of AI in Business 2025" (см. мой разбор), результаты которого говорят о том, что 95% корпоративных AI-проектов проваливаются. Обсуждение строится на том, а в чем причины этих результатов и почему это на руку AI стартапам, а если точнее, то ребята обсуждают вопросы
- Что на самом деле стоит за вирусной статистикой о "95% провалов" AI-проектов?
- Почему внутренние IT-проекты даже в крупных компаниях зачастую буксуют?
- Что усложняет внедрение сложных AI-систем в корпоративной среде?
- Как небольшие AI-стартапы выигрывают конкуренцию у банков и консалтинга?
- Почему устоявшиеся компании не могут создать работающий AI-продукт и что с этим делать?
Мнения управляющих партнеров Y-Combinator примерно такое:
- Броска фраза «95% провалов» искажена: она относится к внутренним решениям в корпорациях, которые не умеют учиться на обратной связи и адаптироваться. Иными словами, дело не в том, что "ИИ не работает", а в том, что большие компании не умеют его строить. Здесь авторы пинают Apple за их приложение-календарь, а уж если Apple делает хреновые решение, то и у обычных компаний и подавно будут проблемы. Большинство корпоративного ПО очень посредственное, а привлечение дорогих консультантов (E&Y, Deloitte) часто только создаёт "две проблемы вместо одной".
- В крупных компаниях существуют организационные сложности: AI-проекту надо учитывать интересы множества команд, преодолевать политические барьеры и согласовывать требования между отделами. Добавьте устаревшие легаси-системы и дизайн "от комитетов" - внедрение AI превращается в долгий и трудный процесс
- AI-стартапы побеждают там, где корпорации пасуют: маленькие команды быстро строят решения под конкретные задачи, сразу с заложенными AI-возможностями (AI-native) и оперативно доводят продукт до результата. Привели кейсы: стартап Tactile за считанные месяцы сделал для банков AI-систему принятия решений, тогда как Citi и JP Morgan потратили годы и миллионы на нерабочие аналоги
- Сейчас для AI-стартапов идеальный момент: крупные фирмы жаждут внедрить ИИ и готовы рисковать с молодыми командами. Боязнь отстать заставляет корпорации быстрее принимать решения и скорее купить готовое AI-решение, чем пытаться сделать своё. Ребята из стартап-инкубатора нахваливали возможности для стартапов в каждом процессе: спрос на AI настолько опережает внутренние возможности компаний, что в каждой нише есть пространство для внешнего решения
- Если возвращаться к гипотезам, которые могли бы объяснить провалы внедрение, то подкастеры выделили человеческий фактор: многие корпоративные инженеры не верят в ИИ, не пользуются новыми инструментами и даже рады ссылаться на исследования вроде MIT, подтверждающие их скепсис. Такая культура приводит к провалу проектов (самосбывающееся пророчество) и упущенным возможностям. В результате предприятия, где внутренние команды сдались, готовы звать на помощь стартапы.
В общем, 95% неудач внедрения AI в корпорациях - это не повод не пробовать. Наоборот, у вас есть все возможности попасть в 5% успешных. Правда, партнеры одного из крупнейших стартап-инкубаторов говорят, что крупные компании, скорее всего, будут всё активнее обращаться к стартапам и покупать готовые AI-решения, поскольку внутренние команды не справляются:) Но я бы тут сделал скидку на конфликт интересов и трактовал это как возможности не только для стартапов, но и для самих корпораций нарастить свои внутренние возможности по использованию AI.
#AI #Engineering #Software #Leadership #ML
В этой серии подкаста ребята из Y Combinator обсуждали исследование "The GenAI Divide: State of AI in Business 2025" (см. мой разбор), результаты которого говорят о том, что 95% корпоративных AI-проектов проваливаются. Обсуждение строится на том, а в чем причины этих результатов и почему это на руку AI стартапам, а если точнее, то ребята обсуждают вопросы
- Что на самом деле стоит за вирусной статистикой о "95% провалов" AI-проектов?
- Почему внутренние IT-проекты даже в крупных компаниях зачастую буксуют?
- Что усложняет внедрение сложных AI-систем в корпоративной среде?
- Как небольшие AI-стартапы выигрывают конкуренцию у банков и консалтинга?
- Почему устоявшиеся компании не могут создать работающий AI-продукт и что с этим делать?
Мнения управляющих партнеров Y-Combinator примерно такое:
- Броска фраза «95% провалов» искажена: она относится к внутренним решениям в корпорациях, которые не умеют учиться на обратной связи и адаптироваться. Иными словами, дело не в том, что "ИИ не работает", а в том, что большие компании не умеют его строить. Здесь авторы пинают Apple за их приложение-календарь, а уж если Apple делает хреновые решение, то и у обычных компаний и подавно будут проблемы. Большинство корпоративного ПО очень посредственное, а привлечение дорогих консультантов (E&Y, Deloitte) часто только создаёт "две проблемы вместо одной".
- В крупных компаниях существуют организационные сложности: AI-проекту надо учитывать интересы множества команд, преодолевать политические барьеры и согласовывать требования между отделами. Добавьте устаревшие легаси-системы и дизайн "от комитетов" - внедрение AI превращается в долгий и трудный процесс
- AI-стартапы побеждают там, где корпорации пасуют: маленькие команды быстро строят решения под конкретные задачи, сразу с заложенными AI-возможностями (AI-native) и оперативно доводят продукт до результата. Привели кейсы: стартап Tactile за считанные месяцы сделал для банков AI-систему принятия решений, тогда как Citi и JP Morgan потратили годы и миллионы на нерабочие аналоги
- Сейчас для AI-стартапов идеальный момент: крупные фирмы жаждут внедрить ИИ и готовы рисковать с молодыми командами. Боязнь отстать заставляет корпорации быстрее принимать решения и скорее купить готовое AI-решение, чем пытаться сделать своё. Ребята из стартап-инкубатора нахваливали возможности для стартапов в каждом процессе: спрос на AI настолько опережает внутренние возможности компаний, что в каждой нише есть пространство для внешнего решения
- Если возвращаться к гипотезам, которые могли бы объяснить провалы внедрение, то подкастеры выделили человеческий фактор: многие корпоративные инженеры не верят в ИИ, не пользуются новыми инструментами и даже рады ссылаться на исследования вроде MIT, подтверждающие их скепсис. Такая культура приводит к провалу проектов (самосбывающееся пророчество) и упущенным возможностям. В результате предприятия, где внутренние команды сдались, готовы звать на помощь стартапы.
В общем, 95% неудач внедрения AI в корпорациях - это не повод не пробовать. Наоборот, у вас есть все возможности попасть в 5% успешных. Правда, партнеры одного из крупнейших стартап-инкубаторов говорят, что крупные компании, скорее всего, будут всё активнее обращаться к стартапам и покупать готовые AI-решения, поскольку внутренние команды не справляются:) Но я бы тут сделал скидку на конфликт интересов и трактовал это как возможности не только для стартапов, но и для самих корпораций нарастить свои внутренние возможности по использованию AI.
#AI #Engineering #Software #Leadership #ML
YouTube
Good News For Startups: Enterprise Is Bad At AI
MIT's new State of AI in Business report went viral for claiming that 95% of enterprise AI projects fail. But the real story isn't that AI doesn't work — it's just big companies can't build it.
In this episode of the Lightcone, Garry, Harj, Diana, and Jared…
In this episode of the Lightcone, Garry, Harj, Diana, and Jared…
❤3🔥3👍1
Мальдивы 2025
Вот и закончился отпуск на Мальдивах, куда мы слетали вместе с друзьями. Выяснилось, что летать вместе семьями интереснее - дети начинают вместе тусить в детском клубе и не только, а у взрослых образуется побольше свободного времени для снорклинга, сейлинга, дайвинга и коктейлинга:))
Вот и закончился отпуск на Мальдивах, куда мы слетали вместе с друзьями. Выяснилось, что летать вместе семьями интереснее - дети начинают вместе тусить в детском клубе и не только, а у взрослых образуется побольше свободного времени для снорклинга, сейлинга, дайвинга и коктейлинга:))
❤23🔥17👍8🌚1