Книжный куб

Обложка книги "Большая энергетика. Что почем и как с этим жить" и несколько иллюстраций

❤10👍3😁3

2.41K viewsAlexander Polomodov, 06:27

Спектакль «Учёная семейка и роботы» (Рубрика #Kids)

Ученая семейка рассказывала про роботов. Нащшим малышам выдали дипломы повышения квалификации по итогам часового представления:)
А если серьезно, то были опыты с жидким азотом, рассказ о том, как работают гидроэлектростанции, конвейер и роботы. Теоретическая часть была хорошо сдобрена юмором - детишки смеялись и с большим интересом генерировали ответы на вопросы актеров.

#ForKids #ForParents

❤9👍4🔥3

2.36K viewsAlexander Polomodov, 11:28

Книжный куб

Rethinking Software Engineering in the Foundation Model Era: From Task-Driven AI Copilots to Goal-Driven AI Pair Programmers (Рубрика #AI)

Прочитал интересный и короткий whitepaper про изменения в разработке софта, готовясь к выступлению "AI в SDLC: от ассистентов к агентам". Если кратко, то это статья далекого 2024 года (а для AI прошлогодняя статья - это реально далеко), в которой авторы A. E. Hassan, G.A. Oliva, D. Lin, B. Chen, Z. M. Jiang предлагают уйти от task‑driven copilot‑инструментов к goal‑driven AI‑напарнику, который понимает цели разработки, помогает с архитектурой, кодом и проверкой результата.

Если присмотреться, то ключевые моменты такие
- Goal‑driven AI pair programmer, где ИИ не автодополнение, а партнёр по достижению цели (фичи, баг-фикса, миграции)
- Инженерный процесс EDD (evaluation‑driven delivery), который аналогичен TDD (test-driven development), но фокус на постоянной проверке прогресса к цели на основе evals
- В основе мультиагентная схема из четырех агентов:
-- Агент целей - помогает выяснить цели инженера, общаясь с ним и собирая информацию (работает как аналитик)
-- Агент архитектуры - умеет дизайнить под выясненные требования, знает архитектурные паттерны и может использовать ATAM (architecture tradeoff analysis method) или его аналоги
-- Агент кода - рабочая лошадка, что умеет писать хороший код (и не только добавлять, но и рефакторить и удалять мертвый код)
-- Goal delivery агент - агент, что отвечает за интеграцию работы всех остальных агентов для доведения проекта до успешного завершения. Он отслеживает выполнение конечных требований: превращение требований в тесты, актуальность тестов при изменении требований, и финальное прохождение всех тестов. Этот агент, помимо прочего, накопливает историю выполненных целей и прогресса, что затем может использоваться для наставничества: по мере работы он отмечает, какие навыки приобретает человек, где делает ошибки (связано с задачей обучения разработчика, см. Challenge 4). (Проще говоря, агент контролирует, чтобы всё задуманное действительно реализовано и проверено тестами, и фиксирует уроки для будущего).

Для успешной работы такой системы есть следующие вызовы
-Выравнивание целей человека и ИИ (минимум уточняющих вопросов, максимум понимания контекста) - тут мы видим пресловутый вопрос alignment
- Общение на естественном языке вместо “промпт‑инжиниринга” (лучшие промпты машины пишут сами себе)
- Доступные и умные code‑LLM (качество понимания проекта при умеренных ресурсах)
- Роль ИИ‑наставника: адаптивное обучение разработчика “в паре” (AI не только исполнитель, но и ментор для инженера)

В своем исследовании авторы опираются на следующие факты
- Накопленный опыт использования GitHub Copilot и аналогов в индустрии, включая выявленные проблемы взаимодействия человека с AI
- Предыдущие попытки автоматизировать разработку с помощью мультиагентных систем (ChatDev, MetaGPT, Devin и др.)
- Проверенные временем методологии разработки (TDD, парное программирование)
- Фундаментальные теории из образования (эффект наставничества по Блуму) и психологии (Theory of Mind) для обоснования социально-обучающего аспекта ИИ

Статья была опубликована как препринт на arXiv в апреле 2024 года и сразу привлекла внимание в сообществе. Google Scholar индексирует эту работу; уже в 2024–2025 годах появились ссылки на нее в ряде новых исследований. Стоит отметить, что сами авторы продолжили развивать эту тему: в октябре 2024 они выпустили расширенный препринт “Towards AI-Native Software Engineering (SE 3.0): A Vision and a Challenge Roadmap”, фактически развивающий идеи этой статьи. В нем они ввели терминологию “Software Engineering 3.0” и более подробно описали план исследований на ближайшие годы.

Если вам нравится эта тема и интересно общее состояние дел о том, как AI влияет на инженерную культуру, то предлагаю пройти опрос от Т-Банка на эту тему. О чем этот опрос и почему его результаты будут интересными я уже рассказывал раньше.

#AI #Software #Architecture #Agents #Leadership #ML #SystemDesign

arXiv.org

Rethinking Software Engineering in the Foundation Model Era: From...

The advent of Foundation Models (FMs) and AI-powered copilots has transformed the landscape of software development, offering unprecedented code completion capabilities and enhancing developer...

❤6🔥5👍3

2.4K viewsAlexander Polomodov, edited 05:08

Книжный куб

AI agents in 2025: Expectations vs. reality (Рубрика #AI)

Когда изучал информацию про успехи AI Agents наткнулся на статью полугодовой давности от IBM. В марте 2025 года IBM собрали четверых экспертов, чтобы обсудить с ними насколько реальна революция AI агентов. Среди экспертов были
- Maryam Ashoori, PhD: Director of Product Management, IBM® watsonx.ai™ 
- Marina Danilevsky: Senior Research Scientist, Language Technologies 
- Vyoma Gajjar: AI Technical Solutions Architect 
- Chris Hay: Distinguished Engineer 

Их позиции в этой статье выглядели примерно так
1. Ашоори: Сегодняшние «агенты» - это LLM с базовым планированием и function calling. Настоящий агент должен автономно рассуждать и планировать.
2. Данилевски (самая скептичная): «Я до сих пор не понимаю, чем это отличается от обычной оркестрации. Вы просто переименовали оркестрацию в агенты, потому что это модное слово». Данилевски опирается на опыт программирования - оркестрация существует давно. Ашоори разделяет текущие возможности и теоретический потенциал.
3. Хэй (самый оптимистичный): Технологический фундамент уже готов:
-- Лучшие, быстрые, компактные модели
-- Chain-of-thought training
-- Расширенные контекстные окна
-- Function calling
На чем основано: Хэй анализирует техническое развитие моделей за 12-18 месяцев и видит качественный скачок в возможностях.
4. Гаджар: «Мы видим ранние проблески, но для сложных решений нужны прорывы в контекстном мышлении и edge cases».

Среди экспертов разгорелись споры по следующим темам
1. Оркестрация vs единый агент
Хэй: Будет маятниковое движение - сначала multi-agent системы с оркестратором, потом переход к «богоподобным» единым агентам, затем снова к коллаборации.
- Ашоори: Это архитектурное решение, зависит от use case. Не всегда нужен мета-оркестратор.
2. Enterprise readiness
- Хэй: «Большинство организаций не готовы к агентам. Интересная работа будет в экспозиции API ваших enterprise-систем». На чем основано: Понимание текущего состояния enterprise-архитектур и требований интеграции.
3. Проблемы безопасности
- Ашоори: «Что, если агент подключится к датасету и удалит кучу чувствительных записей?»
- Данилевски: «Технология не думает. Она не может быть ответственной. Масштаб риска выше - технология может сделать больше за меньшее время незаметно».
- Гаджар предлагает в качестве решений: строгое тестирование в sandbox, механизмы rollback, audit logs.
4. Human-in-the-loop vs замещение
- Данилевски: Агенты будут аугментировать людей - «человек должен постоянно присутствовать и принимать финальные решения».
- Хэй: «Есть реальный риск, что при неправильной реализации люди будут дополнять AI, а не наоборот».

На чем основаны прогнозы экспертов
- Технический анализ: Хэй смотрит на прогресс в модельных capabilities
- Практический опыт: Данилевски основывается на опыте с текущими системами
- Enterprise research: Ашоори опирается на исследования поведения разработчиков
- Архитектурное понимание: Гаджар анализирует требования к production-системам

Выводы для инженеров
- Текущие «агенты» - это upgraded LLM с function calling. До настоящей автономии еще далеко, но базовые кейсы уже работают.
- Ценность будет у тех, кто организует свои данные для агентных workflow. Проблема не в моделях, а в enterprise-readiness.
- Transparency, traceability, rollback mechanisms - это не опция, а must-have. Один неконтролируемый агент может удалить критические данные.
- «Не становитесь молотком в поисках гвоздей» - сначала определите ROI, потом внедряйте агенты.

Главное предсказание авторов в том, что 2025 действительно станет годом экспериментов с агентами, но революцию стоит ожидать позже. Готовьте почву сейчас, но держите ожидания реалистичными. Пока кажется, что он сбывается:)

#AI #Software #Architecture #Agents #Leadership #ML #SystemDesign

Ibm

AI Agents in 2025: Expectations vs. Reality | IBM

For 2025, the dominant innovation narrative is the AI agent. But what can we realistically expect from agentic AI in 2025, and how will it affect our lives?

👍7❤5🔥4

2.37K viewsAlexander Polomodov, edited 05:08

Книжный куб

Unpacking нового роутера (Рубрика #Hardware)

Недавно решил сменить роутер дома, так как прошлый не дотягивал до дальней комнаты. Решил прикупить роутер с 4 ядрами, достаточным количеством оперативы, а также слотом под флешку, чтобы расширять их. После раздумий я купил TP-Link AX80v1, особенно когда под него появилась прошивка под openwrt. А потом я его начал распаковывать и настраивать, что привело к распаковке до уровня платы и подключению через uart для накатки новой прошивки. Внутри роутер выглядит тоже отлично, примерно как и снаружи. Зато теперь у меня есть неплохой роутер со всеми нужными для меня возможностями (правда я узнал, что под перепрошивку можно купить роутер помощнее и даже подешевле).

#Hardware #Software

🔥11❤3👍3🤯2

2.62K viewsAlexander Polomodov, 12:46

Книжный куб

[1/2] How tech companies measure the impact of AI on software development (Рубрика #AI)

Интересный пост от Гергели Ороша, автора подписки "The Pragmatic Engineer", и Лаура Тахо, CTO платформы DX, которая занимается измерением эффективности продуктивности. Они вместе были в подкасте "Measuring the impact of AI on software engineering", который я уже разбирал. У DX есть свой фреймворк для измерения продуктивности и недавно появился фреймвор для измерения влияния AI. В подкасте Research Insights мы их разбирали с Женей Сергеевым, engineering director из Flo Health
- "DX Core 4"
- "Measuring AI Code Assistants and Agents"

Если возвращаться к этой статье, то интересны примеры конкретных метрик из 18 компаний, которые Лаура привела в качестве примеров. Из них видно, что ИИ-инструменты уже широко распространились: ими пользуются ~85% разработчиков. Но измерить их эффект непросто - 60% техлидов признаются, что у них нет понятных метрик пользы ИИ. В новостях упрощают: звучат заявления вроде «ИИ пишет N% кода». Однако строки кода - плохая метрика продуктивности: исходный код - скорее бремя, а не ценность.

В итоге, Лаура предлагает ориетироваться на базовые метрики продуктивности: качество, надёжность, скорость, удовлетворённость инженеров. Многие компании продолжают измерять те же показатели, что и до ИИ (частота сбоев, скорость выпуска, время цикла, DevEx), а также оценивают насколько AI помогает их улучшать. Если эти базовые метрики не определены и нет консенсуса, а что считать продуктивностью, то оценка ИИ сведётся к пустым метрикам типа «количество кода» или процент принятых подсказок.

Кромое стандартных показателей появляются и специфичные для AI метрики и они разбиваются на три категории (подробности в статье "Measuring AI Code Assistants and Agents"):
1. Уровень использования (usage)
2. Влияние на работу (сэкономленные часы)
3. Экономическое влияние (cost & benefits)

Продолжение в следующем посте.

#AI #ML #PlatformEngineering #Software #Architecture #Processes #DevEx #Devops

🔥5👍4❤1

2.63K viewsAlexander Polomodov, 14:23

Книжный куб

[2/2] How tech companies measure the impact of AI on software development (Рубрика #AI)

Продолжая пост про измерение влияние AI на разработку хочется поделиться примером из Dropbox, где ~90% инженеров регулярно пользуются AI-помощниками (по индустрии ~50%). Там измеряют активных пользователей, CSAT, экономию времени и расходы на ИИ, а затем накладывают эти данные на core-метрики: change fail percentage (CFR), throughput и др. (заметим, что CFR и throughput - это контр-балансирующие метрики). В итоге AI-пользователи доставляют на ~20% больше кода в неделю, при этом качество не падает (сбоев даже меньше). Это признак того, что массовое внедрение ИИ реально повышает эффективность, а не просто активность.

Компании также сравнивают показатели у тех, кто пользуется ИИ, и тех, кто нет, и наблюдают изменения со временем. Такой анализ возможен только при наличии базовых данных до внедрения ИИ, но он ценен: так можно проверять гипотезы о влиянии ИИ на реальных цифрах. Важно не упирать только на скорость, забивая на качество - важно, чтобы рост частоты релизов/PR не сопровождался увеличением багов или откатов. Для выявления скрытого негативного эффекта (ухудшение maintainability, недовольство команды) проводите регулярные опросы Developer Experience.

Из размышлений авторов вытекают практические рекомендации:
1.Сформулируйте ключевые метрики продуктивности (качество и скорость) и зафиксируйте базовый уровень до внедрения ИИ. Без этого непонятно, улучшает ли ИИ то, что нужно.
2. Отслеживайте использование ИИ, но не путайте активность с результатом. Важно не количество сгенерированного кода, а влияние на качество, скорость и комфорт работы
3. Балансируйте скорость и надёжность. Ускорение работы не должно приводить к росту брака - следите сразу за метриками скорости и качества
4. Учитывайте опыт команды. Наряду с логами и другими системными метриками регулярно собирайте обратную связь разработчиков (опросы DevEx, CSAT) - так вы не пропустите проблемы, незаметные в одних только цифрах.
5. Не карайте метриками. Донесите, что показатели ИИ нужны для улучшения процессов, а не для оценки персонала. Иначе подорвёте доверие и получите искажённые данные.
6. Культивируйте эксперименты. Пробуйте разные инструменты на небольших проектах, сравнивайте, где эффект максимален. Поощряйте обмен знаниями – обсуждайте удачные и провальные кейсы, делитесь находками и предупреждайте об ограничениях инструментов
7. Держите в фокусе ROI и риски. Отслеживайте, где ИИ даёт наибольший эффект и оправдывает вложения. Ограничьте применение ИИ в критичных зонах (данные пользователей, безопасность) до появления уверенности и нужных контролей

#AI #ML #PlatformEngineering #Software #Architecture #Processes #DevEx #Devops

Книжный куб

[1/2] How tech companies measure the impact of AI on software development (Рубрика #AI)

Интересный пост от Гергели Ороша, автора подписки "The Pragmatic Engineer", и Лаура Тахо, CTO платформы DX, которая занимается измерением эффективности продуктивности.…

👍8❤5🔥1

2.49K viewsAlexander Polomodov, 05:08

Книжный куб

Yandex Neuro Scale (Рубрика #AI)

Дошел сегодня на конференцию Yandex Cloud, где на keynote докладе анонсировали много нового: новую зону доступности, новые AI инструменты внутри Яндекс Облака, новую AI студию для создания агентов и т.д. А сейчас я зашел послушать про работу AI агентов в разработке софта от Жени Колесникова (через недельку просто я сам буду выступать на похожую тему). Думаю, что потом напишу пост про выступления, что мне понравились на этой конфе.

#AI #Cloud #Engineering #Software

🔥14❤5⚡3👍2

2.71K viewsAlexander Polomodov, 11:21

About

Blog

Apps

Platform