Да, кстати, я настолько богат, что езжу на такси по Москве
Уже думаю, как потом кредит закрывать
😁2
Вообще самый большой минус удалёнки это то, что мы перестали проводить очные собеседования
😢2
Вот мне и 33. Какой-то прям нормальный возраст такой. Чувствую себя ровно на него. Давно такого не было.
Мыслей сразу каких-то много философских.
Мыслей сразу каких-то много философских.
❤5🎉1
Forwarded from Борис опять
# Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity
METR выложил рандомизированное исследование влияния AI на скорость работы опытных разработчиков в реалистичных условиях с неожиданным результатом.
Выполнение задач с использованием AI инструментов в среднем занимает на 20% дольше.
Причем если спрашивать разработчиков, то сами они уверены, что AI ускоряет их работу на 20%, а внешние эксперты вообще ожидают ускорения порядка 40%.
Я думаю, что на текущий момент это самое реалистичое исследование влияния AI инструментов на продуктивность разработчиков:
🔹Настоящие задачи из больших open source репозиториев с высокими стандартами качества.
🔸Опытные разработчики (5 лет в среднем) знакомые с кодовой базой над которой работают.
🔹Фронтир AI инструменты на момент исследования: Claude 3.5/3.7 Sonnet и Cursor Pro.
🔸Все разработчики были обучены правильно использовать Cursor Pro.
🔹Хороший дизайн эксперимента: фиксированная метрика (время исполнения), рандомизация, статзначимость, факторный анализ.
🔸Всё проверено вдоль и поперек, чтобы убедиться, что результаты не объясняются каким-то конфаундером.
🔹Исследование не сделано компанией продающей AI тулы.
Подробнее про эксперимент. В исследовании участвовали 16 опытных open-source разработчиков (если выборка кажется маленькой, то читайте дальше, станет понятнее) работающих над большими (1м+ строк кода) и популярными (20к+ коммитов) репозиториями. Разработчики были знакомы со своими проектами, в среднем сделали в них по 1500 коммитов. Всем разработчикам выдали Cursor Pro и научили им пользоваться.
Разработчики выбирали задачу. Далее они делали прогноз сколько у них займет исполнение с AI и без. Затем монетка определяла можно ли использовать для этой задачи AI инструменты. Если задача оказывалась в AI группе, то разработчик мог использовать любые AI инструменты. Мог и не использовать, если не считал нужным. На практике большинство использовали Cursor. Разработчик делал задачу записывая свой экран. Затем создавал Pull Request и дорабатаывал его после код-ревью. Задача считалась завершенной в момент принятия PR, то есть после всех доработок, и в этот момент фиксировалась метрика: время исполнения. Всего за время эксперимента было сделано 246 задач разной сложности, из них 136 с AI.
То есть важно понимать, что рандомизация происходила по задачам, а не по разработчикам. Поэтому выборка здесь не 16 разработчиков, а 246 задач. Это всё ещё не гигантская выборка, но:
1. P-value в порядке.
2. Авторы проанализировали и разметили записи экранов, провели интервью. Словом, сделали качественное исследование. Когда результаты качественного и количественного исследования консистентны это сильный сигнал.
Результаты показывают, что AI инструменты тормозят опытных разработчиков на реальных больших проектах. Здесь каждое слово важно. Например, AI может одновременно с этим ускорять начинающих на маленьких проектах.
Моё мнение👀 : я думаю это правда. Во-первых, надо иметь серьезные основания, чтобы спорить с рандомизированным исследованием. Я искал до чего докопаться и не нашел. Во-вторых, это совпадает с моими личным опытом: я и сам записывал экран где Cursor пытается решить несложную реальную задачу, не заметил никакого ускорения. В-третьих, ускорение даже на 20% не стыкуется с реальностью. Если у нас уже два года вся разработка быстрее и дешевле на 20%, то где эффект? Я бы ожидал колоссальных изменений на рынке труда из-за сложного процента, но по факту пока ничего не произошло (недавние сокращения в бигтехах были из-за налогов на ФОТ в США).
В статье очень много интересных деталей. Например, что эффект сохраняется вне зависимости от используемого инструмента: пользуешься ты agentic mode, только TAB или вообще руками копипастишь в ChatGPT. Или что даже после 50+ часов использования Cursor не наступает никаких изменений, так что это не зависит от опыта работы с AI инструментами.
Я разберу интересные моменты в отдельных постах.
@boris_again
METR выложил рандомизированное исследование влияния AI на скорость работы опытных разработчиков в реалистичных условиях с неожиданным результатом.
Выполнение задач с использованием AI инструментов в среднем занимает на 20% дольше.
Причем если спрашивать разработчиков, то сами они уверены, что AI ускоряет их работу на 20%, а внешние эксперты вообще ожидают ускорения порядка 40%.
Я думаю, что на текущий момент это самое реалистичое исследование влияния AI инструментов на продуктивность разработчиков:
🔹Настоящие задачи из больших open source репозиториев с высокими стандартами качества.
🔸Опытные разработчики (5 лет в среднем) знакомые с кодовой базой над которой работают.
🔹Фронтир AI инструменты на момент исследования: Claude 3.5/3.7 Sonnet и Cursor Pro.
🔸Все разработчики были обучены правильно использовать Cursor Pro.
🔹Хороший дизайн эксперимента: фиксированная метрика (время исполнения), рандомизация, статзначимость, факторный анализ.
🔸Всё проверено вдоль и поперек, чтобы убедиться, что результаты не объясняются каким-то конфаундером.
🔹Исследование не сделано компанией продающей AI тулы.
Подробнее про эксперимент. В исследовании участвовали 16 опытных open-source разработчиков (если выборка кажется маленькой, то читайте дальше, станет понятнее) работающих над большими (1м+ строк кода) и популярными (20к+ коммитов) репозиториями. Разработчики были знакомы со своими проектами, в среднем сделали в них по 1500 коммитов. Всем разработчикам выдали Cursor Pro и научили им пользоваться.
Разработчики выбирали задачу. Далее они делали прогноз сколько у них займет исполнение с AI и без. Затем монетка определяла можно ли использовать для этой задачи AI инструменты. Если задача оказывалась в AI группе, то разработчик мог использовать любые AI инструменты. Мог и не использовать, если не считал нужным. На практике большинство использовали Cursor. Разработчик делал задачу записывая свой экран. Затем создавал Pull Request и дорабатаывал его после код-ревью. Задача считалась завершенной в момент принятия PR, то есть после всех доработок, и в этот момент фиксировалась метрика: время исполнения. Всего за время эксперимента было сделано 246 задач разной сложности, из них 136 с AI.
То есть важно понимать, что рандомизация происходила по задачам, а не по разработчикам. Поэтому выборка здесь не 16 разработчиков, а 246 задач. Это всё ещё не гигантская выборка, но:
1. P-value в порядке.
2. Авторы проанализировали и разметили записи экранов, провели интервью. Словом, сделали качественное исследование. Когда результаты качественного и количественного исследования консистентны это сильный сигнал.
Результаты показывают, что AI инструменты тормозят опытных разработчиков на реальных больших проектах. Здесь каждое слово важно. Например, AI может одновременно с этим ускорять начинающих на маленьких проектах.
Моё мнение
В статье очень много интересных деталей. Например, что эффект сохраняется вне зависимости от используемого инструмента: пользуешься ты agentic mode, только TAB или вообще руками копипастишь в ChatGPT. Или что даже после 50+ часов использования Cursor не наступает никаких изменений, так что это не зависит от опыта работы с AI инструментами.
Я разберу интересные моменты в отдельных постах.
@boris_again
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2👍1🔥1
Forwarded from Дратути Антон
Влияние LLM на продуктивность опытных разработчиков
Статья: https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
Утверждается:
Уже хотелось поверить, проваливаемся внутрь блога, видим:
Ну и скриншот уже из статьи.
И к чему такие громкие заголовки или я чот не понял?
В целом и правда когда ты только начинаешь работать с LLM, то думаешь, ну ща она перелопатит весь проект и всё будет класс. Но, кажется, пока так не работает. Кто знает, что будет в следующем году — посмотрим.
Статья: https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
Утверждается:
Surprisingly, we find that when developers use AI tools, they take 19% longer than without—AI makes them slower.
Уже хотелось поверить, проваливаемся внутрь блога, видим:
It also may be the case that there are strong learning effects for AI tools like Cursor that only appear after several hundred hours of usage—our developers typically only use Cursor for a few dozen hours before and during the study.
Ну и скриншот уже из статьи.
И к чему такие громкие заголовки или я чот не понял?
В целом и правда когда ты только начинаешь работать с LLM, то думаешь, ну ща она перелопатит весь проект и всё будет класс. Но, кажется, пока так не работает. Кто знает, что будет в следующем году — посмотрим.
👍1
А есть такое, что с топами по работе прям энергозатратно разговаривать? Или это какой-то мой загон?
На 1-1 именно
На 1-1 именно
💯2
Дам вам полезный hint
Если пойдёте на собес в IMC, у них там есть секция "креативных" задачек или задачек на логику, че-то такое. Короче, на самом деле это просто алгоритмическая секция без кода. Я из-за это недопонимания сесть лет назад сходил на дополнительный раунд онлайн интервью с трейдером, а мог бы обойтись программистами онсайт.
Если пойдёте на собес в IMC, у них там есть секция "креативных" задачек или задачек на логику, че-то такое. Короче, на самом деле это просто алгоритмическая секция без кода. Я из-за это недопонимания сесть лет назад сходил на дополнительный раунд онлайн интервью с трейдером, а мог бы обойтись программистами онсайт.
👍1
Вот здесь довольно точно описано, как стоит относиться к метрикам. В том числе метрикам разработки, продукта и т.д.
Или, например, можно заоверфиттить торговую стратегию под метрики, но если там нет физического обоснования, идеи, то это лотерея, оптимизация метрики, а не целевого показателя.
Или, например, можно заоверфиттить торговую стратегию под метрики, но если там нет физического обоснования, идеи, то это лотерея, оптимизация метрики, а не целевого показателя.
❤2
Forwarded from Нефролог I Данила Пыриков
Кто меня давно читает уже прекрасно знает, что изменения анализов в лучшую или худшую сторону не всегда отражает реальное состояние органа
Самый яркий пример с этим креатином из поста выше. Попьете его, креатинин крови повысится. Функция почек не ухудшится
Госпитализировать бабульку, влить в нее несколько литров физраствора, разбавив кровушку, перебрать анализы и увидеть показатели получше - это просто махинация с анализами. Ритуал лечения. Иллюзия.
«Мы КТ не делаем при креатинине выше 150, а у вас 160, снизьте и возвращайтесь». От вас требуют махинацию с анализами. Очевидно, что даже если бы была «таблетка от креатинина», то на функцию почек она бы не влияла, так как просто снижала бы цифру в бланке анализов.
Терапия должна влиять на механизм заболевания и на прогноз, а не только на цифру в бумажке. Тогда она достойна в внимания.
Привожу еще один яркий и понятный пример. Гептрал реально может снижать АЛТ и АСТ. Но на печеночный прогноз не влияет.
И я очень рад, что за годы ведения моего канала это поняли уже тысячи людей и сделали правильный выбор в своей тактике лечения, уйдя от трав, сорбентов, прокапываний, БАДов и прочих жертвоприношений своей тревожности
Please open Telegram to view this post
VIEW IN TELEGRAM
Антонов такой Антонов
Особо забавно, что против ТЦК граждане Украины ни разу не протестовали, а против какой-то сложной политической «дижухи» — скоординированно вышли. Очередное напоминание о том, что протесты организуются конкретными силами, и если этим силам не дали команду, то никаких протестов нет.
Очень интересное наблюдение. Я, честно говоря, придерживаюсь другого мнения, но этот кейс довольно больно бьёт по моей картине мира. Буду думать.
👍1🤔1
Был в Уфе несколько дней. Отвык уже от большого количества азиатских лиц. Теперь уже непривычно даже, а в детстве не обращал внимания совсем.
Вообще город восстанавливается, с предыдущим президентом республики было все намного хуже. Дороги латают, хотя бы в черте города. Посносили рухлядь наконец-то. Появились клёвые пространства типа арт-квадрата.
По-прежнему много красивых, наверное скорее даже стильных, людей. Прям приятно.
Вообще город восстанавливается, с предыдущим президентом республики было все намного хуже. Дороги латают, хотя бы в черте города. Посносили рухлядь наконец-то. Появились клёвые пространства типа арт-квадрата.
По-прежнему много красивых, наверное скорее даже стильных, людей. Прям приятно.
🔥3❤1
Forwarded from Время Валеры
Недавно на одной встрече, очень большой начальник заметил: с учётом того, что мы теперь много нанимаем по всему миру и в разных часовых зонах, умение писать становится критически важным.
Спорить с этим сложно, и переоценить важность тоже. К сожалению, многие люди катастрофически не умеют формулировать свои мысли — отсюда все эти «давай быстро созвонимся», «пересечёмся раз на раз» или голосовые сообщения. Не всегда, но очень часто это происходит не потому, что встреча действительно нужна, а потому что человек просто не в состоянии организовать свой словесный салат во что-то внятное. В итоге он выливает свои мысленные помои на собеседника в надежде, что тот переработает это во что-то осмысленное — вместо того чтобы самому потратить время и внимание.
Черчилль как-то написал: «Прости, времени было мало, поэтому письмо длинное». И почти все это понимают на подсознательном уровне — отсюда все мемы и приколы про голосовые сообщения. Сложно переоценить важность хорошей культуры письма: она не только экономит кучу времени и сил, позволяет работать асинхронно, но со временем ещё и учит человека мыслить собранно и чётко.
Возможно, не стоит доходить до пределов ребят из провинции Лакония с их «если», но пример с них брать точно стоит. В здоровом письме — здоровый дух. А лучшая встреча - это короткая встреча
Спорить с этим сложно, и переоценить важность тоже. К сожалению, многие люди катастрофически не умеют формулировать свои мысли — отсюда все эти «давай быстро созвонимся», «пересечёмся раз на раз» или голосовые сообщения. Не всегда, но очень часто это происходит не потому, что встреча действительно нужна, а потому что человек просто не в состоянии организовать свой словесный салат во что-то внятное. В итоге он выливает свои мысленные помои на собеседника в надежде, что тот переработает это во что-то осмысленное — вместо того чтобы самому потратить время и внимание.
Черчилль как-то написал: «Прости, времени было мало, поэтому письмо длинное». И почти все это понимают на подсознательном уровне — отсюда все мемы и приколы про голосовые сообщения. Сложно переоценить важность хорошей культуры письма: она не только экономит кучу времени и сил, позволяет работать асинхронно, но со временем ещё и учит человека мыслить собранно и чётко.
Возможно, не стоит доходить до пределов ребят из провинции Лакония с их «если», но пример с них брать точно стоит. В здоровом письме — здоровый дух. А лучшая встреча - это короткая встреча
👍8❤1
Лежу в клинике. Сказали, побольше ходить. Теперь каждый раз думаю, что совершаю ЭЙЛЕРОВ ОБХОД ОТДЕЛЕНИЯ 😀
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5
Когда нанимаю стажёров, смотрю, че другие НМ пишут в отзывах. Я в ахуе с количества отказов по причине "недостаточно опыта". Это стажёр! Весь смысл в том, что у него нет опыта, ёпта!
Но я даже понимаю, почему так...
Но я даже понимаю, почему так...
💔7
Forwarded from Самые умные мысли Павла Комаровского (и немножко щитпостинг)
Рубрика "политический анекдот" от Bloomberg: Роберта Граньери — ко-фаундера Jane Street (один из самых крупных и успешных проп-трейдинговых фондов) — развели на то, чтобы он задонатил 7 млн баксов на "поддержку прав человека и демократии в Южном Судане". Ну, в смысле, на закупку АК-47 и стингеров для госпереворота в стране, с помощью которых автор инициативы (выпускник Гарварда по имени Аджак, на фото) собирался поставить во главе суданской демократии самого себя.
С суданским борцом за демократию (который сейчас готовится сесть в США) Граньери познакомил Гарри Каспаров. От него журналисты получили следующий комментарий: "I have spent much of my life standing up for civil rights and promoting democracy around the world".
С суданским борцом за демократию (который сейчас готовится сесть в США) Граньери познакомил Гарри Каспаров. От него журналисты получили следующий комментарий: "I have spent much of my life standing up for civil rights and promoting democracy around the world".
😁3😱2👍1🔥1