Аналитик на коне

Объяснение через визуализацию (или как создаются такие посты, как выше)

Часть 2. Тяжелая доля "AI-креатора" на минималках

Как же создаются сами посты?

Хотела бы я написать следующее:
1. Идею, что и как визуализировать, генерит ИИ
2. Картинки для визуализации генерит ИИ
3. Вжух! Новый пост про http-коды готов :)

Но... нет :)

Например, у нас мог бы быть весьма чувственный сериал о кодах http, если бы сценаристом был ИИ:

Суть: Сервер всегда четко говорит, что случилось, через цифровые коды. Не надо гадать.

Мем (Картинка): Сцена из фильма, где персонаж спрашивает: "Ты меня любишь?".

Ответ 200 OK: "Да, люблю!" (Всё отлично, запрос выполнен).

Ответ 404 Not Found: "А кто ты?" (Ресурс (чувства) не найден).

Ответ 500 Internal Server Error: Персонаж внезапно начинает плакать и кричать "Я НЕ ЗНАЮ, ЧТО ПРОИСХОДИТ!" (Ошибка на сервере).

~~(хотя может быть он и вообще на ура бы зашел, что это я тут...)~~

От продюсирования такого сериала я осознанно отказалась, поэтому текущая реальность создания постов такова:

1. Я вспоминаю/узнаю, что значит конкретный код (да-да, я была не в курсе, что 4ХХ кодов под 30 штук, прастити).

Тут ИИ мне помогает, но за ним надо следить. Часть кодов он может просто забыть, т.к. "ой, так они почти не используются, зачем они тебе?"
Надо, тут великая миссия объяснить ВСЕ коды ✨

2. Ищу айтишных персонажей и придумываю им диалоги, которые помогут пояснить эти коды.

Со стороны это смотрится как будто я немного котик - я смотрю в стену на нечто, видимое только мне. А внутри работает креативный генератор :D

3. Придумываю, как визуально мог бы выглядеть этот диалог.
В целом почти как пункт 2.

4. Генерирую с ИИ картинки.

5. Собираю все воедино.

Вжух, прошло часов 5 и один пост с 5ю-6ю кодами готов :)

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

112 views20:05

Аналитик на коне

Объяснение через визуализацию (или как создаются такие посты, как выше)

Часть 3. Изнанка генерации картинок с персонажами

Отдельно хочу рассказать про генерацию картинок для этих постов.

Замечено, что ИИ умеет от меня уставать. Ровно когда осталась пара последних картинок, он начинает намекать разными способами, что пора бы и честь знать, Настя, сколько можно-то.

Начинается это с каких-то мелких проблемок - примеры на картинках 1 и 2. То у нас 3я рука, то человечек начинает интегрироваться с компьютерным столом. Вполне даже современная реальность удаленщика :)

Если я продолжаю настаивать - ИИ или перестает изменять картинку, независимо от промптов, или уходит в область сюрреализма.

Однажды я решила в этот момент переключиться на версию Pro. Итог - на 3й картинке.

Приходится начинать новый чат + удалять предыдущие, где все пошло не туда. Но это не спасает. В пике мне пришлось начать 4 новых чата (с удалением "отслуживших") и N раз сказать забыть предыдущие генерации, чтобы мы смогли работать снова :)

Но мое любимое - это диалог с картинок 4 и 5. Мы два часа до этого генерировали исключительно человечков из палочек, исключительно программистов и все такое прочее. Чтобы внезапно... получить фотореалистичную женщину!

Почему бы и да :D

На самом деле разгадка скорее всего в том, что "поза идеальная" в понимании ИИ выглядит именно так. А вот, надо понятно формулировать, что поза на текущей картинке идеальная, не трогай, исправь только стол и стул!

Что в итоге я для себя поняла в части генерации таких картинок:

1. Все, что я могу доделать на пост-обработке сама (нанести буквы на человечков, добавить облачка с диалогами, etc) - я делаю сама

2. За счет п.1 запрос к ИИ упрощается, плюс, если ему совсем тяжело - я упрощаю сюжет. Мне нужны два человечка? Генерируем два отдельных изображения, на каждом по одному персонажу в требуемой позе.

3. Иногда проще в Paint стереть третью руку или удлинить ножки столу, чем попросить сделать это ИИ.

Вот такое вот закулисье, казалось бы, простого и забавного итога :)

А вообще, если вы дочитали до этого момента, и хотите, чтобы я попыталась визуализировать какое-то понятие из области системного анализа - готова принять челлендж, если напишете в комментарии :D

👍3😁1

134 views20:07

Аналитик на коне

0:27

This media is not supported in your browser

VIEW IN TELEGRAM

Конь и его девочка

Хотела я сделать красивый пост с представлением коня и рассказом, как же он помогает мне прокачивать мои навыки аналитика.

Но нет, первый пост о коне будет таким, ибо это великолепно!

Всё, что нужно знать о моем коне, в одном видео.

Вот с одной стороны, очень дорогая зверюга спасибо, что не убилась, с другой... Это очень смешно :D

P.S. Потом он, как большой, пришел сам в конюшню, и никто бы не знал о его скрытых каскадерских талантах, если бы не камера.

P.S.S. "Конь и его девочка" отсылка к "Конь и его мальчик", одна из частей Хроник Нарнии К.С.Льюиса. А то сложные у меня, наверное, аналогии.

🤣8👏1

153 viewsedited 07:02

Аналитик на коне

Нас стало в 3 раза больше!

... ну и что, что с 9 до 31, а не со 100 до 300 подписчиков, в три же раза :)

Спасибо всем, кто подписался за 3 дня моей мини-рекламы канала 🥰

Постараюсь подкидывать вам интересности 🙂

Сегодня вечером выложу саммари статейки про ИИ и долгосрочную поддерживаемость его кода.

Со всех сторон очень много новостей, какой ИИ прекрасный, а мой аналитический мозг не может не исследовать вторую сторону медали. Поэтому, если мне будут попадаться новости о том, где ИИ не такой прекрасный буду делиться с вами :)

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4⚡1🤣1

75 views14:48

Аналитик на коне

ИИ и поддержание кода в долгосрочной перспективе

Исследователи из Университета Сунь Ятсена и Alibaba Group представили SWE-CI - бенчмарк*, позволяющий оценить, насколько модель способна писать код, поддерживаемый в долгосрочной перспективе.

*Бенчмарк - стандартизированный тест или набор задач (датасет), используемый для объективной оценки и сравнения производительности, точности, скорости и возможностей моделей ИИ.

Для ленивых - кратко :)

Китайцы заставили ИИ поиграть в долгосрочное развитие кода - сделав ИИ-Архитектора, который выдает требования на естественном языке, и ИИ-программиста, который их исполняет. Ну что бы прям как вживую! 😏

А затем начали измерять, сколько работающих юнитов упадет после очередной итерации доработок.

15 из 18 моделей смогли не ухудшить код в 37% случаев и менее.

А если интересны подробности, читай дальше :)

Зачем?
Существующие бенчмарки направлены на оценку того, что ИИ генерирует работающий "в моменте" код. Но в условиях реальной разработки - код надо не просто написать, а еще развивать и поддерживать. Поэтому и решили создать бенчмарк, оценивающий насколько код ИИ работоспособен в долгосрочной перспективе.

Исходные данные
Исследователи прошлись по Python-репозиториям на Github, выбирая по критериям: активно поддерживается не менее трех лет, набрал более 500 звезд, содержит конфиги, зависимости и наборы юнит-тестов, распространяется под разрешительной лицензией (такие как MIT или Apache-2.0).

Затем, оставив только основную ветку, выделили такие кусочки истории, в которых зависимости кода неизменны. Начальная точка такого кусочка - "база" с которой стартовал ИИ, конечная - "эталон" к которому он должен был прийти.

После проверили корректность отработки тестов и выбрали топ-100 кусочков истории из 68 репозиториев, в которых присутствует более длинная история, большее число коммитов и у которых было значительное число изменений (сравнивали по запуску тестов). В среднем, кусочек истории состоял из 233 дней и 71 последовательного коммита + в каждом кусочке не менее 500 строк измененного кода (без учета тестов).

Как?
ИИ должен был превратить "базовую" кодовую базу в "эталонную", путем итераций разработки.

Для итераций использовалось 2 ИИ агента - Архитектор и Программист.

Тесты, релевантные эталонной базе, запускались на базовой версии. Архитектор должен был проанализировать ошибки упавших тестов и сформировать список требований Программисту, причем этот список требований формировался на естественном языке. Также допустимо было формулировать не более 5 требований за раз, поэтому Архитектор должен был выбирать наиболее критичные.

Программист реализовывал требования Архитектора.

Оценка "поддерживаемости" кода
Для оценки "поддерживаемости", т.е. корректности работы кода в будущем, сравнивалось, сколько юнит-тестов из исходного их количества выполнилось успешно после очередной итерации доработки кода.

При этом более поздним итерациям доработок давался больший "вес", чтобы как раз и выделить модели, чей код в будущем работал менее корректно.

Итог
См. график выше. По оси Y - модель, которую тестировали, по оси X - доля нулевых регрессий от всех итераций доработки (нулевая регрессия - ни один старый тест не сломался после доработки кода).

15 из 18 моделей показали результат ниже 37% - т.е. доля таких доработок, при котором тесты, что должны были работать, не сломаны, ниже 37%.

Однако 2 модели Claude показали очень неплохие результаты в 51 и 76 процентов.

Также попробовали варьировать метрику, дающую больший вес итерациям, и выяснили, что модели MiniMax, DeepSeek и GPT склонны к долгосрочным улучшениям, Kimi и GLM - к более быстрым, но менее поддерживаемым результатам. Qwen, Doubao и Claude оставались стабильными при разных значениях метрики.

Также внутри одного "семейства" более новые версии модели давали лучшие результаты.

- - - - - - -

Такие вот дела. Всё еще осторожнее с генерацией кода с ИИ - в долгосрок они пока умеют не очень :) Но совершенствуются!

Оригинал статьи можно скачать тут + переведенная от меня в первом комментарии. Осторожно, там немного математики :)

Please open Telegram to view this post

VIEW IN TELEGRAM

👏4👍1😁1

108 viewsedited 16:12

Аналитик на коне

А я тут в честнознаковом телевизоре!

🔥2

91 views14:30

Аналитик на коне

Forwarded from 43; Tech

Deep Dive in Problem Solving 🔍

Иногда в работе аналитика самое сложное – не написать требования, а понять, почему заказчик пришел именно с таким запросом.

На одной из конференций, наш системный аналитик Анастасия Кайнова рассказала, как опыт работы в техподдержке научил её быстро разбираться в сложных инцидентах и находить настоящие причины проблем.

Главная мысль проста: любая система – это граф из узлов и связей, и проблемы можно искать по понятному алгоритму.

Мы превратили доклад в короткую серию карточек. Внутри – простой алгоритм, который помогает находить проблему даже в очень сложных системах.

▶️ Полное выступление можно посмотреть по ссылке
💬 Больше материалов и мыслей автора – в её Telegram-канале

👍2🔥1👏1

84 views14:30

Аналитик на коне

ИИ-сериальчик на вечер

Всем пятничное 🙂

Рабочая неделя закончилась, значит, можно и сериальчики посмотреть.

Очень давно стали модными вертикальные сериальчики формата reels, но в них снимались люди. Теперь их генерируют в ИИ! (и продают за сто тыщ мильенов уроки по их созданию)

Один такой меня зацепил, на злобу дня, так сказать. Рекомендасьон сериальчика про мессенджеры! Тут все: Инста, Телеграм, Ватсапп, Макс... и даже Роскомнадзор с Аськой :)

Юмор неплохой, картинка приятная, ностальгию вызывает. Кидаю вам вторую серию, как самую затравочную, остальное в первом комментарии)

1:33

This media is not supported in your browser

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2😁2

114 views15:13

Аналитик на коне

Объявляю у себя на канале неделю техподдержечных кейсов!

🙃

Да, не самое смешное, что могло бы быть, но надо же тут полезный какой-то для аналитиков контент выкладывать, чтобы они подписывались 🙂

~~хотя ставлю на то, что именно аналитики на этой неделе не совсем поймут, зачем им что-то такое~~

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1🤔1👀1

63 views13:18

About

Blog

Apps

Platform