Интересное что-то
517 subscribers
2.72K photos
253 videos
139 files
4.52K links
Материалы и мысли, понадерганные отовсюду
Блог: https://t.me/asisakov_channel
Чат: https://t.me/youknowds_chat
Download Telegram
Forwarded from Fley's flow
Log & roll №3

У меня все равно плохо получается регулярно о чем-либо сообщать, потому что бывают такие моменты, когда написать нечего — рутина и рутина. В первую неделю после отпуска, сколько бы я ни был заряжен на работу, она вообще не шла в том темпе, в котором хотелось бы. Но за три недели что-то да накопилось.

💼 Работа

Я продолжил заниматься задачей по временным рядам, хорошо по ней продвинулся: добавил недостающие метрики, сделал кучу фиксов, написал огромную доку по каждому аспекту, докинул разные аугментации — в основном рутина, но отдельные моменты отмечу:

1️⃣ Подбор гиперпараметров

Оформил подбор гиперпараметров в максимально удобный скрипт, запустил и получил результаты. Скажу так: это шикарная возможность поднять метрики, особенно если есть ресурс на 20+ запусков обучения, а в моем случае это было возможно, поскольку модель очень легковесная. Здесь важно понимать, какой метод вам подойдет — будь то ASHA, которая при шаге, равном полному обучению, вырождается в Random Search, или же Model-based методы типа Байеса (однажды я напишу статью об этом...).

Капля дегтя – разные методы поддерживают разные типы данных – где-то есть поддержка категорий, где-то ее нет, где-то даже была поддержка квантованных (для русских людей – просто с меньшим числом значений после запятой, чтобы не было потом 0.232545589 в конфиге), но её убрали в новых версиях.

2️⃣ Пайплайн проекта

В этой задаче для разных типов временных рядов используются разные предобработки и модели, в связи с чем была необходимость в реализации достаточно серьезного пайплайна. Основная цель — сделать так, чтобы на вход можно было просто отправить практически любой ряд + его тип, а на выходе получить верный ответ. Я подошел к реализации с помощью Triton Business Logic Scripting (BLS). Я думал написать пост о нем, но не сложилось. (Если нужно, сообщите в комментах, потому что у меня в сохраненках два текста по нему, оба бросил 👍).

Если кратко, то BLS — это скрипт на Python, который в Triton Inference Server трактуется как независимая модель. То есть, к ней так же пишется конфиг с I/O модели, внутри скрипта model.py реализуется класс с методом execute, а дальше делай с питоном все, что захочешь. И я сделал две обычные TensorRT модели, дописал BLS-скрипт, в котором вся-вся логика предобработки + отправка рядов в нужную модель + логика постобработки. Разумеется, сделал асинхронное обращение к моделям.

Самое неприятное в этой задаче — куча разных мелочей, которые вылезают, потому что человеческий мозг (окей, подмножество {мой мозг}) не вмещает все нюансы разом. Это различные размерности, это правильная конвертация тензоров одного бэкенда в другой, это... в общем, об этом читать неинтересно. Главное — оно заработало, а я задолбался.

3️⃣ Документация

Документации было много, вплоть до ссылки на другие README внутри основного, но это не главное. Оказывается, в Gitlab есть поддержка Mermaid-графов, которые позволяют шикарно визуализировать пайплайн модели. Причем, судя по всему, эта поддержка есть уже давно. Да, достаточно просто написать '''mermaid, описать диаграмму и она появится в доке. Магия да и только. К сожалению, в Github не завезли.

👨‍💻 Продолжил рефакторинг BoxMOT

Я обнаружил еще одну важную проблему — в проекте мало того, что дублируется, так еще и разбросана в разных местах логика скачивания весов моделей. Я решил сделать так: назвал эту сущность ModelRegistry, дал ей геттеры, чтобы узнавать URL/названия доступных моделей, а также метод download. И все ее наследники должны просто прокинуть свои словарики с URL весов и прочей информацией, которая нужна для загрузки.

Затем у меня была долгая дилемма по поводу связывания различных сущностей вместе, но решилось это примерно так: роль скачивания берет на себя ModelRegistry, роль инициализации pytorch-модели берет на себя непосредственно класс модели — ReID или Detector, назовем этот метод build, а в PytorchBackend на вход будем подавать модель + веса.

Негусто, но немного продвинулся.

В иных аспектах пока тоже все в порядке — жизнь бьет ключом, пока что не по голове.

#lognroll
Please open Telegram to view this post
VIEW IN TELEGRAM
Что за милашечную книгу я нашла???

Сначала меня зацепило оформление — она написана в диалоге с героиней моей любимой истории. А потом заинтересовала и суть.

Каждая глава — почти диалог между Алисой и её профессором.
Я уважаю такой стиль и помню его по занимательной манге по молекулярной биологии и химии, которые когда-то прочитала взахлёб. Там — рассуждения, вопросы и неожиданные «а почему так?», например:

Почему мы делим выборку?
🫤А что случится, если не нормализовать данные?
🙄Как вообще модель понимает, что происходит?

Я прочитала пару глав по диагонали, но уже хочется полежать с ней по вечерам и повспоминать БАЗУ🤌🏻. И да, книга мне действительно понравилась — вот три причины:
😍Она новая — в ней упоминаются SOTA-подходы и свежие идеи.
🧣Расслабляющая — читается легко, как разговор с умным другом
😊Красивая — да, для меня визуальная подача имеет значение

Заставляет не просто понять DL, а полюбить его

Читать можно тут, но я хочу поискать печатную версию, мне надо
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Евгений Козлов пишет про IT (Eugene Kozlov)
Продолжаю учиться на курсе Школа технического директора от Стратоплана

Всем привет! Давно не было постов про курс, исправляюсь, нужно отрефлексировать полученные знания. Последний пройденный модуль был посвящен IT инфраструктуре в широком смысле.

Первый день модуля начался с разговоров о софте. Рассуждали и искали ответы на вопросы:
- Как бороться с Legacy? И стоит ли вообще? Можно ли его побороть?
- Осознанный выбор технологий
- Vendor-lock: различные варианты последствий. Митигирование рисков
- Покупка или свой велосипед: тренер довольно подробно рассказал о том на что обращать внимания в обоих вариантах.

Контент мне зашел, я рассуждал в том же ключе что и тренер, добавилось структуры в голове после просмотра слайдов.

-----

Далее перешли к проектированию: тут для меня не нашлось откровений, разобрали Закон Конвея и его обратную модификацию. Тренер высказал мысль с которой я живу со времен универа - цель любой архитектуры помимо достижения НФТ и ФТ это также достаточная степень гибкости, адаптации к изменениям. Обсудили в том числе то как реальный мир устроен, и какие мероприятия позволяют нам держать эту гибкость на нужном уровне.

Контент хороший, тренер постарался, но для себя я много нового не открыл, многие вещи на собственном опыте прожил.

-----

Закончили день разбором ключевых процессов разработки софта. Тренер подробно прошелся по 3м китам:
- Разработка (Проектирование, Жизненный цикл)
- Эксплуатация (SRE)
- Контроль качества (QA)

Если говорить в целом, осталось хорошее впечатление от контента, добавилось структуры + увидел что у меня довольно сильно пересекаются взгляды с тренером и ребятами в группе. При этом по годам опыта я значительно моложе ребят :)

Завтра опубликую отдельную заметку о втором дне модуля, на нем обсуждали закупки. Вот там для меня было прям много нового и незнакомого, все таки я в своей работе подобным почти не занимался.
Forwarded from Евгений Козлов пишет про IT (Eugene Kozlov)
Продолжаю учиться на курсе Школа технического директора от Стратоплана

Как и обещал, сегодня пост про второй блок модуля IT инфраструктура, изучали то как устроены закупки и как CTO должен ими управлять.

Тренер подошел к вопросу системно: прошлись по определениям из PMBOK, рассмотрели обобщенную схему как проводить закупки:
- Планирование
- Проведение
- Контроль
- Закрытие

Отдельно разобрались с тем какие ресурсы CTO может приобрести для своей компании (Рабочие руки, экспертиза, Софт, Инфра, Данные)

Отдельно прошлись по тому какие есть варианты контрактов:
- Fixed Price
- Cost Plus Fee
- Time and Material

Разобрались на примерах в каких задачах более уместен тот или иной вариант. Также рассмотрели какие риски мы несем в каждом из вариантов.

По сути разобрались с первыми 2мя этапами закупок (Планирование и проведение)

Отдельный блок тренер посвятил контролю закупок. Тренер рассказал про несколько вариантов:
🔸 Заранее договориться о наборе метрик на которые смотрим вместе с поставщиком (PROJECT метрики, Kanban, SCRUM).
Очень классный момент отметил тренер, сильно мне врезался в ухо. Процитирую почти дословно: ДЛЯ КОНТРОЛЯ ЗАКУПОК ОЧЕНЬ ВАЖНО СМОТРЕТЬ НЕ НА ROADMAP, Диаграмму Ганта или ПРОЕКТНУЮ ДОКУМЕНТАЦИЮ а на РЕАЛЬНОЕ ПОЛОЖЕНИЕ ДЕЛ. Проектная документация это всего лишь интерпретация реальности и с не самым добросовестным поставщиком можно обжечься. В общем фактура ван лав.

🔸Инспекции и аудиты
Нужны в том случае если фактура пропадает из поля зрения и действия поставщика перетекают в интерпретацию. Или появились проблемы с доверием.

🔸Отчетность об исполнении
Отчеты, метрики (с достаточным уровнем фактуры). Особенно важно для последующего ретроспективного анализа, поиска точки когда была допущена ошибка и что-то пошло не так.

И отдельно разобрались с тем как осуществлять контроллинг в зависимости от типа контракта с поставщиком.

Завершился день разбором сложнейшей темы - Развитие отношений с поставщиками и построение своей партнерской сети😊
Forwarded from дAI потестить!
Все так увлечены исследованием Veo3, что самой вкуснятины и не заметили.

Знакомьтесь TTC от Google

Есть выбор голосов (клонировать нельзя), мульти спикер режим (да да, наши любимые диалоги), 2 модели Pro и Flash, и самая мякотка - можно задать эмоции естественным языком🤗.
Дают бесплатно, лимиты я пока не понял.
За примерами придется спуститься в комменты👇👇.
#TTS
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from дAI потестить!
Тут https://dreamina.capcut.com/ai-tool/home раскатала очередного убийцу Seedance 1.0. Чтобы стало активно, заходитм с ip USA. Дадут ежедневные 120 поинтов, что в переводе на русский - 10 с видео. Я попробовал, определенно в динамику умеет, но лицо не держит.

Накидайте в комменты у кого что получается. По моим ощущениям, выглядит как замена Kling.

Вот Вам утренних танцующих девушек. Одна по промпту вторая по картинке.
#tips@dAIpotestit
Forwarded from дAI потестить!
И для тех, кто еще не понял, какая видео модель нужна и для чего. Что там по скорости и сколько Vram, смотрите скрины.
Взял от сюда источник.
Ссылку прислала Марика
#tips
Forwarded from дAI потестить!
Media is too big
VIEW IN TELEGRAM
Тут dreamina.capcut.com обновила интерфейс, при этом сохранила баги (все как мы любим😊).

Подсказал @astrolog_expert
- Регистрируем аккаунт под IP Аргентины (есть и другие страны)
- Смотрим чтобы слева у нас было 0 поинтов (значит все получилось)
- Переключаемся на IP США, и генерим все что нам нужно.
Это не безлимит, я доставал до дна. Но развлечься можно.

P.S. Еще у меня получалась сбрасывать потраченные баллы к исходным ежедневным, если переключить VPN во время генерации с Аргентины на США.
P.S.S. Кидайте в комменты, чего получилось нагенерить👇👇👇.

Пожалуйста!

#tips