Время Валеры
25.2K subscribers
166 photos
6 videos
1 file
348 links
Мне платят за то, что я говорю другим людям что им делать.
Автор книги https://www.manning.com/books/machine-learning-system-design
https://venheads.io
https://www.linkedin.com/in/venheads
Download Telegram
Live stream started
Пост для комментариев по стриму
Live stream finished (1 hour)
Второй стрим с Игорем проведем 27 апреля в 15 по Лондону.

В прошлый раз поговорили про рефлексию языковых моделей, немного про алайнмент(нужно развить тему дальше), автономных агентов и неполную модель мира. Так же затронули нечеловеческие условия работы на заводах в викторианскую эпоху и сходство между генеративным контентом и космическим мусором. Даже страшно представить что бы мы обсуждали, будь у Игоря высшее образование, благо у нас была затронута только четверть из подготовленного
Читаю старую статью про churn prediction WTTE-RNN - Less hacky churn prediction из 2016 года. Статья отличная, так как я проповедаю практически то же самое + еще кое-что сверху. Цитата:

The last point is the most important one. One can argue that ‘churn’-modeling is something you should only be doing if you’re in a clear-cut subscription based service. Even then it might be hard. The Netflix-class action lawsuit, where shareholders felt mislead over reported churn-rates, showed that all stakeholders seems to be confused about how to define churn. The court even dropped the case concluding that there’s no official definition of it.
Live stream scheduled for
По многочисленным просьбам продолжение стрима по Large Language Models будет 27 апреля, но не в 15, а в 18 по Лондону
Live stream scheduled for
Случилось то, чего я долго ждал, в ранний доступ вышла наша с Арсением книга: Machine Learning System Design With end-to-end examples

Сейчас доступны первые 5 глав (в черновиках есть еще 8), каждую вторую неделю планируем выкладывать по новой главе и править опечатки в выложенных.

Скидка на книгу до 9 мая: MEAP launch code: mlbabushkin (45% off Machine Learning System Design in all formats)

P.S. - Раз пошли промокды, то вот скидка на Hard ML - BABUSHKINCANADA
Live stream started
Пост для комментов по второму стриму
Ссылка на слайды и твиты
Live stream finished (1 hour)
Хочу поделиться ссылкой на Шаблон документа для дизайна ML-систем от телеграм-канала Reliable ML

Насколько я понял, Ира железной рукой насаживает этот шаблон как стандарт в учебной системе для молодых МЛщиков, хотя мы с Игорем знаем, что никаких молодых МЛщиков не будет
Forwarded from Борис опять
# Рецензия: Machine Learning System Design

Валерий Бабушкин и Арсений Кравченко выпустили в early access книгу про дизайн ML систем. До 9 мая можно получить скидку 45% по промокоду mlkravchenko.

Мне повезло получить копию для рецензии, я прочитал и презентую вам свой отзыв.

Первым делом спойлер: это не про MLOps! Многие могли подумать, что в книге будут учить строить пайплайны на Spark, или оптимизировать инференс нейросетей или что-то в таком духе. Нет. Эта книга про более важный вопрос: как сделать, чтобы ML проект не оказался на полке?

Вот как авторы определяют ML System Design:
> MACHINE LEARNING SYSTEM DESIGN is a complex, multistep process of designing, implementing, and maintaining machine learning-based systems that involves a combination of techniques and skills from various fields and roles

То есть книга о том, как строить ML системы от идеи до планирования до реализации до мониторинга и развития. Сейчас доступны пять глав из шестнадцати. Они покрывают три темы: введение в ML System Design, создание дизайн документа, выбор метрик.

Авторы рассматривают вопросы на верхнем уровне. Лишь иногда вдаются в детали для иллюстрации общих идей. Это хорошо работает, потому что для решения вопросов вроде “как понять, какую систему надо построить?” примеры с кодом не нужны. Особенно ценно, что каждая рекомендация сопровождается реальным кейсом из опыта авторов.

Кому подойдет эта книга? Middle ML инженерам, которые хотят вырасти с уровня реализации фич до уровня стратегического планирования. Senior ML инженерам и тимлидам как настольная книга.

Кому она не подойдет? Я считаю, что она не для начинающих: слишком высокий уровень абстракции. Так же она требует базовых знаний про ML инжиниринг в индустрии, или хотя бы понимания, зачем он нужен.

Лично я даже прочитав доступные пять глав почерпнул для себя много полезного. Например, в книге описано как создать дизайн документ системы. Это лучший подход к сбору требований к ML решению, что я видел. Я буду применять это в работе на текущем проекте. Подводя итог, я думаю, что скоро описанное в книге станет стандартом индустрии.

Напомню, что это рецензия лишь на первые пять глав. Дальше авторы обещают больше хардкора. Книгу можно найти здесь, промокод для скидки 45% mlkravchenko.

@boris_again
Когда я только переехал в Лондон, у меня был план. Согласно плану если после первого года жизни мне там нравится, я делаю визу Global Talent и получаю бессрочный вид на жительство не через 5, а через 3 года. Так я и поступил, в декабре 2021 года обратился к ребятам из Immigram, которые все сделали за меня - от меня было только 3-4 раза поговорить с ними по видео и рассказать какой я классный. В начале мая 2022 года получил свою визу.

Не думаю что кто-то удивился , узнав что в 2022 году спрос ну услуги Immigram и любой другой конторы, помогающий с визами вырост в десятки из раз от людей из России, Украины и Беларуси.
Понятное дело, пропускная способность настолько не выросла, отсюда изменилась и скорость работы.

Они проанализировали свои сотни успешных и не очень кейсов и на их базе выкатили платформу где можно самостоятельно собрать себе кейс на Global Talent не занося деньги никаким юристам (непонятно правда в чем тут их выгода). Говорят, что О1 идет следом и уже в разработке.

Сегодня они запустились с ней на Product Hunt - и им нужна поддержка.
Прочитал небольшую статью Neural Networks are Decision Trees.

Краткая идея простая - we have shown that neural networks can be equivalently represented as decision trees. The tree equivalence holds for fully connected layers, convolutional layers, residual connections, normalizations, recurrent layers and any activation.

Приводят алгоритм как сконвертировать сетку в дерево. В целом, почему бы и нет? Полезного особо не вижу, но удивить друга вполне можно
Вышло продолжение ответов на вопросы про А/B тесты, ниже анонс от Карпов Курсес:

Всегда ли для проверки гипотезы необходимо использовать A/B-тест? Можно ли сравнивать попарно несколько разных категорий пользователей? Какие есть подходы к повышению чувствительности A/B-тестов? 

На эти и ещё более узконаправленные вопросы, которые вы задавали Валерию Бабушкину, ответим сегодня во второй части «10 вопросов»