Bayesian Noise
61 subscribers
57 photos
234 links
Канал @nesterione. Посты про ИТ, машинное обучение, рациональность, иногда просто заметки и наблюдения.

з.ы. картинка не картинка...
Download Telegram
Неоднократно ссылался на гайды от гугл про машинное обучение, уж очевидно, что им есть что рассказать о ML и больших данных. Нашёл время и прочёл очередную серию статей https://developers.google.com/machine-learning/problem-framing - про постановку задач машинного обучения.

Серия статей подходит для чтения совсем новичкам в ML, но с опытом разработки. Люди с опытом найдут тоже много полезного. Особенно если у вас есть опыт исследователя и вы хотите применять знания в продакшене. Материал будет полезен тем, кто хочет делать продукты с ML, там рассматриваются важные вопросы, как нужно подходить к постановке задачи и о том, как оценить, проанализировать то, что нужно для вашего продукта. Меня особенно порадовало сходство правил по выставлению метрик, с рекомендациями, наподобие SMART, для постановки персональных целей.

Дальше лонгрид резюме, набор полезных сниппетов заметок важных идей для себя. Получилось реально много букв, поэтому вынев в telegraph
https://telegra.ph/Postanovka-zadachi-ML-04-07

#ml #problem #framing #production #engineering
Небольшая статья достоянная прочтения о том, почему ML проекты проваливаются https://towardsdatascience.com/what-is-the-main-reason-most-ml-projects-fail-515d409a161f

В статье говорится о двух основных причинах:

Цена итерации — при разработке ML продуктов подготовка данных очень дорогая стадия, как по деньгам, так и по времени. Если плохо поставили задачу или данные разметили не так, то повторная операция приведёт к существенным затратам.

Определения готовности (definition of readiness) "How good is good enough" — действительно это частая проблема, когда принимающее решение на проекте люди, не понимают, когда стоит остановиться и продолжить внедрение. Всегда можно попробовать ещё что-нибудь, чтобы улучшить модель, но для успешного продукта, нужно держать в уме цели продукта, не только модели.

Нельзя сказать, что это единственные проблемы, но точно стоит уделить им особое внимание.

#ml #production