Нескучный Data Science
11.9K subscribers
315 photos
17 videos
1 file
183 links
Нюансы работы в Data Science, о которых ты не узнаешь в школе
👨‍💻 Managing AI Director, Sber @smirnovevgeny
https://www.linkedin.com/in/smirnov-evgeny/

По вопросам сотрудничества @datascience_assist

Регистрации в Роскомнадзор № 5278866657
Download Telegram
📹 Влияние DS на бизнес, управление проектами и построение команды | R77 AI

🤔 Хотите узнать самые актуальные тематики, находящиеся в фокусе моего внимание на текущий момент? Смотрите наш подкаст с Ярославом Шмулевым, сооснователем интегратора AI в корпорации R77.

Список полезных и хайповых тем из интервью:
1️⃣ Нужны ли проджект менеджеры в Data Science?
2️⃣ Как продавать Data Science бизнесу?
3️⃣ Зачем нужно глубоко понимать жизненный цикл моделей?
4️⃣ Как эффективно управлять командой?
5️⃣ Когда нужно привлекать DS-консалтинг?
6️⃣ Что означает "режим куколда" в рабочем процессе?
7️⃣ Как математика помогает принимать эффективные решения?
8️⃣ Как хайп ChatGPT мешает работать?
9️⃣ Как помогает расчет финансового эффекта?

🤝 Несмотря на довольно разный карьерный трек мы на многие вещи смотрим одинаково.
🗯 А как вы смотрите на распределение ролей в менеджменте DS-проектов?

#подкасты #личный_опыт
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥216💯4🤣3
Forwarded from Альфа-Банк
Проводим самые прорывные исследования — и делаем вклад в мировую науку 🧑‍🎓

Наши ребята из Лаборатории машинного обучения Альфа-Банка написали уникальную научную работу — об атаках на искусственный интеллект и техниках его защиты. Это исследование на уровне ведущих международных институтов 🦾

Работу опубликовали на главном научном сайте в мире — arXiv. А наших ребят пригласили на международную конференцию для учёных — ICDM 2024: IEEE International Conference on Data Mining в Абу-Даби.

Гордимся достижениями и продолжаем создавать науку будущего ❤️

Редактор канала: своими шутками делает вклад в мировой стендап 🤩

@alfabank
Please open Telegram to view this post
VIEW IN TELEGRAM
30🔥14👍10😁2👎1
🏆 Альфа-Банк получил премию за лучший AutoML

12 декабря на конференции AI Journey получили премию «Лидеры ИИ» за прорыв года в AutoML - наши сервисы ANNA и AMELIA 🌿

Премию получил CEO Альфа-Банка - Владимир Верхошинский. Теперь и топ-менеджмент знает про наш AutoML 🏆

🌐 Пока все обсуждают новые LLM, большой процент бизнес-value по-прежнему лежит в классических моделях - бустингах и небольших нейросетях

🏎 Умение их быстро строить, деплоить и обновлять является трамплином к многомиллионным фин-эффектам 💸

🌱 Активно прокапывать тему AutoML мы начали в 2023 году - в то время у многих были сомнения: AutoML изжит, зачем изобретать велосипед...

Однако мы твердо уверены - тема ML-автоматизации раскрыта не до конца. За этот год:
1️⃣ Покрыли AutoML все процессы и заработали сотни миллионов рублей
2️⃣ Наши сервисы ANNA и AMELIA стали первопроходцами нового поколения AutoML
3️⃣ Выпустили большой AutoML курс, множество Habr-статей и провели AutoML-хакатон
4️⃣ Тема AutoML возрождена и активно обсуждается на всех конференциях

Очень рады продолжать быть трендсеттерами в банковском DS 💅

🚀 Лимит технологии не достигнут: на 2025 год у нас большие планы по развитию AutoML. Будем активно делиться с вами новостями, не отключайтесь 😎

#автоматизация_ds #ML_Lab
Please open Telegram to view this post
VIEW IN TELEGRAM
39👍20🔥8👏3😁1👌1
🥇 Как взять соло золото на Kaggle

🧑‍💻 Недавно на Kaggle завершилось соревнование UM - Game-Playing Strength of MCTS Variants - в котором наш тиммейт Вадим в одиночку занял 6 из 1608 мест, забрав золотую медаль 🏆

⭐️ Задачей соревнования было создать решение, способное предсказывать насколько хорошо один вариант поиска по дереву Монте-Карло (MCTS) будет работать по сравнению с другим в той или иной игре. MCTS алгоритмы используются в качестве ИИ в различных настольных и компьютерных играх, исследователи регулярно придумывают их улучшения, однако нет единой конфигурации, которая подходила была для всех игр, поэтому правильный подбор этих агентов для каждой игры являеется важной исследовательской задачей направленной на достижение наилучшего перформанса в каждой из возможных игр.

🧪Для обучения моделей участниками были даны описания агентов, правила игр, а также различные ситуативные и статистические параметры для каждой игры. Требовалось избегать переобучения и создать модель с хорошей генерализацией: тестовом датасете будут уже новые игры.

💡 В решении зашли как классически тактики (генерация и отбор фичей, ансамбли), так и более продвинутые (OpenFE и калибровка под тестовое распределение). Большой прирост по точности дала идея генерации новых данных: ее использовали лучшие участники, а победитель даже придумал прогонять микросимуляции для каждого нового семпла.

🎓 Прочитать полностью про решение Вадима можно по ссылке.

🤴 Стоит отметить, что это не первый успех на Kaggle у Вадима. Ранг мастера и свое первое соло золото он получил еще 3 года назад, когда учился в старшей школе. Сейчас Вадим работает в Лаборатории на позиции Senior Data Scientist и занимается разработкой AutoML & AutoDL в Альфе Банке.

🏆 Поздравляем и желаем еще больше побед!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍79🔥4817🆒1
🔔 Работа над искусственным интеллектом может принести вам не только научное признание, но и денежный приз

Премия Data Fusion Awards впервые запускает номинацию «Научный прорыв года в ИИ». Российские ученые, опубликовавшие статьи по ИИ или науке о данных в 2024 году, могут побороться за один из трех призов по 1 000 000 рублей.

Дедлайн подачи заявки: 31 января 2025 года.

🔥 Торжественное награждение пройдет 16-17 апреля в Москве на конференции Data Fusion.

➡️Детали участия
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍43😱2🙉1
📞📞📞Команда исследователей
👍👍запускаю конкурс - священный MAPE👍👍 - хочу провести эксперимент.
Недавно в такси ехал и увидел какие яндекс такси хитрюшки-врушки.

Вы посмотрите как они делают - предположим у них в модели прогнозирования времени поездки возьмем метрики MAPE (Mean Absolute Percentage Error) - допустим смотрим процент ошибки вверх и вниз прогноза от фактическиз значений - скрин 1. Немного математики.

Допустим эта ошибка 20%.

Яндекс делает похоже в такси для клиента и водителя разные ожидания скрин 2 - увидел у таксиста и сфотографировал - слева это фото и время поездки оставшееся, а справа мое время скрин из телефона. - разница 20-30% по нескольким поездкам идет.
- слева - для водителя похоже эту ошибку вычитают из прогноза и выводят в UI
- справа - для пассажира похоже эту ошибку прибавляют к прогнозу и выводят в UI


Хочу понять насколько у кого из нас в канале какая ошибка зависит от времени поездки.

Продуктово подумал как они аргументируют:
Водителю - у тебя поездка не такая долгая и ты получишь деньги == меньше отказов от поездки со стороны такси и тд
Пассажиру - ты точно приедешь за это время == меньше негатива, что поезда дольше идет чем ожидалось

🔥Конкурс в чем🔥 Как такси вызовите себе - в комментах напишите 2 цифры, которые посмотрите как поездка начнется в машине уже: сколько минут ехать на экране у водителя и сколько минут ехать на экране у пассажира. Репостните своим дата друзьям плиз - хочу статистики собрать веселой

🔼🔼Призы бабки🔼🔼 - из тех кто написал оценки - рандомно выберем 3 товарищей - им по 5 тысяч рублей за генерацию статистики) если вы картинки фотки прикрепите в треде - вам приоритет))

Итог 13 февраля подводим рандомом и тут напишу => и пишу в личку - купите своему любимому подарок (или себе грязные извращенцы)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1💯148😁6👍4🔥2🤷2
По моему опыту использования Яндекс.Такси фактическое время поездки получается
Anonymous Poll
28%
выше прогнозируемого
19%
ниже прогнозируемого
53%
совпадает с прогнозируемым
🐳6👍1🔥1😎1
Всем привет! 28 февраля в 17:00 приходите на митап по Data Science в Москве. На встрече экспертами из Центра Big Data МТС и Лаборатории машинного обучения Альфа-Банка поделимся кейсами:

🎙️Гибкая калибровка: как одновременно попадать в KPI для сотен рекламных кампаний?
🎙️Превращаем нейросети в SOTA и для табличных задач
🎙️Трансформеры в RecTools: от fit/predict из коробки до кастомных архитектур
🎙️Улучшаем клиентский опыт за счет комплекса моделей
🎙️Бандиты и нейросети. Строим рекомендации с нуля в стриминговом сервисе с UGC-контентом
🎙️Ускоряем работу аналитиков инструментами Data Science
🎙️Новый релиз CoolGraph – краткий обзор нашей библиотеки для быстрого старта с GNN

🎬Модераторы: Никита Зелинский (CDS & Head of ML Platforms, МТС) и Евгений Смирнов (CDS & Head of ML Lab, Alfa-Bank).

😍 В рамках колоборации двух CDS-ов из красных компаний запускаем розыгрыш аж 1️⃣0️⃣ подписок ✈️-премиум на год!

Как принять участие?
1️⃣ Подписаться на канал "Нескучный Data Science" (@not_boring_ds)
2️⃣ Подписаться на канал "Дата канальи – про "специалистов" данных в ML/AI" (@datarascals)
3️⃣ Ждать 28 февраля, когда мы объявим, кто победил.

🗓️ 28 февраля в 17:00
📍 г. Москва, офлайн
➡️ Регистрация по ссылке: https://mts-digital.ru/events/details?id=12357783

#митап
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍74🙏1
This media is not supported in the widget
VIEW IN TELEGRAM
😱17
Развиваем навыки публичных выступлений в Лаборатории

💬 "На конференциях выступают только крупные руководители, а линейные члены команды на это не способны" - this number 1 bullshit, который Лаборатория поменяла. Оказывается, что можно вместо руководителя направить на конференцию любого члена команды. Качество выступления не будет сильно отличаться от опытного спикера, если его должным образом подготовить. С каждым выступлением времени на подготовку требуется все меньше, обычно через 2-3 итерации помощь больше не требуется. О том, как мы растим спикеров, расскажу в одном из следующих постов.

🔉 В конце прошлого года к нашей команде присоединился аспирант Физтеха на middle-позицию, с явным запросом прокачать свои навыки публичных выступлений. Альфа-Банк расширяет число совместных программ с ВУЗами и поэтому экстренно потребовался опытный спикер на офлайн-мероприятие в Хабаровске. Эрнест подготовился к выступлению в короткий сроки и получил признание от аудитории, а мне написали восторженные отзывы организаторы этого мероприятия.

🤖 Михаил Попов(@m3rlyn) был одним из первых devrel, который заценил силу наших джунов-спикеров. С ним же мы первыми от Альфы прошли на HighLoad, помню насколько там был жесткий тайминг подачи. Если у вас нет своего деврела, который вам будет напоминать подаваться на конференции, то рекомендую воспользоваться DevRel CFP Bot @devrelcfpbot от Миши, который автоматизирует эту работу.

P.S. уже записал Эрнеста на следующую конференцию.

#карьера #ML_Lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥209👍2👎1🎉1💯1
Как обстоят дела у сына маминой подруги?

Вы помните Максима Шапошникова: закончил ШАД со средним баллом 4.9/5, Покинул Лаборатории ради PhD, но попал в FAANG. С момента последнего интервью прошло уже 2.5 года, настало время узнать, что изменилось в карьере нашего героя.

Интересные факты из интервью:
1️⃣ Кто такой МЛ-инжинер в зарубежном Биг Техе?
2️⃣ А кто такой Applied Scientist в FAANG?
3️⃣ Как стать "ученым" без PhD?
4️⃣ Насколько развито ML-комьюнити в Англии?
5️⃣ Как упорство и переработки помогли Максиму в карьере?

Максиму так и не удалось меня схантить в FAANG, но зато мне удалось его убедить начать вести свой канал, подписывайтесь - ✈️@max_dot_sh

Ставьте 🔥, если хотите, чтобы мы с Максимом записали видео-подкаст.

💬 Прошу пройти опрос в комментариях по стилю карточек для интервью.👇

#мини_интервью
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥57👍1411💯21🙉1
👩‍🦱 Ваша мама еще не знает про ANNA?

✈️ Перешлите ей этот пост.

✏️ Переписали нашу техническую статью про сервис ANNA более простым языком. В материале дополнительно рассказали о результатах сервиса за предыдущий год и о планах на будущее.

👉 Читать на VC
👉 Читать на Forbes

#статьи
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥124👍4😁1